1001Ferramentas
🧪 Validadores

Validador SMILES (Notação Química)

Verifica sintaxe de uma string SMILES (átomos, ligações, anéis, isomeria, parênteses). Aponta erros de tokenização e valência.

Aspirina Cafeína

SMILES: escrever uma molécula como uma linha de texto

O SMILES (Simplified Molecular-Input Line-Entry System) é uma notação que codifica a estrutura de uma molécula como uma única string ASCII. Diferente do número CAS — uma chave de registro arbitrária — o SMILES descreve a estrutura real: quais átomos estão ligados a quais. É a língua franca da quimioinformática, aceita por RDKit, Open Babel, PubChem e praticamente todo toolkit de química. Esta ferramenta verifica se uma string é sintaticamente um SMILES válido (não há checksum — SMILES é uma gramática, não um número codificado).

A sintaxe básica

  • Átomos: o subconjunto orgânico B C N O P S F Cl Br I é escrito direto; qualquer outro elemento (ou com carga/isótopo/H explícito) vai entre colchetes, ex. [NH4+], [13C], [Fe].
  • Ligações: - simples, = dupla, # tripla, : aromática; ligações simples/aromáticas costumam ser implícitas.
  • Ramificações: parênteses, ex. ácido acético CC(=O)O.
  • Anéis: rótulos de dígitos iguais abrem e fecham um anel — cicloexano é C1CCCCC1; números de anel com dois dígitos usam %nn.
  • Aromaticidade: átomos em minúscula, ex. benzeno c1ccccc1.
  • Estereoquímica: / e \ para geometria de dupla ligação, @/@@ para quiralidade.

Exemplos

  • Água O · etanol CCO · ácido acético CC(=O)O
  • Aspirina CC(=O)Oc1ccccc1C(=O)O
  • Cafeína CN1C=NC2=C1C(=O)N(C)C(=O)N2C

Pegadinhas comuns

  • Maiúsculas importam: CO é carbono–oxigênio, mas Co é o elemento cobalto. Minúscula significa aromático ou símbolo de duas letras — nunca intercambiáveis.
  • Dígitos de anel sem par: todo dígito que abre anel precisa do par que fecha; um 1 solto é inválido.
  • Parênteses/colchetes desbalanceados: ramificações e átomos entre colchetes precisam fechar.
  • Não é InChI nem SMARTS: InChI é um identificador canônico diferente; SMARTS é uma linguagem de busca que estende o SMILES e não vale como estrutura simples.

FAQ

Existe um único SMILES correto por molécula? Não — uma molécula tem muitos SMILES válidos. O SMILES canônico (gerado pelo algoritmo de um toolkit) dá uma string reproduzível por estrutura.

Sintaxe válida significa molécula real? Não necessariamente — a gramática pode ser satisfeita por uma valência quimicamente implausível. Toolkits acrescentam uma checagem de valência/sanitização separada.

SMILES vs InChI? SMILES é compacto e fácil de escrever à mão; InChI é uma string canônica padronizada feita para casamento exato em bancos de dados. Muitos fluxos guardam os dois.

Ferramentas Relacionadas