Validador SMILES (Notação Química)
Verifica sintaxe de uma string SMILES (átomos, ligações, anéis, isomeria, parênteses). Aponta erros de tokenização e valência.
SMILES: escrever uma molécula como uma linha de texto
O SMILES (Simplified Molecular-Input Line-Entry System) é uma notação que codifica a estrutura de uma molécula como uma única string ASCII. Diferente do número CAS — uma chave de registro arbitrária — o SMILES descreve a estrutura real: quais átomos estão ligados a quais. É a língua franca da quimioinformática, aceita por RDKit, Open Babel, PubChem e praticamente todo toolkit de química. Esta ferramenta verifica se uma string é sintaticamente um SMILES válido (não há checksum — SMILES é uma gramática, não um número codificado).
A sintaxe básica
- Átomos: o subconjunto orgânico
B C N O P S F Cl Br Ié escrito direto; qualquer outro elemento (ou com carga/isótopo/H explícito) vai entre colchetes, ex.[NH4+],[13C],[Fe]. - Ligações:
-simples,=dupla,#tripla,:aromática; ligações simples/aromáticas costumam ser implícitas. - Ramificações: parênteses, ex. ácido acético
CC(=O)O. - Anéis: rótulos de dígitos iguais abrem e fecham um anel — cicloexano é
C1CCCCC1; números de anel com dois dígitos usam%nn. - Aromaticidade: átomos em minúscula, ex. benzeno
c1ccccc1. - Estereoquímica:
/e\para geometria de dupla ligação,@/@@para quiralidade.
Exemplos
- Água
O· etanolCCO· ácido acéticoCC(=O)O - Aspirina
CC(=O)Oc1ccccc1C(=O)O - Cafeína
CN1C=NC2=C1C(=O)N(C)C(=O)N2C
Pegadinhas comuns
- Maiúsculas importam:
COé carbono–oxigênio, masCoé o elemento cobalto. Minúscula significa aromático ou símbolo de duas letras — nunca intercambiáveis. - Dígitos de anel sem par: todo dígito que abre anel precisa do par que fecha; um
1solto é inválido. - Parênteses/colchetes desbalanceados: ramificações e átomos entre colchetes precisam fechar.
- Não é InChI nem SMARTS: InChI é um identificador canônico diferente; SMARTS é uma linguagem de busca que estende o SMILES e não vale como estrutura simples.
FAQ
Existe um único SMILES correto por molécula? Não — uma molécula tem muitos SMILES válidos. O SMILES canônico (gerado pelo algoritmo de um toolkit) dá uma string reproduzível por estrutura.
Sintaxe válida significa molécula real? Não necessariamente — a gramática pode ser satisfeita por uma valência quimicamente implausível. Toolkits acrescentam uma checagem de valência/sanitização separada.
SMILES vs InChI? SMILES é compacto e fácil de escrever à mão; InChI é uma string canônica padronizada feita para casamento exato em bancos de dados. Muitos fluxos guardam os dois.
Ferramentas Relacionadas
Validador de CPF
Valide CPFs instantaneamente pelo algoritmo oficial da Receita Federal, sem enviar dados para nenhum servidor. Gratuito e sem cadastro.
Validador de CPF em Lote
Valida uma lista de CPFs (um por linha) e mostra quais são válidos e quais são inválidos. Sem envio para servidores.
Validador de CNPJ em Lote
Valida uma lista de CNPJs (um por linha) e mostra resumo: válidos, inválidos e total. Sem envio para servidores.