SMILES
İngilizce simplified molecular input line entry specification deyiminin kısaltması olan SMILES molekül yapılarının kısa ASCII dizileri şeklinde kesin olarak tanımlanabilmesi için geliştirilmiş bir sistemdir. Çoğu kimyasal çizim programı SMILES dizilerini okuyup bunları iki boyutlu çizimlere veya üç boyutlu modellere dönüştürebilirler.
Örnekler
SMILES Notation | Genel Formül | Adı |
---|---|---|
C | CH4 | Metan |
CC | CH3–CH3 | Etan |
CCC | CH3–CH2–CH3 | Propan |
Clc(c(Cl)c(Cl)c1C(=O)O)c(Cl)c1Cl |
C7HCl5O2 | Penta klorobenzo asit |
Atomlar elementlerin standart kısaltmaları ile temsil edilirler, örneğin altın için [Au]. B, C, N, O, P, S, F, Cl, Br ve I@dan oluşan "organik altgrup" için köşeli parantezler kullanılmayabilir, diger elementler için kullanılır. Eğer köşeli parantez kullanılmamışsa yeterli sayıda hidrojen atomunun bulunduğu varsayılır, örneğin su için SMILES kodu O'dur, etanol için CCO'dur.
Çift bağlı karbon dioksit O=C=O, üçlü bağlı hidrojen siyanür ise C#N olarak gösterilir.
Dallar parantezlerle gösterilir, propionik asit için CCC(=O)O ve fluoroform için C(F)(F)F (veya FC(F)F olarak da) gibi.
Sikloheksan C1CCCCC1 olarak gösterilir, burda '1 numara'nın molekülde aynı konumu işaretlediği anlaşılır, böylece 6 arbonlu bir halka oluşur. Burda kullanılan işaret numaradır (bu örnekte 1), 'C1' bileşimi değildir.
Aromatik C, O, S ve N atomları küçük harfli olarak, 'c', 'o', 's', ve 'n' olarak gösterilir. Böylece benzen c1ccccc1'dir.
İzomerler
Çift bağların etrafındaki atomların konumlarını belirtmek için "/" ve "\" karakterleri kullanılır. Örneğin F/C=C/F trans-difluoroeten'i temsil eder, F'ler cift bağın zit taraflarındadır. F'lerin çift bağın aynı tarafında olduğu cis-difluoroeten için F/C=C\F kullanılabilir.
Eklentiler
SMILES'dan türetilmiş olan SMARTS genel arama karakteri ve bağların tanımlanmasına olanak sağlar. Kimyasal veritabanı araması yaparken aranılan yapıların tanımlanmasına yarar.