SMILES文字列からの分子
SMILES文字列は,組織的な化学名を使う代りに,簡潔な方法で分子を表現する.この表記を使うと,新しい種類の化学構造を素早く容易に生成することができる.
SMILES文字列の基本単位は,角カッコで囲まれた原子記号である.例えば,"[Xe]"は結合を解除された原子を表す.
間に何も挟まずに2つの原子記号を繋げたものは,単結合を表す.
原子記号内に電荷や同位体の値を含むことができる.
よく使われる有機要素については,原子記号の周りに角カッコを加える必要はない.通常の原子価を大きくするために水素原子が加えられる.したがって,メタンは単に"C"と表される.
Moleculeで分子に変換されると,水素が自動的に加えられる.
単結合で接続された原子の線状鎖を作るためには,その記号を順に組み合わせればよい.
二重結合と三重結合はそれぞれ"="と"#"の記号で表され,連鎖は2つの隣接原子に数値ラベルを加えることで表現される.
以下は,線状鎖と連鎖の変異型を表す.表記における唯一の違いは,最初と最後の原子が同じ数で記されていることだけである.