Zápis linky SYBYL - SYBYL line notation
Přípona názvu souboru | .sln |
---|---|
Typ formátu | formát chemického souboru |
The Zápis linky SYBYL nebo SLN je specifikace pro jednoznačný popis struktury chemikálie molekuly pomocí short ASCII struny. SLN se liší od ÚSMĚVY několika významnými způsoby. SLN může specifikovat molekuly, molekulární dotazy a reakce v jedné řádkové notaci, zatímco SMILES je zpracovává prostřednictvím jazykových rozšíření. SLN má podporu pro relativní stereochemie, může rozlišovat směsi enantiomery z čistých molekul s čistou, ale nevyřešenou stereochemií. V ÚSMĚVECH aromatičnost je považována za vlastnost atomů i vazeb, zatímco v SLN je to vlastnost vazeb.
Popis
Stejně jako SMILES je SLN lineární jazyk, který popisuje molekuly. To poskytuje velkou podobnost s SMILES navzdory mnoha rozdílům SLN od SMILES, a ve výsledku tento popis silně porovná SLN s SMILES a jeho rozšířeními.
Atributy
Atributy, závorky s dalšími daty, jako jsou [klíč1 = hodnota1, klíč2 ...]
, je základní funkcí SLN. Atributy lze aplikovat na atomy a vazby. Atributy, které nejsou oficiálně definovány, jsou uživatelům k dispozici pro soukromé rozšíření.
Při hledání molekul operátory porovnání, jako je poplatek> -0,125
lze použít místo obvyklého znaménka rovná se. A !
předchozí skupina klíč / hodnota invertuje výsledek srovnání.
Celé molekuly nebo reakce mohou mít také atributy. Hranaté závorky se změní na pár <>
znamení.
Atomy
Cokoli, co začíná velkým písmenem, identifikuje atom v SLN. Vodíky se nepřidávají automaticky, ale jednoduché vazby s vodíkem lze pro organické sloučeniny zkrátit CH4
namísto C (H) (H) (H) H
pro metan. Autor tvrdí, že explicitní vodíky umožňují robustnější analýzu.
Atributy definované pro atomy zahrnují I = pro číslo hmotnosti izotopu, poplatek = za formální poplatek, poplatek za částečné nabití, s = pro stereochemii a rotace = pro radikály (singlet, dpodnájem, triplet ). Formální obvinění z poplatek = 2
lze zkrátit na +2
, a naopak pro záporné poplatky; -
a +
je navíc uznán jako poplatek 1 nebo +1. *
je zkratka pro spin = d
. Stereochemie na atomech je většinou čtyřboká, přičemž R / S a D / L jsou k dispozici mimo jiné; může to být explicitní (E) nebo relativní (R), nebo specifikovat směs (M) stereoizomerů na tomto atomu. A Normal /Jáobrácená notace, ekvivalent k @@
a @
v SMILES, je k dispozici. Pro vyhledávání je k dispozici spousta dalších atributů.
Kromě elementárních atomů podporuje SLN specifikaci atomů divoké karty: Libovolný (odpovídá libovolnému atomu) a Hev (odpovídá libovolnému těžkému atomu). Má také rozsáhlou Markushova syntaxe pro specifikaci kombinatorických knihoven a dotazů RGROUP. SLN má několik typů atomů dotazu pro shodu skupin atomů. Každý typ má název skupiny, následovaný volitelným kladným celým číslem.
Skupina | Popis |
---|---|
R | Používá se k přizpůsobení postranního řetězu. Odpovídající atomy nesmí mít žádné spojení s jádrem |
X | Používá se k přizpůsobení postranních řetězů a kroužků. Atomy odpovídající skupině X se mohou shodovat s postranními řetězy a prsteny |
Rx | Odpovídá postranním řetězům a prstenům, uzávěr kroužku musí odpovídat druhé skupině Rx |
„0
"hromadné číslo označuje obvyklý izotop, N [I = 0]
rovná se N [I = 14]
vhodný 14N a N [! I = 0]
odpovídající všem ostatním izotopům.
Vazby
SLN používá do značné míry stejnou spojovací notaci jako SMILES, s -
, =
, #
, a :
pro jednoduché, dvojné, trojné a aromatické vazby. .
se používá pro vazby nultého řádu, podobně jako reakce SMILES, i když a +
je preferován pro odlišné molekuly.
Většina jednoduchých dluhopisů je implicitní CH3CH3
() lze použít místo CH3-CH3
() pro etan. Výslovné jednoduché vazby jsou užitečné pro dluhopisy se třemi středy.
The s =
atribut je definován pro dvojné vazby, k přenosu stereochemických informací v E / Z nebo Cje/trans notace. N / I je k dispozici a znamená, že „hlavní“ řetězec je navzájem trans nebo cis.
Prsteny
SLN zapisuje kruhy explicitnějším způsobem než SMILES, přičemž benzen je specifikován jako C [1] H: CH: CH: CH: CH: CH: @ 1
. Atom je označen jako kotva na prstenci s jediným číselným atributem a @1
pak lze použít k určení tohoto (v našem případě „číslo jedna“) atomu pro vazbu zpět na.
Větvení
Pobočky SLN jsou totožné s větvemi SMILES, jejichž závorky je specifikují. Kyselina propionová je CH3CH2C (= O) OH
().
Reakce
SLN podporuje reakce s ->
připojení reaktantů a produktů. Mapování atomů je možné pomocí [#počet]
atributy. Atribut reakčního centra (rc) lze přidat do vazeb a atribut chirální konverze (cc) na atomy.
Různé
Více řádků lze sloučit do syntatického řádku psaním a (zpětné lomítko) na konci každého řádku. To umožňuje rozbití dlouhé linie na více linií, například při reakci s každou molekulou na její vlastní linii.
Viz také
- Zjednodušená specifikace vstupu do molekulární vstupní linky (SMILES notace)
- Usměje se na libovolnou specifikaci cíle (SMARTS notace)
Reference
- Ash, Sheila; Cline, Malcolm A .; Homer, R. Webster; Hurst, Tad; Smith, Gregory B. (1997). "Lineární notace SYBYL (SLN): Univerzální jazyk pro reprezentaci chemických struktur". J. Chem. Inf. Comput. Sci. 37: 71–79. doi:10.1021 / ci960109j.
- Homer, R. Webster; Swanson, Jon; Jilek, Robert J .; Hurst, Tad; Clark, Robert D. (2008). „SYBYL Line Notation (SLN): A Single Notation to represent Chemical Structures, Queries, Reactions, and Virtual Libraries“. J. Chem. Inf. Comput. Sci. 48: 2294–2307. doi:10.1021 / ci7004687.