Zápis linky SYBYL - SYBYL line notation

sybylová linka
Přípona názvu souboru
.sln
Typ formátuformát chemického souboru

The Zápis linky SYBYL nebo SLN je specifikace pro jednoznačný popis struktury chemikálie molekuly pomocí short ASCII struny. SLN se liší od ÚSMĚVY několika významnými způsoby. SLN může specifikovat molekuly, molekulární dotazy a reakce v jedné řádkové notaci, zatímco SMILES je zpracovává prostřednictvím jazykových rozšíření. SLN má podporu pro relativní stereochemie, může rozlišovat směsi enantiomery z čistých molekul s čistou, ale nevyřešenou stereochemií. V ÚSMĚVECH aromatičnost je považována za vlastnost atomů i vazeb, zatímco v SLN je to vlastnost vazeb.

Popis

Stejně jako SMILES je SLN lineární jazyk, který popisuje molekuly. To poskytuje velkou podobnost s SMILES navzdory mnoha rozdílům SLN od SMILES, a ve výsledku tento popis silně porovná SLN s SMILES a jeho rozšířeními.

Atributy

Atributy, závorky s dalšími daty, jako jsou [klíč1 = hodnota1, klíč2 ...], je základní funkcí SLN. Atributy lze aplikovat na atomy a vazby. Atributy, které nejsou oficiálně definovány, jsou uživatelům k dispozici pro soukromé rozšíření.

Při hledání molekul operátory porovnání, jako je poplatek> -0,125 lze použít místo obvyklého znaménka rovná se. A ! předchozí skupina klíč / hodnota invertuje výsledek srovnání.

Celé molekuly nebo reakce mohou mít také atributy. Hranaté závorky se změní na pár <> znamení.

Atomy

Cokoli, co začíná velkým písmenem, identifikuje atom v SLN. Vodíky se nepřidávají automaticky, ale jednoduché vazby s vodíkem lze pro organické sloučeniny zkrátit CH4 namísto C (H) (H) (H) H pro metan. Autor tvrdí, že explicitní vodíky umožňují robustnější analýzu.

Atributy definované pro atomy zahrnují I = pro číslo hmotnosti izotopu, poplatek = za formální poplatek, poplatek za částečné nabití, s = pro stereochemii a rotace = pro radikály (singlet, dpodnájem, triplet ). Formální obvinění z poplatek = 2 lze zkrátit na +2, a naopak pro záporné poplatky; - a + je navíc uznán jako poplatek 1 nebo +1. * je zkratka pro spin = d. Stereochemie na atomech je většinou čtyřboká, přičemž R / S a D / L jsou k dispozici mimo jiné; může to být explicitní (E) nebo relativní (R), nebo specifikovat směs (M) stereoizomerů na tomto atomu. A Normal /obrácená notace, ekvivalent k @@ a @ v SMILES, je k dispozici. Pro vyhledávání je k dispozici spousta dalších atributů.

Kromě elementárních atomů podporuje SLN specifikaci atomů divoké karty: Libovolný (odpovídá libovolnému atomu) a Hev (odpovídá libovolnému těžkému atomu). Má také rozsáhlou Markushova syntaxe pro specifikaci kombinatorických knihoven a dotazů RGROUP. SLN má několik typů atomů dotazu pro shodu skupin atomů. Každý typ má název skupiny, následovaný volitelným kladným celým číslem.

SkupinaPopis
RPoužívá se k přizpůsobení postranního řetězu. Odpovídající atomy nesmí mít žádné spojení s jádrem
XPoužívá se k přizpůsobení postranních řetězů a kroužků. Atomy odpovídající skupině X se mohou shodovat s postranními řetězy a prsteny
RxOdpovídá postranním řetězům a prstenům, uzávěr kroužku musí odpovídat druhé skupině Rx

0"hromadné číslo označuje obvyklý izotop, N [I = 0] rovná se N [I = 14] vhodný 14N a N [! I = 0] odpovídající všem ostatním izotopům.

Vazby

SLN používá do značné míry stejnou spojovací notaci jako SMILES, s -, =, #, a : pro jednoduché, dvojné, trojné a aromatické vazby. . se používá pro vazby nultého řádu, podobně jako reakce SMILES, i když a + je preferován pro odlišné molekuly.

Většina jednoduchých dluhopisů je implicitní CH3CH3() lze použít místo CH3-CH3() pro etan. Výslovné jednoduché vazby jsou užitečné pro dluhopisy se třemi středy.

The s = atribut je definován pro dvojné vazby, k přenosu stereochemických informací v E / Z nebo Cje/trans notace. N / I je k dispozici a znamená, že „hlavní“ řetězec je navzájem trans nebo cis.

Prsteny

SLN zapisuje kruhy explicitnějším způsobem než SMILES, přičemž benzen je specifikován jako C [1] H: CH: CH: CH: CH: CH: @ 1. Atom je označen jako kotva na prstenci s jediným číselným atributem a @1 pak lze použít k určení tohoto (v našem případě „číslo jedna“) atomu pro vazbu zpět na.

Větvení

Pobočky SLN jsou totožné s větvemi SMILES, jejichž závorky je specifikují. Kyselina propionová je CH3CH2C (= O) OH().

Reakce

SLN podporuje reakce s -> připojení reaktantů a produktů. Mapování atomů je možné pomocí [#počet] atributy. Atribut reakčního centra (rc) lze přidat do vazeb a atribut chirální konverze (cc) na atomy.

Různé

Více řádků lze sloučit do syntatického řádku psaním a (zpětné lomítko) na konci každého řádku. To umožňuje rozbití dlouhé linie na více linií, například při reakci s každou molekulou na její vlastní linii.

Viz také

Reference

  • Ash, Sheila; Cline, Malcolm A .; Homer, R. Webster; Hurst, Tad; Smith, Gregory B. (1997). "Lineární notace SYBYL (SLN): Univerzální jazyk pro reprezentaci chemických struktur". J. Chem. Inf. Comput. Sci. 37: 71–79. doi:10.1021 / ci960109j.
  • Homer, R. Webster; Swanson, Jon; Jilek, Robert J .; Hurst, Tad; Clark, Robert D. (2008). „SYBYL Line Notation (SLN): A Single Notation to represent Chemical Structures, Queries, Reactions, and Virtual Libraries“. J. Chem. Inf. Comput. Sci. 48: 2294–2307. doi:10.1021 / ci7004687.