Latentní sémantická struktura indexování - Latent semantic structure indexing - Wikipedia
Latentní sémantická struktura indexování (LaSSI) je technika pro výpočet chemické podobnosti odvozená z latentní sémantická analýza (LSA).
LaSSI byl vyvinut v Merck & Co. a patentováno v roce 2007[1] Richard Hull, Eugene Fluder, Suresh Singh, Robert Sheridan, Robert Nachbar a Simon Kearsley.
Přehled
LaSSI je podobný LSA v tom, že zahrnuje konstrukci matice výskytů z korpusu položek a aplikaci rozklad singulární hodnoty k této matici, abychom odvodili latentní rysy. Liší se tím, že matice výskytu představuje frekvenci dvoj- a trojrozměrných chemických deskriptorů (spíše než výrazů přirozeného jazyka) nalezených v chemická databáze chemických struktur. Tento proces odvozuje latentní koncepty chemické struktury, které lze použít k výpočtu chemických podobností a vztahy struktura-aktivita pro objev drog.
Reference
- Hull, R.D., Fluder, E.M., Singh, S.B., Nachbar, R.B., Sheridan, R.P. a Kearsley, S.K. (2001) „Latentní sémantická struktura indexování (LaSSI) pro definování chemické podobnosti.“ J Med Chem, 2001 12. dubna; 44 (8): 1177-84. doi:10.1021 / jm000393c
- Hull, R.D., Singh, S.B., Nachbar, R.B., Sheridan, R.P., Kearsley, S.K. a Fluder, E.M. (2001) „Hledání chemické podobnosti pomocí indexování latentní sémantické struktury (LaSSI) a srovnání s TOPOSIM.“ J Med Chem, 2001 12. dubna; 44 (8): 1185-91.
- Singh, S.B., Sheridan, R.P., Fluder, E.M. a Hull, R.D. (2001) „Těžba chemického lomu pomocí společných chemických sond: aplikace indexování latentní sémantické struktury (LaSSI) a TOPOSIM (kostky) na těžbu chemické databáze.“ J Med Chem, 2001 10. května; 44 (10): 1564–75.