Laboratoř lékařské inteligence a jazykového inženýrství - Medical intelligence and language engineering lab

The Laboratoř lékařské inteligence a jazykového inženýrství, také známý jako MILE laboratoř, je výzkumná laboratoř na Indian Institute of Science, Bangalore pod katedrou elektrotechniky. Laboratoř je známá svou prací na Zpracování obrazu online rozpoznávání rukopisu, Text na řeč a Optické rozpoznávání znaků[1] systémy, z nichž všechny jsou zaměřeny hlavně na dokumenty a mluvený projev v Indické jazyky.[2] Laboratoř vede A. G. Ramakrishnan.[3]

Zaměření výzkumu

Jedním ze závazků laboratoře MILE je vývoj technologie pro lidi s zrakové postižení využít znalosti z jakéhokoli dostupného tištěného materiálu v indických jazycích.[4] Laboratoř pracuje na dosažení tohoto cíle. Jeho práce dosud zahrnovala: mozaika dokumentů barevných snímků pořízených fotoaparátem; extrakce textu ze složitých barevných obrázků, včetně snímků pořízených fotoaparátem; analýza rozložení dokumentu; detekce zlomených a sloučených znaků; Technologie OCR pro tamilštinu a kannadštinu;[5] převod textu na řeč v Tamil a Kannadština [6] ; úprava výšky tónu pomocí diskrétní kosinová transformace ve zdrojové doméně;[7] Automatizovaný část mluvy značkování; predikce frází a modelování prozodie.

Mozhi Vallan, Tamil OCR[8] Produkt vyvinutý společností MILE Lab je používán společnostmi Worth Trust a Karna Vidya Technology Center v Chennai[9] pro převod tištěných školních a vysokoškolských knih do Braillovo písmo formát. Sri Ramakrishna Math, Chennai[10] používá jej k převodu tištěných filosofických knih v tamilštině na počítačově čitelný text. Lipi Gnani, kannadský OCR vyvinutý společností MILE Lab, je používán Braillovým přepisovacím centrem Mitrajyothi[11] a Canara Bank Relief & Welfare Society,[12] Bangalore pro podobné účely. Také Thirukkural,[13] Tamil TTS Systém[14] vyvinutý MILE Lab je používán některými učiteli školy v Singapuru pro úkoly. Madhura, kannadský TTS[15] vyvinutý laboratoří, je používán dvěma nevidomými studenty, integrovaný s a čtečka obrazovky, číst nahlas text OCR'ed s Lipi Gnani z kanadských knih. V současné době laboratoř zkoumá strojový poslech[16] a byla navržena nová dočasná funkce pojmenovaná jako plosion index, která se ukázala jako extrémně účinná při detekci přechodů uzávěrky zastavit souhlásky a afrikáty z nepřetržité řeči, dokonce i v hluk.[17] Další navrhovanou funkcí je DCTILPR,[18] což je vektor funkcí založený na zdroji hlasu, který zlepšuje výkon rozpoznávání a identifikace reproduktoru Systém.

V počátcích byla provedena významná práce ve zpracování lékařských signálů a obrazů. Byl navržen jedinečný algoritmus EKG komprese ošetřením každého srdeční cyklus jako vektor a použití lineární predikce na diskrétní vlnková transformace tohoto vektoru, po jeho normalizaci doba pomocí víceúrovňového zpracování založeného interpolace.[19] Zralost plodu plíce bylo předpovězeno pomocí textura obrazu funkce získané z játra a plicní oblasti ultrazvuk obrázky získané z těhotná žena[20] Byla navržena účinná technika bezztrátová komprese 3D obrazy magnetické rezonance z mozek. Každý MRI řez byl reprezentován jednotnou nebo adaptivní sítí; afinní transformace byl použit mezi odpovídajícími prvky sítě sousedních řezů a založen na kontextu entropické kódování, na zbytcích.[21]

Reference

  1. ^ „MILE Lab at IISc: Developing technologies to allow the specifically abled“.
  2. ^ MILE Lab. "MILE Lab ve zprávách". Citováno 28. dubna 2013.
  3. ^ MILE Lab. "Lidé". Archivovány od originál dne 3. září 2014. Citováno 28. dubna 2013.
  4. ^ „Chůze navíc MILE pro speciálně zvládnuté - Bangalore Mirror“.
  5. ^ Pati, Peeta Basa; Ramakrishnan, A.G. (2008). Msgstr "Identifikace více skriptů na úrovni slov". Písmena pro rozpoznávání vzorů. 29 (9): 1218–1229. doi:10.1016 / j.patrec.2008.01.027.
  6. ^ „Shiva Kumar H R, Ashwini J K, Rajaram B S R and A G Ramakrishnan,“ MILE TTS pro tamilštinu a kannadštinu pro blizzard challenge 2013, „Proc. Blizzard Challenge Workshop, Barcelona, ​​Španělsko, 3. září 2013“ (PDF).
  7. ^ Msgstr "Změna synchronní výšky tónu". Řečová komunikace. 42: 143–154. doi:10.1016 / j.specom.2003.05.001.
  8. ^ Subramanian, Karthik (17. ledna 2014). „Article in The Hindu on MILE Lab Tamil OCR“. Hind.
  9. ^ „Technologické centrum Karna Vidya, Guindy, Chennai“.
  10. ^ „Sri Ramakrishna Math, Chennai“.
  11. ^ „Středisko pro psaní Braillova písma v Mitrajyothi, Bangalore“. Archivovány od originál dne 3. února 2011.
  12. ^ „Braille Transcription Center, Canara Bank Relief & Welfare Society, Bangalore“.
  13. ^ Jayavardhana Rama, G.L .; Ramakrishnan, A.G .; Muralishankar, R .; Prathibha, R. (2002). „Kompletní systém syntézy textu na řeč v tamilštině“ (PDF). Proceedings of 2002 IEEE Workshop on Speech Synthesis, 2002. 191–194. doi:10.1109 / WSS.2002.1224406. ISBN  0-7803-7395-2. S2CID  13870581.
  14. ^ „Blogujte v tamilštině Manam na tamilské TTS thirukkural“.
  15. ^ „Deccan Herald: IISc vyvíjí software pro převod textu na řeč pro kannadštinu, tamilštinu“. 26. června 2010.
  16. ^ „Zaměření výzkumu MILE Lab“.
  17. ^ Ananthapadmanabha, T. V .; Prathosh, A. P .; Ramakrishnan, A. G. (2014). "Plosion index, dočasná funkce pro detekci výbuchů v zastávkách a afrikátech". The Journal of the Acoustical Society of America. 135 (1): 460–71. doi:10.1121/1.4836055. PMID  24437786.
  18. ^ Ramakrishnan, A. G .; Abhiram, B .; Prasanna, S.R. (2015). „A G Ramakrishnan, B Abhiram a S R Mahadeva Prasanna,„ Charakterizace zdroje hlasu pomocí synchronní diskrétní kosinové transformace výšky tónu pro identifikaci reproduktoru, “Journal of the Acoustical Society of America Express Letters, sv. 137 (), str., 2015“. The Journal of the Acoustical Society of America. 137 (6): EL469-75. doi:10.1121/1.4921679. PMID  26093457.
  19. ^ Ramakrishnan, A. G .; Saha, S. (1997). "Srdeční cyklus synchronizovaná komprese EKG" (PDF). Transakce IEEE na biomedicínském inženýrství. 44 (12): 1253–61. doi:10.1109/10.649997. PMID  9401225. S2CID  8834327.
  20. ^ Prakash, K. N .; Ramakrishnan, A. G .; Suresh, S .; Chow, T. W. (2002). "Predikce zralosti plic plodu z funkcí ultrazvukového obrazu" (PDF). Transakce IEEE o informačních technologiích v biomedicíně. 6 (1): 38–45. doi:10.1109/4233.992160. PMID  11936595. S2CID  14662967.
  21. ^ Srikanth, R .; Ramakrishnan, A. G. (2005). „3D mozková MRI komprese pomocí adaptivního síťování a kontextového kódování“ (PDF). Transakce IEEE na lékařském zobrazování. 24 (9): 1199–206. doi:10.1109 / TMI.2005.853638. PMID  16156357. S2CID  7523030.

externí odkazy