Vkládání věty - Sentence embedding

Vkládání věty je souhrnný název pro řadu technik v zpracování přirozeného jazyka (NLP), na které jsou věty mapovány vektory z reálná čísla^[1]^[2]^[3]^[4]^[5]^[6]^[7]^[8].

aplikace

Vkládání věty používá hluboké učení softwarové knihovny PyTorch^[9] a TensorFlow^[10]

Hodnocení

Způsobem testování kódování vět je jejich použití v korpusu Věty zahrnující kompoziční znalosti (SICK)^[11]jak pro zapojení (SICK-E), tak pro příbuznost (SICK-R).

v ^[12] nejlepších výsledků se dosáhne pomocí a Síť BiLSTM vyškoleni na Korpus Stanfordského přirozeného jazyka (SNLI). The Pearsonův korelační koeficient pro SICK-R je 0,885 a výsledek pro SICK-E je 86,3. Mírné zlepšení oproti předchozím výsledkům je uvedeno v ^[13]: SICK-R: 0,888 a SICK-E: 87,8 pomocí zřetězení obousměrně Vratná rekurentní jednotka.

Viz také

externí odkazy

Scholia má téma profil pro Q29043221.

Vkládání vět InferSent a tréninkový kód

Výuka Reprezentace distribuované věty pro všeobecné účely prostřednictvím rozsáhlého víceúčelového učení

Reference

^ Shrnutí příspěvku: Hodnocení vkládání vět do následných a lingvistických úloh sondování
^ Oren Barkan, Noam Razin, Itzik Malkiel, Ori Katz, Avi Caciularu, Noam Koenigstein. "Škálovatelné pozorné modelování věty-dvojice pomocí vkládání destilované věty". AAAI 2020; arxiv: 1908.05161.
^ Aktuálně nejlepší univerzální vkládání slov a vkládání vět
^ Daniel Cer, Yinfei Yang, Sheng-yi Kong, Nan Hua, Nicole Limtiaco, Rhomni St. John, Noah Constant, Mario Guajardo-Cespedes, Steve Yuan, Chris Tar, Yun-Hsuan Sung, Brian Strope: „Universal Sentence Encoder“, 2018; arXiv: 1803.11175.
^ Ledell Wu, Adam Fisch, Sumit Chopra, Keith Adams, Antoine Bordes: „StarSpace: Embed All The Things!“, 2017; arXiv: 1709.03856.
^ Sanjeev Arora, Yingyu Liang a Tengyu Ma. „Jednoduchý, ale obtížný základ pro vkládání vět.“, 2016; openreview: SyK00v5xx.
^ Mircea Trifan, Bogdan Ionescu, Cristian Gadea a Dan Ionescu. "Metoda zpracování digitálního signálu grafu pro sémantickou analýzu." In Applied Computational Intelligence and Informatics (SACI), 2015 IEEE 10. Jubilee International Symposium on, pp. 187-192. IEEE, 2015; ieee: 7208196.
^ Pierpaolo Basile, Annalina Caputo a Giovanni Semeraro. „Studie kompoziční sémantiky slov v distribučních prostorech.“ In Semantic Computing (ICSC), 2012 IEEE Sixth International Conference on, str. 154-161. IEEE, 2012; tj. 6337099 .
^ Microsoft. "vložení destilované věty".
^ Google. "univerzální kodér vět". Hub TensorFlow. Citováno 6. října 2018.
^ Marco Marelli, Stefano Menini, Marco Baroni, Luisa Bentivogli, Raffaella Bernardi a Roberto Zamparelli. „Léčba SICK pro hodnocení kompozičních distribučních sémantických modelů.“ V LREC, s. 216-223. 2014 [1].
^ Alexis Conneau, Douwe Kiela, Holger Schwenk, Loic Barrault: „Supervised Learning of Universal Sentence Reprezentations from Natural Language Inference Data“, 2017; arXiv: 1705,02364.
^ Sandeep Subramanian, Adam Trischler, Yoshua Bengio: „Learning General Purpose Distributed Sentence Reprezentations via Large Scale Multi-task Learning“, 2018; arXiv: 1804 00079.

[1] Shrnutí příspěvku: Hodnocení vkládání vět do následných a lingvistických úloh sondování

[2] Oren Barkan, Noam Razin, Itzik Malkiel, Ori Katz, Avi Caciularu, Noam Koenigstein. "Škálovatelné pozorné modelování věty-dvojice pomocí vkládání destilované věty". AAAI 2020; arxiv: 1908.05161.

[3] Aktuálně nejlepší univerzální vkládání slov a vkládání vět

[4] Daniel Cer, Yinfei Yang, Sheng-yi Kong, Nan Hua, Nicole Limtiaco, Rhomni St. John, Noah Constant, Mario Guajardo-Cespedes, Steve Yuan, Chris Tar, Yun-Hsuan Sung, Brian Strope: „Universal Sentence Encoder“, 2018; arXiv: 1803.11175.

[5] Ledell Wu, Adam Fisch, Sumit Chopra, Keith Adams, Antoine Bordes: „StarSpace: Embed All The Things!“, 2017; arXiv: 1709.03856.

[6] Sanjeev Arora, Yingyu Liang a Tengyu Ma. „Jednoduchý, ale obtížný základ pro vkládání vět.“, 2016; openreview: SyK00v5xx.

[7] Mircea Trifan, Bogdan Ionescu, Cristian Gadea a Dan Ionescu. "Metoda zpracování digitálního signálu grafu pro sémantickou analýzu." In Applied Computational Intelligence and Informatics (SACI), 2015 IEEE 10. Jubilee International Symposium on, pp. 187-192. IEEE, 2015; ieee: 7208196.

[8] Pierpaolo Basile, Annalina Caputo a Giovanni Semeraro. „Studie kompoziční sémantiky slov v distribučních prostorech.“ In Semantic Computing (ICSC), 2012 IEEE Sixth International Conference on, str. 154-161. IEEE, 2012; tj. 6337099 .

[9] Microsoft. "vložení destilované věty".

[10] Google. "univerzální kodér vět". Hub TensorFlow. Citováno 6. října 2018.

[11] Marco Marelli, Stefano Menini, Marco Baroni, Luisa Bentivogli, Raffaella Bernardi a Roberto Zamparelli. „Léčba SICK pro hodnocení kompozičních distribučních sémantických modelů.“ V LREC, s. 216-223. 2014 [1].

[12] Alexis Conneau, Douwe Kiela, Holger Schwenk, Loic Barrault: „Supervised Learning of Universal Sentence Reprezentations from Natural Language Inference Data“, 2017; arXiv: 1705,02364.

[13] Sandeep Subramanian, Adam Trischler, Yoshua Bengio: „Learning General Purpose Distributed Sentence Reprezentations via Large Scale Multi-task Learning“, 2018; arXiv: 1804 00079.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]