Specifikace slovníku výslovnosti - Pronunciation Lexicon Specification
The Specifikace slovníku výslovnosti (PLS) je a W3C Doporučení, jehož cílem je umožnit interoperabilní specifikaci informací o výslovnosti pro oba rozpoznávání řeči a syntéza řeči motory v aplikacích pro procházení hlasem. Tento jazyk má vývojáři snadno používat a zároveň podporovat přesnou specifikaci informací o výslovnosti pro mezinárodní použití.
Jazyk umožňuje zadat jednu nebo více výslovností slova nebo fráze pomocí standardní abecedy výslovnosti nebo v případě potřeby pomocí abeced specifických pro dodavatele. Výslovnosti jsou seskupeny do dokumentu PLS, na který lze odkazovat z jiných značkovacích jazyků, jako je Speech Recognition Grammar Specification SRGS a značkovací jazyk řeči SSML.
Používání
Zde je příklad dokumentu PLS:
<?xml version="1.0" encoding="UTF-8"?> verze ="1.0" xmlns =„http://www.w3.org/2005/01/pronunciation-lexicon“ xmlns: xsi =„http://www.w3.org/2001/XMLSchema-instance“ xsi: schemaLocation =„http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd " abeceda =„ipa“ xml: lang =„en-US“> <lexeme> <grapheme>rozsudek</grapheme> <grapheme>rozsudek</grapheme> <phoneme>ˈDʒʌdʒ.mənt</phoneme> "Ʒʌdʒʌdʒ.mənt" -> </lexeme> <lexeme> <grapheme>snoubenec</grapheme> <grapheme>snoubenec</grapheme> <phoneme>fis.ns.eɪ</phoneme> "fiˈɒns.eɪ" -> <phoneme>ˌFiː.ɑːnˈseɪ</phoneme> „ːFiː.ɑːnˈseɪ“ -> </lexeme> </lexicon>
které by mohly být použity ke zlepšení TTS jak je znázorněno v následujícím textu SSML 1.0 dokument:
<?xml version="1.0" encoding="UTF-8"?> verze ="1.0" xmlns =„http://www.w3.org/2001/10/synthesis“ xmlns: xsi =„http://www.w3.org/2001/XMLSchema-instance“ xsi: schemaLocation =„http://www.w3.org/2001/10/synthesis http://www.w3.org/TR/speech-synthesis/synthesis.xsd " xml: lang =„en-US“> uri =„http://www.example.org/lexicon_defined_above.xml“/> <p> Podle úsudku mého snoubence je Las Vegas nejlepším místem pro líbánky. Odpověděl jsem, že dávám přednost Benátkám, a nemyslel jsem si, že benátské kasino je přijatelným kompromisem.</p> </speak>
ale také zlepšit ASR v následujícím SRGS 1.0 gramatika:
<?xml version="1.0" encoding="UTF-8"?> verze ="1.0" xmlns =„http://www.w3.org/2001/06/grammar“ xmlns: xsi =„http://www.w3.org/2001/XMLSchema-instance“ xsi: schemaLocation =„http://www.w3.org/2001/06/grammar http://www.w3.org/TR/speech-grammar/grammar.xsd " xml: lang =„en-US“ root ="filmy" režim ="hlas"> uri =„http://www.example.org/lexicon_defined_above.xml“/> id ="filmy" rozsah ="veřejnost"> <one-of> <item>Terminátor 2: Soudný den</item> <item>My Big Fat Obnoxious Fiance</item> <item>Soudný den Pluta</item> </one-of> </rule> </grammar>
Běžné případy použití
Více výslovností pro stejný pravopis
Pro ASR systémy se běžně spoléhají na více výslovností stejného slova nebo fráze, aby zvládly variace výslovnosti v určitém jazyce. V jazyce Lexicon výslovnosti je více výslovností reprezentováno více než jedním prvkem
V následujícím příkladu má slovo „Newton“ dvě možné výslovnosti.
<?xml version="1.0" encoding="UTF-8"?> verze ="1.0" xmlns =„http://www.w3.org/2005/01/pronunciation-lexicon“ xmlns: xsi =„http://www.w3.org/2001/XMLSchema-instance“ xsi: schemaLocation =„http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd " abeceda =„ipa“ xml: lang ="en-GB"> <lexeme> <grapheme>Newton</grapheme> <phoneme>Jnjuːtən</phoneme> <!-- IPA string is: "ˈnjuːtən" --> <phoneme>ˈNuːtən</phoneme> <!-- IPA string is: "ˈnuːtən" --> </lexeme> </lexicon>
Několik pravopisů
V některých situacích existují alternativní textová znázornění stejného slova nebo fráze. K tomu může dojít z řady důvodů. Podrobnosti najdete v části 4.5 PLS. Protože se jedná o reprezentace, které mají stejný význam (na rozdíl od homofonů), doporučuje se, aby byly reprezentovány pomocí jediného prvku
Zde jsou dva jednoduché příklady několika pravopisů: alternativní hláskování anglického slova a několik zápisů japonského slova.
<?xml version="1.0" encoding="UTF-8"?> verze ="1.0" xmlns =„http://www.w3.org/2005/01/pronunciation-lexicon“ xmlns: xsi =„http://www.w3.org/2001/XMLSchema-instance“ xsi: schemaLocation =„http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd " abeceda =„ipa“ xml: lang =„en-US“> <!-- English entry showing how alternative spellings are handled --> <lexeme> <grapheme>barva</grapheme> <grapheme>barva</grapheme> <phoneme>ˈKʌlər</phoneme> <!-- IPA string is: "ˈkʌlər" --> </lexeme> </lexicon> <?xml version="1.0" encoding="UTF-8"?> verze ="1.0" xmlns =„http://www.w3.org/2005/01/pronunciation-lexicon“ xmlns: xsi =„http://www.w3.org/2001/XMLSchema-instance“ xsi: schemaLocation =„http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd " abeceda =„ipa“ xml: lang =„jp“> pravopisy romaji, kanji a hiragana -> <lexeme> <grapheme>nihongo</grapheme> <grapheme>日本語</grapheme> <grapheme>に ほ ん ご</grapheme> <phoneme>ɲihoŋɡo</phoneme> <!-- IPA string is: "ɲihoŋɡo" --> </lexeme> </lexicon>
Homofony
Většina jazyků má homofony, slova se stejnou výslovností, ale odlišným významem (a případně odlišným hláskováním), například „seed“ a „cede“. Doporučuje se, aby byly reprezentovány jako různé lexémy.
<?xml version="1.0" encoding="UTF-8"?> verze ="1.0" xmlns =„http://www.w3.org/2005/01/pronunciation-lexicon“ xmlns: xsi =„http://www.w3.org/2001/XMLSchema-instance“ xsi: schemaLocation =„http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd " abeceda =„ipa“ xml: lang =„en-US“> <lexeme> <grapheme>postoupit</grapheme> <phoneme>siːd</phoneme> <!-- IPA string is: "siːd" --> </lexeme> <lexeme> <grapheme>semínko</grapheme> <phoneme>siːd</phoneme> <!-- IPA string is: "siːd" --> </lexeme> </lexicon>
Homografie
Většina jazyků má slova s různým významem, ale stejným hláskováním (a někdy i jinou výslovností) homografie. Například v angličtině mají slova basa (ryby) a slovo basa (v hudbě) shodná hláskování, ale různé významy a výslovnosti. Ačkoli se doporučuje, aby tato slova byla reprezentována pomocí samostatných prvků
V tomto příkladu jsou uvedeny výslovnosti homografu „bas“.
<?xml version="1.0" encoding="UTF-8"?> verze ="1.0" xmlns =„http://www.w3.org/2005/01/pronunciation-lexicon“ xmlns: xsi =„http://www.w3.org/2001/XMLSchema-instance“ xsi: schemaLocation =„http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd " abeceda =„ipa“ xml: lang =„en-US“> <lexeme> <grapheme>bas</grapheme> <phoneme>bæs</phoneme> <!-- IPA string is: bæs --> <phoneme>být</phoneme> <!-- IPA string is: beɪs --> </lexeme> </lexicon>
Všimněte si, že angličtina obsahuje řadu příkladů dvojic podstatných sloves, která lze považovat za homografie nebo jako alternativní výslovnosti, v závislosti na preferencích autora. Dva příklady jsou podstatné jméno / sloveso „odmítnout“ a podstatné jméno / sloveso „adresa“.
<?xml version="1.0" encoding="UTF-8"?> verze ="1.0" xmlns =„http://www.w3.org/2005/01/pronunciation-lexicon“ xmlns: xsi =„http://www.w3.org/2001/XMLSchema-instance“ xsi: schemaLocation =„http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd " xmlns: mypos =„http://www.example.org/my_pos_namespace“ abeceda =„ipa“ xml: lang =„en-US“> role ="mypos: sloveso"> <grapheme>odmítnout</grapheme> <phoneme>rɪˈfjuːz</phoneme> <!-- IPA string is: "rɪˈfjuːz" --> </lexeme> role ="mypos: podstatné jméno"> <grapheme>odmítnout</grapheme> <phoneme>ˈRɛfjuːs</phoneme> <!-- IPA string is: "ˈrɛfjuːs" --> </lexeme> </lexicon>
Výslovnost pravopisem
U některých slov a frází lze výslovnost vyslovit rychle a pohodlně jako posloupnost jiných pravopisy. Vývojář nemusí mít jazykové znalosti, ale místo toho využívá výslovnosti u nichž se již očekává, že budou k dispozici. K vyjádření výslovnosti pomocí jiných pravopisů lze použít prvek
Tato funkce může být velmi užitečná při řešení zkratek.
<?xml version="1.0" encoding="UTF-8"?> verze ="1.0" xmlns =„http://www.w3.org/2005/01/pronunciation-lexicon“ xmlns: xsi =„http://www.w3.org/2001/XMLSchema-instance“ xsi: schemaLocation =„http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd " abeceda =„ipa“ xml: lang =„en-US“> <!-- Rozšíření zkratek --> <lexeme> <grapheme>W3C</grapheme> <alias>World Wide Web Consortium</alias> </lexeme> <!-- číselné vyjádření --> <lexeme> <grapheme>101</grapheme> <alias>sto jedna</alias> </lexeme> <!-- hrubý mechanismus výslovnosti --> <lexeme> <grapheme>Thajsko</grapheme> <alias>svázat zemi</alias> </lexeme> <!-- mechanismus hrubé výslovnosti a rozšiřování zkratek --> <lexeme> <grapheme>BBC 1</grapheme> <alias>buď mořská</alias> </lexeme> </lexicon>
Stav a budoucnost
- PLS 1.0 dosáhl stavu doporučení W3C dne 14. října 2008.