Seznam softwaru pro rozpoznávání řeči - List of speech recognition software - Wikipedia
Rozpoznávání řeči software je k dispozici pro mnoho výpočetní platformy, operační systémy, používat modely a softwarové licence. Zde je seznam takových, seskupených různými užitečnými způsoby.
Akustické modely a řečový korpus (kompilace)
Následující seznam představuje pozoruhodné rozpoznávání řeči softwarové enginy se stručným shrnutím charakteristik.
Název aplikace | Popis | Otevřený zdroj | Licence | Operační systém | Programovací jazyk | Podporovaný jazyk, poznámka | Offline nebo online |
---|---|---|---|---|---|---|---|
CMU Sfinga | HMM | Ano | BSD styl | Cross-platform | Jáva | Angličtina, němčina, francouzština, mandarínština, ruština | Offline |
HTK | HMM neurální síť | Ne | HTK specifické | Cross-platform | C | Angličtina; verze 3.5 vydaná v prosinci 2015 | |
Julius | HMM trigramy | Ano | BSD styl, nekomerční | Cross-platform | C | Japonština, angličtina; [2] | Offline |
Kaldi | Neuronová síť | Ano | Apache | Cross-platform | C ++ | Angličtina | |
RWTH ASR | RWTH Aachen University | Ne | RWTH ASR, pouze pro nekomerční použití | Linux, Operační Systém Mac | C ++ | Angličtina |
Macintosh
Název aplikace | Popis | Otevřený zdroj | Licence | Cena | Poznámka |
---|---|---|---|---|---|
Dragon pro Mac (ukončeno 2018) | Operační Systém Mac; podle Nuance | Ne | Proprietární | ||
Dragon Dictate (ukončeno) | Operační Systém Mac; podle Nuance | Ne | Proprietární | ||
MacSpeech Scribe (ukončeno) | Přepis ze zaznamenaného textu; získané společností Nuance | ||||
poslouchám (ukončeno) | PowerPC Macintosh; ukončeno společností MacSpeech; získané společností Nuance | ||||
Mluvitelné předměty | Zahrnuto v systému macOS | ||||
ViaVoice (ukončeno) | Produkt IBM; získané společností Nuance | ||||
Hlasový navigátor | Originál GUI hlasová kontrola; 1989 |
Cross-platformní webové aplikace
Temi.com
Ebby.co
Sonix.ai
Simonsays.ai
Cross-platformní webové aplikace založené na prohlížeči Chrome
Následující seznam představuje pozoruhodný software pro rozpoznávání řeči, který funguje v prohlížeči Chrome jako webové aplikace. Využívají HTML5 Web-Speech-API.[1]
Název aplikace | Popis | Otevřený zdroj | Licence | Cena | Poznámka |
---|---|---|---|---|---|
Speechmatics[2] | Cloudové a lokální automatické rozpoznávání řeči | Ne | Proprietární | Od 0,06 GBP za minutu zvuku |
Mobilní zařízení a smartphony
Mnoho mobilní telefon sluchátka včetně běžné telefony a chytré telefony jako iPhony a BlackBerry, mají zabudované základní funkce vytáčeného hlasu. Mnoho aplikací třetích stran implementovalo podporu rozpoznávání řeči v přirozeném jazyce, včetně:
Název aplikace | Popis | Otevřený zdroj | Licence | Cena | Poznámka |
---|---|---|---|---|---|
Assistant.ai | Asistent pro Android, iOS a Windows Phone | Ne | Proprietární, freeware | Volný, uvolnit | Přerušeno |
Dračí diktát | Ne | Proprietární, freeware | Volný, uvolnit | ||
Chytré karty Google | Hlasové vyhledávání Android | Ne | Proprietární, freeware | Volný, uvolnit | |
Hlasové vyhledávání Google | Ne | Proprietární, freeware | Volný, uvolnit | ||
Microsoft Cortana | Hlasové vyhledávání Microsoft | Ne | Proprietární, freeware | Volný, uvolnit | |
Siri osobní asistent | Virtuální osobní asistent společnosti Apple | Ne | Proprietární, freeware | Volný, uvolnit | |
Alexa - Amazon Echo | Amazonův osobní asistent | Ne | Proprietární | ||
SILVIA | Android a iOS | Ne | |||
Vlingo |
Okna
Integrované rozpoznávání řeči ve Windows
The Rozpoznávání řeči systému Windows verze 8.0 od Microsoft je zabudován Windows Vista, Windows 7, Windows 8 a Windows 10 Rozpoznávání řeči je k dispozici pouze v angličtině, francouzštině, španělštině, němčině, japonštině, zjednodušené čínštině a tradiční čínštině a pouze v odpovídající verzi systému Windows; což znamená, že nemůžete použít modul pro rozpoznávání řeči v jednom jazyce, pokud používáte verzi systému Windows v jiném jazyce. Windows 7 Ultimate a Windows 8 Pro vám umožňují změnit jazyk systému a tím změnit, který modul řeči je k dispozici. Rozpoznávání řeči systému Windows se vyvinulo do Cortana (software), osobní asistent zahrnutý v Windows 10.
Doplňky pro rozpoznávání řeči v systému Windows 7
- Hlasový prst - software pro Windows Vista a Windows 7 který vylepšuje Rozpoznávání řeči Windows systému přidáním několika rozšíření k urychlení a vylepšení ovládání myší a klávesnicí.
Windows 7, 8, 10 rozpoznávání řeči třetích stran
- Braina - Diktujte software a webové stránky třetích stran,[3] vyplňte webové formuláře a proveďte hlasové příkazy.[4]
- Dragon NaturallySpeaking z Komunikace Nuance - Nástupce staršího DragonDictate produkt. Zaměřit se na diktát. 64bitová podpora Windows od verze 10.1.
- SpeechMagic – Komunikace Nuance získané Philips ve vlastnictví. Zaměření na lékařský průmysl podle Frost & Sullivan. Samostatné nebo vložené.[5]
- Tazti - Vytvořte profily hlasových příkazů pro hraní počítačových her a ovládání aplikací - programů. Vytvářejte hlasové příkazy pro otevírání souborů, složek, webových stránek, aplikací. Verze Windows 7, Windows 8 a Windows 8.1.[6]
Pouze Windows XP nebo 2000
- Microsoft Speech API - Funkce rozpoznávání řeči je součástí Microsoft Office a dále Tablet PC se systémem Microsoft Windows XP Tablet PC Edition. Lze jej také stáhnout jako součást Speech SDK 5.1 pro aplikace Windows, ale protože je zaměřen na vývojáře, kteří vytvářejí řečové aplikace, postrádá čistá forma SDK jakékoli uživatelské rozhraní, a proto je pro koncové uživatele nevhodná.
Integrovaný software
- Microsoft Kinect obsahuje integrovaný software, který umožňuje rozpoznávání řeči příkazů.
- Starší generace Nokia telefony jako Nokia N Series (před použitím Windows 7 mobilní technologie) používá rozpoznávání řeči se jmény ze seznamu kontaktů a několika příkazy.
- Siri, původně implementováno v iPhone 4S, Apple osobní asistent pro iOS, který využívá technologii od Komunikace Nuance.
- Cortana (software), Microsoft vestavěný osobní asistent Windows Phone a Windows 10.
Interaktivní hlasová odpověď
Následující jsou Interaktivní hlasová odpověď Systémy (IVR):
- Sada nástrojů CSLU
- Genesys[7]
- HTK - chráněno autorskými právy společnosti Microsoft, ale umožňuje změnu softwaru pro interní použití držitele licence
- LumenVox ASR
- Tellme Networks; získané Microsoft
Software pro přepis řeči x86 a x86-64 podobný unixu
Ukončený software
- IBM VoiceType (dříve IBM Personal Dictation System)
- IBM ViaVoice - Integrovaná verze stále udržována IBM.[10] U verzí nad Windows Vista již není podporováno.[11] Netestováno nad macOS 10.4 nebo na počítačích Macintosh s čipovou sadou Intel.[12]
- Quack.com; získané AOL; název byl nyní znovu použit pro vyhledávací aplikaci pro iPad.
- SpeechWorks z Komunikace Nuance.
- Yap Speech Cloud - Platforma pro převod řeči na text, kterou získal Amazon.com.
Viz také
Reference
- ^ „Specifikace rozhraní Web Speech API“. dvcs.w3.org. Archivováno od originálu dne 2016-06-21.
- ^ Orlowski, Andrew. „Totální uznání: Britská AI přináší průlom v univerzální řeči“. Registrace. Publikování situace. Citováno 17. května 2018.
- ^ „Software pro rozpoznávání řeči pro Windows PC - Braina“. www.brainasoft.com. Archivováno z původního dne 2015-04-07.
- ^ „Dynamic Faceting-List of most 57 Speech Recognition SWs and Web Services“. Archivováno z původního 13. února 2019. Citováno 23. února 2019.
- ^ „Společnost Philips SpeechMagic byla společností Frost & Sullivan jmenována evropským technologickým lídrem“. www.frost.com. Archivováno od původního dne 2008-04-15.
- ^ O'Neill, Mark (06.11.2013). „Ovládejte svůj počítač pomocí těchto 5 programů rozpoznávání řeči“. PC svět. Archivováno od originálu dne 2014-01-01. Citováno 2013-12-30.
- ^ "Interaktivní hlasová odpověď". Genesys. Archivováno od originálu dne 2016-10-14.
- ^ [1][mrtvý odkaz ]
- ^ Lavie, A .; Waibel, A .; Levin, L .; Finke, M .; Gates, D .; Gavalda, M .; Zeppenfeld, T .; Zhan, Puming (1. dubna 1997). „Janus-III: překlad řeči do řeči ve více jazycích“. 1997 Mezinárodní konference IEEE o akustice, řeči a zpracování signálu. IEEE Xplore. 1. 99–102. CiteSeerX 10.1.1.36.6967. doi:10.1109 / ICASSP.1997.599557. ISBN 978-0-8186-7919-3.
- ^ „Archivovaná kopie“. Archivováno od originálu 2010-08-08. Citováno 2010-06-29.CS1 maint: archivovaná kopie jako titul (odkaz)
- ^ „Podpora produktů Nuance pro Microsoft Windows 7“. Nuance Communications, zákaznická pomoc. Citováno 2019-03-16.
- ^ „ViaVoice pro Mac OS X na čipové sadě Intel“. Nuance Communications, zákaznická pomoc. Citováno 2019-03-16.