Open Mind Common Sense - Open Mind Common Sense
Open Mind Common Sense (OMK) je umělá inteligence projekt založený na Massachusetts Institute of Technology (MIT) Media Lab jehož cílem je vybudovat a využít velké zdravá znalostní báze z příspěvků mnoha tisíců lidí na webu.
Od svého založení v roce 1999 shromáždila kromě znalostních základen v jiných jazycích více než milion anglických faktů od více než 15 000 přispěvatelů. Velká část softwaru OMCS je postavena na třech vzájemně propojených reprezentacích: korpus přirozeného jazyka, se kterým lidé přímo komunikují, sémantická síť postavená z tohoto korpusu zvaného ConceptNeta tzv. maticová reprezentace ConceptNet AnalogySpace které mohou odvodit nové znalosti pomocí redukce rozměrů.[1] Znalosti shromážděné Open Mind Common Sense umožnily výzkumné projekty na MIT i jinde.
Dějiny
Projekt byl duchovním dítětem společnosti Marvin Minsky, Push Singh, Catherine Havasi, a další. Vývojové práce začaly v září 1999 a o rok později byl projekt otevřen pro internet. Havasi to ve své disertační práci popsala jako „pokus ... využít část distribuované lidské výpočetní síly internetu, což byla myšlenka, která byla tehdy teprve v počátečních fázích.“[2] Původní OMCS byl ovlivněn webem Vše2 a jeho předchůdce a představil minimalistické rozhraní, které bylo inspirováno Google.
Push Singh měl být profesorem na MIT Media Lab vést skupinu Common Sense Computing v roce 2007 až do své sebevraždy v úterý 28. února 2006.[3]
Projekt v současné době provozuje skupina Digital Intuition Group v MIT Media Lab pod vedením Catherine Havasi.[Citace je zapotřebí ]
Databáze a webové stránky
V OMCS existuje mnoho různých typů znalostí. Některá tvrzení vyjadřují vztahy mezi objekty nebo událostmi vyjádřená jednoduchými frázemi přirozeného jazyka: některé příklady zahrnují „Kabát se používá k zahřátí“, „Slunce je velmi horké“ a „Poslední věc, kterou děláte, když vaříte večeři, je umýt nádobí “. Databáze také obsahuje informace o emocionálním obsahu situací, například „trávení času s přáteli způsobuje štěstí“ a „nasedání do autovraku člověka rozčiluje“. OMCS obsahuje informace o přáních a cílech lidí, velkých i malých, například „Lidé chtějí očekávat“ a „Lidé chtějí dobrou kávu“.[1]
Původně bylo možné tyto příkazy zadávat na web jako neomezené věty textu, které musely být později analyzovány. Aktuální verze webová stránka shromažďuje znalosti pouze pomocí strukturovanějších šablon fill-in-the-blank. OMCS rovněž využívá údaje shromážděné Hra se záměrem "Výřečnost ".[4]
V nativní podobě je databáze OMCS jednoduše souborem těchto krátkých vět, které vyjadřují některé běžné znalosti. Aby bylo možné tyto znalosti využít výpočetně, je třeba je transformovat do strukturovanější reprezentace.
ConceptNet
ConceptNet je sémantická síť na základě informací v databázi OMCS. ConceptNet je vyjádřen jako směrovaný graf, jehož uzly jsou koncepty a jejichž hrany jsou tvrzením zdravého rozumu o těchto konceptech. Pojmy představují sady úzce souvisejících frází přirozeného jazyka, kterými mohou být jmenné fráze, slovesné fráze, adjektivní fráze nebo klauze.[5]
ConceptNet je vytvořen z tvrzení přirozeného jazyka v OMCS jejich porovnáním se vzory pomocí mělkého analyzátoru. Tvrzení jsou vyjádřena jako vztahy mezi dvěma koncepty, vybranými z omezené sady možných vztahů. Různé relace představují běžné vzory vět nalezené v korpusu OMCS, a zejména každá šablona „fill-in-the-blanks“ použitá na webu sběru znalostí je spojena s konkrétní relací.[5]
Datové struktury, které tvoří ConceptNet, byly v roce 2007 významně reorganizovány a publikovány jako ConceptNet 3.[5] Skupina Softwaroví agenti aktuálně distribuuje databázi a API pro novou verzi 4.0.[6]
V roce 2010 vytvořila spoluzakladatelka a ředitelka OMCS Catherine Havasi s Robyn Speerem, Dennisem Clarkem a Jasonem Alonsem Luminoso, softwarová společnost pro analýzu textu, která staví na ConceptNet.[7][8][9][10] Využívá ConceptNet jako svůj primární lexikální zdroj, aby pomohl podnikům pochopit a odvodit vhled z obrovského množství kvalitativních dat, včetně průzkumů, recenzí produktů a sociálních médií.[7][11][12]
Nástroje pro strojové učení
Informace v ConceptNet lze použít jako základ pro strojové učení algoritmy. Jedna reprezentace, nazvaná AnalogySpace, používá rozklad singulární hodnoty zobecnit a reprezentovat vzory ve znalostech inConceptNet způsobem, který lze použít v aplikacích AI. Jeho tvůrci distribuují sadu nástrojů pro strojové učení v jazyce Python s názvem Divisi [13] pro provádění strojového učení založeného na textových korpusech, strukturovaných znalostních základnách, jako je ConceptNet, a jejich kombinací.
Srovnání s jinými projekty
Mezi další podobné projekty patří Nekonečné studium jazyků, Mindpixel (ukončeno), Cyc, Žák, SenticNet, Freebase, YAGO, DBpedia a Open Mind 1001 Questions, které zkoumaly alternativní přístupy ke shromažďování znalostí a poskytování pobídek pro účast.
Projekt Open Mind Common Sense se od Cyc liší, protože se zaměřil na reprezentaci znalostí zdravého rozumu, které shromáždil jako anglické věty, spíše než na použití formální logické struktury. Koncept je popsán jedním z jeho tvůrců, Hugem Liu, jako strukturovanější WordNet než Cyc, kvůli jeho „důrazu na neformální pojmovou propojenost nad formální lingvistickou přísností“.[14]
Existuje také brazilská iniciativa s názvem Open Mind Common Sense in Brazil (OMCS-Br), kterou vede Advanced Interaction Lab na Federální univerzitě v São Carlos (LIA-UFSCar ). Tento projekt byl zahájen v roce 2005 ve spolupráci se skupinou softwarových agentů v MIT Media Lab. Hlavním cílem je shromáždit zdravý rozum uvedený v brazilské portugalštině a použít jej k rozvoji kulturně citlivé softwarové aplikace založené na získávání znalostí o kulturních profilech z ConceptNet. To je určeno na pomoc vývojářům a uživatelům s kulturně kontextualizovaným softwarem pro obsah, díky čemuž budou finální aplikace flexibilnější, adaptivnější, přístupnější a použitelnější. Hlavní zaměření aplikací je vzdělávání a zdravotní péče.[Citace je zapotřebí ]
Viz také
- Attempto ovládal angličtinu
- Nekonečné studium jazyků
- Mindpixel
- Myšlenkový poklad
- Sémantický web
- DBpedia
- Freebase (databáze)
- yago (databáze)
Reference
- ^ A b Robyn Speer, Catherine Havasi a Henry Lieberman. AnalogySpace: Snížení rozměrnosti znalostí o běžném smyslu Archivováno 09.07.2010 na Wayback Machine. AAAI 2008.
- ^ Catherine Havasi. Objevování sémantických vztahů pomocí technik založených na rozkladu singulární hodnoty. Ph.D Thesis, Brandeis University June 2009.
- ^ MIT News Office (2006-03-08). „Vzpomínková služba zítra pro Pushpindera Singha“. MIT Tech Talk. Citováno 2009-10-07.
- ^ „Profil pro výřečnost“. Otevřete Mind Commons Sense. Archivovány od originál dne 25. 06. 2010.
- ^ A b C Catherine Havasi, Robyn Speer a Jason Alonso. ConceptNet 3: Flexibilní vícejazyčná sémantická síť pro znalost běžného rozumu. Proceedings of recent Advances in Natural Language Processing, 2007. try ConceptNet 3: ... Archivováno 2015-05-29 na Wayback Machine
- ^ Commonsense Computing Initiative (2009-02-24). „ConceptNet API v Launchpadu“. Citováno 2009-10-07.
- ^ A b Lohr, Steve (27. června 2014). „Spojení mezi USA a Německem prostřednictvím objektivu sociálních médií“. New York Times. Citováno 3. března 2015.
- ^ Rusli, Evelyn (14. dubna 2014). „Firmy využívají umělou inteligenci k zobrazení názorů nakupujících“. The Wall Street Journal. Citováno 3. března 2015.
- ^ Alba, Davey (12. února 2015). „Spuštění, které vám pomůže analyzovat chatování na Twitteru v reálném čase“. Kabelové. Citováno 3. března 2015.
- ^ Noyes, Katherine (11. února 2015). „Luminoso to enterprises: Here's what all that chatter really means“. PC svět. Citováno 3. března 2015.
- ^ Miller, Ron (2. července 2014). „Luminoso přistává 6,5 mil. USD v sérii A, aby pokračovala v budování služby cloudové textové analýzy. TechCrunch. Citováno 3. března 2015.
- ^ Darrow, Barb (11. února 2015). „Luminoso přináší své inteligentní analytické nástroje pro streamování dat“. GigaOm. Citováno 3. března 2015.
- ^ Commonsense Computing Initiative (2009-02-24). „Divisi in Launchpad“. Citováno 2009-10-07.
- ^ „Projekt ConceptNet V2.1“. Citováno 2008-12-17.
externí odkazy
- Open Mind Common Sense
- Otevřete meta-úložiště GitHub Mind Common Sense
- ConceptNet
- AnalogySpace
- Sada nástrojů pro odvození Divisi
- Webová stránka iniciativy Commonsense Computing (Stránka neexistuje)
- Iniciativa otevřené mysli (Stránka neexistuje)
- OMCSNetCPP - Open source C ++ inference engine using the OMCSNet data
- Open Mind Common Sense v Brazílii (Stránky nefunkční)
- Laboratoř pokročilých interakcí