Apache Lucene - Apache Lucene
![]() | tento článek potřebuje další citace pro ověření.Únor 2012) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
![]() | |
Vývojáři | Softwarová nadace Apache |
---|---|
První vydání | 1999 |
Stabilní uvolnění | 8.7.0 / 3. listopadu 2020[1] |
Úložiště | ![]() |
Napsáno | Jáva |
Operační systém | Cross-platform |
Typ | Vyhledávání a index |
Licence | Licence Apache 2.0 |
webová stránka | Lucene |
Apache Lucene je zdarma a open-source vyhledávač softwarová knihovna, původně napsán úplně v Jáva podle Doug Cutting. Podporuje jej Softwarová nadace Apache a je propuštěn pod Softwarová licence Apache.
Lucene byl přenesen do dalších programovacích jazyků včetně Objekt Pascal, Perl, C#, C ++, Krajta, Rubín a PHP.[2]
Dějiny
Doug Cutting původně napsal Lucene v roce 1999.[3] Lucene byl jeho pátým vyhledávačem, předtím napsal dva, zatímco pracoval v Xerox PARC, jeden v Apple a čtvrtý v Excite.[4] To bylo zpočátku k dispozici ke stažení ze svého domova na internetu SourceForge webová stránka. Připojilo se k nadaci Apache Software Foundation Jakarta Rodina produktů Java s otevřeným zdrojovým kódem v září 2001 a v únoru 2005 se stala vlastním projektem nejvyšší úrovně Apache. Jméno Lucene je prostředním jménem manželky Doug Cutting a křestním jménem její babičky z matčiny strany.[5]
Lucene dříve zahrnoval řadu dílčích projektů, jako je Lucene.NET, Mahout, Tika a Nutch. Tito tři jsou nyní nezávislé projekty nejvyšší úrovně.
V březnu 2010 Apache Solr vyhledávací server se připojil jako dílčí projekt Lucene a spojil komunity vývojářů.
Verze 4.0 byla vydána 12. října 2012.[6]
Vlastnosti a běžné použití
Je vhodný pro všechny aplikace, které vyžadují plný text indexování a schopnost vyhledávání, Lucene je uznáván pro jeho užitečnost při implementaci Internetové vyhledávače a místní vyhledávání na jednom místě.[7][8]
Lucene obsahuje funkci pro provádění fuzzy vyhledávání na základě upravit vzdálenost.[9]
Lucene byl také použit k implementaci doporučovacích systémů.[10] Například třída „MoreLikeThis“ od Lucene může generovat doporučení pro podobné dokumenty. Ve srovnání přístupu pojmu podobnosti založeného na vektorech „MoreLikeThis“ s opatřeními podobnosti dokumentů založených na citacích, jako je spolucitace a kocitační blízkostní analýza, Lucenův přístup vynikal v doporučování dokumentů s velmi podobnými strukturálními charakteristikami a užší příbuzností.[11] Naproti tomu opatření podobnosti dokumentů na základě citací měla tendenci být vhodnější pro doporučení obecněji souvisejících dokumentů,[11] což znamená, že pro generování může být vhodnější přístup založený na citaci serendipitous doporučení, pokud dokumenty, které mají být doporučeny, obsahují citace v textu.
Projekty založené na lucenu
Samotný Lucene je pouze indexovací a vyhledávací knihovna a neobsahuje plazení a HTML analýza funkčnost. Několik projektů však rozšiřuje možnosti Lucene:
- Apache Nutch - poskytuje procházení webu a HTML analýza[Citace je zapotřebí ]
- Apache Solr - server podnikového vyhledávání
- Kompas - předchůdce Elasticsearch[12]
- CrateDB - open source, distribuovaná databáze SQL postavená na Lucene[13]
- DocFetcher - a multiplatformní desktopové vyhledávací aplikace[Citace je zapotřebí ]
- Elasticsearch - server podnikového vyhledávání vydaný v roce 2010[14]
- Kinosearch - vyhledávač napsaný v Perl a C[15] a volná přístav Lucene.[16] The Sociální text software wiki používá tento vyhledávač,[15] a stejně tak MojoMojo wiki.[17] To je také používáno Lidská databáze metabolomu (HMDB)[18] a Databáze toxinů a toxinových cílů (T3DB).[19]
- Swiftype - spuštění podnikového vyhledávání založené na Lucene
Viz také
Reference
- ^ „Vítejte v Apache Lucene“. Sekce zpráv Lucene ™. Archivováno z původního dne 14. srpna 2020. Citováno 14. srpna 2020.
- ^ „LuceneImplementations“. apache.org. Archivováno z původního dne 6. října 2015. Citováno 23. září 2015.
- ^ KeywordAnalyzer„Lepší vyhledávání s Apache Lucene a Solr“ (PDF). 19. listopadu 2007. Archivovány od originál (PDF) dne 31. ledna 2012.
- ^ Cutting, Doug (07.06.2019). „Napsal jsem pár vyhledávačů ve společnosti Xerox PARC, poté V-Twin v Apple, poté přepsal vyhledávání Excite, pak Lucene. Takže Lucene by mohl být považován za V-Twin 3.0? Téměř o 25 let později V-Twin stále žije jako vyhledávací sada pro Mac OS X! “. @ řezání. Citováno 2019-06-19.
- ^ Barker, Deane (2016). Správa webového obsahu. O'Reilly. p. 233. ISBN 1491908106.
- ^ „Apache Lucene - Vítejte v Apache Lucene“. apache.org. Archivováno z původního dne 4. února 2016. Citováno 4. února 2016.
- ^ McCandless, Michael; Hatcher, Erik; Gospodnetić, Otis (2010). Lucene v akci, druhé vydání. Manning. p.8. ISBN 1933988177.
- ^ „Sémantický úložný systém GNU / Linux“ (PDF). glscube.org. Archivovány od originál (PDF) dne 01.06.2010.
- ^ "Apache Lucene - syntaxe dotazovacího analyzátoru". lucene.apache.org. Archivováno z původního dne 2017-05-02.
- ^ J. Beel, S. Langer a B. Gipp, „The Architecture and Datasets of Docear's Research Paper Doporučující systém,“ ve sborníku ze 3. mezinárodního workshopu o těžařských vědeckých publikacích (WOSP 2014) na společné konferenci ACM / IEEE o digitálních technologiích Knihovny (JCDL 2014), Londýn, Velká Británie, 2014
- ^ A b M. Schwarzer, M. Schubotz, N. Meuschke, C. Breitinger, V. Markl a B. Gipp, https://www.gipp.com/wp-content/papercite-data/pdf/schwarzer2016.pdf „Evaluating Link-based doporučení pro Wikipedii“ ve sborníku z 16. společné konference ACM / IEEE-CS o digitálních knihovnách (JCDL), New York, NY, USA, 2016, s. 191-200.
- ^ „The Future of Compass & Elasticsearch“. ten chlápek zůstává. Archivovány od originál dne 2015-10-15. Citováno 2015-10-14.
- ^ Wayner, Peter. „11 špičkových databází, které nyní stojí za prozkoumání“. InfoWorld. Archivováno z původního dne 21. září 2015. Citováno 21. září 2015.
- ^ „Elasticsearch: RESTful, Distributed Search & Analytics - Elastic“. elastic.co. Archivováno z původního dne 8. října 2015. Citováno 23. září 2015.
- ^ A b Natividad, Angela. „Vyhledávání aktualizací sociálního textu, jde do kina“. CMS Wire. Archivováno z původního dne 2012-09-29. Citováno 2011-05-31.
- ^ Marvin Humphrey. „KinoSearch - knihovna vyhledávače. - metacpan.org“. p3rl.org. Citováno 23. září 2015.
- ^ Diment, Kieren; Trout, Matt S (2009). "Catalyst Cookbook". Definitivní průvodce katalyzátorem. Apress. p.280. ISBN 978-1-4302-2365-8.
- ^ „HMDB: znalostní databáze lidského metabolomu“. Nucleic Acids Res. 37 (Problém s databází): D603–10. Leden 2009. doi:10.1093 / nar / gkn810. PMC 2686599. PMID 18953024.
- ^ „T3DB: komplexně anotovaná databáze běžných toxinů a jejich cílů“. Nucleic Acids Res. 38 (Problém s databází): D781–6. Leden 2010. doi:10.1093 / nar / gkp934. PMC 2808899. PMID 19897546.
Bibliografie
- Gospodnetic, Otis; Erik Hatcher; Michael McCandless (28. června 2009). Lucene v akci (2. vyd.). Manning Publications. ISBN 1-9339-8817-7.
- Gospodnetic, Otis; Erik Hatcher (1. prosince 2004). Lucene v akci (1. vyd.). Manning Publications. ISBN 978-1-9323-9428-3.