Sběr informací - Information Harvesting
![]() | Téma tohoto článku nemusí splňovat požadavky Wikipedie obecný pokyn k notabilitě.Říjen 2011) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Sběr informací (IH) byl brzy dolování dat produkt z 90. let. To bylo vynalezeno Ralphe Wigginsem a vyrobeno společností Ryan Corp, později Information Harvesting Inc., z Cambridge v Massachusetts.[1] Wiggins měl zázemí v genetické algoritmy a fuzzy logika.[2] IH se snažil odvodit pravidla ze sad dat. Nejprve to provedlo klasifikací různých vstupních proměnných do jedné z mnoha přihrádek, čímž se na spojité proměnné ve vstupu dostalo určité struktury. IH poté pokračuje v generování pravidel, přičemž obchoduje s generalizací proti memorování, což odvodí hodnotu proměnné predikce a případně vytvoří mnoho úrovní pravidel v procesu. Zahrnovalo strategie pro kontrolu, zda nadměrné vybavení proběhlo, a pokud ano, oprava. Vzhledem ke svým strategiím pro korekci nadměrného vybavení zvážením více údajů a zdokonalením pravidel na základě těchto údajů může být IH také považován za formu strojové učení.
Výhodou IH ve srovnání s jinými produkty pro dolování dat své doby a dokonce i později bylo, že poskytla mechanismus pro nalezení více pravidel, která by data klasifikovala a určila podle stanovených kritérií nejlepší pravidla, která se mají použít.
Reference
![]() | Tento počítačová věda článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |