Relační dolování dat - Relational data mining
Relační dolování dat je dolování dat technika pro relační databáze.[1] Na rozdíl od tradičních algoritmů pro dolování dat, které hledají vzory v jedné tabulce (výrokové vzory ), algoritmy pro těžbu relačních dat hledají vzory mezi více tabulkami (relační vzory ). U většiny typů výrokových vzorů existují odpovídající relační vzory. Například existují relační klasifikační pravidla (relační klasifikace), relační regresní strom a relační pravidla přidružení.
Existuje několik přístupů k dolování relačních dat:
- Induktivní logické programování (ILP)
- Statistické relační učení (SRL)
- Těžba grafů
- Propozice
- Učení s více pohledy
Algoritmy
Pravidla asociace s více vztahy: Multi-Relation Association Rules (MRAR) is a new class of association rules which which několik vztahů. Tyto vztahy naznačují nepřímý vztah mezi entitami. Zvažte následující MRAR, kde první položka se skládá ze tří vztahů žít v, poblíž a vlhký: "Ti, kteří žít v místo, které je poblíž město s vlhký klimatický typ a také jsou mladší než 20 -> jejich zdravotní stav je dobrý". Taková asociační pravidla lze extrahovat z dat RDBMS nebo sémantických webových dat.[2]
Software
- Safari: a Prostředí pro dolování dat pro analýzu velkých relačních databází založených na vícerozsahovém těžebním stroji.
- Dataconda: software zdarma pro výzkumné a výukové účely, který pomáhá při těžbě relačních databází bez použití SQL.
Datové sady
- Relační úložiště datových sad: sbírka veřejně dostupných relačních datových sad.
Viz také
Reference
- ^ Dzeroski, Saso, Lavrač, Nada (Eds.), Relational Data Mining, Springer 2001 [1]
- ^ Ramezani, Reza, Mohamad Saraee a Mohammad Ali Nematbakhsh; MRAR: Mining Multi-Relation Association Rules, Journal of Computing and Security, 1, no. 2 (2014)
externí odkazy
![]() | Tento databáze související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |