Optimální objevování vzorů K. - K-optimal pattern discovery

Optimální objevování vzorů K. je dolování dat technika, která poskytuje alternativu k časté objevování vzorů přístup, který je základem nejvíce učení asociačního pravidla techniky.

Techniky častého zjišťování vzorů nacházejí všechny vzory, pro které jsou ve vzorku dostatečně časté příklady data. Naproti tomu k-optimální techniky zjišťování vzorů naleznou k vzory, které optimalizují míru zájmu určenou uživatelem. Parametr k je také specifikován uživatelem.

Příklady technik k-optimálního zjišťování vzorů zahrnují:

  • objevení pravidla k-optimální klasifikace.[1]
  • k-optimální objev podskupiny.[2]
  • nalezení nejzajímavějších vzorů pomocí sekvenčního vzorkování.[3]
  • těžba top.k časté uzavřené vzory bez minimální podpory.[4]
  • k-optimální zjišťování pravidel.[5]

Na rozdíl od k-optimálního zjišťování pravidel a častých technik dolování vzorů se zjišťování podskupin zaměřuje na těžbu zajímavých vzorů s ohledem na specifikovanou cílovou vlastnost zájmu. To zahrnuje například binární, nominální nebo číselné atributy,[6] ale také komplexnější cílové koncepty, jako jsou korelace mezi několika proměnnými. Základní znalosti[7] omezení a ontologické vztahy lze často úspěšně použít pro zaměření a zlepšení výsledků objevů.

Reference

  1. ^ Webb, G. I. (1995). OPUS: Efektivní přípustný algoritmus pro neuspořádané vyhledávání. Journal of Artificial Intelligence Research, 3, 431-465.
  2. ^ Wrobel, Stefan (1997) Algoritmus pro multirelační objev podskupin. v Sborník První evropské sympozium o zásadách dolování dat a získávání znalostí. Springer.
  3. ^ Scheffer, T. a Wrobel, S. (2002). Rychlé vyhledání nejzajímavějších vzorů v databázi pomocí sekvenčního vzorkování.Journal of Machine Learning Research, 3, 833-862.
  4. ^ Han, J., Wang, J., Lu, Y., & Tzvetkov, P. (2002) Těžba top-k časté uzavřené vzory bez minimální podpory. v Sborník z mezinárodní konference o dolování dat211 až 218.
  5. ^ Webb, G. I., & Zhang, S. (2005). Optimální zjišťování pravidel K. Těžba dat a vyhledávání znalostí, 10(1), 39-79.
  6. ^ Kloesgen, W. (1996). Explora: Asistent objevování více vzorů a více strategií. Pokroky ve zjišťování znalostí a dolování dat, str. 249-271.
  7. ^ Atzmueller, M., Puppe, F., Buscher HP. (2005). Využívání znalostí na pozadí pro objevování podskupin náročných na znalosti. Proc. IJCAI'05: 19. mezinárodní společná konference o umělé inteligenci. Morgan Kaufmann

externí odkazy