Session (webová analýza) - Session (web analytics)
v webové analýzy, a zasedánínebo návštěva je měrná jednotka akcí uživatele provedených v časovém období nebo s ohledem na dokončení úkolu. Relace se také používají v provozní analytika a poskytování doporučení specifická pro uživatele. K definici relace se používají dvě primární metody: časově orientované přístupy na základě kontinuity v uživatelské aktivitě a přístupy založené na navigaci na základě kontinuity v řetězci požadováno stránky.
Definice
Definice „relace“ se liší, zejména je-li použita vyhledávače.[1] Obecně se relací rozumí, že sestává z „posloupnosti požadavků podaných jedním koncovým uživatelem během návštěvy konkrétního webu“.[2] V kontextu vyhledávače „relace“ a „relace dotazu“ mají alespoň dvě definice.[1] Relace nebo relace dotazu mohou být všechny dotazy zadané uživatelem v určité časové období[3] nebo to může být také řada dotazů nebo navigace s konzistentní základní potřebou uživatele.[4][5]
Použití
Relace na uživatele lze použít jako měřítko využití webových stránek.[6][7] Mezi další metriky používané v rámci výzkumu a aplikované webové analýzy patří délka relace,[8] a akce uživatele na relaci.[9] Délka relace je považována za přesnější alternativu k měření zobrazení stránky.[10]
Rekonstruované relace byly také použity k měření celkového uživatelského vstupu, včetně měření počtu pracovní doba zaujatý k konstrukci Wikipedia.[11] Relace se také používají pro provozní analýzu, anonymizace dat, identifikace anomálie sítí, a syntetické generování pracovní zátěže pro testování serverů s umělým provozem.[12][13]
Rekonstrukce relace

Pro použití relací ve webové analytice je zásadní jejich identifikace. Toto se nazývá „rekonstrukce relace“. Přístupy k rekonstrukci relace lze rozdělit do dvou hlavních kategorií: časově a navigačně.[14]
Časově orientované přístupy
Časově orientované přístupy k rekonstrukci relací hledají stanovené období nečinnosti uživatelů, které se běžně říká „práh nečinnosti“. Jakmile je dosaženo tohoto období nečinnosti, předpokládá se, že uživatel opustil web nebo úplně přestal používat prohlížeč a relace je ukončena. Další požadavky od stejného uživatele se považují za druhou relaci. Běžná hodnota pro prahovou hodnotu nečinnosti je 30 minut a někdy se popisuje jako průmyslový standard.[15][16] Někteří argumentovali, že prahová hodnota 30 minut vytváří artefakty kolem přirozeně dlouhých relací a experimentovali s jinými prahovými hodnotami.[17][18] Jiní jednoduše říkají: „žádný časový limit není účinný při identifikaci [relací]“.[19]
Jednou z alternativ, která byla navržena, je použití prahových hodnot specifických pro uživatele namísto jediné globální prahové hodnoty pro celou datovou sadu.[20][21] To má problém předpokládat, že se prahové hodnoty řídí a bimodální distribuce, a není vhodný pro datové sady, které pokrývají dlouhou dobu.[17]
Navigační přístupy využívají strukturu webových stránek - konkrétně přítomnost hypertextové odkazy a tendence uživatelů procházet mezi stránkami na stejném webu kliknutím na ně, místo toho, aby do svého prohlížeče zadávali úplnou adresu URL.[14] Jedním ze způsobů identifikace relací na základě těchto údajů je vytvoření mapy webu: pokud lze identifikovat první stránku uživatele, „relace“ akcí trvá, dokud se nedostanou na stránku, na kterou nelze získat přístup z žádné z dříve - přístupné stránky. Toto zohledňuje zpětné sledování, kdy uživatel před otevřením nové stránky vysleduje své kroky.[22] Jednodušší přístup, který nezohledňuje zpětné sledování, je jednoduše vyžadovat, aby HTTP referer každého požadavku být stránka, která je již v relaci. Pokud tomu tak není, vytvoří se nová relace.[23] Tato třída heuristiky „vykazuje velmi špatný výkon“ na webových stránkách, které obsahují sady rámců.[24]
Reference
- ^ A b Gayo-Avello 2009, str. 1824.
- ^ Arlitt 2000, str. 2.
- ^ Donato 2010, str. 324.
- ^ Gayo-Avello 2009, str. 1825.
- ^ Lam 2007, str. 147.
- ^ Weischdel 2006, str. 464.
- ^ Catledge 1995, str. 5.
- ^ Jansen 2006, str. 10.
- ^ Jansen 2000, str. 12.
- ^ Khoo 2008, str. 377.
- ^ Geiger 2014, str. 1.
- ^ Meiss 2009, str. 177.
- ^ Arlitt 2000, str. 8.
- ^ A b Spiliopoulou 2003, str. 176.
- ^ Ortega 2010, str. 332.
- ^ Eickhoff 2014, str. 3.
- ^ A b Mehrzadi 2012, str. 3.
- ^ On 2002, str. 733.
- ^ Jones 2008, str. 2.
- ^ Murray 2006, str. 3.
- ^ Mehrzadi 2012, str. 1.
- ^ Cooley 1999, str. 19.
- ^ Cooley 1999, str. 23.
- ^ Berendt 2003, str. 179.
Bibliografie
- Arlitt, Martin (2000). „Charakterizace relací uživatele na webu“ (PDF). Hodnocení hodnocení výkonu SIGMETRICS. 28 (2): 50–63. doi:10.1145/362883.362920.CS1 maint: ref = harv (odkaz)
- Berendt, Bettina; Mobasher, Bamshad; Nakagawa, Miki; Spiliopoulou, Myra (2003). „Dopad struktury webu a uživatelského prostředí na rekonstrukci relace v analýze využití webu“ (PDF). WEBKDD 2002 - Těžba webových dat pro zjišťování vzorů a profilů využití. WEBKDD. Springer. doi:10.1007/978-3-540-39663-5_10. ISBN 978-3-540-39663-5.CS1 maint: ref = harv (odkaz)
- Catledge, L .; Pitkow, J. (1995). „Charakterizace strategií procházení v celosvětovém webu“ (PDF). Sborník příspěvků ze třetí mezinárodní konference o technologiích, nástrojích a aplikacích na internetu. 27 (6): 1065–1073. doi:10.1016/0169-7552(95)00043-7.CS1 maint: ref = harv (odkaz)
- Cooley, Robert; Mobasher, Bamshad; Srivastava, Jaideep (1999). „Příprava dat pro těžbu vzorů procházení webu“ (PDF). Znalostní a informační systémy. 1 (1): 5–32. CiteSeerX 10.1.1.33.2792. doi:10.1007 / BF03325089. ISSN 0219-3116.CS1 maint: ref = harv (odkaz)
- Donato, Debora; Bonchi, Francesco; Chi, Tom (2010). „Chcete si dělat poznámky ?: identifikace výzkumných misí ve vyhledávacím panelu Yahoo!“ (PDF). Sborník z 19. mezinárodní konference o World Wide Web. ACM.CS1 maint: ref = harv (odkaz)
- Eickhoff, Carsten; Teevan, Jaime; White, Ryen; Dumais, Susan. (2014). Poučení z cesty: Analýza dotazu na logické učení v rámci relace (PDF). Sborník ze sedmé mezinárodní konference o vyhledávání na webu a dolování dat na webu. ACM. 223–232. doi:10.1145/2556195.2556217. ISBN 9781450323512.CS1 maint: ref = harv (odkaz)
- Gayo-Avello, Daniel (2009). „Průzkum metod detekce relace v protokolech dotazů a návrh budoucího vyhodnocení“ (PDF). Informační vědy. 179 (12): 1822–1843. doi:10.1016 / j.ins.2009.01.026. ISSN 0020-0255.CS1 maint: ref = harv (odkaz){{Dead link} | datum = leden 2017}
- Geiger, R. S.; Halfaker, A. (2014). Využití úprav relací k měření účasti na Wikipedii (PDF). Sborník konference ACM z roku 2013 o počítačové spolupráci podporované počítačem. ACM. p. 861. doi:10.1145/2441776.2441873. ISBN 9781450313315.CS1 maint: ref = harv (odkaz)
- On, Daqing; Goker, Ayse; Harper, David J. (2002). Msgstr "Kombinace důkazů pro automatickou identifikaci webové relace". Zpracování a správa informací. 38 (5): 727–742. doi:10.1016 / S0306-4573 (01) 00060-7. ISSN 0306-4573.CS1 maint: ref = harv (odkaz)
- Heer, Jeffrey; Chi, Ed H. (2002). „Oddělení roje: metody kategorizace relací uživatelů na webu“ (PDF). Sborník konference SIGCHI o lidských faktorech ve výpočetních systémech. ACM. 4 (1).CS1 maint: ref = harv (odkaz)
- Huang, Chien-Kang; Chien, Lee ‐ Feng; Oyang, Yen-Jen (2003). "Návrh relevantního výrazu v interaktivním vyhledávání na webu na základě kontextových informací v protokolech relací dotazů". Journal of the American Society for Information Science and Technology. 54 (7): 638–649. CiteSeerX 10.1.1.105.5584. doi:10.1002 / asi.10256.CS1 maint: ref = harv (odkaz)
- Jansen, Bernard J .; Spink, Amanda; Saracevic, Tefko (2000). „Skutečný život, skuteční uživatelé a skutečné potřeby: studie a analýza uživatelských dotazů na webu“ (PDF). Zpracování a správa informací. 36 (2): 207–227. CiteSeerX 10.1.1.155.1383. doi:10.1016 / S0306-4573 (99) 00056-4. ISSN 0306-4573.CS1 maint: ref = harv (odkaz)
- Jansen, Bernard J .; Spink, Amanda (2006). „Jak prohledáváme celosvětový web? Porovnání devíti protokolů transakcí vyhledávače“ (PDF). Zpracování a správa informací. 42 (1): 248–263. doi:10.1016 / j.ipm.2004.10.007. ISSN 0306-4573.CS1 maint: ref = harv (odkaz)
- Jones, Rosie; Klinkner, Kristina Lisa (2008). Beyond the Session Timeout: Automatic Hierarchical Segmentation of Search Topics in Query Logs (PDF). Cikm 08. ACM. p. 699. doi:10.1145/1458082.1458176. ISBN 9781595939913.CS1 maint: ref = harv (odkaz)
- Khoo, Michael; Pagano, Joe; Washington, Anne L .; Recker, Mimi; Palmer, Bart; Donahue, Robert A. (2008). „Používání webových metrik k analýze digitálních knihoven“ (PDF). Sborník příspěvků z 8. společné konference ACM / IEEE-CS o digitálních knihovnách. ACM.CS1 maint: ref = harv (odkaz)
- Lam, Heidi; = Russell, Daniel; Tang, Diane (2007). "Prohlížeč relací: Vizuální průzkumná analýza protokolů webových relací". IEEE Symposium on Visual Analytics Science and Technology. IEEE.CS1 maint: ref = harv (odkaz)
- Mehrzadi, David; Feitelson, Dror G. (2012). „Při extrakci dat relace z protokolů aktivit“ (PDF). Sborník z 5. výroční mezinárodní konference o systémech a úložištích. SYSTOR '12. ACM. CiteSeerX 10.1.1.381.1956. doi:10.1145/2367589.2367592. ISBN 978-1-4503-1448-0.CS1 maint: ref = harv (odkaz)
- Meiss, Mark; Duncan, John; Gonçalves, Bruno; Ramasco, José J .; Menczer, Filippo (2009). „Co je v relaci: Sledování chování jednotlivců na webu“ (PDF). Sborník příspěvků z 20. konference ACM o hypertextu a hypermedii. ACM.CS1 maint: ref = harv (odkaz)
- Menascé, Daniel A .; Almeida, V .; Fonseca, R .; Mendes, M. (1999). „Metodika pro charakterizaci pracovní zátěže stránek elektronického obchodování“ (PDF). Sborník z konference ACM o elektronickém obchodu. ACM.CS1 maint: ref = harv (odkaz)
- Murray, G. Craig; Lin, Jimmy; Chowdhury, Abdur (2006). „Identifikace uživatelských relací pomocí hierarchického aglomerativního shlukování“ (PDF). Proceedings of the American Society for Information Science and Technology. 43 (1): 1–9. doi:10.1002 / meet.14504301312.CS1 maint: ref = harv (odkaz)
- Ortega, J.L .; Aguillo, I. (2010). „Rozdíly mezi webovými relacemi podle původu jejich návštěv“ (PDF). Journal of Informetrics. 4 (3): 331–337. doi:10.1016 / j.joi.2010.02.001. ISSN 1751-1577.CS1 maint: ref = harv (odkaz)
- Spiliopoulou, Myra; Mobasher, Bamshad; Berendt, Bettina; Nakagawa, Miki (2003). „Rámec pro hodnocení heuristiky rekonstrukce relace v analýze využití webu“ (PDF). INFORMS Journal o práci na počítači. 15 (2): 171–190. CiteSeerX 10.1.1.621.3037. doi:10.1287 / ijoc.15.2.171.14445. ISSN 1526-5528.CS1 maint: ref = harv (odkaz)
- Weischdel, Birgit; Huizingh, Eelko K. R. E. (2006). Optimalizace webových stránek pomocí webových metrik: případová studie (PDF). Sborník příspěvků z 8. mezinárodní konference o elektronickém obchodu. p. 463. doi:10.1145/1151454.1151525. ISBN 978-1595933928.CS1 maint: ref = harv (odkaz)