Sociální datová revoluce - Social data revolution

The sociální datová revoluce je posun ve vzorcích lidské komunikace směrem k většímu sdílení osobních informací a souvisejícím důsledkům, umožněným vzestupem sociální sítě v časném 2000s. Tento jev vedl k akumulaci nebývalé množství veřejných dat.[1]

Tento velký a často aktualizovaný zdroj dat byl popsán jako nový typ vědeckého nástroje pro sociální vědy.[2] Několik nezávislých vědců použilo sociální data k „nowcastingu“ a předpovědi trendů, jako je nezaměstnanost, propuknutí chřipky,[3] nálada celé populace,[4] cestovní výdaje a politické názory způsobem, který je rychlejší, přesnější a levnější než standardní vládní zprávy nebo Gallupovy ankety.[2]

Sociální data jsou data, která jednotlivci vytvářejí a která je vědomě a dobrovolně sdílí. Díky nákladům a režii byla tato poloveřejná forma komunikace neproveditelná, ale pokrok v technologii sociálních sítí v období 2004–2010 umožnil širší koncepci sdílení.[5] Mezi typy sdílení dat, které uživatelé sdílejí, patří geolokace, lékařské údaje,[6] preference randění, otevřené myšlenky, zajímavé zpravodajské články atd.

Sociální datová revoluce umožňuje nejen nové obchodní modely, jako jsou ty na Amazon.com ale také poskytuje velké příležitosti ke zlepšení rozhodování pro veřejnou politiku a mezinárodní rozvoj.[7]

Analýza velkého množství sociálních dat vede k poli výpočetní sociální věda. Mezi klasické příklady patří studium mediálního obsahu[8] nebo obsah sociálních médií.[3][4][9]

Vývoj sociálních údajů

Každá internetová aktivita po sobě zanechává stopy dat (a digitální stopa ), které lze použít k získání více informací o uživateli.[10] Jelikož se používání internetu stále více rozšiřuje, datafikace světa rychle postupuje: V současné době se ročně vyprodukuje přibližně 16 zettabytů dat a pro rok 2025 se očekává 163 zettabytů dat.[11] To vedlo k tomu, že se data stala kritickou komoditou.[10] To spojuje všechny společenské aktéry: veřejné instituce, soukromé firmy i jednotlivce, přičemž každý z nich spoléhá na data jedinečným způsobem.

Vlády se shromažďují data po celá staletí zajistit pokračování institucionálních systémů, a to omezením rizika nesplácení úvěrů, výběrem daně z příjmu a poskytováním nezbytné infrastruktury s ohledem na demografické rozdělení jejich občanů.[12] Ve svých počátcích tato data obsahovala písemné informace pro vedení a kontrolu záznamů, včetně systému sčítání lidu.[12]

Tento analogový proces byl velmi časově a nákladově náročný a ponechával malý prostor pro interpretaci větších souborů dat.[12] Mezitím technologický vývoj společnosti přesunul tato offline data do digitálního věku, což umožnilo vizualizaci a analýzu dat.[12][10] Ve veřejné sféře mělo spojení metodik průzkumu a hlasování s výpočtem databáze za následek schopnost shromažďovat a ukládat velké soubory dat o jednotlivcích.[10]

Web 2.0 a weby sociálních sítí

Za posledních několik desetiletí se internet posunul od používání hlavně jako zdroje informací o světě k primárnímu použití ke komunikaci, obsahu vytvářenému uživateli, sdílení dat, a budování komunity.[13] To je to, co mnozí považují za vývoj „Web 2.0 "stránky sociálních sítí jako Facebook a Youtube jsou základem vývoje Web 2.0 a posunu ke sdílení sociálních dat.[13]

Brzy příklady sociálních datových webů jsou Craigslist a seznamy přání z Amazon.com. Oba umožňují uživatelům sdělovat informace komukoli, kdo je hledá. Liší se svým přístupem k identita. Craigslist využívá sílu anonymity, zatímco Amazon.com využívá sílu trvalé identity na základě historie zákazníka u firmy. Trh práce je dokonce formován informacemi, které o sobě lidé sdílejí na podobných webech LinkedIn a Facebook.[14]

Příklady sofistikovanějších sociálních datových serverů jsou Cvrlikání a Facebook. Na Twitteru je odeslání zprávy nebo tweetu stejně snadné jako odeslání textové zprávy SMS. Twitter vytvořil tento C2W, zákazníka do světa: Jakýkoli tweet, který uživatel pošle, může potenciálně číst celý svět. Facebook se zaměřuje na interakce mezi přáteli, C2C v tradičním jazyce. Poskytuje mnoho způsobů shromažďování údajů od uživatelů: "štítek „přítel na fotografii, komentujte to, co zveřejnili, nebo se vám to„ líbí “. Tyto údaje jsou základem pro sofistikované modely vztahů mezi uživateli. Lze je použít k výraznému zvýšení relevantnost toho, co se uživateli zobrazuje, a pro reklamní účely.[15]

Do roku 2009 se popularita sociálních sítí zvýšila na čtyřnásobek toho, co v roce 2005.[16] Od roku 2013 má Twitter více než 250 milionů uživatelů, kteří sdílejí téměř 500 milionů tweetů denně, a Facebook má více než miliardu uživatelů po celém světě.[17]

Obchodní sektor a sociální data

Společnosti často používají data sdílená prostřednictvím sociálních sítí a jiných forem sdílení dat, inzerentů atd.[18] Například weby sociálních sítí mohou prodávat uživatelská data inzerentům a dalším entitám, které pak mohou ovlivňovat rozhodování spotřebitelů.[13] Dolování dat se také používá ke shromažďování těchto informací.[18]

Zatímco původem tohoto sběru dat byly webové stránky a další aplikace, s vylepšením technologie má mnoho zařízení, která se používají v každodenním životě, schopnost shromažďovat údaje o jednotlivcích, a proto zvyšují množství dostupných osobních údajů (např. Smartphony) , technické hodinky, hudební zařízení atd.).[19][20]

Tento růst lidí digitální identita - informace dostupné prostřednictvím těchto elektronických zdrojů - používají společnosti a organizace ke zlepšování produktů a služeb a ke snižování nákladů zaměřením na to, co spotřebitelé chtějí / očekávají.[20] Data, která lze shromáždit, mohou zahrnovat zážitky z nakupování, preference sociálních médií, demografické informace a další.[18]

Použití těchto dat může umožnit lepší personalizaci produktů a stalo se očekávaným a zásadním aspektem používání a výroby produktů.[19] Údaje, které jsou o spotřebitelích dostupné, lze použít k odvození vzorců chování spotřebitelů.[21] Například informace o poloze se používají k posouzení, kdy a kde budou spotřebitelé cílit reklamy a propagace na základě toho, do kterých obchodů se spotřebitelé chystají.[21] Online prodejci také získali přehled o tom, jak lépe přizpůsobit zážitek z online nakupování prostřednictvím údajů shromážděných během online transakce.[22]

Firmy mohou dokonce použít údaje o spotřebitelích k určení, zda různé rozteče regálů produktů mají vliv na rozhodnutí spotřebitele při nákupu, a také k posouzení potenciálních marketingových potenciálů mezi položkami na základě často zakoupených položek.[23]

Sociální obchod

Zatímco podniky a inzerenti často využívají dostupných spotřebitelských dat, spotřebitelé také při rozhodování o nákupu používají informace ostatních uživatelů. Sociální obchod weby, kde zákazníci sdílejí zkušenosti s produkty / službami a názory a další informace.[24] Slavným příkladem takového webu je Pinterest který má více než 100 milionů uživatelů.[24] Tyto weby a další online zdroje informací o produktech / značkách mají vliv na nákupní rozhodnutí spotřebitele.[25] Odhaduje se, že přibližně 67% online zákazníků používá tyto informace při rozhodování o nákupu.[24] Tyto stránky vytvářejí prostředí, které zákazníci považují za důvěryhodné, protože informace pocházejí od jiných spotřebitelů.[24]

Další využití sociálních údajů

S obrovským množstvím dostupných údajů o jednotlivcích, které jsou přístupné, potenciální využití těchto informací roste.

Zdravotnický sektor má pro tato data mnoho potenciálních využití. Informace shromážděné ze sociálních médií a dalších zdrojů pro sdílení sociálních dat lze použít k předpovědi chřipky, propuknutí nemocí, způsobu řešení mimořádných situací atd.[26] S využitím Twitteru a zeměpisné značky mohou lékaři vyhodnotit zdraví konkrétního sousedství a využít tyto informace k lepšímu dosahu a službám.[26] Medtronic vyvinula digitální měřič glukózy v krvi, který umožňuje poskytovatelům zdravotní péče a pacientům vědět o nízkých hladinách.[19]

Sociální údaje lze také použít k posouzení reakcí na krize.[27] Po Hurikán Sandy Vědci použili Twitter k vyhodnocení emocí a problémů, kterým byli postiženi.[27] Tyto informace lze potenciálně použít k lepší přípravě a reakci na budoucí krize.

Tato data mohou být použita jako pomůcka při plánování měst. Město Boston použil informace jezdce z Uber zlepšit plánování dopravy a údržbu silnic.[19]

Výpočetní sociální věda

Používání sociálních dat pro výzkumné účely vedlo k rozvoji výpočetní sociální vědy. Výpočetní sociální věda kombinuje sociální vědu, počítačovou vědu a síťovou vědu.[28] Toto pole se objevilo v roce 2009.[29] Před vzestupem sociálních dat a technologickým pokrokem, který je podporoval, se vědci omezili na úzký pohled na informace založené na jednotlivcích, protože jejich primární forma výzkumu se spoléhala na rozhovory.[29] Díky obrovskému množství sociálních dat, která jsou dnes k dispozici, mohou nyní vědci analyzovat širší skupinu a získat širší pohled na informace. Mohou používat sociální sítě, data z mobilních telefonů a provádět online experimenty, které jim umožňují shromažďovat více informací než dříve.[29]

Ochrana osobních údajů

Vzhledem k množství údajů dostupných o jednotlivcích, které jsou přístupné z mnoha zdrojů, se soukromí stalo hlavním problémem. Porušení bezpečnosti zákaznických a dalších sociálních informací, jako je kompromis více než 56 milionů Home Depot informace o kreditní kartě zákazníka[19] ovlivnily obavy o soukromí se sociálními údaji. Způsob, jakým společnosti využívají, a potenciální zneužití shromážděných osobních údajů je problémem pro většinu spotřebitelů.[19][20] Navzdory tomu mnoho lidí neví, jak stránky sociálních sítí a další zdroje používají a prodávají svá data.[30] Ve studii z roku 2014 pouze 25% uživatelů online vědělo, že je možné získat přístup k jejich umístění, a pouze 14% vědělo, že je možné získat přístup a sdílet jejich historii procházení webu.[19]

Přestože je ochrana soukromí zásadním faktorem při sdílení osobních údajů lidmi na internetu a celkové účasti na internetu,[22] většina lidí je ochotna tyto informace sdílet, pokud jejich výhody převáží potenciální náklady na soukromí a zabezpečení.[18][20] Spotřebitelé mají rádi personalizaci produktů a služeb, které jsou díky tomuto shromažďování informací možné, a navzdory obavám je i nadále používají.[19]

Mezinárodní rozvoj

„Z makroekonomického hlediska se očekává, že rozhodování na základě informací o velkých datech bude mít podobný pozitivní vliv na efektivitu a produktivitu, jaký měly ICT během posledního desetiletí.“

— Hilbert 2013

Ve své studii o datové revoluci v mezinárodním rozvoji profesor sociálních věd na UC Davis Martin Hilbert tvrdil, že přirozeným dalším krokem od informační společnosti, poháněno ICT od konce 90. let znalostní společnosti informoval Velká data analýza. Rozhodování na základě analýzy velkých dat zlepšilo jak efektivitu, tak produktivitu v rozvinutém světě. Hilbert zkoumá výzvy a potenciál datové revoluce v „neposlušném světě mezinárodního rozvoje“.[7]

Druhy dat

Hilbert identifikoval čtyři typy dat dostupných ve velkém množství do roku 2013: slova, umístění, příroda a chování.[7]

Slova

Jednotlivé interakce s internetem, jako jsou slova v komentářích, zveřejňování příspěvků na sociálních médiích a objemy vyhledávacích dotazů Google, nabízejí stále větší zdroj velkých dat. Statistiky se obvykle generují pomocí sčítání lidu nebo průzkumu pravděpodobnosti, například Roční sociální a ekonomický příplatek (ASEC), Aktuální průzkum populace (CPS), Průzkum amerického společenství (ACS), Národní průzkum veřejného zdraví (NHIS) ve Spojených státech nebo administrativní záznamy, jako jsou mzdy, nezaměstnanost, daně z příjmu sociálního zabezpečení, data skeneru a údaje o kreditní kartě a další záznamy o obchodních transakcích.[31]

„Google analyzoval shluky vyhledávacích dotazů podle regionů ve Spojených státech, aby pomocí záznamů o hospitalizaci předpověděl ohniska chřipky rychleji, než bylo možné.“

— Shaw 2014 „Proč“ Big Data „je velký obchod“

Profesor univerzity Weatherhead Gary King popsal, že revoluce není jen o množství dostupných dat, ale také ve schopnosti něco s daty udělat ve prospěch společnosti.[32]

Umístění

Globální Polohovací Systém (GPS) mobilní tablety, telefony, Identifikace frekvence rádia (RFID) čipy (součást Automatická identifikace a sběr dat (AIDC) technologie), telematika, Hry založené na poloze atd. poskytují údaje o absolutním umístění a relativním pohybu.

Příroda

Hilbert kategorizuje údaje o přírodních procesech do kategorie „Příroda“, která zahrnuje senzory, které poskytují údaje o vlhkosti ve vzduchu a teplotě.[7]

Chování

Data lze generovat z chování uživatelů v online hry pro více hráčů,[7] jako League of Legends, Svět války, Minecraft, Volání povinnosti, a Dota 2. Nathan Eagle ', počítačový vědec z institutu Santa Fe v Novém Mexiku, začal používat mobilní telefony počátkem roku 2000 ke shromažďování přesných a rozsáhlých údajů o skutečných sociálních interakcích.[33][34][35] Projekt byl jmenován jednou z "10 technologií, které pravděpodobně změní způsob života" Recenze technologie MIT.[36]

Viz také

Reference

  1. ^ Weigend, Andreasi. „Sociální datová revoluce“. Harvardský obchodní přehled. Citováno 15. července 2009.
  2. ^ A b Hubbard, Douglas (2011). Pulse: The New Science of Harnessing Internet Buzz to Track Threats and Opportunities. John Wiley & Sons.
  3. ^ A b Vasileios Lampos; Nello Cristianini (2012). "Nowcasting Události ze sociálního webu se statistickým učením". Transakce ACM na inteligentních systémech a technologiích. 3 (4): 1–22. doi:10.1145/2337542.2337557. 72.
  4. ^ A b Thomas Lansdall-Welfare; Vasileios Lampos; Nello Cristianini (srpen 2012). "Nyní zjišťuje náladu národa". Význam časopis. Sv. 9 č. 4. doi:10.1111 / j.1740-9713.2012.00588.x.
  5. ^ Swathi Dharshana Naidu (prosinec 2009). „Sociální datová revoluce“. Pozdější. Citováno 2010-07-08.
  6. ^ Dyson, Esther (23. března 2010). „Zdraví, ne zdravotní péče!“. Huffington Post. Citováno 2010-06-08.
  7. ^ A b C d E Hilbert, Martin (2013). „Big Data for Development: From Information- to Knowledge Societies“. SSRN Scholarly Paper (2205145). Rochester, NY: Social Science Research Network. SSRN  2205145. Citovat deník vyžaduje | deník = (Pomoc)
  8. ^ Detekce makropodniků v globálním mediálním obsahu
  9. ^ Twitter Mood: Dopady recese na veřejnou náladu ve Velké Británii
  10. ^ A b C d West, Sarah Myers (2017). „Datový kapitalismus: Předefinování logiky dohledu a soukromí“. Obchod a společnost: 1–22.
  11. ^ Cave, Andrew (13. dubna 2017). „Co uděláme, když světová data v roce 2025 dosáhnou 163 Zettabytů?“. Forbes. Citováno 30. května 2018.
  12. ^ A b C d Mayer-Schönberger, Viktor; Cukier, Kenneth (2013). Big Data: Revoluce, která změní způsob, jakým žijeme, pracujeme a myslíme. London, UK: John Murray (Publishers).
  13. ^ A b C Fuchs, Christian. 2011. „Web 2.0, Prosumption a Surveillance.“ Dohled a společnost 8(3): 288-309.
  14. ^ Reid Hoffman (26. června 2009). „Budoucnost pracovních míst a revoluce v sociálních datech“. Techaffair.com. Citováno 2010-07-02.
  15. ^ Dyson, Esther (11. února 2008). „Coming Ad Revolution“. The Wall Street Journal. Citováno 2010-04-10.
  16. ^ Donde, Deepa S., Chopade, Neha a Ranjith, P.V. 2012. „Sociální sítě: nová éra 21. století.“ SIES Journal of Management 8(1): 66-73.
  17. ^ Osatuyi, Babajide. 2013. „Sdílení informací na stránkách sociálních médií.“ Počítače v lidském chování 29(6): 2622-2631.
  18. ^ A b C d Jai, Tun-Min a King, Nancy J. 2016. „Ochrana osobních údajů versus odměna: Zvyšují věrnostní programy ochotu spotřebitelů sdílet osobní údaje s inzerenty třetích stran a zprostředkovateli dat?“ Journal of Retailing and Consumer Services 28: 296-303.
  19. ^ A b C d E F G h Morey, Timothy, Forbath, Theodore a Schoop, Allison. 2015. „Údaje o zákaznících: návrh pro transparentnost a důvěru.“ Harvardský obchodní přehled 93(5): 96-105
  20. ^ A b C d Roeber, Bjoern; Rehse, Olaf; Knorrek, Robert; Thomsen, Benjamin (2015). „Osobní údaje: Jak kontext utváří sdílení údajů spotřebitelů s organizacemi z různých odvětví“. Elektronické trhy. 25 (2): 95. doi:10.1007 / s12525-015-0183-0.
  21. ^ A b Smith, Natasha. 2015. „Datafikace marketingu.“ Novinky DM: 16+. Citováno z http://go.galegroup.com/
  22. ^ A b Lee, Seungsin; Lee, Younghee; Lee, Joing-In; Park, Jungkun (2015). „Personalizované elektronické služby: Ochrana soukromí spotřebitelů a sdílení informací“. Sociální chování a osobnost. 43 (5): 729. doi:10,2224 / sbp.2015.43.5.729.
  23. ^ Tsai, Chieh-Yuan; Huang, Sheng-Hsiang (2014). „Přístup k dolování dat k optimalizaci alokace regálového prostoru s ohledem na chování zákazníků při nakupování a přesunu“. International Journal of Production Research. 53 (3): 850. doi:10.1080/00207543.2014.937011.
  24. ^ A b C d Liu, Libo, Cheung, Christy M. K. a Lee, Matthew K.O. 2016. „Empirické zkoumání chování při sdílení informací na sociálních obchodních stránkách.“ International Journal of Information Management 36(5): 686-699.
  25. ^ Chen, Jie, Teng, Lefa, Yu, Ying a Yu, Xeer. 2016. „Vliv online informačních zdrojů na nákupní úmysly mezi spotřebiteli s vysokou a nízkou náchylností k informačnímu vlivu.“ Journal of Business Research 69(2): 467-475.
  26. ^ A b Nguyen, Duc T. a Jung, Jai E. 2016. „Detekce událostí v reálném čase pro online analýzu chování velkých sociálních dat.“ Počítačové systémy budoucí generace 66: 137-145.
  27. ^ A b Spence, Patric R., Lachlan, Kenneth A. a Rainear, Adam M. 2016. „Sociální média a krizový výzkum: Sběr dat a pokyny.“ Počítače v lidském chování 54: 667-672.
  28. ^ Chang, R. M., Kauffman, R. J. a Kwon, Y. 2014. Pochopení posunu paradigmatu k výpočetní sociální vědě za přítomnosti velkých dat. Rozhodnutí, 63, 67-80.
  29. ^ A b C Mann, A. 2016. Základní koncept: výpočetní sociální věda. PNAS, 113(3). 468-470. doi: 10,1073 / pnas.1524881113
  30. ^ Lilley, Stephen, Frances S. Grodzinsky a Andra Gumbus. 2012. „Odhalení komercializovaného a vyhovujícího uživatele Facebooku.“ Journal of Information, Communication & Ethics in Society 10(2):82-92
  31. ^ „Metodika průzkumu“ (PDF), Statistiky, 19. prosince 2014, vyvoláno 19. prosince 2013
  32. ^ Shaw, Jonathan (březen 2014), „Proč jsou„ velká data “velkým problémem: Informační věda slibuje změnu světa“, Harvardský časopis, vyvoláno 23. prosince 2016
  33. ^ Nature News, duben 2009
  34. ^ Stahování reality těžby
  35. ^ Dokument o těžbě reality
  36. ^ Eagleova Harvardova biografie