3,5 let vztahu, v Whatsapp zprávách

Analýza dat z chatu Whatsapp s mou přítelkyní

Valentýn 2020 nedávno prošel. Den roku, kdy páry slaví svůj vztah a sociální média, je zaplaven příspěvky, obrázky a chválí „druhé pololetí“. Je to často nepříjemné roční období pro kohokoli, kdo není ve vztahu, který se musí vypořádat s portrétem dokonalosti, který tak často vidíme v našich časových osách. Přesto, že jsem ve vztahu, i já jsem z toho, že jsem viděl nereálná zobrazení párů online, letos jsem se rozhodl bojovat s některými studenými tvrdými údaji. Za tímto účelem jsem obětoval své soukromí a obrátil se k médiu, které považuji za nejrealističtější - můj chat Whatsapp se svou přítelkyní.

Nedávno jsem zjistil, že je možné stáhnout celou historii chatu z Whatsapp do jediného textového souboru. Napadlo mě, že by to mohl být velmi zajímavý zdroj dat, který by mohl poskytnout mnohem realističtější a jedinečnější zobrazení toho, jaký je vztah vlastně. Takže tady v tomto článku budu dát svůj tam venku v naději, že vám může připadat analýza zajímavá, nebo že vás to může inspirovat k a) přemýšlet o tom, jak data mohou působit proti falešné realitě, kterou vidíme na sociálních médiích, b) kopat trochu hlouběji do údajů, které sami produkujete, nebo c) dát svému partnerovi velmi nerdy, dárek na věda s tématem Valentýna.

(Bonusové body, pokud můžete identifikovat všechny nadpisy sekcí…)

Tady přichází slunce

Jak jsem již zmínil, Whatsapp vám umožňuje velmi snadno stahovat celou historii vašich chatů a exportovat jako jediný textový soubor, který jsem poté transformoval a analyzoval pomocí programovacího jazyka R. Dotčený chat byl zahájen v říjnu 2016 ( protože jsem naposledy změnil telefonní čísla - moje přítelkyně a já jsme spolu od března 2016).

Je to naše hlavní forma virtuální komunikace (jen zřídka textujeme nebo používáme Facebook, například) a výsledkem byl datový soubor 52 163 individuálních zpráv - průměrně 43 zpráv denně. To mě už překvapuje a povrch jsme ještě nepoškrábali…

Síla dat

Cílem je shrnout náš vztah tak hned po netopýru, který budeme sbírat a dívat se na čísla na vysoké úrovni. Zde je stručný přehled:

  • 1212 dní - mezi 18. říjnem 2016 a 12. únorem 2020.
  • 980 (81%) z nich byly „aktivní“ dny (tj. Zprávy byly zaslány).
  • 52 163 zpráv. Poslal jsem 1 495 více zpráv než moje přítelkyně - znovu, ne to, co jsem očekával, že najde!
  • Bylo použito 11 670 jedinečných slov (z nichž mnohá nejsou skutečná slova). Použil jsem 8 844 jedinečných slov, kde moje přítelkyně použila 7 043.
  • 2 účastníci - moje přítelkyně a já - žijící ve Velké Británii a v našich dvacátých letech.

Nechci něco napsat

Počet zpráv, které každý den posíláme, v průběhu doby, kdy jsme spolu byli, v průměru klesal.

Počet zpráv Whatsapp odesílaných denně mezi mojí přítelkyní a já, 16. října - 20. února. Modrá čára označuje vyhlazený průměr.

Většinou to souvisí s tím, že na začátku tohoto období jsme byli oba na univerzitě a žili odděleně, proto jsme častěji zasílali zprávy. Pak můžete vidět v polovině roku 2017, kdy dokončujeme univerzitu a žijeme spolu, ale ještě ne v práci na plný úvazek. Z tohoto důvodu jsme trávili většinu času společně každý den a v důsledku toho jsme se navzájem nesdělili. V září 2017 jsme znovu zahájili práci a četnost zpráv se opět zvýšila (oops).

Pokud se podíváte pozorně, uvidíte také vzorec špičky kolem vánočního času - který trávíme odděleně s našimi příslušnými rodinami - a následný pokles kolem nového roku - který máme tendenci trávit společně.

Pátek, jsem zamilovaný

Dalším grafem by mohl být snadno graf motivačních úrovní po celý týden. Ve všední dny posíláme více zpráv než o víkendech.

Průměrný počet zpráv odeslaných za den v týdnu.

Naše vzorce zasílání zpráv mají tendenci odrážet mé obecné pocity vůči každému dni v týdnu a v pátek dosahovat crescendo, kdy jsme s největší pravděpodobností zaneprázdněni a stýkáme se. To často zahrnuje plánování a komunikaci příslušných informací (tedy více zpráv). Neděle je den v týdnu, který spolu pravděpodobně utratíme, takže posíláme výrazně méně zpráv.

Znovu a znovu

V návaznosti na téma většího množství zpráv během pracovního týdne se podívejme, jestli jsme opravdu tak špatní při odkládání, nebo jestli si můžu trochu zachránit obličej…

Průměrný počet zpráv za minutu během 24 hodin.

Můžete vidět, že naše zprávy se během dopoledne postupně zvyšují a kolem poledne dosahují vrcholu (nepřekvapuje). Po obědě se poněkud ponoří, když se vracíme do práce a po 16:00 se znovu zvedáme, což je čas, kdy obvykle dokončujeme práci. Méně zpráv ve večerních hodinách je prostě dalším odrazem skutečnosti, že neposíláme zprávy, když jsme spolu.

Více než slova

Nyní pro skutečné prokazující důkazy ... je čas podívat se na to, co naše nejčastěji používaná slova byla. Z tohoto důvodu jsem odstranil veškerá slova pro zastavení („a“, „,“ a „atd.) A 10 nejpoužívanějších slov každého z nás je vidět níže:

10 nejpoužívanějších slov pro každého z nás, s výjimkou stop slov

Je zřejmé, že se navzájem souhlasíme ... hodně. Jsem si docela jistý, že můj učitel výuky angličtiny bude zklamán mým častým používáním 'gonna'. Je také jasné, že 'ah' je naše oblíbené výplňové slovo - nebo cokoli ekvivalentní pro textové konverzace.

Považuji za zajímavé, že „čas“ je pro nás oba tak běžné slovo, pravděpodobně odrážející situace, kdy se snažíme něco zorganizovat nebo naplánovat („jaký čas?“, „Pokud máme čas“ atd.). Je také zcela zřejmé, kdo říká „dobrou noc“ a „dobré ráno“ nejčastěji.

Úplné zatmění srdce (Emoji)

Emojis je v dnešní době velmi populární formou komunikace a často se používá pro komediální efekt nebo pro vykreslení emocí, aniž byste museli psát slova. Abychom doplnili tuto prchavou analýzu chatu Whatsapp mezi mnou a mojí přítelkyní, podívejme se, jaké jsou naše oblíbené emodži:

Graf zobrazující každého z našich 10 nejpoužívanějších emodži v časovém období

Ani jeden z nás není překvapen, jaké jsou naše nejčastěji používané emodži. Jsem však velmi překvapen tím, jak moc používám emoji oční rolky ... zvláště když si uvědomíte, že je to více než dvakrát tolik, než jakákoli emoji, kterou moje přítelkyně používá, kromě prvních dvou.

Také mi připadá zajímavé vidět, jak graf odráží rozdíly ve způsobu, jakým používáme emodži. Mám sklon používat širší škálu a - i když mám zjevně nějaké oblíbené - šíření počtu použití jednotlivých emodži je poměrně rovnoměrné. Moje přítelkyně, na druhé straně, má dva emodži, kteří jsou zjevně její „jdi na“ emodži - neviditelnou opici a smějící se plačící tvář.

ÚPRAVA: Kód použitý v tomto článku je nyní k dispozici v mém Githubu.

Vaše data jsou říši divů

Doufám, že se vám tento krátký pohled na můj vztah těšil - jsem si jistý, že jste zjistili, že je to vzrušující. Celkově se zdá, že 3,5letý vztah na Whatsappu lze shrnout do jednoho emoji s očima.

Se vší vážností, pokud vás tento typ analýzy a prezentace dat zajímá, dejte mi sledovat a dejte mé publikaci (Data Slice) také sledovat, abych zůstal v obraze se svými články! Také uvažuji o vytvoření aplikace, která by každému umožnila rychle zobrazit vizualizaci jejich chatu Whatsapp pomocí podobných grafů / grafů, jaké vidíte zde - dejte mi vědět v komentářích nebo přímou zprávou, pokud by vás to zajímalo.