Johannes Kepler bol počítačom svojej doby. Bol astronómom, fyzikom, optikom, matematikom. Objavil zákony pohybu vesmírnych telies. Zákonom lásky rozumel menej, o čom svedčí rozkošný príbeh, ktorý vo svojej knihe Grapes of Math (vo voľnom preklade – Ovocie matematiky, čo je alúzia na Steinbeckovo Ovocie hnevu) opisuje britský spisovateľ Alex Bellos. Keď Kepler ovdovel, začal si hľadať novú manželku a viedol si o tom dôkladné poznámky. Dnes preto vieme, že flirtoval až s jedenástimi rôznymi ženami, no lásku nenachádzal – strácal ju buď z vlastného nezáujmu, alebo z váhavosti.
Po dvoch rokoch dvorenia rôznym dámam sa napokon s odprosením vrátil k "číslu päť”. A žili šťastne, až kým nepomreli. Veda však od Keplerových čias pokročila, a tak Bellos v knihe ponúka návod, ktorý mohol slávnemu matematikovi ušetriť šesť zlých schôdzok. V 60. rokoch minulého storočia údajne aj na základe tejto Keplerovej príhody vymysleli matematici stratégiu, ktorú nazvali "Problém so sobášom“. Nemá garantovať ideálny výber, ale má matematicky maximalizovať šance na uspokojivý výsledok. Dá sa uplatniť, keď máte vopred daný počet "uchádzačov“. A výsledok býva lepší ako náhodný výber.
Popularizátor matematiky Martin Gardner prišiel s výpočtom, podľa ktorého treba najskôr absolvovať 36,8 percenta stretnutí. Človek však nesmie povedať ani raz "áno“. Rozhodnutie môže prísť až potom – človek sa má rozhodnúť hneď pre prvého "uchádzača“, ktorý je lepší, ako najlepší z tej "prvej vzorky“. Hoci je pravda, že najlepší kandidát môže byť medzi prvými 36,8 percenta, pre matematikov je to stále dosť dobrý systém. V Keplerovom prípade by inak rozhodnutie podľa vzorca zhodou okolností korešpondovalo s jeho náhodným výberom. Dáma číslo päť bola prvou po ukončení "úvodnej vzorky“.
Špión vo vernostnej karte
Od čias Gardnera je veda opäť ďalej, a tak okrem matematickej optimalizácie dnes stroje môžu v snahe o pochopenie lásky pracovať aj s množstvom dát, ktoré o sebe ľudia rozosievajú na sociálnych sieťach, googlovaním alebo prezeraním webu, ale aj pri nákupoch (vernostnými kartami). New York Times pred časom napísal príbeh o analytikovi dát Andrewovi Polovi, ktorý sa v roku 2002 zamestnal v obchodnom reťazci Target. Pre veľké obchody sú vzácnou komoditou zákazníci, ktorí práve čakajú bábätko. Nielenže veľa utrácajú na dieťa, ale vytvorí sa u nich návyk na obchod, ktorý môže pretrvať roky.
Preto sa kolegovia Pola spýtali, či by vedel vytvoriť program, ktorý by len na základe údajov z vernostných kariet dokázal zistiť, či daná zákazníčka nie je tehotná, a to v čo najskoršom termíne, možno už vtedy, keď o tom ešte nevie ani najbližšia rodina. Pole to dokázal a v Targete spravil kariéru. Ako to súvisí s on-line randením? Keď počítače len na základe vášho nakupovania vedia vyhodnotiť, čo budete potrebovať, ešte predtým, než to viete vy sami, prečo by stroje vďaka veľkým dátam nemohli predvídať aj intímnejšie správanie, napríklad výber partnera a lásku? Poďme teda ešte ďalej – viac na telo.
Veľké dáta nezbierajú len obchody, ale aj sociálne siete. A ak si myslíte, že na nich o sebe prezrádzate len to, čo sami napíšete a zdieľate, ste na omyle. V roku 2013 prišiel so štúdiou výskumný tím z Cambridgeskej univerzity. Na Facebooku skúmali na vzorke 58-tisíc ľudí jedinú vec – čo sa im na sociálnej sieti páči, teda čomu dávajú "lajky“. Výsledok? S úspechom 88 percent vedeli určiť sexuálnu orientáciu jedinca, v 67 percentách vedeli, či je vo vzťahu, a v 60 percentách trafili, či sa rodičia skúmanej osoby rozviedli predtým, než dosiahla vek 21 rokov. Ukážte strojom, čo lajkujete, a ony vám povedia, kto ste.
Keďže je máj, lásky čas, poďme sa ďalej venovať tomu, ako stroje dokážu rozumieť citom. Opäť môžeme začať Facebookom. Ten presne na Valentína 2014 zverejnil na svojom blogu sériu grafov, ktoré ukazovali, ako vidia lásku stroje v jazyku jednotiek a núl. Niektoré výstupy tímu Facebook Data Science sú zjavné. Páry, ktoré si navzájom "lajkujú“ a komentujú príspevky a objavujú sa spoločne na fotkách, sú menej náchylné na rozchod, ako tie, ktoré to nerobia. Zaujímavé je však sledovať sieť kontaktov. Ak sa všetci spoloční známi páru poznajú nielen s danou dvojicou, ale aj navzájom, je to chyba. Príliš veľa prepojených spoločných známych znamená, že pár nemá vlastný život a pravdepodobnosť rozchodu je preň štatisticky vyššia.
Vďaka veľkým dátam by počítač na Facebooku mohol zistiť aj to, kedy ste sa s niekým dali dokopy, bez toho, že by ste si zmenili na sociálnej sieti status na "zadaný“. Podľa anonymných údajov miliónov účtov pracovníci Facebooku odhalili, že pred vzťahom intenzita pridávania príspevkov narastá (je to forma digitálneho dvorenia) a následne náhle klesá (pár sa venuje sám sebe v reálnom svete). Zároveň čerstvá dvojica používa v statusoch pozitívnejšie slová.
Vlani vo februári zase Facebook vypočítal, kto z vašich priateľov na sociálnej sieti má najväčšiu šancu stať sa vaším Amorom, teda čia sieť známych najviac prináša možnosť na spoznanie niekoho nového (sú to ľudia, ktorí nie sú úplne vaši najbližší kamaráti, ale dobre vás poznajú, zároveň majú na Facebooku viac priateľov ako vy a ich kontakty sú navzájom menej prepojené). Toto všetko však vlastne boli iba PR správy firmy Marka Zuckerberga. Iná veľká sociálna sieť, ktorá sa vyslovene točí okolo lásky, sa však hrá s dátami od svojich užívateľov (a aj s nimi samotnými) od počiatku svojej existencie…
Myslia si, že sa nik nedíva
O odvážnych akciách jednej z najväčších on-line zoznamiek na svete OkCupid jej spoluzakladateľ Christian Rudder povedal, že ľudia sa k nim nestavajú negatívne, lebo samotné on-line zoznamovanie berú ako jeden veľký sociálny experiment. Keď spravíte pokusné králiky z užívateľov Facebooku, príde rozhorčená reakcia davu aspoň na ôsmom stupni Richterovej škály. Keď to isté spraví OkCupid, seizmológovia on-line hnevu sa musia ľudí pýtať, či vôbec cítili nejaké otrasy. Aj preto Rudder o dátach z on-line zoznamovania písal nielen blog, ale dokonca o tejto téme napísal knihu.
Jej názov je Dataclysm, podtitul Kto sme?* a za hviezdičkou sa skrýva doplnenie menším písmom: "*ak si myslíme, že sa nik nedíva“. Na predchádzajúcich príkladoch sme si ukázali, ako stroje dokážu zistiť, kto sme, len na základe analýzy veľkých dát. OkCupid je len jednou z mnohých zoznamiek, ktoré sa snažili tento fakt využiť. Pred dvanástimi rokmi teda vytvorili systém, ktorý sa snaží ľudí zoznamovať na základe analýzy čo najväčšieho počtu osobných dát. Neťahajú ich z iných stránok, ale používajú vlastný systém série ankiet na najrozličnejšie otázky a kombinujú ich s preferenciami užívateľov pri výbere partnera.
Systém funguje tak, že odpovedáte takmer na nekonečný sled otázok. Od tých očakávaných "zoznamkových“, ako – či chcete mať deti, čo hovoríte na príležitostný sex, cez hodnotové, ako – čo pre vás znamená Boh, či ste liberál, alebo konzervatívec, až po uletené, ako – či chcete byť vládcom sveta. Po každej otázke zaškrtnete nielen svoju odpoveď, ale aj očakávanú odpoveď partnera/ky a nakoľko je pre vás táto téma dôležitá. Systém na základe spracovania dát vytvorí percento zhody s partnermi, ktorí sú vo vašom okolí a ktorí spadajú do vašej vybranej vzorky.
Na internete viete nájsť všetko, čo chcete, ale s tým, čo naozaj potrebujete, je to oveľa komplikovanejšie.Christian Rudder, spoluzakladateľ OkCupid
A tu sa začína Rudderova hra s dátami o láske. Ako vedúci tímu veľkých dát má prístup k tomu, čo ľudia otvorene nepovedia, ale pri výbere partnera sa tým riadia. Štatistická vzorka, s ktorou pracuje, je mnohonásobne väčšia než tá, s ktorou robia napríklad prieskumné agentúry. Zoznamka má ročne približne desať miliónov užívateľov! Denne si cez túto stránku dohodne rande 30-tisíc párov, tri tisícky z nich vytvoria dlhodobý vzťah a asi dve stovky sa po čase vezmú. Okrem veľkej vzorky je výhodou aj to, že ľudia sa na stránke správajú na rozdiel od prieskumov prirodzenejšie, keďže nesedia s anketárom.
Jedno z najčastejšie zdieľaných zistení knihy, ktoré je zároveň najviac zavádzajúce, je graf o tom, koho považujú ľudia oboch pohlaví v rôznom veku za najatraktívnejšieho. Rudder údaje získal na základe funkcie, kde ľudia môžu hodnotiť fotografie iných na stupnici od jednej do piatich hviezdičiek. Kým v ženskom grafe sa vek mužov, ktorí sa im najviac páčia, približne zhoduje s ich vlastným vekom, pri mužoch dominujú len tri čísla – 20, 21 a 22. Práve na tomto príklade sa dá ukázať zraniteľnosť veľkých dát. Stroj by si ľahko mohol myslieť, že má všetkým mužom dávať do výberu len ženy v tomto veku.
Zasahuje však človek, a tiež Rudder, ktorý nám v ďalšom grafe ukazuje vekové preferencie mužov na ženy, ktoré naozaj hľadajú. Tu sa už viac približujeme k realite. Aj pre tridsiatnikov sú už dvadsaťročné primladé, nehovoriac o starších ročníkoch. Najreálnejší ukazovateľ je potom, s kým si reálne muži najviac píšu – dvadsiatnik s dvadsiatničkou, tridsiatnik s dvadsaťpäťročnou, štyridsiatnik s tridsaťročnou… Možno sú to trochu bulvárne čísla, no poukazujú na to, že veľké dáta vyžadujú veľkú pozornosť. A že pri láske robí problémy to, že ľudia často vedia, čo chcú, ale nevedia, čo potrebujú.
Hitchcock viac ako boh
"Ak môžem pozmeniť text Rolling Stones You Can’t Always Get What You Want (nemôžete vždy dostať to, čo chcete – pozn. preklad.) – na internete viete nájsť všetko, čo chcete, ale s tým, čo naozaj potrebujete, je to oveľa komplikovanejšie,“ píše Rudder v knihe Dataclysm. Pekný príklad pridáva pri analýze spomínaných anketových otázok. Ľudia majú napríklad veľkú tendenciu prikladať dôležitosť veľkým témam, ako je politika, náboženstvo a iné hodnotové postoje. Čo však ukazuje analýza veľkých dát? Zhoda v týchto otázkach je pre vzťah menej dôležitá ako odpovede na otázky: "Máš rád horory?“ alebo "Rád cestuješ sám po svete?“
Inými slovami, hororom a cestovaniu po svete ľudia neprikladajú v dotazníku veľkú dôležitosť, ale pri analýze státisícov rande sú práve tieto dve kategórie prekvapujúco dobrým parametrom, či vzťah môže fungovať. Rudder píše aj o unikátnom experimente, ktorý opäť ukázal, ako ľudia v on-line zoznamkách preceňujú niektoré aspekty na hľadanom partnerovi – v tomto konkrétnom prípade výzor. V roku 2007 OkCupid spustili službu "Rande naslepo“. Na špeciálnu aplikáciu sa viazal aj dotazník, kde obaja hodnotili, kto z partnerov bol atraktívnejší. A takisto, ako boli celkovo spokojní s rande.
Prekvapujúce bolo, že kvalita schôdzky sa neodvíjala od výzoru partnera. Aj viac atraktívny z dvojice mal tiež dobré rande, ako ten menej oslnivý. V on-line priestore však hrá atraktivita v súčasnosti absolútny prím. Dokazuje to aj aktuálny úspech aplikácie Tinder, kde si ľudia partnera vyberajú iba na základe fotografií a pár slov v profile (obyčajne 1–2 vety, často vôbec nič). Klasické zoznamky dokonca strácajú klientov v prospech tých, ktoré sú viac zamerané na rýchlosť rozhodovania a výzor. Je to, akoby sa ľudia naučili používať oheň a zrazu začali vo veľkom prechádzať k modleniu sa za blesk, ktorý zapáli konár?
Nie úplne. Keby boli on-line zoznamky, ktoré vykročili v ústrety veľkým dátam, vďaka nim skutočne úspešné, zrejme by Tinder bodoval naozaj len u ľudí, ktorí si hľadajú sex na jednu noc. Príčin neúspechov je viac. Napríklad tá, že dáta, ktoré zbierali, tvorili užívatelia vedome – v profiloch. Boli to teda skreslené dáta. Povedzme si, že istá Katarína hľadá každý deň na Googli slovné spojenie „50 odtieňov sivej“. Stroj zvaný Google vie, že zrejme hľadá svojho pána Greya. Do profilu zoznamky sa však Katarína zdráha napísať tieto svoje túžby, otázku vynechá alebo zodpovie zle. A nikdy nenájde, čo hľadá.
Druhým problémom je známy efekt internetovej bubliny. V článku Veľké dáta sa preceňujú pre magazín Slate naň upozornil David Auerbach, počítačový inžinier a publicista, ktorý často píše o hlúposti počítačov. Po príklad sa vráťme k analýzam obchodných reťazcov. Povedzme, že človek ide dva víkendy po sebe na chatu a dostane za úlohu spraviť nákup pre všetkých. Kúpi teda aj viac alkoholu, čo stroj z jeho vernostnej karty vyhodnotí tak, že mu začne posielať akciové ponuky na alkohol. On si povie, že to je dobrá ponuka a akcie začne využívať a kupovať zrazu viac alkoholu než predtým…
Podobne to funguje aj v on-line zoznamovaní. Počítač môže vyhodnotiť preferencie pri výbere partnera nesprávne, no dotyčný si to neuvedomuje a možno stále chodí na ďalšie a ďalšie rande odsúdené na neúspech a rozmýšľa, kde sa stala chyba. Často sa však stáva, že pod vplyvom počítača začne meniť svoje vlastné preferencie. Viera v techniku ho utvrdzuje v tom, že práve toto je to správne. Dostane sa tak paradoxne do situácie ostýchavého Františka z českej komédie, ktorému vo filme stroj zaslal zlý kondiciogram, no on mu predtým uveril natoľko, že mu svoj život aj tak maximálne prispôsobil.
Haiku miliónov žien
moje modré oči
ryšavá a
štvorkolka
country dievča
milujem prírodu
Začiatok haiku? Nie, len päť najčastejších fráz a útržkov viet, ktoré sa objavujú v ženských profiloch na OkCupid. Dokonca aj keď stroju dáte správne informácie, stále ich môže vyhodnotiť úplne zle. V staršom rozhovore pre Pravdu Auerbach spomínal, ako práve túto zoznamku testoval raz zo žartu s vlastnou manželkou. Systém im vtedy prisúdil takú nízku zhodu, že by sa ich profily partnerovi nikdy neboli bývali zobrazili. „Keďže som napríklad o sebe napísal, že som tvrdohlavý, systém mi vyhľadával iba ženy, ktoré explicitne napísali, že sú tolerantné,“ opísal vtedy slabiny analýzy dát.
Slabé stránky robotického dohadzovača však ľudí neodrádzajú. V Spojených štátoch je na on-line zoznamke prihlásený každý druhý slobodný človek. Na Slovensku mala pri poslednom prieskume z roku 2013 skúsenosť s on-line zoznamovaním až tretina opýtaných. Päť percent Slovákov vtedy podľa TNS randilo cez web pravidelne. Dnes sú tieto čísla určite ešte vyššie. On-line zoznamovanie je veľkou témou po celom svete, štúdií o pozitívnom a negatívnom efekte rozšíreného výberu partnerov je neúrekom, rovnako ako príbehov o tom, ako Tinder zmenil sexuálne správanie najmladšej generácie.
Aj podľa príkladov z Rudderovej knihy je zjavné, že stroje láske nerozumejú. Nechápu, prečo Auerbachovci môžu spolu vychádzať napriek tomu, že majú zásadnú nekompatibilitu v kolónke "S-3997-tvrdohlavosť“. Počítače skôr dávajú priestor spoznať nových ľudí a vo väčšom počte, s ktorými máte strojovo správne predpoklady rozumieť si. Alebo sa vám len fyzicky páčia. To nemusí byť až taká dramatická zmena ako pri ľudských dohadzovačoch či "off-line zoznámeniach“, ale stroje svojimi filtrami a bublinami predsa len menia nielen to, ako sa zoznamujeme, ale aj s kým.
Možno si to neuvedomujeme, ale stroje nám už do značnej miery určujú, s kým sa zoznamujeme, milujeme, usadíme, s kým stvoríme pokračovateľov ľudského rodu. Treba sa znepokojovať? Ktovie. Ale určite na to treba občas myslieť. Lebo, vážení priatelia, do našej obce zavítala veda!