Kdo poslouchá vaši komunikaci s digitálními asistenty? [téma]

14. 8. 2019

Sdílet

Při komunikaci s chytrým reproduktorem, z něhož vám odpovídá Alexa nebo např. Google Asistent, vám vůbec nemusí dojít, že vaše komunikace není soukromá. Kde leží příčina problému a co s tím?

Původní článek je ze dne 9. srpna 2019. Dne 14. srpna byly doplněny informace o Facebooku a o vyšetřování irskou komisí. Už jste se někdy zabývali myšlenkou, kdo vás může poslouchat? Namířené mikrofony slouží při telefonování, ale také v posledních letech sledujeme vzestup hlasové asistence. To, co si příliš neuvědomujeme, že komunikaci s nimi mohou poslouchat jiní lidé z masa a kostí. A nemyslím teď ty, kteří jsou s námi přítomní ve stejné místnosti. V letošním roce bylo odhaleno několik případů chytrých komunikačních technologií, které vám naslouchají, přičemž cesta nahrávek pak směřuje přes datacentra k dalším lidem. V těchto dnech sledujeme prozatímní vrchol odhalení a jejich důsledků. Začněme shrnutím. Zaznamenány byly tyto případy:

  • Dne 11. dubna Bloomberg ve svém reportu odhalil, že lidští pracovníci a pracovnice Amazonu poslouchají uživatelskou komunikaci s Alexou. Někdy jde o banální dotazy pro vyhledání, jindy o omylem odposlechnuté zpívání ve sprše.
  • Dne 12. července Flanders News odhalil, že lidé najatí Googlem poslouchají záznamy uživatelské komunikace s Asistentem a chytrým reproduktorem Home, a to minimálně v Belgii a Nizozemsku. Zachyceny byly také soukromé konverzace, kterým Google naslouchat neměl.
  • Dne 26. července The Guardian zjistil, že lidé najatí Applem poslouchají i velice soukromé uživatelské komunikace se Siri. V rámci nich zaznívají soukromí informace o zdraví, někdy Siri zprostředkuje manželský pár při souloži.
  • Dne 7. srpna přinesl další report magazín Motherboard. Lidé najatí Microsoftem poslouchají hovory probíhající skrze Skype Translator. V rámci některých byla řešena velmi citlivá osobní témata týkající se vztahů, zdraví apod. Některé záznamy uživatelských konverzací se pak týkají i asistentky Cortany.
  • Dne 13. srpna Bloomberg informoval o tom, že stovky externě najatých lidí provádí transkripci anonymizovaných zvukových nahrávek ze služeb Facebooku. Jde primárně o Messenger. Účel jim firma nesdělila, obsah některých nahrávek byl vulgární.

Na lepším rozpoznávání hlasu pracují lidé

Všechny tyto případy jsou uvedeným publikacemi pečlivě zdokumentovány a potvrzeny interními zdroji. Existuje samozřejmě oprávněný důvod, proč k odposlouchávání záznamů lidmi dochází. Na základě reálných dat ze skutečného světa se technologie pro hlasovou komunikaci s roboty rozvíjí a zdokonaluje. Nebude-li robot rozumět vašim příkazům, nebude vám k ničemu. V případě Skypu šlo např. o zlepšení funkce pro překlad mezi jazyky v reálném čase.

Jakkoli je důvod firem oprávněný, ne každému vyhovuje, že si jeho komunikaci mohou poslechnout živí lidé, byť nejde o obsah vašich sdělení, ale o samotnou technologii. Rozpoznávání hlasu není lehká disciplína. Microsoft v roce 2014 popsal, co vedlo k vzniku jeho produktu a extenzívně používá výraz strojové učení (dnes by se zřejmě svezl na vlně popularity pojmu umělá inteligence, šlo by ovšem o nesprávné použití).

V dlouhém příspěvku explicitně nezmiňuje, že analýzu záznamů komunikace provádí lidé, ačkoli to z něj nepřímo vyplývá. Pro řadu lidí bude strojové učení abstraktním pojmem a už vůbec si s ním neasociují lidskou úlohu v procesu. Technogiganti o lidech nemluví, zmiňovat algoritmus nebo strojové učení je pohlednější, jenže lidé jsou v tomto procesu aspoň dnes nezbytným elementem. Právě oni vytváří algoritmy pro analýzu. Co je nenaučí, to algoritmy neumí. Manuální korekce prováděné lidmi pak pomáhají algoritmům, aby v budoucnu přesněji rozpoznávali pronesená slova.

S ohledem na reakci po uvedených odhaleních je zjevné, že si část veřejnosti neuvědomuje, že k poslouchání záznamů komunikací může dojít. Právě nejasné podmínky, mlžení i lhaní technologických firem platí za základní problém. Kolik lidí si domyslí, že jejich nahrávky mohou být poslouchány, když používají reproduktor s Alexou nebo Google Asistentem, Siri na iPhonu, případně Skype Translator?

Firmy neříkají, co s vaší komunikací udělají

Hlasoví asistenti a asistentky a další produkty byl měly dát jasně najevo, jak bude s vašimi daty nakládáno. Jenže to se neděje. Google chce např. zlepšit svůj vyhledávač. Budiž. V podmínkách používání uvádí, že nahrávání mohou být uložena. Málokdo podmínky čte, což můžeme považovat za svou chybu.

Přesto by bylo dobré, kdyby zařízení např. při první aktivaci dalo tuto skutečnost explicitně najevo. V podmínkách Google nicméně neuvádí, že nahrávky může poslouchat člověk. Je to minimálně netransparentní. Ještě horší je, že Google dříve odposlouchání nahrávek člověkem přímo popřel. Flanders News upozornil, že tak učinila ve videu věnovanému problematice odposlechů místní pobočka Googlu.

To je maximálně zavádějící. Sice nejste odposloucháváni přímo v reálném čase, na vaše nahrávky ale může přijít řada později při analýze uložených záznamů, jakkoli mohou být anonymizovány. Anonymizace je pak typickým argumentem technogigantů, není však odpovědí na netransparentní přístup. I kolem ní navíc panují pochybnosti.

(a podávají zavádějící informace)

Navíc se ukázalo, že Google nahrával také konverzace, aniž by došlo k uživatelské aktivaci robota příkazem „OK, Google“. Apple se brání tím, že analyzováno je jen nízké procento aktivací robota. I Siri bývá aktivována omylem, slyší prý i na rozepnutí zipu. Nejde o záměr, technologie zkrátka jen není dokonalá. Bohužel ani Apple explicitně neříká, že vaši komunikaci může poslouchat nejen stroj, ale také člověk.

Amazon se rovněž odvolává na přísné podmínky při posleších s tím, že jeho lidé nemají přímý přístup k informacím, podle nichž by mohli jedince identifikovat. Jenže na snímku Bloomberg viděl, že jsou nahrávky spojeny s identifikačním číslem účtu, křestním jménem a sériovým číslem zařízení. To lze přinejlepším označit za částečnou anonymizaci a výrok Amazonu o přímém přístupu k informacím za zavádějící.

V tomto případě se můžete v nastavení vyvázat z toho, aby byly nahrávky komunikace použity pro vývoj nových funkcí. I předvolba je ale zavádějící, protože při obyčejném procesu kontroly kvality Alexy mohou být nahrávky analyzovány tak jako tak. Microsoft zveřejnil přehled otázek a odpovědí na téma soukromí ve Skype Translatoru. Nezmiňuje, že může člověk poslouchat úseky vaší komunikace. Pouze uvádí, že je komunikace šifrovaná, což vyvolává mylný dojem, že je zcela soukromá.

Facebook potvrdil, že také poslouchá své uživatele a uživatelky. Dále pro Bloomberg uvedl, že lidé, jejichž nahrávky byly poslouchány za účelem ověření validity přepisu mluveného slova počítačem, si tuto možnost zvolili v nastavení Messengeru. Co tím myslí? Stačí, že aplikaci udělíte přístup k mikrofonu a používáte hlasové služby. Navíc Facebook neupozorňuje, že by vaše nahrávky mohly slyšet třetí strany. (Jeden z najatých subjektů, který kontrolu transkripcí pro Facebook provádí, se nazývá TaskUs.)

Nic o zvukových nahrávkách nezmiňuje ani v podmínkách používání, obecně však uvádí, že zaznamenává vaši komunikaci s ostatními. Ještě loni při slyšení v americkém senátu Zurkerberg tvrdil, že nás firma neposlouchá za účelem prodeje reklam. Účel je jiný a k odposlechům tedy dochází. Postup technogigantů nelze ani vzdáleně označit za transparentní.

Další etické otázky

S omylem zaznamenanými citlivými komunikacemi pak vyvstávají další etické otázky, když pominu, že celá problematika poslechů cizích komunikací je ohromným etickým dilematem. Co uděláte, když se dozvíte, že někdo plánuje vraždu nebo loupež? S tím se technogiganti musí popasovat. I přes veškerá ujištění, že pracovnice a pracovníci provádějící analýzy nemohou identifikovat osobu na záznamu, existuje možnost, že poznají své příbuzné, přátele, známé osobnosti apod.

Konec lidských odposlechů?

Před pár dny Apple TechCrunchi oznámil, že svůj program pro zkvalitnění Siri prostřednictvím lidských pracovníky a pracovnice přerušuje. Proces prověří a vydá aktualizaci, kde vás nechá rozhodnout, zda se chcete podílet na zkvalitnění produktu skrze lidskou analýzu. To je zřejmě ideální stav, pokud Apple dodrží princip volitelnosti a na neschválené záznamy člověk nesáhne.

Také Google pozastavil proces analýzy záznamů lidmi, jak uvedla Ars Technica. Chce zabránit únikům dat a podotýká, že ukládání zvukových záznamů na servery lze v účtu vypnout, pokud se do nastavení ponoříte. Oba subjekty budou ve sběru ovšem po nějaké době opět pokračovat a bude tak činit také Microsoft, který zpřísní praktiky pro nakládání s daty. Facebook také oznámil pozastavení programu.

Irish Data Protection Commission podle Bloomberga prošetřuje praktiky Facebooku a Googlu. Už dříve se začala zabývat chováním dalších technogigantů. Firmy by v EU mohly porušovat GDPR.

bitcoin školení listopad 24

K poslouchání nahrávek lidmi bude docházet, pokud mají být hlasové služby zlepšovány. Ve výsledku jde tedy o to, abyste měli možnost se informovaně rozhodnout, jestli chcete službu používat, pokud vaše záznamy může slyšet živý člověk, případně abyste měli možnost se z analýzy vyvázat. Provozovatelé služeb musí být transparentní a na tak citlivé záležitosti by dle mého osobního názoru měli zvlášť upozorňovat, aby se nestávalo, že si vůbec neuvědomíte, kdo vás může slyšet.

V neposlední řadě musí uživatelé a uživatelky tyto zprávy akceptovat, nikoli jen bezhlavě „odklikávat“ souhlasy s podmínkami používání. Je potřeba si uvědomit, že v našem světě je mikrofonů plno. Jsou jimi vybaveny naše laptopy, tablety, hodiny a hlavně mobily. Platí, že zatímco přítomnost fyzického zařízení jsme si všimneme, i když ani to nemusí být vždycky snadné, nikdy nepoznáme, co činí software na pozadí. Nahrává nás? Posílá data neznámo kam do cloudu? Nad situací bychom měli aspoň uvažovat.