MetaAI a trénovanie umelej inteligencie na dátach a fotkách z Facebooku a Instagramu

Problematika, o ktorej sa moc nehovorí, no týka sa mnohých z nás. Ak máte účet na Facebooku alebo Instagrame, je možné, že aj vaše dáta budú zdrojom na trénovanie novej umelej inteligencie (AI) spoločnosti Meta. Čo to ale znamená pre nás a ako sa tomu dá zamedziť?

Spoločnosť Meta mení zásady ochrany súkromia

Už od minulého roka sa množstvo užívateľov, hlavne umelcov búri proti novým zásadám, ktoré prídu do platnosti 26.6.2024. Do týchto nových zásad sa dá dostať cez Nastavenia > Informácie > Zásady ochrany súkromia (na Instagrame). Hneď na vrchu stránky je aktualizácia aj so všetkými údajmi, ako „AI od spoločnosti Meta“, kde je link na stránku so všetkými informáciami, ale aj „Právo namietať“, kde je formulár, v ktorom sa dá podať námietku.

Práve tu zisťujeme, že vďaka tomu, že sme súčasťou členských štátov EÚ (+ Spojené Kráľovstvo) máme právo namietať kvôli silným GDPR nariadeniam a zákonom; ostatné krajiny a kontinenty túto možnosť nemajú. Meta píše, ako im táto generatívna AI bude pomáhať zlepšiť produkty, no tiež píše, odkiaľ tieto dáta na trénovanie AI získava:

„Keďže na trénovanie efektívnych modelov je potrebné veľké množstvo údajov, získavame ich z kombinácie rôznych zdrojov. Používame informácie, ktoré sú verejne dostupné online, a aj licencované informácie. Používame aj informácie, ktoré boli zdieľané v produktoch a službách spoločnosti Meta. Medzi tieto informácie môžu patriť napríklad príspevky alebo fotky a ich titulky. Na trénovanie našej umelej inteligencie nepoužívame obsah vašich súkromných správ s priateľmi a rodinou.

Aj keď nepoužívate naše produkty a služby alebo nemáte účet, môžeme spracúvať informácie o vás na účely vývoja a zlepšovania AI od spoločnosti Meta. Môže sa to stať napríklad vtedy, ak sa objavíte kdekoľvek na obrázku zdieľanom v rámci našich produktov alebo služieb niekým, kto ich používa, alebo ak niekto uvedie informácie o vás v príspevkoch alebo titulkoch, ktoré zdieľa v rámci našich produktov a služieb.“
– Spoločnosť Meta

Z tohto úseku môžeme vyčítať, že Meta na trénovanie svojej AI používa všetky verejné príspevky alebo fotky a ich popisy. Čo to môže pre vás znamenať?

Všetky verejné profily a príspevky môžu byť použité na trénovanie AI

Ak máte verejný profil a zdieľali ste na ňom pred rokmi alebo teraz svoje rodinné fotky, fotky svojich detí alebo akékoľvek iné, po čase môžu byť zhromaždené v datasetoch a ktokoľvek používajúci MetaAI bude môcť vygenerovať podobu vás alebo niekoho iného, kto bol zdieľaný na fotkách. Nemusíte o tom vedieť, dokonca ani mať Facebook/Instagram a súhlasiť s tým; stačí, ak vašu fotku niekto bez Vášho vedomia zdieľal a môže to skončiť v datasetoch.

Veľký problém majú hlavne umelci a kreatívci, ktorí si rokmi na Instagrame budovali svoj profil, zdieľali svoje umenie, texty, a teraz je ich kariéra a umelecká identita ohrozená. Mimo EÚ nemajú právo namietať, tj. používaním služby musia buď podstúpiť riziko, že ich údaje a umelecký štýl bude ukradnutý a následne generovaný konkurenciou; alebo si musia svoj profil vymazať. Pri tom neexistuje v Meta žiaden opt-out. Jedinou možnou alternatívou je právo namietať, čo automaticky nemusí znamenať, že všetky vaše údaje a dáta nebudú použité na tréning AI.

Vy nedávate súhlas, nová aktualizácia ho automaticky dá za Vás.

Spoločnosť Meta si nepýta povolenie, ale využíva tzv. oprávnený záujem. Má jedinú povinnosť, a to informovať svojich používateľov o zmenách. Tie nastanú 26.6.2024. Právo namietať môžete využiť, ak žijete v krajinách EÚ a UK.

Link na námietky na Facebooku a Instagrame pridávam do článku, lebo inak sú zahrabané v mnohých podstránkach, aby to ľudia ľahko nenašli, prípadne aby ich to odradilo. Vo formulári je tiež použité pole, kde musíte napísať dôvod, no tu stačí napísať, že s tým nesúhlasíte alebo nechcete, aby vaše údaje boli využité na trénovanie AI a po potvrdení mailu s kódom Vám na FB/IG príde upozornenie s výsledkom námietky.

Podľa správnosti by vašu námietku mali prijať, no stávajú sa aj prípady, kedy Meta napíše, že ju neprijmú (a to hlavne v krajinách mimo EÚ, kde majú odlišný formulár (kde chcú dôkaz, že údaje alebo dáta už boli ukradnuté a použité))

Kvôli tejto problematike nemôžeme povedať, že právo namietať znamená tzv. „opt-out“, keďže námietke nemusia vyhovieť. Ak by spoločnosť Meta išla etickou cestou, nebol by žiaden opt-out ale forma opt-in. To znamená, že len ľudia, ktorí by s tým vyslovene súhlasili by sa do programu AI pridali a ich údaje a dáta by boli použité do trénovania. Keďže legislatíva je v tomto ešte krátka, veľké spoločnosti využívajú možnosť zneužiť pomalosť zákonov proti generatívnej AI, lebo im to takto vyhovuje. Takýmto spôsobom budú mať milióny až miliardy dát a fotiek, ktoré boli na ich platformy nahraté a malé percento, čo sa z tohto odhlási bude zanedbateľné. Ich oznámenia sú tiež nenápadné, aby sa čo najmenej ľudí z tohto programu AI odhlásilo.

Návod v screenshotoch, ako podať námietku na Instagrame:

Najskôr treba ísť na svoj profil a kliknúť na hamburgrové menu

Potom treba prescrollovať až dole, kde je možnosť „Informácie“

Tu treba kliknúť na „Zásady ochrany súkromia“

A tu už máte danú aktualizáciu a info, kde je tiež aj možnosť „Právo namietať“

Keď kliknete na právo namietať, dostanete sa na stránku formuláru. Musíte sa znova prescrollovať o krok nižšie a vyplniť ho

Zadáte svoju krajinu, mail a dôvod, prečo nechcete aby trénovali na vašich údajoch Meta svoju AI

Dôvod nemusí byť nič komplikované, ja som napísala toto a prijali mi to. Formulár takto vyzerá len v krajinách EÚ a UK.

Na konci už od vás budú vyžadovať len verifikačný kód, ktorým vám overia mail. POZOR: je možné, že vám to nepríde do hlavnej pošty, ale do záložky „Siete“ Kód je platný hodinu.

Na koniec už len dáte odoslať, a o chvíľu by vám mal prísť mail s rozhodnutím.

Mala by vám prísť takáto automatická odpoveď, na FB príde aj upozornenie. Keď už odošlete formulár, môžete zavrieť stránku lebo proces už beží na pozadí.

Prečo je toto veľké bezpečnostné riziko?

Generatívna AI je založená na datasetoch, ktoré majú obrovské množstvo dát, obrázkov, textov a iných, ktoré boli bez súhlasu pridané z rôznych častí internetu. Keď si buduje platforma vlastnú AI, chcú použiť čo najviac dát svojich používateľov, aby „vylepšili svoje služby“ a „pomáhali ľuďom riešiť zložité problémy, byť vynaliezavejší a vytvárať niečo, čo bolo doteraz nemysliteľné“.

Pre obyčajného laika toto tvrdenie vyzerá v poriadku, no ľudia, čo sa do toho vyznajú a záleží im na svojom digitálnom súkromí sú znepokojení. Meta nepíše presne, ako jej AI bude v budúcnosti využitá, komu z tretích strán sprístupnia svoje datasety v budúcnosti a ako budú naše dáta využívané. Ak sa naše údaje alebo fotky dostanú do nejakého datasetu, už sa nedajú odstrániť a my nad nimi strácame kontrolu.

Veľká časť obrázkov využitá v týchto datasetoch sú dokonca chránené copyrightom alebo IP (intelektuálne vlastníctvo), čo väčšina spoločností s integráciami AI ignoruje a odmietajú zverejniť svoje datasety. Týmto spôsobom je pre ľudí ťažšie nájsť dôkaz, že spoločnosť využila ich prácu, fotky alebo umenie aby ich mohla legálne žalovať.

Veľká hrozba, ktorej čelia hlavne umelci a spisovatelia už je realitou – kvôli AI prichádzajú o prácu, lebo generované obrázky, ktoré by bez týchto umelcov nemohli vzniknúť im odrazu konkurujú na trhu ako lacnejšia alternatíva, dokonca niekedy kopírujú celkový štýl a identitu umelca alebo spisovateľa. Tiež majú problém aj hudobníci alebo ľudia, ktorí pracujú so svojim hlasom a AI im kradne ich identitu. Je využívaná vo veľkom na podvody a je ešte viac dostupná, ako kedykoľvek v minulosti.

Ako niekto, kto tento problém sleduje dlhodobo z pohľadu umelca, viem, že nie všetky AI sú neetické a dokážu sa využívať aj na dobré veci (napríklad v zdravotníctve, výpočtoch atď.). Generatívna AI, ktorá nie je dostatočne regulovaná ale do tohto zoznamu nespadá. Spoločnosti ako OpenAI, StableDifusion a Midjourney využívajú nelegálne získané obrázky z internetu na obrovský zisk na úkor všetkých dotknutých.

Hlavne z tohto dôvodu som silne proti GenAI, ktorá generuje obrázky a budem šíriť osvetu, fakty a informácie, aby sa viac ľudí dozvedelo o tom, ako toto všetko funguje a prečo je to silne neetické a škodí to nielen ľuďom, ale aj životnému prostrediu (áno, aj to je jeden z problémov).

GenAI by mohla byť etická, keby veľkým spoločnostiam nezáležalo len na rýchlom zisku a keby legislatíva na ochranu tvorcov bola rýchlejšia proti tejto rýchlo sa vyvíjajúcej technológii.

Update:
Meta pozastavuje spustenie modelov AI v Európe kvôli írskej žiadosti*, no nevie sa na koľko, ani či Európske zákony GDPR pomôžu v konečnom dôsledku. Preto odporúčam všetkým využiť právo namietať, ako na Facebooku, tak aj na Instagrame a Messengeri. Jeden účet = 1 námietka (formulár) – treba si to vyklikať pre všetky profily, ktoré máte.

Linky na zdroje a diskusie:

Umelci proti GenAI:

Info o Adobe AI:

https://www.instagram.com/p/C766Oq2pjPK/?igsh=MWZkczQ2YW52eTkycw==

Možnosti pre ochranu umelcov a ich umenia:

https://www.instagram.com/p/C7g6oIpxoy2/?igsh=MTN1N3Q1bnA5M3Npdg==

MetaAI a trénovanie umelej inteligencie na dátach a fotkách z Facebooku a Instagramu