Nevidni stroji


Vladan Joler

Mi, kot človeški delci omrežene družbe, smo vidni skorajda v vsakem trenutku interakcije s tehnologijo. Ves čas se nam sledi, se nas kvantificira, analizira in poblagovlja. Toda v nasprotju s našo hipervidnostjo pa je mnogo faz rojstva, življenja in smrti omreženih naprav pokritih s plaščem nevidnosti. Z nastopom popularnih naprav, ki so podprte z osrediščeno umetno inteligentno infrastrukturo in nevidnimi vmesniki, kot so denimo glasovni, se zdi, da plašč nevidnosti postaja še večji.

Dosegli smo točko, ko je gladka in bleščeča aluminijasta površina naših naprav brez vijakov, brez vidnega vhoda, izgubili smo tipkovnice, ki so nam omogočale kodiranje in ustvarjanje novih svetov. In sedaj izgubljamo tudi vidne vmesnike, ki jih bodo zamenjali glasovni ali gestikularni vmesniki. S tako imenovanim “oblakom” in tehnologijami strojnega učenja se komputacija in procesiranje ne dogajata več v naših napravah, temveč v neki veliki sivi zgradbi tisoč kilometrov stran. Dejanske naprave, programska oprema in algoritmi so nekje drugje ali pa morda na mnogih krajih hkrati, a redkokdaj znotraj dosega roke. Sedaj imamo, denimo, v napravah, kot je Amazon Echo, zgolj nekaj senzorjev in zvočnikov. Na uporabnikovi strani ni prav dosti za odpreti, zlomiti, popraviti ali ponovno sestaviti.

Kot velja v primeru omreženih naprav, lahko govorimo tudi o drugih plasteh nevidnosti.
Nevidnost mrežne infrastrukture in tako imenovane infrastrukture oblaka;
nevidnost proizvodnega procesa, dobavnih verig in materialov, ki se rabijo v proizvodnji;
nevidnost človeškega dela, povezanega z mnogimi procesi v proizvodnji naprav;
nevidnost kode, skrite za lastniško programsko opremo; nevidnost splošne energetske porabe celotnega sistema.

Obstajajo tudi mnoge druge očitne ali bolj subtilne oblike nevidnosti, ki smo jih že povezali z omreženimi napravami, obstajajo pa tudi nekatere specifične oblike nevidnosti, ki se pojavljajo šele takrat, ko govorimo o glasovnih vmesnikih kot razširitvi infrastrukture umetne inteligence in strojnega učenja.

Po eni strani imamo pred seboj tako rekoč nevidne vmesnike, toda po drugi strani pa globlje, v srcu procesa, v temi nevronskih mrež in strojnega učenja, vidimo nove forme nevidnosti. Nevidnost je sam proces strojnega sklepanja. V preteklih letih je v akademskih, političnih in aktivističnih krogih krožil govor o pomembnosti algoritmične transparentnosti. Ne moremo reči, da je iz teh razprav izšla neka jasna rešitev, in problem algoritmične transparentnosti je še vedno na mizi. Toda, če govorimo o algoritmih strojnega učenja, denimo tistimi, ki so odgovorni za modele za glasovnimi vmesniki, se soočamo s potencialno celo globljim problemom.

Po svoji naravi je globinsko učenje še posebej temna črna škatla in težko je verjeti, da bomo zmožni preverjati, zakaj je neka nevronska mreža sklepala tako, kot je, ali pa denimo nekoga diskriminirala, tako da bi pogledali v skrite plasti ali križišča te mreže. Ti procesi bodo verjetno ostali skriti v skritih plasteh nevronske mreže. Ta fenomen ima ime: črna škatla umetne inteligence. Ko je nevronska mreža enkrat izurjena, je res težko razumeti, zakaj nek nabor vhodnih podatkov daje nek določen rezultat. To je lahko kritična točka ali ovira v grajenju zaupanja v razsodnost umetne inteligence in kar nekaj raziskovalnih inštitucij in akademskih raziskovalcev raziskuje to temo.

Toda morda naša pozornost v procesu razkrivanja plasti nevidnosti ne bi smela biti usmerjena le na plast nevronskih mrež in globinskega učenja samega, temveč prav toliko na raven vhodnih podatkov ali pa recimo temu učbenikov naborov podatkov ali virov informacij, ki jih neka umetna inteligenca prebira. Zdi se, da še nikoli ni bilo lažje kot danes zgraditi umetne inteligence ali sisteme, osnovane na strojnem učenju. Dejstvo, da imamo na voljo odprtokodna orodja za to, v kombinaciji z zlahka dostopno komputacijsko močjo preko oblačnih oligarhov, kot sta Amazon (AWS) ali Google (Google Cloud), daje lažno idejo dostopnosti, odprtosti in decentraliziranosti UI revolucije.

Rečemo lahko, da postaja imetje lastnih nevronskih mrež bolj in bolj dostopno z vidika postavljanja lastnega sistema, toda ko gre za nabore podatkov, ki so potrebni za učenje teh sistemov, pa se soočamo z mnogimi novimi problemi. Vadbeni nabori podatkov so postali najpomembnejši vir razvoja prihodnjega strojnega učenja ali umetne inteligence in so močno zaščiteni za lastniškimi zidovi pečice običajnih osumljencev. Tu vidimo, kako ta ista koncentracija moči, ki je bila v zadnjem desetletju nakopičena preko ekonomije nadzora in praks množičnega kopičenja podatkov, postaja odločilen vir za razvoj nove, še bolj asimetrično razporejene moči in za ustvarjanje še večje vrzeli med »veliki petimi« in ostalimi. V njihovem sistemu izkoriščanja nematerialnega dela je naša nova naloga hraniti nevronske mreže s podatki o našem obnašanju, glasom, označenimi fotografijami in videi ali zdravstvenimi podatki.

Še en zanimiv vidik v zvezi s tem problemom nas pripelje nazaj k staremu, toda nikoli razrešenemu in nekoliko pozabljenemu problemu lastništva in avtorskih pravic nad vsebinami. Leta 1989 je ustanovitelj Microsofta Bill Gates zagnal družbo Interactive Home Systems, ki je kasneje postala Corbis, eden od “velike četverice” digitalnih arhivov slik. Zbirka, ki si jo lasti ta družba, vsebuje največji arhiv zgodovinskih fotografij iz 19. in začetka 20. stoletja. Ni težko verjeti, da je lahko tak arhiv z milijoni zgodovinskih fotografij,, ki je v bistvu zasebna lastnina, lahko zanimiv nabor podatkov za učenje prihodnje umetne inteligence. To nas pripelje do problema lastništva arhivov digitaliziranih medijev preteklosti in novih oblik moči in bogastva, ki se jih lahko ustvarja na privatiziranih zapisih naše zgodovine.

Še več, razvoj umetne inteligence in analize velikega podatkovja lahko ustvarja nova asimetrična razmerja moči med kvantificiranimi družbami, ki so razvila kulturo in prakso arhiviranja in kvantificiranja svoje dediščine, zgodovine in sedanjosti ter na drugi strani družb in kultur, ponavadi v državah v razvoju, ki so brez takih praks. To lahko potencialno okrepi vrzel med prvim svetom in državami v razvoju, okrepi staro in ustvari nove oblike hegemonije ter digitalnega imperializma.

Osebnost prihodnjih umetnih inteligenc se bo oblikovala na osnovi javno dostopnih in lastniških naborov podatkov. Dovolj nenavadno je, da sta dva popularna javno dostopna nabora podatkov danes zbirka 1495 zvočnih posnetkov »TEDTalks« s popolnimi transkripcijami teh posnetkov in nabor pol milijona sporočil elektronske pošte, ki so nekoč pripadali višjemu menedžmentu korporacije Enron. Četudi globinsko učenje ne deluje povsem na ta način, se mi je zdelo izjemno zabavno in obenem zastrašujoče si predstavljati osebo, ki lahko v sebi združi osebnost Enronovega menedžerja in “kako rešiti svet” pripovedi steroidnih »TEDTalks« predstavitev.

Naša potencialna hipoteza tu je, da bi morali, če govorimo o transparentnosti ene naprave ali produkta osnovanega na strojnemu učenju in nevronskih mrežah, zahtevati transparentnost naborov podatkov in virov, ki so bili uporabljeni v procesu učenja te mreže.

Zdi se, da najtežji del te igre ni zgolj ogromna zbirka podatkov in lastništvo vsebine, temveč označevanje in kategoriziranje zbranih vsebin. Ta proces lahko razkrije še en zanimiv vidik – tisoče ur skritega, slabo plačanega človeškega dela.

Leta 1770 je Wofgang von Kempelen sestavil stroj za igranje šaha, znan kot “mehanični Turek”, da bi naredil vtis na cesarico Marijo Terezijo. Ta naprava je bila zmožna igranja šaha proti človeškemu nasprotniku in je z velikim uspehom zmagovala v večini iger, ki jih je igrala na predstavitvah širom Evrope in Amerike skoraj devet desetletji. Toda očitno je bil “mehanični Turek” v resnici mehanična iluzija, v kateri je s strojem upravljal v njem skrit človeški šahist.

Kakšnih 160 let kasneje je Amazon za znamko svoje, na mikroplačilih osnovane platforme množičenja [crowdsourcing] uporabil to isto ime. Po Ayhanu Aytesu se je Amazonova začetna motivacija za izgradnjo Amazonovega Mechanical Turka pojavila po neuspehu umetno inteligentnih programov pri nalogi, da bi našli podvojene strani s produkti na Amazonovi prodajni strani. Po nizu jalovih in dragih poskusov so se projektni inženirji obrnili k ljudem, ki bodo delali za računalniki v tekočem spletnem sistemu. Amazon Mechanical Turk digitalna delavnica posnema sisteme umetne inteligence tako, da zamenjuje komputacijo s človeško možgansko močjo. Kot to razloži Amazon: Mechanical Turk se morda vašim strankam zdi, kot da ta aplikacija za opravljanje svojih nalog nekako uporablja napredno umetno inteligenco, toda v resnici gre za “umetno umetno inteligenco” delovne sile Mechanical Turka, ki vam pomaga učinkovito doseči poslovne cilje.

Kot opaža Aytes, v obeh primerih (pri mehaničnem Turku iz leta 1770 in v sodobni različici Amazonove storitve) je zmogljivost delavcev, ki animirajo napravo, zakrita s spektaklom stroja.

Ta vrsta nevidnega, skritega dela, izvoženega ali množično opravljenega dela, skritega za vmesniki ali kamufliranega v algoritmične umetne procese ni tako redka, še posebej v procesih označevanja in razporejanja tisočih ur digitalnih arhivov zavoljo hranjenja nevronskih mrež.

Kalifornijske sanje osvobojenih superljudi, okrepljenih z močmi umetne inteligence v globalni omreženi družbi, večinoma osvetljuje neslavni bleščeči vrh piramide, na znanju osnovano aristokracijo, ki dela v velikih in bleščečih kotnih pisarnah, osvetljenih s celoletno pomladno svetlobo, in zanemarja mnoge nevidne plasti izvoženega človeškega dela, ki se nahaja na drugi strani planeta. Christian Fuchs, pišoč o definiciji digitalnega dela, trdi, da ustvarjanje digitalnih vsebin (podobno se lahko reče za proizvodnjo in vzdrževanje strojnega učenja in sistemov umetne inteligence) zahteva tehnološko infrastrukturo, ki jo proizvajajo in vzdržujejo delovni procesi, ki vključujejo različne aktivnosti, kot so suženjsko delo ekstrakcije mineralov, ki oblikujejo fizično osnovo informacijskih tehnologij, delo vojaško nadzorovanih močno izkoriščanih sestavljalcev strojne opreme, ki delajo v pogojih taylorističnega industrializma, visoko plačano aristokracijo vednostnega dela, prekarne delavce digitalnih storitev kot tudi imperialistično izkoriščane vednostne delavce v državah v razvoju, delavce, ki vodijo industrijsko reciklažo in upravljanje elektronskih odpadkov, ali pa upravljajo visoko tvegano neformalno fizično delo z elektronskimi odpadki.

Da bi dobili popolno sliko, je pomembno, da ne zanemarimo materialnosti sistemov umetne inteligence in omreženih naprav oziroma tega, kar Jussi Parikka opisuje kot geologijo medijev. Od tisočev žarečih jeder NVidiinih grafičnih kartic v gigantskih podatkovnih centrih po svetu do tisočev vozlišč internetne infrastrukture, ki so zahtevane za prenos, materialnost storitev, kot je Amazonova Alexa, denimo, ni nekaj, kar bi lahko odpisali. Vsaka od teh komponent ima svojo lastno zgodovino, ki se začenja z milijoni let dolgega časa geoloških procesov, ki so jim sledila dinamična obdobja ekstrakcije kovin iz Zemljine skorje v globokih rudniških luknjah, s katerimi potem trgujejo sumljivi cehi trgovcev s kovinami, milijoni kilometrov prevozov tovora, kompleksnimi fraktalnimi produkcijskimi verigami, sofisticiranimi in dolgimi postopki proizvodnje čipov, dolgimi tekočimi trakovi kitajskih megatovarn in dolgimi potovanji mednarodnih tokov blaga.

Tu se nevidnost doseže s kompleksnostjo produkcijskega procesa. Fraktalne dobavne verige ene same sofisticirane tehnične naprave – bodisi take, ki je skrita v zidovih podatkovnih centrov bodisi vmesnika v naših domovih – sestavljajo tisoči dobaviteljev, ki priskrbujejo različne komponente, ki imajo svoje lastne dobavne verige. Kompleksnost tega sistema je tako ogromna, da je izdelovalec mikročipov Intel, denimo, potreboval dve leti, da je ugotovil, ali njihovi čipi vsebujejo material iz Konga. Kot so dejali raziskovalci iz Oxford Internet Institute v svojem projektu Wikichain:

“Sodobni kapitalizem zakriva zgodovine in geografije večine blaga pred potrošniki. Potrošniki večinoma lahko vidijo le blago v »tukaj in zdaj« prostoru in času in imajo redkokdaj priložnost videti nazaj preko proizvodne verige, da bi kaj zvedeli o mestih produkcije, transformacije in distribucije.”

Rečemo lahko, da tu ni nič novega glede na že znani diskurz o praksah v garaških tovarnah v zvezi z, denimo, proizvodnjo čevljev ali oblačil, ki obstajajo že od zgodnjih sedemdesetih let, ali v osnovi katerakoli drugo kolonialno ali neokolnialno prakso v zadnjih stoletjih. In to je verjetno res, a pomembna razlika je v tem, da je proizvodnja sodobnih tehnoloških naprav v večini primerov veliko bolj kompleksna in ji je še težje slediti, jo raziskovati in jo preverjati.

Prevod: Martin Hergouth

Slika: Wikimedia Commons