Az adattudomány sárkánya: hagyjuk a big data-t szabadon fejlődni, vagy már most kalickában a helye?


A Budapesti Corvinus Egyetem G-kari Kutatási hetének címei nem voltak híján a az olyan varázsszavaknak, melyek könnyűszerrel vonzhatják be a szakmai közönség mellett a gazdaság- és társadalomtudományok iránt érdeklődőket is. Villogó, vörös Piketty felirat, utalva a legnépszerűbb kortárs francia közgazdász (vagy épp kriptoszocialista) könyvéről való beszélgetésre. Sápadtan derengő médiaökonómia egy másik program címében, keserédes szellemvasutazást ígérve a centralizált médiabirodalmak kulisszái mögé. De ezek után megjelent az a mágikus hívószó, amely a leghatározottabb véleményű tudósokat is megtorpanásra készteti: a big data. Az adattudomány egy olyan téma, egy olyan terra incognita, ahol senki nem mer biztosat mondani, vagy ha mégis, akkor annak szinte kötelező szuperlatívusznak lennie. Nem tudjuk, hogy mire lesz még jó, de teljesen biztos, hogy gyökerestül megváltoztatja a tudományt, az életünket, mindent.

A Kutatási hét kereteiben Zöldi Zsolt a big data szabályozási kérdéseiről tartott előadást, mely pont ezt a kettősséget világította a meg a sztárdiszciplína esetében. Még nem tudhatjuk pontosan, hogy mire képes, mégis mindenki sürgeti a súlyos ellenőrzését és szabályozását, utalva arra, hogy a személyes adataink birtoklása végleg kicsúszhat a kezeink közül, ráadásul ezeket nem az óvó állam, hanem kétes erkölcsű magánvállalatok kaparintják meg. Ez a kezdetektől való korlátozás azonban minden jel szerint a tudomány fejlődését gátolja, és annak pozitív hozadékaitól is elzárja a társadalmat. Hagyjuk felnőni, hogy meglássuk, mire is képes, vagy kölyökkorától kössük gúzsba és így tanulmányozzuk? Az oldalak képviselői megpróbálnak gáncsot vetni egymáson, mondjuk azt is hozzá kell tennünk, hogy amíg nincsenek kilátásban egyértelmű, átütő eredmények, addig senki sem veszi a feladatát véresen komolyan.

Zöldi felvázolta a pro/contra irányokat, majd bemutatott egy hozzá közel álló szeletet a témakörből, mely tökéletesen példázza, milyen társadalmi, gazdasági és etikai áramlatok segítik és hátráltatják a technológia alkalmazását: a big data használatát a bírósági gyakorlatban. Az amerikai jogrendszer precedensre építő jellege miatt az igény teremtette a Lex Machina nevű jogi céget és a hozzá tartozó adatbázist. A kezdeményezés összegyűjtött minden eddigi Egyesült Államokban született bírósági anyagot, mely nem csak a végkimenetelt, de az első tárgyalástól, az utolsó szakértői véleményig mindent rendszerbe foglal. Egyrészt kereshetővé alakítja a bírósági anyagokat, de ami fontosabb, elemzéseket is készít belőle a cég. A program az ismert faktorok alapján előrejelzéseket ad a folyamatban lévő perünkre, megadja, hogy melyik bíró milyen ítéletet hoz bizonyos helyzetekben, sőt még odáig is elmegy, hogy ha az ügyvédünk a védőbeszédben a megadott érveket és kifejezéseket használja, akkor a megjelölt bírónál hány százalékkal nő a kedvező ítélethozatal esélye.

Ez a példa magában foglalja mindazokat a lehetőségeket és dilemmákat, amit a big data jelenleg nyújt számunkra. Hozzáférhetünk a vágyott információhoz, de nem csak mi, hanem más is. Vajon etikus a bíróság rejtett emberi tényezőit kihasználnia annak, aki meg tud fizetni Lex Machina hozzáféréssel rendelkező ügyvédet? És aki ezt nem engedheti meg magának, az hátrányba kerül, így ezzel a társadalmi különbségeket erősítjük tovább? Ugyanakkor, ha senki nem képes átlátni az összes precedens nyújtotta információkat, az nem deformálja-e ugyanúgy az esélyegyenlőséget? Nem véletlen a sok kérdőjel, hiszen a big data egységes szabályozása nélkül, központi felügyelő intézmény hiányában egy olyan terep, ahol nem lehet egyértelműen állást foglalni a közérdek szempontjából.

A hasonló programok sokasága már használatban van, és rengeteg további van fejlesztés alatt, viszont amíg nem láthatjuk egységesen, hogy a különféle óriásadatbázis-feldolgozás milyen gazdasági és társadalmi hatással jár, addig az a legjobb, ha megbéklyózás helyett hagyjuk, hogy fejlődjön, újabb utakat és lehetőségeket nyisson meg előttünk, de kíváncsiságunk mellett megmarad az a felügyelő figyelem, ami a megfelelő pillanatban kezelésbe tudja venni a big data esetleges vadhajtásait.

Hegedűs Robin