„Fizikusnak-kémikusnak labor kell, a közgazdásznak pedig adat” – Science Café, Középpontban az adat sorozat

A Gazdálkodástudományi Kar Kutatási Bizottsága Science Café sorozatot hirdetett „Középpontban az ADAT” címmel, melynek keretében a félév során négy eseményt szerveznek az adattudomány kérdései köré, azok a kutatók legszélesebb köréhez szóló, az adatelemzést és adatgyűjtést érintő aspektusait feldolgozva. A „kávéházi események” alkalmával az egyetem különböző kutatásaiban részt vevő szakértőket hívják meg a szervezők a Faculty Clubba, akik nem csak egymással vitatják meg az aktuális problémákat, de megpróbálnak a vendégségbe érkező kutatók segítségére lenni abban, hogy hogyan érjék el és használják a rendelkezésre álló adatokat. A rendezvény az EFOP-3.6.3.-VEKOP-16-2017-00007 "Tehetségből fiatal kutató”- A kutatói életpályát támogató tevékenységek a felsőoktatásban program támogatásával jött létre.

Az első alkalom vezérfonalát az adatbázisokhoz való hozzáférés és a másodlagos adatok elérése adta, a kerekasztal-beszélgetés résztvevői pedig Agárdi Irma (Marketing és Média Intézet), Csengődi Sándor (Gazdaságpolitika és Közpolitika Intézet), Hoffmann Ádám (Egyetemi Könyvtár) és Mezősi András (Regionális Energiagazdasági Kutatóközpont) voltak. A résztvevők elsősorban arról meséltek, hogy milyen adatbázisokkal szoktak dolgozni, illetve milyen bevált módszereik, jó gyakorlataik vannak az adatok labirintusában való eligazodásban.

Hoffmann Ádám bemutatta, hogy milyen adatbázisok, illetve azok milyen szolgáltatásai érhetőek el az egyetemi polgárok részére.

Agárdi Irma rávilágított, hogy a marketing és média kapcsán az embereknek leginkább a fókuszcsoportos és ehhez hasonló módszertannal készülő kutatások ugranak be, de a valóságban a vállalatok kutatásában jelentős mértékű adatbázis-használat figyelhető meg, hiszen a kérdőívezésnek a területen megvannak a maga korlátai, így gyakran meglévő, széleskörű adatokat dolgoznak fel vizsgálataikban. A nagyvállalatok innovációjának vizsgálatához számos adathalmazt fésülnek össze a kutatások, különféle innovációs eredményeket gyűjtenek össze, melyben a digitális és nem-digitális innováció aspektusai is megjelennek, mindez összevetésre kerül a részletes pénzügyi eredményekkel. Az adatok nem csak tudományos célokat szolgálnak: a külső gazdasági partnerekkel való együttműködést segítik, viszont ehhez gyakran még több vállalati adatra lenne szükség, amelyek nem egy-egy iparágat vizsgálnak aggregálva, hanem olyanok, melyekből vállalati paneleket lehet építeni.

Csengődi Sándor elmondta, hogy míg a fizikusnak-kémikusnak a munkához labor kell, addig a közgazdásznak ugyanehhez a munkához adatra van szüksége, amiben Magyarország nagyon jó helyzetben van. Jó adatok állnak rendelkezésre, melyekhez ha jó ökonometriai módszerekkel nyúlunk, akkor minden adott egy magas minőségű publikációhoz egy neves folyóiratban. Azonban a megfelelő adatbázisok nem tetszőlegesen használhatóak, a jelenlegi helyzetben erős a célhoz kötöttség. Ez olyan furcsa helyzeteket is szül a kutatók életében, amikor valamilyen célra megkapnak adatokat használatra, de azokat felhasználás után le kell törölniük a számítógépükről, nem tárolhatják tovább, holott ez egy későbbi publikációhoz kért számítás elvégzéséhez akár még szükséges lehetne. A mai, GDPR-tól terhelt időkben a kutató az adatok tárolásával súlyos büntetés kockázatának teszi ki magát, ha egy-egy ilyen meghatározott módon kiadott adatbázist a kelleténél tovább tárol, ez viszont nem csak a flexibilitást csökkenti nagy mértékben, de az adott kutatás megfelelő prezentálását is hátráltatja. Akár tanszékeken belül is tapasztalható az a zavarba ejtő helyzet, hogy egy adatbázisból több kutatás is dolgozott, utána viszont a saját kollégájuk házon belül nem tud hozzáférni ugyanazokhoz az adatokhoz. Gyakran a megfelelő adatok beszerzésének nehézségei el is veszik a kutató kíváncsiságát, hogy az ötletei nyomába eredjen. Erre megoldást jelentene, ha az adatokat maga az egyetem kaphatná meg általános kutathatóságról szóló szerződést kötve, mert amíg ezt a „kis” kutató teszi, addig mindenkinek egyesével kell újra és újra megküzdenie az adatokért.

Mezősi András egy másik problémáról számolt be, mégpedig arról, hogy az adatbázisokban gyakran egy-kétéves lemaradás tapasztalható, ami egy akadémiai cikk esetében még megfelel, de egy tanácsadás jellegű munkában ez nagyon hátráltatja a folyamatot. További nehézségként a hivatalos szervek törvényi kötelezettség szerinti adatszolgáltatásának lassúságát, illetve annak megtagadását említette, ami az energiagazdasági vizsgálatok esetében egy komoly akadályozó tényezőnek számít. De nem csak a hivatalos szervekre jellemző, hogy fokozottan védik az adataikat, és még olyan célokra is vonakodva szolgáltatják ki őket, amelyek az adott intézmény hasznára is válhatnak. Természetesen fontos kérdésként merült föl, hogy a beszerzői oldalról is különböző nehézségek állnak a kutatók előtt, hiszen sokkal több és összetettebb intézményi rendszeren kell keresztülvinniük az adatkéréseiket, mintha ugyanezt egy magánvállalat számára kérnék ki.

A kutatók persze azt is hozzátették, hogy vannak olyan gyűjtéseik, eredményeik, amelyeket ők sem szívesen osztanának meg bárkivel, így az érvelések nem az adatok feltétlen és szabad áramlása mellett szólnak, hanem arra próbáltak rávilágítani a beszélgetésen, hogy milyen együttműködési formák könnyítenék meg a kutatók munkáját az egyetemen belül, és milyen általános nehézségeket kellene közös erővel kommunikálni a magyar és külföldi adatszolgáltatók irányába.

A sorozat következő alkalma 2019. március 20-án kerül megrendezésre Adatelemzési környezet - Bolyongás az adat körül címmel, a részletes leírás programajánlónkban olvasható.