Közszolgálat

Miért tesszük letölthetővé a feldolgozott adatainkat, és miért ajánljuk ugyanezt másoknak?

Mert ezzel a mi munkánk is ellenőrizhetőbb, átláthatóbb és hitelesebb lesz. 

Akár csak az elmúlt negyed évben számos fontos vagy érdekes kutatás összefoglalója jelent meg a magyar médiában, egyik-másik népszerűsége pedig azt mutatja, hogy a számottevőn is túlmutató érdeklődés mutatkozik a hazai tudományos eredményekre is. Ezek többségében a társadalom széles rétegeit érintő kérdések. Többször kerestem meg kutatókat azzal, hogy feldolgozás céljából megkaphatnánk-e az adatokat, nyilván minden kellő és jogos hivatkozást megadva. A legtöbbször választ sem kaptam a kutatóktól, más alkalmakkor a válasz egy kedves, de határozott nem volt, és csak pár esetben mutatkozott a kutatók részéről valamiféle érdeklődés. Persze vannak üdítő kivételek, például a Corruption Research Center Budapest, de egy kezemen meg tudom számolni azokat az eseteket, amikor a kutatók számára teljesen evidens volt, hogy az adataikat közzé kell tenniük.

A tudósok, kutatók és sajnos civil szervezetek elzárkózása a gyűjtött vagy kiperelt adataik közlésétől nem sajátosan magyar jelenség, más országok újságírói, kutatói és szervezetei is szenvednek tőle. Az adatok nyilvánossá tételének megtagadását ilyenkor a kutatók a szerzői jogokkal magyarázzák, hiszen az elvégzett munka és kutatás során keletkezett adatbázis – jogosan – szerzői műnek minősül, így valóban van jogalapja annak, hogy egy kutató ráül az adataira és nem kötelezhető azok nyilvánossá tételére.

Találkoztam olyan esettel, amikor a kutató/adatgyűjtő nem zárkózott el az adatai átadásától, viszont ezért komoly pénzt kért volna cserébe. Ritkább, de szintén előforduló érv, hogy a kutatók azért nem hozzák nyilvánosságra az adataikat, mert szerintük azokat az új felhasználók csak félreinterpretálnák, vagyis ezzel akarják megvédeni a kutatás integritását, nehogy a hozzá nem értő, vagy rossz szándékú emberek „rossz” eredményre, „téves” következtetésre jussanak. Ebben a gyakorlatban annak is lehet szerepe (láttunk erre is épp elég példát), hogy a végén pont a fordítottja derül ki: az adatokat maguk a kutatók interpretálták a felismerhetetlenségig, lényegében hazudtak. Az adatok kiadásának megtagadása mögött tehát a lebukástól való félelem is motiváció lehet.

Ezzel szemben áll az az érv, hogy ezeket a kutatásokat a tudósok közpénzből végezték el, vagyis a kutatási munkáért, az adatbázis előállításáért és az eredmények publikációjáért közvagyonból már eleve fizettünk. Továbbá az adatok kiadásának megtagadása szembe megy a tudományosság ethoszával is, vagyis azzal, hogy ezek a kutatások átláthatóak, ellenőrizhetőek és reprodukálhatóak legyenek.

Meg kell említeni továbbá a kutatók és civil szervezetek méltányolható félelmét is, hogy mások pont az ő adataikat felhasználva kapnak nagyobb figyelmet, illetve aratják le azok presztízsbeli és anyagi gyümölcseit. Ezt azonban ki lehet védeni és meg lehet előzni. Egyfelől azzal (köszönöm a tippet Léderer Sándornak), hogy különféle lincenszekkel látjuk el az adatainkat, amire például a Creative Commons még mindig talán a legjobb megoldás (az Átlátszó által előállított minden szellemi termék így van licenszelve – a szerk.). A Creative Commons licenszekkel ki lehet kötni, hogy a szerzői művet, jelen esetben az adatokat milyen feltételekkel lehet felhasználni, hogyan lehet az eredeti forrást megnevezni és meg lehet tiltani azt is, hogy az adatokból származó műveket, feldolgozásokat, további adatszármazékokat nem lehet üzleti célra felhasználni.

A másik megoldás pedig tényleg az adatgyűjtő és a feldolgozó közötti bizalmi viszony és párbeszéd, amely során a felek felfogják és elfogadják, hogy az együttműködésekből win-win helyzetek jöhetnek ki. A kutatónak azért lesz jó, mert minél több formában terjednek az eredményei, a feldolgozóknak azért, mert több és érdekesebb tartalmakat tudnak előállítani, a közönségnek pedig azért, mert több és érdekesebb, ráadásul tudományosan megalapozott tartalomhoz juthatnak hozzá.

Az Átlátszónál nem feltétlenül csak a fentebbiek miatt, de legtöbbször kénytelenek vagyunk saját magunk előállítani az adatbázisainkat. Ezek sokszor fáradságos, több hetes vagy több hónapos manuális adatgyűjtések, vagy az államtól kiperelt adatok szintén sokszor idegtépő munkával való rendszerezése, de egyre többször fordul elő, hogy programozott adatgyűjtő robotokkal egyszerűen lehúzzuk az internetről a nekünk kellő információkat egy strukturált adatbázisba.

Mindezt nem magyar közpénzből tesszük, hanem olvasóink adományaiból, SZJA 1 százalékokból, pályázati pénzekből. Ennek ellenére most már jó ideje az általunk feldolgozott adatokat nyilvánossá és letölthetővé tesszük a cikkeink végén, vagy pedig itt, ez lett a működésünk egyik ökölszabálya.

 

Miért csináljuk?

Az Átlátszó egyik legfontosabb feladata a politikai és gazdasági elit elszámoltatása, átláthatóbbá tétele, ezen túl pedig bizonyos jó vagy rossz társadalmi folyamatok elemzése. Erre a feladatra sokszor és egyre többször használunk adatokat. Azt gondoljuk, hogy a tevékenységünk akkor lesz hitelesebb, ha a cikkeinkhez használt adatok alapján megtett állításaink megmérhetőek és ellenőrizhetőek. Így az adatalapú munkáink során az alábbi alapelvek miatt tesszük elérhetővé az adatbázisainkat változtatás nélkül:

  • hogy a munkánk átláthatóbb legyen
  • hogy az állításaink, eredményeink visszaellenőrizhetőek legyenek
  • hogy az eredményeink mások számára is reprodukálhatóak legyenek
  • hogy ezzel is hozzájáruljunk a közös adatvagyonhoz
  • mert nem gondoljuk, hogy tévedhetetlenek lennénk
  • mert nem gondoljuk, hogy az adott adatokat kizárólag egyféleképpen lehet feldolgozni
  • mert nem gondoljuk, hogy a mi feldolgozásaink a lehető legjobbak lennének, bár nyilván törekszünk rá, hogy jók legyenek
  • mert nincs mit titkolnunk

Emellett törekszünk arra is, hogy a számításaink módszertana szintén ellenőrizhető legyen, így amennyiben a téma bonyolultsága megkívánja, minden egyes esetben leírjuk, hogy milyen számításokat, összevonásokat, egyszerűsítéseket vagy törléseket (pl. személyiségi jogok miatt) végeztünk az adatbázison. Szintén fontos, hogy a legtöbb esetben az általunk készített grafikonok, térképek mindenki számára hasznosíthatók, elvihetők, beágyazhatók legyenek, így azokon az adatok eredeti forrását továbbá az értelmezést segítő megjegyzéseket is feltüntetjük.

Mindez a következő adatkörökre vonatkozik:

  • az Átlátszó által manuálisan vagy gépi módszerrel gyűjtött adatokra
  • az Átlátszó által kiperelt közérdekű adatokra és dokumentumokra
  • a másoktól megkapott, felhasználásra és utánközlésre engedélyezett adatokra
  • az Átlátszó által megvásárolt, felhasználásra és utánközlésre engedélyezett adatokra

Ezeket az adatokat egyelőre Excel, csv vagy PDF-formátumban lehet elérni.

Minden kutatót, kutatócsoportot, szerkesztőséget, civil szervezetet illetve kormányközeli szervezetet is arra buzdítunk, hogy ne üljenek rajta az adataikon, hanem tegyék azokat közkinccsé. Főként akkor, ha ez közpénzből előállt adatokra, adatbázisokra vonatkozik, és akkor is, ha azokért adott esetben perelni kellett.

Bátorfy Attila

Megosztás