Cikkek

Miért jó dolog a közérdekű adatok üzleti célú újrahasznosítása?

A cím a jelenlegi egyre antikapitalistább magyar légkörben valóságos anatémának tűnik.  Ez részben azért van így, mert a közszféra adatai (public sector information – PSI) ma Magyarországon általában abban a kontextusban kerülnek elő, amelyben az atlatszo.hu is foglalkozik velük – a közszféra alkotmányos átláthatóságának (freedom of information) összefüggésében. Azt kevesebben tudják, hogy létezik egy EU-s irányelv a közszféra által kezelt információk további hasznosításának (re-use of information) témakörében is. Szegény irányelvre sok mindent lehet mondani, azonban a legkevésbé azt hogy nagy sikert aratott volna Európa-szerte. Ennek nagyrészt az az oka, hogy egy versengő, szabadpiaci, és az állami adópénzek szoros, kérlelhetetlenül következetes kontrollján alapuló angolszász személetmódot tükröz. Magyarországon az irányelv még halványabban érvényesül.

Ő maga

Az Európai Parlament és Tanács 2003. november 17-i 2003/98/EK irányelvéről (http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=DD:13:32:32003L0098:HU:PDF) van szó. Európának az Internet megjelenése után hosszú évekkel esett le, hogy itt egy újabb terület, amelyen Amerika megint beelőzött. Nemcsak a web mindennapi, állampolgárok által történő használatáról van szó, hanem az ún. tudásipar méretéről, fejlettségéről is. Illetve az előbbi feltételezi az utóbbit – ha nincsenek internetes tartalmak, kreatív, jól használható internetes szolgáltatások, adattárak és kikötők, tudakozók és információ-aggregáló helyek, akkor ugyan ki fogja az internetet használni, és mire? Továbbá ez az iparág a gazdaság egyre jelentősebb részét teszi ki. Sok embernek ad munkát, és rengeteg adót fizet be. Már ahol van.

Az is elég világos, hogy az államapparátus a pénzünkön elképesztő mennyiségű adatot gyűjt be, dolgoz fel, tárol, manipulál. Az adóhatóság, a földhivatal, a cégbíróság, az állami hírügynökség, a meteorológiai szolgálatok, a statisztikai hivatal, a kulturális intézmények, méregdrága szakember-gárdával működtetnek olykor méregdrága technológiákat, amelyekben naponta tonnaszámra képződnek a nyers, vagy félig feldolgozott információk. Ezekből a megfelelő csoportosítással, összepárosítással, keresőkkel, szoftverekkel, kézi munkával, (azaz ‘érték hozzáadásával’) olykor zseniálisan innovatív termékek fejleszthetőek. Csak az a baj, hogy az adatokról a közvélemény, az üzleti élet, – és itt álljunk meg egy percre, ez adott esetben egy nagy ötletet dédelgető zsíros hajú progmatos is lehet – a leggyakrabban nem is tudja, hogy léteznek. Ha tudja, nincsen hozzáférése, ha van, akkor ez nem szabályozott és kiszámítható, ha igen, akkor az adat rossz minőségű, vagy nem abban a formátumban van amiben kéne, ha meg minden stimmel, a köztisztviselő sötét irigysége fogja megakadályozni, hogy mégis megkaphassa, de erről majd később.

Amerika egyébként, amely a parát kiváltotta időközben köszöni irányelvek nélkül is megcsinálta a http://www.data.gov/ -ot, amely ma már 172 kormányzati szerv közel 400 000 adathalmazát (igen, nem elírás, nem az adatok darabszámáról, hanem az adatbázisok számáról van szó) tartalmazza. Olyan adatokról, amelyek láttán nekem, aki Magyarlandon voltam információipari szakmunkás, feláll a szőr a hátamon. Ijesztőnek tűnő adathalmazok vannak itt, nyers, félig feldolgozott, (pl. keresővel ellátott) vagy teljesen feldolgozott (ún. app-ekkel ellátott) változatban. Nem részletezem, buzdítok mindenkit egy látogatásra.

Az irányelv tehát a siralmas európai helyzeten akart javítani, Az elvárás, amit támaszt az lenne, hogy ezeket az információkat versenysemlegesen, teljes körűen, a lehető legkönnyebben hasznosítható formában rendelkezésére kell bocsátani azoknak, akik belőle mint nyersanyagból dolgozni szeretnének. Ezzel az nemcsak az információs (tudás)ipar fejlődhet, új munkahelyeket teremtve, hanem a tudományos kutatás is könnyebbé válhat, és (mellesleg) az állam is átláthatóbb lehet, (azokon a területeken, ahol a saját magára vonatkozó adatokat kezeli), sőt, a céginformációs, ingatlan-nyilvántartási, vagy a statisztikai adatok felhasználásakor a gazdasági élet biztonsága is növekedhet. A jogi adatokból képzett termékek az állampolgárok jogismeretét növelhetik, a széles körben felhasznált meteorológiai és távérzékelési adatok a biztonságot fokozzák, és így tovább.

Mert ebben az irányelvben nem csak a közszféra adatairól van szó, hanem minden adatról, amelyet – elnagyoltan – közpénzből gyűjtenek össze. Ezek az adatok lehetnek jogi, céginformációs, ingatlan-nyilvántartási, földmérési-távérzékelési, meteorológiai, statisztikai, gazdasági, kulturális, stb. adatok, információk. Nem kell talán mondani, hogy a szabály tartalmaz néhány komoly kizárást is: az állam legitim módon tartja vissza a kezelésében található személyes adatokat, államtitkokat, szerzői jogilag védett alkotásokat, stb.

A ‘normál’ közérdekű adatokhoz képest (ilyenek tipikusan egy állami szervezet működésére, döntéseire, szerződéseire vonatkozó dokumentumok) ez az adatkör jellegében, az adathasznosítás céljában, módjában, és az adathasznosítók személyében kicsit más, mint a megszokott közérdekű adat.  Más az adatkör: ahogy, ahogy azt korábban említettem ezek az adatok tipikusan épp nem az állam belső működésére vonatkoznak, hanem másra, (pl. közhiteles nyilvántartások, közpénzen gyűjtött statisztikai, vagy meteorológiai adatok, földmérési, távérzékelési, stb. adatok), így az adatkérők célja nem az állam ellenőrzéseAz adatkérések módja is más: jellemzően nem kis mennyiségben, ad hoc alapon történnek, hanem kifejezetten nagy tömegben, és rendszeresen. Az adatkérők, mivel az adatokat gyakran nem kézzel, hanem automatákkal dolgozzák fel, és a nyers adat csak alapanyaga egy terméknek, szeretnének stabil minőséget kapni, például előre megállapodott formátumokat és szerkezetet. És ezek az adatkérők rendszerint üzleti vállalkozások, (bár olykor lehetnek kutatóhelyek is.) Ha a nyersanyag nem korrekt minőségű, akkor leállnak a ‘gyártósorok’, lebénul a rendszer.

Végezetül, mivel maga az irányelv is elismeri, hogy az állami szervezeteknek lehet az ilyen nagy tömegű, egységes formátumú adatok feldolgozásával dolga, megengedi, hogy ezeket az adatokat pénzért lehessen adni, igaz csak az adatok gyűjtésével és feldolgozásával kapcsolatos költséget, az adott szerv önfinanszírozásához szükséges további költségeket, illetve némi ‘ésszerű’ hasznot lehet érvényesíteni.

Európa ellenáll

Az irányelv érvényesülését monitorozó weboldal, http://www.epsiplus.net/termékeket és szolgáltatásokat felsoroló rovatában több mint 100 példát sorol fel, és ez nyilván csak a jéghegy csúcsa, hiszen Magyarországról pl. egyetlen céginformációs vállalkozás sem regisztrált. Hogy érzékeljük, hogy miről beszélünk néhány példával szeretném megvilágítani a közadatok kreatív felhasználását.  Jómagam a céginformáció világában voltam jelen hosszasan, itt tudom a legszemléletesebben bemutatni, hogy miről is van szó.

Mint az köztudott, a cégnyilvántartás adatai a legtöbb országban szabadon hozzáférhetőek, de az állami nyilvántartások arra vannak kitalálva, hogy egy-egy céget célzottan meg lehessen bennük találni, megnézni ki jogosult azt képviselni, nem áll-e felszámolás alatt, mekkora a jegyzett tőkéje, mi a székhelye, stb.. Sok esetben a cégek mellett ott található ugyan a mérlegük is, de gyakran egyszerű, képi formában. De mi van, ha én nem egy egyszerű állampolgár vagyok, hanem egy gazdasági elemző, aki például egy teljes iparágat szeretne áttekinteni? Mondjuk földrajzi alapon, és az árbevétel-megoszlása szempontjából, esetleg idősorosan, visszatekintve néhány évre? Mi van, ha egy nagy cég vagyok, további céges ügyfelekkel, és szeretném tudni, hogy a portfóliómba tartozó cégekkel, az ügyfelekkel mi történik, (és nem akarom látni az összes cég összes változását, sőt adott esetben a saját cégeim esetében is csak a lényeges változásokat akarom tudni: pl. a telephely áthelyezését nem, de az ügyvezető személyében történő módosulást igen.

És mi van, ha arra még kíváncsibb vagyok, (tudjuk miért, ugye) ha az új ügyvezető mondjuk ukrán, vagy szerb állampolgár? És mi van, ha (természetes vágytól vezérelve) szeretném nemcsak cégek, hanem bizonyos emberek sorsát is nyomon követni, és tudni, hogy az asztal másik oldalán épp hantáló ürge hány vállalkozását vezette felszámolásba az elmúlt évek során? És mi van, ha az adatokat be szeretném esetleg építeni a saját rendszereimbe, automatizált folyamataimba, mondjuk oly módon, hogy a vevőnyilvántartásom a cégnyilvántartásból automatikusan frissüljön. És így tovább.

Ebből a példából látható, hogy hogyan kapcsolódhat össze egy állami adatbázis, némi szakételem, szoftveres megoldások és esetleg egy másik állami adathalmaz egy értéknövelt, innovatív, jól eladható üzleti szolgáltatássá. Teljesen mellesleg, a leírt szolgáltatáshalmazt Európa-szerte és Magyarországon több cég is nyújtja.

Az irányelv ennek ellenére, különösen a 2003-2009 periódusban nem tartozott az egyértelmű sikersztorik közé. Átültetése a nemzeti jogokba vontatottan haladt, (nemigen volt ez prioritás sehol), és más gondok is voltak. Az egyik – ki hinné – a költségek felszámítása, és az ésszerű nyereséghányad kategóriái voltak. Arról van szó, hogy az állami szervek lényegében annyi pénzt kértek a kezelésükben levő adatokért, amennyit nem szégyelltek. Ennek olykor megvolt az ideológiája, hogy mondjuk a kulturális intézmények által kezelt adatok milyen értékesek pl.  Olaszországban. Ez persze lehet igaz, de ez nem változtat azon a tényen, hogy ezeket közpénzen állították elő, és bárki igényt tarthat rájuk, – akár profitszerzési céllal is. Az állami szervek a költségek megállapításakor a kontrollálhatatlan feldolgozási költségek mögé bújtak, de nagyon gyakran még ezt a fáradságot sem vették, egyszerűen csak mondtak egy összeget. Az is gyakran baj volt, hogy nem voltak árlisták, egységes felhasználási szabályok, illetve ezek folyamatosan változtak. A legpikánsabb persze az volt, amikor kiderült, hogy maga az EU sem adja üzleti célú újrafelhasználásra ingyen a saját jogszabályait.

Ennél is komolyabb gondot jelentett azonban az, hogy az állami szerepvállalás határait az adatok felhasználását illetően sehol nem húzták meg világosan. Az európai beavatkozó állam eszméjébe bőven belefért, hogy azok az állami szervek, amelyeknek az irányelvvel érintett adat volt a birtokában elkezdjenekmaguk is értéknövelt szolgáltatásokat fejleszteni és ezzel piacra lépni, és eközben sumák módon a nyers adatokhoz való hozzáférést is megnehezíteni, megdrágítani, vagy csak egyszerűen  kihasználni azt, hogy ők pontosan ismerték a formátumot és ennek változásait, valamint – értelemszerűen – gyorsabban jutnak hozzá a nyersanyaghoz.

A helyzetet súlyosbíthatta, ha az adott szervezeten önfinanszírozási nyomás is volt, azaz kellettek a saját bevételek is. Ez esetben a szerv nem egyszerűen egy versenyelőnyben levő piaci résztvevő kívánt lenni, hanem egyszerűen ki akarta a többi piaci szolgáltatót nyírni, máskülönben lehúzhatta a rolót.

Nem fenékig tejföl Magyarország sem

A közigazgatás számítógépesítettségének szintje a 90-es években elég katasztrofális volt, így túl sok használható közadat sem képződött. Bizonyos nyilvántartások és adathalmazok azért már létrejöttek a kilencvenes évek végefelé. (Pl. a cégnyilvántartás kifejezetten korszerűnek számított már a 90-es évek közepén is.) Az adatokkal való bánásmód ugyanakkor a teljes elzárás és a gátlástalan csencselés végletei között ingadozott. Ezért az információs ipar valóságos eufóriában volt, amikor az irányelv megjelent.

Ez az eufória épp az átültetését elvileg megvalósító 2005. évi XC. törvény megjelenéséig tartott. Ennek 23. §-a ugyan kifejezetten arra utal, hogy az irányelvnek való megfelelést szolgálja, de ha valaki akár felületesen is átfutotta már egyszer a vonatkozó szöveget, az azonnal detektálhatja, hogy a valóságban erről a legcsekélyebb mértékben sincsen szó.  Az Elektronikus információszabadság törvény (Eitv.) nem más mint az ezen a területen eléggé elnagyolt adatvédelmi törvény közadatokra vonatkozó szabályainak Internetre történő adaptációja és újra kibontása, azaz egy újabb ‘Freedom of information’ típusú szabályozás. A jogszabály nagyrészt állami adatokról szól, mint az Internetre publikálandó információkról, és érezhetően az ‘oknyomozó újságírót’, meg az ‘öntudatos állampolgárt’ tartja a célzott haszonélvezőnek.

A törvényben felállított közadat-kereső rendszer a mai napig az ‘állampolgárok’ közérdekű adatokhoz történő hozzáférésének jogáról beszél. A jogszabály tehát nem szabályozza az adatok árának képzését, a térítés módját, az adatkezelő szervezeten belüli munkaterhek kezelésének metódusát, nem ad iránymutatást a megkötendő szerződésekre vonatkozóan, és nem döntött el egy sor évek óta a levegőben lógó problémát sem. (Mint pl. hogy jogszerű-e a cégadatbázisokon a személynevekre történő keresés, vagy hogy miért nem hozzáférhető az ingatlan-nyilvántartás a cégadatbázishoz hasonlóan.) De paradox módon a törvény legnagyobb hibája az, hogy fenntartja a közadatok teljes ingyenességét és korlátlan hozzáférhetőségét.

A gyakorlat ugyanis azt mutatja, hogy ha nagy tömegben vagy speciális kiszerelésben és főként ha rendszeresen akarunk adathoz hozzáférni, akkor az bizony az adott szervezet számára is erőfeszítésbe kerül, és ezt nem árt kompenzálni. Ha viszont mionden ingyenes, semmiért nem kérhet legálisan pénzt, akkor semmilyen erőfeszítést nem fog megtenni annak érdekében, hogy az adat ‘ipari’ továbbfelhasználásra használható legyen. Olcsó húsnak híg a leve. Ha mindenhez hozzá lehet férni ingyenesen, akkor semmihez sem. A magyar jog a mai napig nem tesz különbséget az évente 10 szerződést kikérő újságíró, és a naponta 15 000 adatrekordot igénylő cég között.

Az információ szabira megy

Tehát ennek megfelelően a jogszabály az adat-újrahasznosítási iparágban nem sok változást hozott. Az adatokról olykor azt sem lehetett tudni kik kezelik, az állami nyilvántartások adataihoz teljesen átláthatatlan szempontok, és napi szinten módosítgatott szerződések, nem nyilvános díjszabások, egyedi alkuk, és sumákolások révén lehetett hozzáférni, ha egyáltalán hozzá lehetett. Sokszor egyszerűbb volt az adatletöltést automatikusan elvégző robotokat írni, majd a rendszergazdákkal, vagy a weboldal üzemeltetőivel megmutyizni, hogy ne tiltsák ki őket, mint a szervezethez fordulni, és a tanácstalan köztisztviselőket győzködni arról, hogy a kérésben semmi illegális nincsen.

A jogszabályi adatok digitális formájához például egészen a Magyar Közlöny 2008-as ingyenessé tételéig kizárólag egy állami tulajdonú, és maga is piaci tevékenységet végző gazdasági társaságon keresztül lehetett egészen irreális összegekért hozzájutni, céginformációs alap-adatbázist szinte teljesen lehetetlen volt, (és ma is az) szerezni, a meteorológiai adatokból az OMSZ csinált üzletet, és egy részélt egyáltalán nem is volt hajlandó átadni magáncégeknek, stb., stb.. Mindezekre egy 2009-ben született alapos és átfogó tanulmány  (Antal Dániel és Kiss Rita:  A közintézmények újrahasznosítható információinak piaca Magyarországon, a Neumann Nonprofit Kft. megbízásából) mutatott rá egy olyan piacon, amelynek méretét egyébként kb. évi 40 milliárd forintra tette.

Mégis, a közadatok üzleti újrahasznosításának legfőbb gátját nem a fentebb felsoroltak jelentik. Nem az a fő gond, hogy az állami szervek vagy a körülöttük sertepertélők túl sok pénzt kérnek az adatért (jó, néha persze ez is, de mint látható a legtöbb üzleti vállalkozás örömmel fizet többet, csak kapjon jó minőséget). De még csak nem is az, hogy az állami szervek a saját üzletüket féltik, (ez is előfordul olykor). Sőt, még csak nem is az, hogy tanácstalanok milyen szerződést kéne kötni, (persze ez is belejátszik.) Hanem a fő gond a jól ismert, egyszerű, irigységgel kombinált, bájosan premodern kapitalizmusellenesség.

Az érintettek nem bírják lelkileg feldolgozni, hogy az állami adatokból magáncégek húzzanak hasznot. Hányszor hallottam hogy ez milyen ‘erkölcstelen’, hogy ‘az állam megkárosítása’, meg hogy ‘mi nem kapunk semmilyen térítést, ez a cég meg halálra keresi magát’. De hogy lehet úgy betartani egy irányelvet, ha annak épp a lényegével nem értünk egyet? Hiszen az irányelvnek éppen az a célja, hogy az információipari vállalkozások éljenek és viruljanak, termékeket fejlesszenek és, igen, hasznot húzzanak a közpénzen összeszedett adatokból. Ezt a sajátos gondolkodásmódot az új kormányzat, úgy tűnik továbbviszi és a hivatalos politika rangjára emeli.

A tárgykörben született első jogszabály, (bár közvetlenül nem érinti a témakört, csak közvetetten) a nemzeti adatvagyon körébe tartozó állami nyilvántartásokról beszél. Nem közpénzen létrehozott és épített nyilvántartásokról tehát, hanemnemzeti adatvagyonról, amelyet csak állami cégek kezelhetnének, és addig is, amíg átmenetileg még a régi adatkezelők teszik, az ügyvezetők jól meg lettek fenyegetve börivel, ha huncutkodnak az adatokkal.

Ebben a nemzeti adatkincsekkel gazdagon telerakott, kis országban ugyanakkor érdekes, és sokatmondó, hogy egy közpénzen, nem is olcsón létrehozott információtípus mégiscsak teljesen és korlátlanul ingyenes lett.  Az MTI a hírfolyamát szinte teljes egészében térítésmentessé tette. Vajon miért, kérdezem naivan? És hasonlóan naiv kíváncsisággal várom, hogy ugyanez megtörténik-e a többi közpénzen gyűjtött adattípussal is. Bár az a sejtésem, és az új jogszabály címe is ezt támasztja alá, ez egyhamar nem fog bekövetkezni, és ez bizony semmi jót nem ígér az egyébként sem túl erős magyar információs iparnak.

Megosztás