A statisztikától a történeti összefoglalásokon keresztül a gyakorlati kézikönyvekig bezárólag bemutatunk két tucat könyvet. Ezt a gyűjtést már régóta meg kellett volna írnom, de mindig ott volt bennem, hogy aki adatvizualizációval foglalkozik, az úgy is tudhat angolul és biztosan utánanézett néhány „Best Books on Data Visualization”-szerű cikknek, blogposztnak. Mivel ez a cikk most elkészült, a továbbiakban az olvasóra bízom annak elképzelését, hogy milyen tapasztalatok vezettek a megírásához. Az alábbi ismeretterjesztés egy szubjektív lista lesz azokból a kézikönyvekből és történeti művekből, amelyekből a legtöbbet tanultam, vagy amelyeket a leghasznosabbnak gondolok. Biztosan lehet ezek nélkül is kiváló adatvizualizációkat készíteni, én viszont biztosan tudom, hogy ezek nélkül rosszabbakat készítettem korábban, ha nem egyenesen borzalmasakat.
Igyekeztem úgy összeválogatni a könyveket, hogy a lehető legszélesebb érdeklődési kör figyelmét is felkelthesse, ezért van közöttük általános ismeretterjesztés és már-már filozófia is, ahogy próbáltam olyanokat is beválogatni, amelyek nem annyira drágák, esetleg a hazai könyvtári ellátásban is elérhetők.
A statisztika alapvetései
Statisztika
Aki adatvizualizációval foglalkozik, annak legalább a legalapvetőbb statisztikai fogalmakkal muszáj tisztában lennie, és sajnos ez nem opcionálisan választható. Ezen kívül az általam ajánlott két könyv egyike sem csupán a statisztikáról szól, hanem arról, hogy az érvelési hibáinkat (logical fallacy) hogyan próbáljuk statisztikával is alátámasztani, továbbá arról, hogy a statisztika tudományának mik a határai.
Így megtudhatjuk, mi a probléma az átlaggal, a mediánnal, a hamis balanszokkal, vagy, hogy a korreláció még nem jelent kauzalitást is. Így persze nem csupán adatvizualizációval foglalkozóknak érdemes őket elolvasniuk, hanem újságíróknak, közvéleménykutatóknak, de akár bölcsészettudománnyal foglalkozóknak is (nyilván a statisztikusoknak, közgazdászoknak, szociológusoknak nem mondanak újdonságot).
Fene se tudja, hányadik kiadásnál tart éppen minden idők legnépszerűbb és legszórakoztatóbb statisztikáról (illetve statisztikai hazugságokról) szóló könyve, mindenesetre ha valaki elolvassa a nagyon aranyos és jól kiválasztott illusztrációkkal még befogadhatóbb könyvet, egészen biztosan egy okos és szuper élménnyel fog gazdagodni. Nem utolsó sorban sokkal szkeptikusabb lesz mindennemű adatvizualizációval, közvéleménykutatással, politikai kampányüzenettel szemben. Ingyenesen és legálisan innen tölthető le.
Könyvtári elérhetőség: A Fővárosi Szabó Ervin Könyvtár Központi Könyvtárának (FSZEK) raktárában, a Központi Statisztikai Hivatal (KSH) Könyvtár törökbálinti lerakatában és a CEU könyvtárában igen. Az Országos Széchenyi Könyvtárban (OSZK) nem.
Stigler könyve a statisztika tudományának alapelveiről, erényeiről és korlátairól szól, valamint arról, hogy mik azok a sajátos tulajdonságai, amelyek megkülönböztetik más tudományoktól. Mindezt közérthető formában.
Könyvtári elérhetőség: sajnos nem elérhető egyetlen hazai könyvtárban sem. Az Október 6. utcai angol nyelvű Bestsellers könyvesboltban igen.
Az adatvizualizáció története
Történet
Az információ- és adatvizualizáció évezredekre visszanyúló története feldolgozott, ma már ritka, hogy egy új, valamilyen gyűjteményben lappangó nyomtatvány hátoldalán felfedezzenek egy korábban ismeretlen grafikát, vagy egy ismert elsőt letaszítson a trónról egy szintén addig ismeretlen ábrázolás. Fontos azonban megjegyezni, hogy a nagy nemzetközi történeteket elsősorban amerikai és nyugat-európi szerzők írják, ebből fakadóan a történet is nyugati fókuszú, a Közel-Kelet és a Távol-Kelet (Kína, Japán) leginkább az ókori csillagászati és térképészeti példáknál kerül szóba, Oroszország (illetve a Szovjetúnió) elvétve, míg Kelet-Európáról, Afrikáról és Dél-Amerikáról szinte semmit nem tudunk. A magyar történet feldolgozása folyamatban van.
Az amerikai statisztikus, Michael Friendly „Mérföldkövek” projektje 2001-ben indult. A Milestones lényegében egy idővonal, ami bemutatja az adatvizualizáció szempontjából összes felfedezést, találmányt, új grafikai típust, de még a fontos konferenciákat, könyveket, tanulmányokat is. Az idővonal az időszámításunk előtti időktől napjainkig több száz tételt számlál és időről-időre új adatokkal frissül. A gyűjtéshez bibliográfia is társul az összes eddig megjelent szakirodalommal. Ennél részletesebb, alaposabb tudástár nem létezik, és PDF-ben is elérhető. És rövidített változata is van.
Könyvtári elérhetőség: Ugyan a teljes idővonalnak különféle verziói tanulmánykötetekben is megjelentek, de Friendly tanulmányai ingyenesen elérhetők a neten.
Lima kutatásai az információábrázolás formanyelvének történetéről szólnak, a Visual Complexity pedig egyfajta bevezető abba, hogy hányféle metaforikus alakzatban (például fa-struktúra, kör) jelenítünk meg információkat, adatokat, és ezeknek mi a története. A Visual Complexity folytatása Lima másik két könyve, a Book of Trees és a Book of Circles.
Rosenberg és Grafton könyve az idő különféle vizuális reprezentációiról szól, illetve annak történetéről. Azért gondolom ide érdemesnek, mivel míg Lima könyvei a formákról, addig ez a könyv egy témáról, az időről ír és tanulságos, hogy az időt hányféleképpen lehet ábrázolni.
Nagyon jó bevezetést nyújt a tematikus, statisztikai térképek történetébe, illetve a keletkezésüket, kitalálásukat megelőző és feltételező társadalmi, politikai vagy egészségügyi helyzetekbe.
Könyvtári elérhetőség: Nincs.
Az adatvizualizáció elmélete
Elmélet
Amikor adatokat, információkat grafikusan megjelenítünk, absztrakt vizuális jeleket és színeket használunk, amelyeknek különféle módokon jelentéseket tulajdonítunk. Célunk az, hogy az információt érthető, megérthető és feldolgozható módon adjuk át ezekkel a vizuális jelekkel. Éppen ezért fontos, hogy tisztában legyünk azzal, hogy az agyunk hogyan dolgozza fel ezeket a jeleket, ehhez pedig érdemes fejben tartanunk a vizuális jelek feldolgozásának törvényeit, a színek működését, az optikai csalódásokat.
A francia térképész-geográfus klasszikusát többekkel ellentétben én nem tartom nehezen érthetőnek, túl filozofikusnak vagy bonyolultnak, de én sem ezzel kezdeném. Bertin könyve jóval több, mint egy kézikönyv az adatok grafikus ábrázolásáról, sokkal inkább egy értekezés arról, hogy hogyan látunk és dolgozunk fel grafikus információkat. Kevés olyan könyv van, amit egy adatvizualizációval foglalkozó szakembernek mindenképpen ismernie kell, de szerintem Bertin könyve az.
Könyvtári elérhetőség: A KSH könyvtárában francia és angol nyelven megvan, más lelőhelyről nincsen tudomásom. A francia eredeti beszerezhetetlen, a 2010-ben megjelent angol fordítás pedig elég drága. Viszont a francia legálisan itt érhető el.
Tufte könyve a másik nagy klasszikus, az adatvizualizációval, információgrafikával foglalkozók körében kultikus tárgy. Tufte nagyesszéjét az utóbbi néhány évben sok kritika érte a jól hangzó, de életszerűtlen, betarthatatlan szabályai, minimalizmusa, és a figurális ábrázolások elleni kirohanásai miatt, de így van ez a legnagyobbakkal. Szerintem fantasztikus mű, és nem kell ezért Tufte minden állításával egyetérteni.
Könyvtári elérhetőség: A CEU könyvtárában két példányban is megvan Tufte másik fontos műve, az Envisioning Information mellett. A MOME Könyvtárában is megvan. Feleannyiba kerül, mint Bertin könyve, de így is drága.
Szerintem nem túlzás azt mondani, hogy a pályafutását újságíróként kezdő Alberto Cairo az információvizualizáció legfontosabb, megkerülhetetlen kortárs figurája. Mint a kortárs szerzők többségénél, nála is az első könyv egy adatdizájn-alapvetés Bertin és Tufte nyomdokain, ugyanakkor tudományosságával és szerénységével szándékosan el is tér tőlük, Tufte szabályainak érvényességét kutatások, tesztek alapján például vitatja. Időről-időre ingyenes online kurzusokat tart, érdemes egyre feliratkozni, emellett pedig előadásaival járja a világot.
Könyvtári elérhetőség: A CEU könyvtárában és a Metropolitan Egyetem könyvtárában is van belőle egy példány.
Az adatvizualizáció gyakorlata
Gyakorlat
Elképesztő mennyiségű gyakorlati kézikönyv kapható ma már, jelentős részük pedig az elmúlt tíz évben jelent meg. Az általam olvasottaknak különböző erényeik vannak, de mindegyik célja az, hogy megtanítson értelmes, színvonalas és ízléses adatvizualizációkat készíteni. Emellett különféle módon rendszereznek, illetve elmagyarázzák, hogy melyik adatgrafikai típus mire való.
Ez a legönkényesebb válogatás, mert én is szimpátia vagy hype alapján szereztem be a legtöbbet, de az interneten ennél legalább ötször több kézikönyv közül válogathatunk, simán lehet, hogy azok között találnánk jobbakat is az alábbiaknál. Kicsit úgy tűnhet, mintha Brinton és a 2000-es évek vége között nem történt volna semmi, már ami a kézikönyvek kiadását illeti, ám ez nem igaz, a listából azért marad ki John Tukey Explanatory Data Analysis és William S. Cleveland Elements of Graphning Data könyve a nyolcvanas-kilencvenes évekből, mert vagy beszerezhetetlenek, vagy az áruk jelentősen a lélektani határon felül van.
Több, elsősorban statisztikusok által írt standardizálási kísérlet után Willard Copeland Brinton Graphic methods 1914-es, később több kiadást megélt könyve volt az első, amely a nagyközönség számára is bemutatta az adatok grafikus ábrázolásának módszertanát. Az 1939-es Graphic Presentation pedig egészen elképesztően szép kiadás az akkor ismert összes ábrázolási típusról és azok alkalmazási területeiről. Szerencsére mindkettő elérhető és letölthető legálisan innen és innen.
Könyvtári elérhetőség: Nincs. A Book Depositoryn fekete-fehér reprinteket lehet rendelni, senkinek nem ajánlom, én megjártam vele.
Yau két könyve párban jár (ahogy Caironál a Functional Art és a Trhutrful Art), kezdő adatgrafikusnak kiváló választás, mert tömör, logikus, okos és nem utolsó sorban egyik sem drága. Ár-érték arányban mindenképpen az egyik legjobb választás.
Könyvtári elérhetőség: A CEU és a KSH könyvtárába érdemes ellátogatni értük.
Azért választottam be ezt a könyvet, mert én nem tudok németül, mégis tökéletesen érthető, miről szól, mivel majdnem szinte csak grafikusan magyarázzák el az adatvizualizáció szabályait.
Valahol az elmélet és gyakorlat határán mozog, vagy egyszerre két könyv egyben Andy Kirk munkája, és legjobb tudomásom szerint az egyetlen olyan adatvizualizációról szóló könyv, amelyben magyar példa is van, Szűcs Krisztina Spotlightja. Nagyon sokat lehet belőle tanulni.
Camoes könyve elsősorban arról szól, hogy Excelben hogyan lehet szép dolgokat csinálni, a bevezető része az egyik legjobb forrás a dizájnról, amit olvastam.
Könyvtári elérhetőség: Tudomásom szerint nincs. Viszont nem túl drága könyv.
Az amerikai térképtörténész egyik legfontosabb, klasszikus munkája arról, hogy hogyan lehet hazudni és csalni a térképekkel, illetve a térképeken megjelenített statisztikai adatokkal. Egy része itt elérhető legálisan és ingyenesen.
Könyvtári elérhetőség: A CEU könyvtárában megvan Monmonier más térképelméleti munkái mellett.
Monográfiák az adatvizualizációról
Monográfiák
Szintén az utóbbi néhány évben születtek meg azok a könyvek, amelyek egy-egy nagyobb jelentőségű tudós, grafikus adatvizualizációs és információgrafikai munkásságát dolgozzák fel. Így többek közt William Playfair skót közgazdász, Alexander von Humboldt német természettudós, Charles-Joseph Minard francia mérnök, W.E.B. Du Bois afrikai-amerikai szociológus és polgárjogi aktivista, vagy Fritz Kahn grafikus munkásságáról is megjelentek önálló monográfiák.
Magyar nyelvű írások, könyvek
Magyar nyelvű szakirodalom
A fentebbi könyvek egyikéből sem született magyar nyelvű fordítás, és alapvetően is kevés a magyar nyelvű irodalom az adatvizualizációról. De azért született néhány, illetve van pár magyar szerzőtől is mű.
Az első, általam ismert magyar nyelven is elérhető szakkönyv a német statisztika egyik legnagyobb alakjának, Georg von Mayr-nek 1877-ben megjelent Die Gesetzmäßigkeit im Gesellschaftsleben könyvének 1881-es magyar fordítása A társadalmi élet törvényszerűsége címmel, amelynek a 6. fejezete foglalkozik a statisztikai adatok grafikus ábrázolásával. A Magyar Tudományos Akadémia által kiadott könyvet itt lehet némi pénz kifizetése után elérni digitalizálva.
A Statisztikai Szemle is közölt magyar nyelvű tanulmányokat a grafikus ábrázolásokról, így 1943-ban Lelkes István A képszerű statisztikai ábrázolások címmel írt összefoglaló tanulmányt, 1959-ben a román statisztikus, I. Teich az idősorok grafikus ábrázolását foglalta össze röviden. Sajnos ezeket nem tudom belinkelni az archívumból, ki kell őket keresni. Hunyadi László 2002-ben írt egy hosszabb cikket a statisztikai adatok grafikus ábrázolásának alapvető típusairól.
Ezeken kívül a tematikus térképek ábrázolási módjairól Klinghammer István és Papp-Váry Árpád 1983-ban megjelent Földünk tükre – a térkép könyvében van egy hosszú rész (pl. Bertinre is hivatkoznak).
Tapasztalatom szerint itthon szakkönyvként szokták idézni David McCandless The Information is Beautiful 2000-ben megjelent képeskönyvének 2010-es magyar fordítását, de tényleg jó ha tudjuk, hogy ez nem szakkönyv, hanem egy album. Ugyanez a helyzet Martin és Simon Toseland itthon Infografika címmel megjelent 2013-as könyvével is. Maczó Péter grafikus 2010-ben megjelent Ön itt áll – az infodesignról könyvében szintén találunk néhány gondolatot az adatvizualizációkról is. Ezek a maguk nemében hasznos ismeretterjesztő könyvek, csak a helyükön kell őket kezelni. Utoljára magyar nyelven kézikönyv(ecske) 1975-ben, tehát több mint negyven éve jelent meg.
Sajnos a releváns szakirodalom drága, és kevesen engedhetik meg maguknak, hogy egy-két darabnál többe beruházzanak. Olcsóbbak közé tartoznak (8-10.000 Ft. körül) az O’Reilly és a Wiley kiadó könyvei, és néha ki lehet fogni jó páros ajánlatokat, például Nathan Yau vagy Alberto Cairo két könyvét egyben sokezer forintért olcsóbban is meg lehet venni, de a hazai angol nyelvű könyveket (is) forgalmazó boltokban nem kaphatók, rendelni kell őket. Ha egy-két könyv sem fér bele, akkor a CEU könyvtárában van a legnagyobb, naprakész kínálat, de használatához, kölcsönzéshez CEU-hallgatónak, alkalmazottnak, vagy más felsőoktatási intézmény hallgatójának, oktatójának kell lenni. Mindenesetre azért a fenti könyvekből és cikkekből néhány ingyenesen és legálisan is elérhető.
Támogasd a munkánkat banki átutalással. Az adományokat az Átlátszónet Alapítvány számlájára utalhatod. Az utalás közleményébe írd: „Adomány”, köszönjük!
Belföld
Külföld
Számlatulajdonos: Átlátszónet Alapítvány
1084 Budapest, Déri Miksa utca 10.
Bankszámlaszám: 12011265-01425189-00100001 Bank neve: Raiffeisen Bank
Számlatulajdonos: Átlátszónet Alapítvány
1084 Budapest, Déri Miksa utca 10.
IBAN (EUR): HU36120112650142518900400002 IBAN (USD): HU36120112650142518900500009 SWIFT: UBRTHUHB Bank neve és címe: Raiffeisen Bank
(H-1133 Budapest, Váci út 116-118.)
Támogasd a munkánkat az Átlátszónet Alapítványnak küldött PayPal adománnyal! Köszönjük.
Ha van bankkártyád, akkor pár kattintással gyorsan tudsz rendszeres vagy egyszeri támogatást beállítani nekünk az adjukossze.hu oldalán.
Postai befizetéssel
Postai befizetéssel is tudsz minket támogatni, amihez „sárga csekket” küldünk. Add meg a postacímedet, és már repül is a csekk.
Havi előfizetés a Patreonon
Néző, Szurkoló, B-közép és VIP-páholy kategóriás Átlátszó-előfizetések között válogathatsz a Patreonon.
Benevity rendszerén keresztül
Bárhol is dolgozol a világban, ha a munkáltatód lehetőséget ad arra, hogy adott összeget felajánlj egy nonprofit szervezetnek, akkor ne feledd, a Benevity-n keresztül az Átlátszónet Alapítvány is ajánlható.
SZJA 1% felajánlásával
Ha az 1 százalékodat az Átlátszó céljaira, projektjeire kívánod felajánlani, a személyi jövedelemadó bevallásodban az Átlátszónet Alapítvány adószámát tüntesd fel: 18516641-1-42
Talán már feltűnhetett itt-ott, hogy az Átlátszó a hagyományos oknyomozói és közpénzrendőri tartalmaitól merőben eltérő anyagokat is megosztott, amelyek Átló...
Interaktív térképen mutatjuk meg, miként tudott a korrupciós ügyeiért két év börtönre ítélt Nikola Gruevszki volt macedón miniszterelnök Magyarországra szökni,...
Támogasd a munkánkat banki átutalással. Az adományokat az Átlátszónet Alapítvány számlájára utalhatod. Az utalás közleményébe írd: „Adomány”, köszönjük!