Adatviz

Ha adatvizualizációval szeretnél foglalkozni, ezekből a könyvekből érdemes párat elolvasnod

A statisztikától a történeti összefoglalásokon keresztül a gyakorlati kézikönyvekig bezárólag bemutatunk két tucat könyvet. Ezt a gyűjtést már régóta meg kellett volna írnom, de mindig ott volt bennem, hogy aki adatvizualizációval foglalkozik, az úgy is tudhat angolul és biztosan utánanézett néhány „Best Books on Data Visualization”-szerű cikknek, blogposztnak. Mivel ez a cikk most elkészült, a továbbiakban az olvasóra bízom annak elképzelését, hogy milyen tapasztalatok vezettek a megírásához. Az alábbi ismeretterjesztés egy szubjektív lista lesz azokból a kézikönyvekből és történeti művekből, amelyekből a legtöbbet tanultam, vagy amelyeket a leghasznosabbnak gondolok. Biztosan lehet ezek nélkül is kiváló adatvizualizációkat készíteni, én viszont biztosan tudom, hogy ezek nélkül rosszabbakat készítettem korábban, ha nem egyenesen borzalmasakat.

Előfizetőket keresünk – támogasd a munkánkat havi ezer forinttal!

Előfizetőket keresünk – támogasd a munkánkat havi ezer forinttal!

Igyekeztem úgy összeválogatni a könyveket, hogy a lehető legszélesebb érdeklődési kör figyelmét is felkelthesse, ezért van közöttük általános ismeretterjesztés és már-már filozófia is, ahogy próbáltam olyanokat is beválogatni, amelyek nem annyira drágák, esetleg a hazai könyvtári ellátásban is elérhetők.

A statisztika alapvetései

Statisztika

Aki adatvizualizációval foglalkozik, annak legalább a legalapvetőbb statisztikai fogalmakkal muszáj tisztában lennie, és sajnos ez nem opcionálisan választható. Ezen kívül az általam ajánlott két könyv egyike sem csupán a statisztikáról szól, hanem arról, hogy az érvelési hibáinkat (logical fallacy) hogyan próbáljuk statisztikával is alátámasztani, továbbá arról, hogy a statisztika tudományának mik a határai.

Így megtudhatjuk, mi a probléma az átlaggal, a mediánnal, a hamis balanszokkal, vagy, hogy a korreláció még nem jelent kauzalitást is. Így persze nem csupán adatvizualizációval foglalkozóknak érdemes őket elolvasniuk, hanem újságíróknak, közvéleménykutatóknak, de akár bölcsészettudománnyal foglalkozóknak is (nyilván a statisztikusoknak, közgazdászoknak, szociológusoknak nem mondanak újdonságot).

Darrell Huff – How to lie with statistics, 1954

Fene se tudja, hányadik kiadásnál tart éppen minden idők legnépszerűbb és legszórakoztatóbb statisztikáról (illetve statisztikai hazugságokról) szóló könyve, mindenesetre ha valaki elolvassa a nagyon aranyos és jól kiválasztott illusztrációkkal még befogadhatóbb könyvet, egészen biztosan egy okos és szuper élménnyel fog gazdagodni. Nem utolsó sorban sokkal szkeptikusabb lesz mindennemű adatvizualizációval, közvéleménykutatással, politikai kampányüzenettel szemben. Ingyenesen és legálisan innen tölthető le

Könyvtári elérhetőség: A Fővárosi Szabó Ervin Könyvtár Központi Könyvtárának (FSZEK) raktárában, a Központi Statisztikai Hivatal (KSH) Könyvtár törökbálinti lerakatában és a CEU könyvtárában igen. Az Országos Széchenyi Könyvtárban (OSZK) nem.

Stephen M. Stigler – Seven Pillars of Statistical Wisdom, 2016

Stigler könyve a statisztika tudományának alapelveiről, erényeiről és korlátairól szól, valamint arról, hogy mik azok a sajátos tulajdonságai, amelyek megkülönböztetik más tudományoktól. Mindezt közérthető formában.

Könyvtári elérhetőség: sajnos nem elérhető egyetlen hazai könyvtárban sem. Az Október 6. utcai angol nyelvű Bestsellers könyvesboltban igen.

Az adatvizualizáció története

Történet

Az információ- és adatvizualizáció évezredekre visszanyúló története feldolgozott, ma már ritka, hogy egy új, valamilyen gyűjteményben lappangó nyomtatvány hátoldalán felfedezzenek egy korábban ismeretlen grafikát, vagy egy ismert elsőt letaszítson a trónról egy szintén addig ismeretlen ábrázolás. Fontos azonban megjegyezni, hogy a nagy nemzetközi történeteket elsősorban amerikai és nyugat-európi szerzők írják, ebből fakadóan a történet is nyugati fókuszú, a Közel-Kelet és a Távol-Kelet (Kína, Japán) leginkább az ókori csillagászati és térképészeti példáknál kerül szóba, Oroszország (illetve a Szovjetúnió) elvétve, míg Kelet-Európáról, Afrikáról és Dél-Amerikáról szinte semmit nem tudunk. A magyar történet feldolgozása folyamatban van.

Scott Christianson – 100 Diagrams That Changed The World, 2012

Ha valakit csak szőrmentén érdekel az információ ábrázolásának története, annak ez a közérthető, népszerűsítő könyv lehet a kapudrog.

Könyvtári elérhetőség: hiába egy népszerűsítő könyv, itthon nem találkoztam vele könyvtári forgalomban sem.

Michael Friendly – Milestones in the History of Thematic Cartography, Statistical Graphics and Data Visualization, 2001–

Az amerikai statisztikus, Michael Friendly „Mérföldkövek” projektje 2001-ben indult. A Milestones lényegében egy idővonal, ami bemutatja az adatvizualizáció szempontjából összes felfedezést, találmányt, új grafikai típust, de még a fontos konferenciákat, könyveket, tanulmányokat is. Az idővonal az időszámításunk előtti időktől napjainkig több száz tételt számlál és időről-időre új adatokkal frissül. A gyűjtéshez bibliográfia is társul az összes eddig megjelent szakirodalommal. Ennél részletesebb, alaposabb tudástár nem létezik, és PDF-ben is elérhető. És rövidített változata is van.

Könyvtári elérhetőség: Ugyan a teljes idővonalnak különféle verziói tanulmánykötetekben is megjelentek, de Friendly tanulmányai ingyenesen elérhetők a neten.

Manuel Lima – Visual Complexity, 2011

Lima kutatásai az információábrázolás formanyelvének történetéről szólnak, a Visual Complexity pedig egyfajta bevezető abba, hogy hányféle metaforikus alakzatban (például fa-struktúra, kör) jelenítünk meg információkat, adatokat, és ezeknek mi a története. A Visual Complexity folytatása Lima másik két könyve, a Book of Trees és a Book of Circles.

Könyvtári elérhetőség: A CEU könyvtárában megvan.

Daniel Rosenberg és Anthony Grafton – Cartographies of Time: A History of the Timeline, 2012

Rosenberg és Grafton könyve az idő különféle vizuális reprezentációiról szól, illetve annak történetéről. Azért gondolom ide érdemesnek, mivel míg Lima könyvei a formákról, addig ez a könyv egy témáról, az időről ír és tanulságos, hogy az időt hányféleképpen lehet ábrázolni.

Könyvtári elérhetőség: Nincs.

Arthur H. Robinson – Early Thematic Mapping in the History of Cartography, 1982

Nagyon jó bevezetést nyújt a tematikus, statisztikai térképek történetébe, illetve a keletkezésüket, kitalálásukat megelőző és feltételező társadalmi, politikai vagy egészségügyi helyzetekbe.

Könyvtári elérhetőség: Nincs.

Az adatvizualizáció elmélete

Elmélet

Amikor adatokat, információkat grafikusan megjelenítünk, absztrakt vizuális jeleket és színeket használunk, amelyeknek különféle módokon jelentéseket tulajdonítunk. Célunk az, hogy az információt érthető, megérthető és feldolgozható módon adjuk át ezekkel a vizuális jelekkel. Éppen ezért fontos, hogy tisztában legyünk azzal, hogy az agyunk hogyan dolgozza fel ezeket a jeleket, ehhez pedig érdemes fejben tartanunk a vizuális jelek feldolgozásának törvényeit, a színek működését, az optikai csalódásokat.

Jacques Bertin – Sémiologie graphique, 1967

A francia térképész-geográfus klasszikusát többekkel ellentétben én nem tartom nehezen érthetőnek, túl filozofikusnak vagy bonyolultnak, de én sem ezzel kezdeném. Bertin könyve jóval több, mint egy kézikönyv az adatok grafikus ábrázolásáról, sokkal inkább egy értekezés arról, hogy hogyan látunk és dolgozunk fel grafikus információkat. Kevés olyan könyv van, amit egy adatvizualizációval foglalkozó szakembernek mindenképpen ismernie kell, de szerintem Bertin könyve az.

Könyvtári elérhetőség: A KSH könyvtárában francia és angol nyelven megvan, más lelőhelyről nincsen tudomásom. A francia eredeti beszerezhetetlen, a 2010-ben megjelent angol fordítás pedig elég drága. Viszont a francia legálisan itt érhető el.

Edward E. Tufte – Visual Display of Quantitative Information, 1983

Tufte könyve a másik nagy klasszikus, az adatvizualizációval, információgrafikával foglalkozók körében kultikus tárgy. Tufte nagyesszéjét az utóbbi néhány évben sok kritika érte a jól hangzó, de életszerűtlen, betarthatatlan szabályai, minimalizmusa, és a figurális ábrázolások elleni kirohanásai miatt, de így van ez a legnagyobbakkal. Szerintem fantasztikus mű, és nem kell ezért Tufte minden állításával egyetérteni.

Könyvtári elérhetőség: A CEU könyvtárában két példányban is megvan Tufte másik fontos műve, az Envisioning Information mellett. A MOME Könyvtárában is megvan. Feleannyiba kerül, mint Bertin könyve, de így is drága.

Alberto Cairo – The Functional Art: An Introduction to Information Graphics and Visualization, 2012

Szerintem nem túlzás azt mondani, hogy a pályafutását újságíróként kezdő Alberto Cairo az információvizualizáció legfontosabb, megkerülhetetlen kortárs figurája. Mint a kortárs szerzők többségénél, nála is az első könyv egy adatdizájn-alapvetés Bertin és Tufte nyomdokain, ugyanakkor tudományosságával és szerénységével szándékosan el is tér tőlük, Tufte szabályainak érvényességét kutatások, tesztek alapján például vitatja. Időről-időre ingyenes online kurzusokat tart, érdemes egyre feliratkozni, emellett pedig előadásaival járja a világot.

Könyvtári elérhetőség: A CEU könyvtárában és a Metropolitan Egyetem könyvtárában is van belőle egy példány.

Az adatvizualizáció gyakorlata

Gyakorlat

Elképesztő mennyiségű gyakorlati kézikönyv kapható ma már, jelentős részük pedig az elmúlt tíz évben jelent meg. Az általam olvasottaknak különböző erényeik vannak, de mindegyik célja az, hogy megtanítson értelmes, színvonalas és ízléses adatvizualizációkat készíteni. Emellett különféle módon rendszereznek, illetve elmagyarázzák, hogy melyik adatgrafikai típus mire való.

Ez a legönkényesebb válogatás, mert én is szimpátia vagy hype alapján szereztem be a legtöbbet, de az interneten ennél legalább ötször több kézikönyv közül válogathatunk, simán lehet, hogy azok között találnánk jobbakat is az alábbiaknál. Kicsit úgy tűnhet, mintha Brinton és a 2000-es évek vége között nem történt volna semmi, már ami a kézikönyvek kiadását illeti, ám ez nem igaz, a listából azért marad ki John Tukey Explanatory Data Analysis és William S. Cleveland Elements of Graphning Data könyve a nyolcvanas-kilencvenes évekből, mert vagy beszerezhetetlenek, vagy az áruk jelentősen a lélektani határon felül van.

Willard C. Brinton – Graphic Methods for Presenting Facts és Graphic Presentation, 1914, 1939

Több, elsősorban statisztikusok által írt standardizálási kísérlet után Willard Copeland Brinton Graphic methods 1914-es, később több kiadást megélt könyve volt az első, amely a nagyközönség számára is bemutatta az adatok grafikus ábrázolásának módszertanát. Az 1939-es Graphic Presentation pedig egészen elképesztően szép kiadás az akkor ismert összes ábrázolási típusról és azok alkalmazási területeiről. Szerencsére mindkettő elérhető és letölthető legálisan innen és innen.

Könyvtári elérhetőség: Nincs. A Book Depositoryn fekete-fehér reprinteket lehet rendelni, senkinek nem ajánlom, én megjártam vele.

Nathan Yau – Visualize This és Data Points, 2011, 2013

Yau két könyve párban jár (ahogy Caironál a Functional Art és a Trhutrful Art), kezdő adatgrafikusnak kiváló választás, mert tömör, logikus, okos és nem utolsó sorban egyik sem drága. Ár-érték arányban mindenképpen az egyik legjobb választás.

Könyvtári elérhetőség: A CEU és a KSH könyvtárába érdemes ellátogatni értük.

Veruschka Götz és Anna Rigamonti – Informationsvisualisierung: Missbrauch und Möglichkeit, 2015

Azért választottam be ezt a könyvet, mert én nem tudok németül, mégis tökéletesen érthető, miről szól, mivel majdnem szinte csak grafikusan magyarázzák el az adatvizualizáció szabályait.

Könyvtári elérhetőség: Tudomásom szerint nincsen.

Andy Kirk – Data Visualization: a Handbook of Data Driven Design, 2016

Valahol az elmélet és gyakorlat határán mozog, vagy egyszerre két könyv egyben Andy Kirk munkája, és legjobb tudomásom szerint az egyetlen olyan adatvizualizációról szóló könyv, amelyben magyar példa is van, Szűcs Krisztina Spotlightja. Nagyon sokat lehet belőle tanulni.

Könyvtári elérhetőség: A CEU könyvtárában megvan.

Jorge Camoes – Data at Work, 2016

Camoes könyve elsősorban arról szól, hogy Excelben hogyan lehet szép dolgokat csinálni, a bevezető része az egyik legjobb forrás a dizájnról, amit olvastam.

Könyvtári elérhetőség: Tudomásom szerint nincs. Viszont nem túl drága könyv.

Mark Monmonier – How To Lie With Maps, 1991

Az amerikai térképtörténész egyik legfontosabb, klasszikus munkája arról, hogy hogyan lehet hazudni és csalni a térképekkel, illetve a térképeken megjelenített statisztikai adatokkal. Egy része itt elérhető legálisan és ingyenesen.

Könyvtári elérhetőség: A CEU könyvtárában megvan Monmonier más térképelméleti munkái mellett.

Monográfiák az adatvizualizációról

Monográfiák

Szintén az utóbbi néhány évben születtek meg azok a könyvek, amelyek egy-egy nagyobb jelentőségű tudós, grafikus adatvizualizációs és információgrafikai munkásságát dolgozzák fel. Így többek közt William Playfair skót közgazdász, Alexander von Humboldt német természettudós, Charles-Joseph Minard francia mérnök, W.E.B. Du Bois afrikai-amerikai szociológus és polgárjogi aktivista, vagy Fritz Kahn grafikus munkásságáról is megjelentek önálló monográfiák.

Magyar nyelvű írások, könyvek

Magyar nyelvű szakirodalom

A fentebbi könyvek egyikéből sem született magyar nyelvű fordítás, és alapvetően is kevés a magyar nyelvű irodalom az adatvizualizációról. De azért született néhány, illetve van pár magyar szerzőtől is mű.

Az első, általam ismert magyar nyelven is elérhető szakkönyv a német statisztika egyik legnagyobb alakjának, Georg von Mayr-nek 1877-ben megjelent Die Gesetzmäßigkeit im Gesellschaftsleben könyvének 1881-es magyar fordítása A társadalmi élet törvényszerűsége címmel, amelynek a 6. fejezete foglalkozik a statisztikai adatok grafikus ábrázolásával. A Magyar Tudományos Akadémia által kiadott könyvet itt lehet némi pénz kifizetése után elérni digitalizálva.

Antikváriumokban is nagyon ritka Rejtő György 1951-es Grafikus ábrázolások a vállalati ügyvitelben kiskönyve (Rejtő György életének és munkásságának Minkó Mihály járt utána 2012-ben), ahogy ugyanilyen ritka Klinghammer István 1975-ös Grafikai módszerek – Információs célokat szolgáló tanulmányok szemléltetésére füzetecskéje. Ha lehet, még nehezebben beszerezhető a sajnos mára kicsit elfelejtett L. A. Bizov (Byzov) orosz statisztikus A ​grafikus ábrázolás módszerei a tervezésben, a statisztikában és a számvitelben című munkája. Mindhárom könyv elérhető a KSH könyvtárában.

A Statisztikai Szemle is közölt magyar nyelvű tanulmányokat a grafikus ábrázolásokról, így 1943-ban Lelkes István A képszerű statisztikai ábrázolások címmel írt összefoglaló tanulmányt, 1959-ben a román statisztikus, I. Teich az idősorok grafikus ábrázolását foglalta össze röviden. Sajnos ezeket nem tudom belinkelni az archívumból, ki kell őket keresni. Hunyadi László 2002-ben írt egy hosszabb cikket a statisztikai adatok grafikus ábrázolásának alapvető típusairól.

Ezeken kívül a tematikus térképek ábrázolási módjairól Klinghammer István és Papp-Váry Árpád 1983-ban megjelent Földünk tükre – a térkép könyvében van egy hosszú rész (pl. Bertinre is hivatkoznak).

Tapasztalatom szerint itthon szakkönyvként szokták idézni David McCandless The Information is Beautiful 2000-ben megjelent képeskönyvének 2010-es magyar fordítását, de tényleg jó ha tudjuk, hogy ez nem szakkönyv, hanem egy album. Ugyanez a helyzet Martin és Simon Toseland itthon Infografika címmel megjelent 2013-as könyvével is. Maczó Péter grafikus 2010-ben megjelent Ön itt áll – az infodesignról könyvében szintén találunk néhány gondolatot az adatvizualizációkról is. Ezek a maguk nemében hasznos ismeretterjesztő könyvek, csak a helyükön kell őket kezelni. Utoljára magyar nyelven kézikönyv(ecske) 1975-ben, tehát több mint negyven éve jelent meg.

Sajnos a releváns szakirodalom drága, és kevesen engedhetik meg maguknak, hogy egy-két darabnál többe beruházzanak. Olcsóbbak közé tartoznak (8-10.000 Ft. körül) az O’Reilly és a Wiley kiadó könyvei, és néha ki lehet fogni jó páros ajánlatokat, például Nathan Yau vagy Alberto Cairo két könyvét egyben sokezer forintért olcsóbban is meg lehet venni, de a hazai angol nyelvű könyveket (is) forgalmazó boltokban nem kaphatók, rendelni kell őket. Ha egy-két könyv sem fér bele, akkor a CEU könyvtárában van a legnagyobb, naprakész kínálat, de használatához, kölcsönzéshez CEU-hallgatónak, alkalmazottnak, vagy más felsőoktatási intézmény hallgatójának, oktatójának kell lenni. Mindenesetre azért a fenti könyvekből és cikkekből néhány ingyenesen és legálisan is elérhető.

Bátorfy Attila

Megosztás