Uncategorized

PDF-konvertáló teszt: melyik a nyerő?

Újságíróknak (és nem újságíróknak is) gyakran szüksége lehet olyan programra, amely PDF dokumentumokat alakít át táblázattá, vagy képet kereshető, szöveges dokumentummá. De melyiket érdemes megvenni? Tesztünkben a PDF Convertert és az ABBYY Finereadert hasonlítottuk össze.

Néhány nappal azután hogy publikáltuk A szívás neve: PDF c. blogposztunkat, jelentkezett egy PDF-konvertáló program marketingese, és megkért, teszteljük terméküket, a PDF Converter Elite 3 -at. Ez a program ún. Optical Character Recognition (OCR) révén képes a kép alapú PDF-dokumentumokat kereshető és szerkeszthető adatcsere (machine readable) formátumra hozni, ami – mint korábban megírtuk – óriási segítség az adatokkal dolgozó újságírók számára.

Némi habozás után egy összehasonlító teszt mellett döntöttünk: a PDF Converter Elite 3-at a műfaj legnépszerűbbje, az ABBYY Finereader -hez mérjük. Ez azért is kézenfekvő, mert a PDF Converter Elite az ABBYY Finereader motorjának egy korábbi (8-as) verziójával dolgozik – ugyanakkor viszont 24 ezer forintos árával nagyjából feleannyiba kerül, mint a jelenlegi, 12-es verziónál tartó ABBYY (43 ezer forint). Aki máris elvesztette a fonalat a verziók rengetegében, azt megnyugtathatjuk: OCR-programokból nagyon sok van, itt van egy elég áttekinthető összefoglaló arról, hogy melyik mit tud.

A kérdés tehát: mire jók ezek a programok? Megéri-e spórolni, és az ABBYY Finereader helyett annak gyakorlatilag egy korábbi verzióját megvenni, mely azonban számottevően olcsóbb?

A teszt során a PDF Converter Elite teljes értékű változatát vetettük össze az ABBYY Finereader 12 Professional tesztverziójával. Ez utóbbi funkciók tekintetében megegyezik a végleges változattal, azonban a használhatóságát némileg rontja az, hogy – mivel tesztverzió – egyszerre csak egy oldalt lehet menteni. A teszt abban áll, hogy egy sor – szövegfelismerés és formázás szempontjából egyre nehezedő – dokumentum-mintát próbálunk átalakítani a két szoftverrel. Mindkét programot Windows 7 alatt futtattuk.

Maga a felhasználói felület mindkét program esetében teljesen egyszerű, első pillantásra is bárki elboldogul velük. Az átalakítandó dokumentumokat ki kell választani, fel kell tölteni, majd ki kell választani, mivé szeretnénk konvertálni: dokumentummá, Excel-táblázattá, esetleg PowerPoint formátummá.

Úgy az ABBYY Finereader, mind a PDF Converter Elite 3 számos más funkcióval rendelkezik – mi az egyszerűség érdekében kifejezetten azokat a funkciókat teszteltük, melyekkel a PDF-formátumból szerkeszthető adatcsere formátumot lehet kinyerni, és melyet újságírók gyakrabban használnak.

1. próba: szöveges formátumból PDF-be alakított, angol nyelvű e-book

Az egyszerű feladat meglepő eredménnyel zárult. Bár a 174 oldalas dokumentumot mindkét program gond nélkül átalakította szöveges dokumentummá, a PDF Converter Elite 3 szövegfelismerése látványosan gyorsabbnak bizonyult. Igaz, utóbbi esetben a formázás és a tördelői megoldások hagytak kívánnivalót maguk után.

2. próba: kép formátumból PDF-be alakított, magyar nyelvű dokumentum

Itt az ABBYY Finereader a nyerő, főleg amiatt, hogy támogatja a magyar karaktereket. A PDF Converter Elite 3 sem teljesít rosszul, de mivel a magyar karaktereket nem ismeri fel, némi utólagos szerkesztés szükséges.

3. próba: szöveges alapú, magyar nyelvű táblázat

Az ABBYY Finereader gond nélkül átalakította XLS-formátummá a PDF-et. A kapott táblázat hibátlan. A PDF Converter Elite valamiért a Microsoft táblázatkezelőjét kéri, annak hiányában nem hajlandó elvégezni az átalakítást, ez elég zavaró.

4. próba: rossz minőségű (írógéppel írt, elmosódott, de szabad szemmel jól olvasható), kép alapú magyar szöveg

Sem a PDF Converter Elite, sem az ABBYY Finereader nem ismeri fel.

Összegzés

A PDF Converter Elite 3 azoknak lesz hasznos, akik nem dolgoznak túl gyakran magyar karaktereket tartalmazó szöveggel. A viszonylag elavult motor senkit ne keserítsen el: az alapvető funkciókat tudja ez a program, ráadásul karcsúbb, gyorsabb és sokkal olcsóbb, mint az ABBYY Finereader.

Az ABBYY Finereader 12-ért azoknak érdemes kiadni az PDF Converter Elite 3 árának dupláját, akiknek fontos a program magyar karakter-felismerő képessége, és akik akkora dokumentum-mennyiséggel fognak dolgozni, ahol már nem éri meg manuálisan kijavítgatni a szövegeket.

Csodát azonban ne várjunk egyik programtól sem. Bár az egyszerűbb feladatokkal jól elboldogulnak, a rossz minőségű dokumentumokkal kevésbé használhatóak. Éppen ezért ha ilyen célra is fel szeretnénk használni őket, érdemes vásárlás előtt tenni egy próbát.

Sipos Zoltán

Megosztás