- Hol tart éppen a Népszava digitalizálása?
- Úgy másfél-két éve kezdtük el a munkát. Gyakorlatilag 1950-ig készen vagyunk, ami úgy 200 ezer oldal. És most kellene valaki, aki tiszta fejjel az elejétől átnézi az egészet, mert annyit dolgoztunk vele, hogy mi már szinte alig látjuk át. Lényegében erőt gyűjtünk, hogy 2006-ig megcsináljuk a következő etapot. De abban bízunk, hogy az idei év végére eljutunk majd 2013-ig - ugye, 1873-tól! -, vagyis a 140 év digitális formába kerül, és ha arra vagyok kíváncsi, hogy mondjuk Kossuth Lajos mit csinált, vagy hogyan fordult elő a Népszavában, azt egyetlen kereséssel meg tudjam találni.
- Nem egy zökkenőmentes folyamat ez, ahogy hallom a szavaiból.
- Legutóbb például kiderült, hogy 2010-ből sincs meg minden szám. Azt gondolná az ember, inkább a régebbi számok előfordulásával van gond, de nincs különbség. Ha valaki egy valóban teljes iratállománnyal jönne, az egy néhány hónapos munkát jelentene, még a Népszava 140 évét tekintve is. Nem véletlenül tartunk mindössze 200 ezer oldalnál, ennyi idő után, miközben havi félmillió oldalkapacitásunk van, ennyit simán digitalizálni tudunk. Persze az is igaz, hogy mivel szerelem-projekt, inkább akkor foglalkozunk vele, amikor van szabad kapacitásunk.
- Vagyis egy csomó lapszám nincs meg?
- Egészen jelentős volt a hiány. A Politikatörténeti Intézettől (PTI) - merthogy az ő pincéjükben lévő terjedelmes Népszava-archívum adta a projekthez az ötletet - kaptunk annyi anyagot először, hogy el tudtunk indulni. Nem tudnám pontosan megmondani, hogy mennyit, de egy kisteherautóval ötször fordultunk. Látható volt, hogy 1873-tól, amikor a lap még a közvetlen elődjének tekintett Munkás Heti Krónika néven működött, rengeteg szám megvolt. De sokszor egész évfolyamok voltak egybe kötve, majd kiderült, hogy hiányzik mondjuk a május 1-jei szám, egy másik pakkból pedig a teljes december. Eközben persze a feldolgozás már tartott. Mindig jött egy újabb csomag Népszava, abban megnéztük, nincs-e benne a régebbi, amit keresünk, és így tovább. Ennek tetejébe borzalmas sok hiba volt a számozásban; például a 122. szám után a 124. jött, de mire kiderült, hogy csak elírták, mi még a 123-ast kerestük. De olyan izgalmas dolgok is láthatóvá válnak, mint a cenzúra: egy számot három példányban is be kellett szkennelnünk, mert először kijött a rendes "teli", de aztán letiltották az egyik hasábot, majd azt is kiadták, de aztán egy második hasábot is, majd az is kiment. Így ezt a három verziót kell dokumentálni. Aztán volt időszaka a lapnak, amikor hónapokig nem is írtak oldalszámot. Vagy újrakezdték a számozást, miközben még feltüntették a régit - ez nagyon sok nehézséget okozott. A lap kezdeti időszakában az is rontotta a helyzetet, hogy csak 1905. áprilisától kezdett véglegesen napilappá válni, és előtte egy ideig csak kétszer jelent meg egy héten. Hónapokig tartó kutatásokat jelentett, hogy meggyőződjünk róla, valóban minden lapszám rendelkezésünkre áll-e.
- De ha jól értem, az állomány még ma sem teljes.
- Ami különösen nehéz volt, az 1905 előtti időszak. Ezzel küzdünk még mindig, de ezt az időszakot eleve csak a Országos Széchényi Könyvtár (OSZK) segítségével tudtuk lefedni. Miközben az OSZK állománya sem teljes: 1903-tól vagy talán 1904-től, egészen a háborúig vannak meg a lapszámaik; volt, hogy több példány egybe kötve, vagy átfedéssel, de borzalmas állapotban. A háborús időkből szinte mindig olvashatatlan minőségű szövegek maradnak fenn, hiszen a nyomás elkopik, eleve rossz minőségű az ólom, a papír. Ezek olyan lapszámok, amelyek azért vannak eltéve, hogy már senki ne nyúlhasson hozzájuk, azonnal szétesnének. Ha aztán valamit nem találtunk, a Szabó Ervin Könyvtárhoz fordultunk, szépen lassan, számonként kerestük "a múltat". És persze volt keresett szám, amivel ők is csak a katalógus szerint rendelkeztek, de fizikailag nem volt meg. Most úgy állunk, hogy tavaly év végén, január elején egyszerűen feladtuk a keresést. Van összesen 10-12 lapszám, 1873-tól 1949-ig, amelyek nem kerültek elő. Ezeket a számokat most az OSZK-val közösen a Népszaván keresztül is próbáljuk felkutatni. Sajnos, amelyik könyvtár már reagált, az azt jelezte, hogy neki sincs meg. Szintén van egy kisebb hiány 1950-től 2006-ig, de ennek egy része remélhetőleg a PTI pincéjéből elő fog kerülni. Lehet, hogy túl szigorú vagyok, hogy effektíve minden egyes oldalt be akarok szkennelni, de ez fontos volna, hiszen vannak időszakok a Népszava történetében, amikor azt is nehéz megmondani, hogy éppen 12 vagy 16 oldalas volt. Azt akarjuk, hogy minden oldal meglegyen. Persze életünk végéig nem csinálhatjuk egyedül, de azt gondolom, valamennyire rendet tudtunk vágni.
- Igényelnek speciális bánásmódot mondjuk a háború előtti számok?
- Nyilván óvatosan kell velük bánni, de ha elszakad egy lap, azzal nem lehet mit csinálni, összeragasztjuk és megyünk tovább, mégsem Mátyás-korabeli oklevelekről van szó. Azok páncélteremben őrzött dokumentumok, amiket csak felügyelettel, a levéltáros ellenőrzésével kezelhetünk, cérnakesztyűben, hogy ne zsírosodjon, ne kopjon, és a legóvatosabb szkennerekkel, amelyek elérhetőek a világban. A pecsétekre vigyázni kell, egyedi bánásmódot igényelnek, szemben a lényegében tömeges szkenneléssel. És persze félmillió oldal a havi kapacitásunk, de egy B5-ös kis könyvecske oldala is egész más, mint egy A3-as, porladó Népszaváé. A porladó anyagok egyébként a gépekkel sincsenek túl jóban, rendszeres vitáink is vannak a Canonnal - az ő szkennereiket használjunk -, amikor ötmillió oldal után kénytelenek vagyunk felvetni, hogy 20 milliót kellene bírnia a gépnek. Ők erre elmondják, mit várunk, nem ilyen anyagról volt szó. Nem tesznek jót a gépnek, vagyis a feldolgozás mindenféle tekintetben kihívás.
- Ha a digitalizálás végére érnek, a PTI alsó raktára felszabadul? Hová kerülnek a régi Népszavák?
- Hát ide, Önökhöz! És milyen büszke vagyok erre. Hiszen végre oda kerülnek, ahol a helyük van - és az hol máshol lenne, mint a Népszavánál? Amellett, hogy remélem, soha, senki nem fogja levenni őket a polcról, hiszen végre ott lesz digitális formában az egész, akár egyetlen lemezen a 140 év.
- Az Arcanum profilját valahogy mégsem a napilapok archiválása rajzolja ki...
- Más munkáink is főleg olyanok, amelyekben nagyon hiszünk is. Hogy úgy mondjam, a mi mániánk a régi dolgok, dokumentumok, térképek, oklevelek, könyvek, iratok. 1989-ben alakultunk, még CD-kiadóként, de már akkor sem multimédiás tartalmakat csináltunk, hanem könyveket digitalizáltunk. 1991-ben mi tettük először CD-re a Bibliát - ez még ma is forgalomban van, sőt az egyik legkeresettebb kiadványunk. Később Verstár címmel megjelentettük 50 költő összes versét, talán ez a legnépszerűbb anyagunk. De akkor a CD még virágzott. Egyszer a Szabó Ervinben az irodalmi osztály akkori vezetője, Pesti Ernő viccesen azt mondta: "tudod mi kellene, Sándor, hogy tudjak keresni a költőkön." Ma már kézenfekvőnek tűnik egy ilyen verstár kiadása, de '94-95-ben közel sem volt az. Aztán a teljes Nyugatot is kiadtuk, de volt egy pont, hogy a nagy állományokat már nem tudtuk volna szabad kézzel beírni, 2005 körül nagyüzemű technológiára álltunk át; azelőtt 15-20-an gépeltük a szövegeket. De mindenféle megbízások jöttek, levéltárak, könyvtárak, múzeumok lettek partnereink, ami folyamatos elfoglaltság. Úgyhogy ma már 8-10 nagyteljesítményű szkennerünk van szolgálatban. Munkánk odáig fejlődött, hogy ma már az egyik legnagyobb ilyen adattulajdonosok vagyunk.
- Ami nyilván a kutatóknak is felbecsülhetetlen értéket jelent. Van hétköznapibb projektjük is?
- Az Akadémiai Értesítő, a Belügyi Közlöny, a Budapesti lakcímjegyzék digitális kiadása a mi nevünkhöz fűződik, ezek a legnépszerűbb kiadványaink. Milyen furcsa, hogy lakcímjegyzéket adtak ki, 1920-ban ugyan megszűnt, de az internetes közösséget mégis megmozgatja. Újra erőre kapott a családkutatás, a felmenők keresésében rengeteget tudunk segíteni. "Szakmaibb" munkáink egyike jelenleg, hogy 200 ezer oldalnyi múzeumi anyagot digitalizálunk, 50 múzeum kiadvány-állományát bővítjük az internetre. Az OSZK-nak készítjük az 1711 előtti összes magyar nyelvű könyv átdolgozását, a legrégebbi magyar nyelvű források digitalizálását, ami közel 2000 kötet.
- Azért itt is biztosan vannak nehézségek...
- Érdekesség, a XVIII. században egy jezsuita szerzetes, Kaprinai György 180 kötetben lemásolta az összes oklevelet, amit talált. Ráadásul lerajzolta a címereket is. De nem tett oldalszámot, hanem minden oldal aljára odaírta a következő oldal első szavát, afféle őrszóként. Ez az 1711 előtti nagy magyar könyveknél, nyomtatott formában is így van. Az a helyzet, hogy hiába gondolja az ember, hogy végtelen a digitalizálható dokumentumok száma, sajnos nem így van. Eleve, A3-asnál nagyobb szkenner nem is létezik, pedig például a XIX. században iszonyú nagy újságokat nyomtak. Azok így eleve kiesnek. Aztán sok lapnak hiába könyörgöm évek óta, hogy készítsük el az archívumukat, nem hajlanak rá. Pedig egy rendes internetes, kereshető archívum, ahol az olvasó azt az állapotot látná, ahogyan a lap először megjelent, pótolhatatlan.
- Melyik korszak feldolgozása a legizgalmasabb?
- Összességében a magyarországi városképeké - azokon minden rajta van, vagyis jól kereshetőek is. Az egymilliós állományú szerencsi képeslapmúzeummal dolgozunk éppen; a magyar városképeket dolgoztuk fel eddig, ami nagyjából 150 ezer kép, de most folytatjuk az európaiakkal, ami legalább 200 ezer képeslap. Ugyancsak dolgozunk az OSZK 40 ezres tárán, de mostanra ott tartunk, hogy elfogytak a magyar képeslapjak, így elkezdtük a környező országokét digitalizálni. Persze van némi átfedés a Monarchia miatt, de a lényeg, hogy szeretnénk a képeslapokat egy helyen elérhetővé tenni. Hogy szegény kutató ne 19 megyében keresse meg, ami érdekli, hanem egy helyen megtalálhassa. Amiben pedig azt hiszem, a legjobbak vagyunk, azok a térképek. Most egy olyan ősbemutató előtt állunk, ami világszenzáció; 1850-ben készült el a Habsburg Birodalom térképe, amelyen Galíciától Dalmáciáig, Salzburgtól Marosvásárhelyig, gyakorlatilag a teljes birodalom területe látható - mégpedig házakra lebontva. Ez egy 1:28 800-as arányú térkép, minden egyes falu minden egyes házát ábrázolták rajta. Csak a térkép ezerötszáz-kétezer négyzetméter, de gyakorlatilag ötezer darab A1-es térképről beszélhetünk. Ezt a térképet most sikerült digitalizálni és március 20-án az Osztrák Állami Levéltárral és a Fővárosi Levéltárral közösen be is mutatjuk.