Digitális kihívások az egyházi levéltárakban

Koltai András vitaindító gondolatai a MELTE kolozsvári vándorgyűlésén, 2018. július 2-án tartott „Új kihívások a levéltári és múzeumi informatikában” című kerekasztal beszélgetéshez

1. A levéltári digitális szoftverek hiánya

Ha a levéltári munka digitális megoldásairól vagy inkább kihívásiról van szó, Magyarországon az egyik legfeltűnőbb jelenség a levéltári szoftverek hiánya. Németországban tucatnyi különféle megoldást használnak és forgalmaznak (pl. ACTAPro, Augias, Faust, Midosa, ScopeArchiv, Mais-Flexis), még nyílt forráskódúak is vannak köztük (Ariadne, Archium, DA.NRW), ezzel szemben Magyarországon tudtommal csupán két komoly szoftver van használatban:

ScopeArchiv, a BFL és az MNL által az e-levéltár projekt keretében beszerezve és magyarítva
Atom (Access to Memory), amelyet az egyetemi és az egyházi levéltárak közös rendszerei használnak.

A kettő között jelentős különbség, hogy a Scope-nak van asztali feldolgozó felülete, az AtoM pedig csak webes felületen működik, tehát levéltári feldolgozó munkához kissé nehézkes a használata.

A szoftverek hiányának több okát is látom. A legfontosabb a piac kicsinysége, amelyből követezik a kínálat hiánya és a magas árak. A másik ok az, hogy mi, levéltárosok kevéssé látjuk a hiányát egy jó szoftvernek, és alapvetően még mindig a régi, papíralapú segédletekben gondolkozunk. Ezekhez képest a jelenleg rendelkezésre álló szoftverek használata nehézkesnek látszik (például a nyílt forráskódú szoftverek telepítése).

Ráadásul a külföldi levéltári szoftverek gondolkodásmódja is kissé más a Magyarországon megszokottnál. A mi feldolgozómunkánk eléggé célorientált, tehát a levéltári anyagot sokszor a szerint írjuk le, hogy fontosnak vagy kevésbé fontosnak látszik (pl. bizonyos szintekhez nem szoktunk évszámot vagy jelzetet írni, mert kevésbé releváns vagy az adott rendszerben nem szükséges). A szabványos leírásnál azonban minden lehetséges adatot ki kell tölteni.

Néhány további jó tanács ezzel kapcsolatban:

a raktári egységek és a levéltári (besorolási) egységek szigorú elválasztása – ez az, ami például megakadályozza, hogy a repertórium, az egyik legelterjedtebb segédlettípus tartalma konvertálható legyen (e téren a ScopeArchiv adaptálásakor a BFL és az MNL is két külön utat választott).
a levéltári egység címének és tartalmának szétválasztása két külön mezőben – ezt ugyanis az ISAD(G) így kezeli

Mi tehát a teendő?

Szabványos táblázat formájú segédleteket készíteni, amelyek ISAD/EAD kompatibilisek, tartalmukat konvertálni lehet az AtoM/Arca-ba vagy másba.
A fondjegyzékeken túl (bár az egyházi levéltárak 60-70%-ában még ez is hiányzik!) minél több részletes, tétel vagy iratszintű adatot feldolgozni és közzétenni. Komoly célkitűzés lehetne a legtöbb püspöki levéltárban kb. 200 éve létező (és kb. 150 éve magyar nyelven vezetett) iktatókönyvek tartalmi digitalizálása és közzététele.
Túl kell lépnünk azon, hogy a levéltárosok különféle jogvédelmi vagy személyes okokból nem szívesen adják ki kezükből az általuk készített segédleteket. Én magam sem szeretem, amikor a feldolgozás során egyes adatok ismertté válnak, más hasonlóam fontos adatok azonban nem, így a tapasztalatlanabb kutatók az előbbieket fölöslegesen használják, pedig igazából nem is arra lenne szükségük. Ezt azonban csak a még jobb feldolgozással kerülhetjük el.
Elgondolkozni a valóban célszerű levéltári szoftverek beszerzési módján.

2. Adatbázisok

A digitális levéltári segédletek azonban csak a dolog egyik felét jelentik. Az egyházi levéltárakban ugyanis rengeteg digitális szöveg, adattár, kép gyűlt föl, és ezek közzététele sem lenne kevésbé fontos. (Most elsősorban nem is az e-kutatásról beszélek, tehát nem a képként digitalizált levélári anyagról, hanem a digitális szövegekről.) A saját gépen, saját formátumban tárolt adatok ugyanis kevéssé hasznosulnak a kutatás számára, ráadásul egyenkénti figyelmet, konverziót igényelnek, tehát az elvesztés veszélyének vannak kitéve.

Ráadásul a világ ma nagy lendülettel mozdult el errefelé. Az olyan adatbázisok, mint a Europeana, Deutsche Digitale Bibliothek (DDB), Archives Portal Europe (APE), Mapire, Monasterium, Early Modern Letters online (EMLO), Hungaricana, Time Machine teljesen új helyzetbe hozzák a levéltári anyagokat és a levéltárakat. Ha mi tehát egyfelől természetesek vesszük, hogy ezek vannak, és használjuk őket, akkor az is természetes, hogy a mi adatbázisaink is hasonló módon jelenjenek meg.

Ez pedig még komolyabb kihívást jelent. Az összes elsorolt adatportál valamilyen nyílt forráskódú adatbázison (MySQL, PostgreSQL, MariaDB) alapszik, amelyekből a tartalomkezelő rendszerek (CMS) PHP vagy Python parancsok segítségével állítanak elő böngészővel szemlélhető oldalakat, keresési találatokat. A tartalomkezelő rendszerek lehetnek a fejlesztő által készült céltermékek, vagy nyílt forráskódúak (Drupla, Joomla, Processwire, MediaWiki). A MELTE eddig a Drupal mellett tette le a voksot, hiszen honlapunk elég régen, azóta pedig több egyházi levéltár honlapja, pl. Győr, Kalocsa, Pannonhalma, Veszprém) így működik, és legutóbb az e-kutatás szoftveres környezetének fejlesztése is ennek segítségével történt meg. Egy ilyen tartalomkezelő rendszer kezelése, sőt akár telepítése tehát elképzelhetetlen dolog, akár egy levéltáros számára is. A szervereken levő adatok külső biztonsága azonban körültekintést és szakértelmet igényel.

Mielőtt tehát végképp elvesznénk az informatikai dzsungelben, inkább arra térek ki, hogy mi lehet ebben a MELTE szerepe. Elsősorban az, hogy közös adatbázisokat építünk, mivel ezek igazi hasznát az adja, ha összekötjük őket. Az első ilyen, az Arca már megszületett, és ha igény mutatkozik rá, akkor más anyagok is szóba jöhetnek:

e-kutatás – ez eddig alapvetően adatbázis nélkül, levéltáronként külön működött. A jövőben azonban szeretnénk megvalósítani egy közös e-kutatási felületet az ingyen hozzáférhető anyagok számára (erről még Lakatos Andor beszél), amelyhez tétel/kötetszintű adatbázis is kapcsolódna.
topográfiai névtár – ennek kidolgozása tavaly merült föl, a Magyar Nemzeti Levéltárral közösen, az anyakönyvi kutatással kapcsolatos problémák felszínre bukkanásakor, a munka azonban nem igazán kezdődött el.
névtárak – a legtöbb levéltárban készültek vagy készülnek életrajzi adattárak, papi névtárak, iskolai vagy anyakönyvi adatbázisok. (A délelőtti első szekcióban erről több előadás is elhangzott). Ha lenne rá igény, jó lenne az ilyen adatbázisok összekötése egy közös felületen.

3. Közös gyűjteményi portálok

Ez még azonban messze nem minden. A jövő ugyanis afelé mutat, hogy a levéltári, könyvtári és múzeumi adattárak is együtt, egy szolgáltatás keretében legyenek hozzáférhetőek. A Deutsche Digitale Bibliothek keretében ezt például már meg is valósították. Hasonlóképpen egységes rendszerben kezelik a különféle digitális tartalmakat a repozitóriumok is, amelyek a hosszú távú megőrzést és hozzáférést helyezik a középpontba, és amelyhez szintén léteznek nyílt forráskódú megoldások (DSpace, EPrints, Invenio).

Ehhez látni kell, hogy a könyvtárak és a múzeumok (levéltárosi nyelven szólva) darabszinten leltároznak. A könyvtárak esetében az adatcsere szabványok már régóta használatban vannak, és a múzeumok esetében is léteznek ilyenek, tehát az adatok aggregálása nem bonyolult. A levéltárakkal azonban két probléma van:

hierarchikus szerkezet – ez inkább nehézség, mint megoldhatatlan probléma
nagymértékben hiányzanak a könyvtárakhoz és levéltárakhoz mérhető tétel/darabszintű leírások, ezért említettem a fentiekben, hogy ezen szükséges változtatni

A nagy kérdés, hogy milyen szinten érdemes egy efféle közös portált működtetni (helyi, egyházi, országos, állami intézményekkel közösen). Ez azonban úgy érzem, szétfeszíti a mostani kerekasztal kereteit.

e-kutatás

AtoM