Megjelent: Tudományos és Műszaki Tájékoztatás 52. évfolyam (2005) 2. szám | |
Elektronikus időszaki kiadványok nyilvántartása és archiválása: az EPA-szolgáltatás
Az Elektronikus Periodika Archívum és Adatbázis 2004-ben indult
elektronikus könyvtári szolgáltatás, amelynek célja a magyar vonatkozású
elektronikus folytatódó kiadványok feltárása és nyilvántartása; valamint
stabil digitális folyóirat-archívum építése. A fejlesztés bemutatása közben
szó esik azokról az elméleti és gyakorlati problémákról, amelyek a rendszer
kiépítése és általában e dokumentumtípus kezelése során adódtak. Az Elektronikus Periodika Archívum és Adatbázis (EPA, http://www.epa.hu) jelenlegi formájában 2004 tavaszán kezdte meg működését. Az első elektronikus periodikumokat feltáró komplex könyvtári forrás kialakítását sürgette egyrészt a szakma részéről megfogalmazódó igény,1 másrészt az egyre növekvő ütemben keletkező (és eltűnő) források burjánzásából adódó kihívás. A cél elsősorban egy olyan felhasználócentrikus, de szakmai és tudományos kihívásokat is felvállaló szolgáltatás kialakítása volt, amely igyekszik összefogni, egy pontról áttekinthetővé tenni a magyar és magyar vonatkozású elektronikus időszaki kiadványok jelentős részét. Ezenfelül – az EPA feladatköréből kiindulva – a fejlesztés során szükségessé vált az állásfoglalás bizonyos elméleti kérdésekben, melyekben sem hazai, sem nemzetközi téren nem született még konszenzus, s ezek a döntések határozták meg a szolgáltatás gyakorlati megoldásait is. Az EPA feladataiAz első komoly próbatételt a szolgáltatás hatókörének és feladatainak felvázolása jelentette. Mivel az EPA fejlesztése a Magyar Elektronikus Könyvtár (MEK) műhelyében indult, az induló tapasztalatok és megfontolások magától értetődően a webes források világában, és azok jellemzőit szem előtt tartva alakultak ki. Az EPA induló állapotában tulajdonképpen a Magyar Elektronikus Könyvtár (elektronikus dokumentumokat gyűjtő, megőrző és weben szolgáltató, de a hagyományos „közkönyvtári” struktúrában kialakított szolgáltatás) különgyűjteménye volt, amely elektronikus kiadványokat archivált és szolgáltatott saját webes tárterületén. Az egyetlen eltérés a MEK-ben tárolt dokumentumokhoz képest az volt, hogy ezek az állományok folyamatosan frissültek. (A szolgáltatás eredeti neve: „Elektronikus Periodika Archívum” is erre az eredeti, zárt struktúrájú gyűjteményrészre utal, mely csak az üzemeltetői tárterületről – az epa. oszk.hu domainről – szolgáltatott kiadványokat tartalmazta volna.) Legjelentősebb aspektusa egyéb felvállalt feladatai mellett is ez maradt: tárterületet, infrastruktúrát és biztos hozzáférést biztosítani a weben megjelenni kívánó elektronikus periodikumoknak [1]. Párhuzamosan azzal, hogy az EPA kezdett kiépülni a MEK folyóirat-archívumaként, az elektronikus időszaki kiadványok száma és jelentősége napról napra nőtt. Egyre jobban kirajzolódott az ebből eredő probléma: ezek a források a jelen helyzetben csak heurisztikus eszközökkel, több keresési mechanizmus egyidejű alkalmazásával kutathatók fel, a felhasználók és információs szakemberek saját ismeretbázisuk, weben való jártasságuk függvényében képesek megtalálni egy számukra releváns tartalmat közlő kiadványt, vagy annak elektronikus változatát. Röviden: a kilencvenes évek végétől világossá vált, hogy ez az ismerettartalmára nézve jelentős, behatárolható dokumentumtípus eltűnik a webes források tömegében. Az IFLA 1995-ös állásfoglalása értelmében minden, ami nyilvános hozzáférésű szerverről elérhető, publikáltnak minősül, tehát a bibliográfiai számbavétel hatálya alá esik [2]. Bár ez az igény a jelen helyzetben mindenképpen távol áll a megvalósíthatóságtól, ha egy adott kiadványkör tipológiailag behatárolható, akkor annak kezelésére módszertant is tudunk alkotni. Az utóbbi években számos próbálkozás született arra nézve, hogy összegyűjtse az időszaki kiadványnak minősülő forrásokat, különböző nyilvántartásokba ágyazva azokat, illetve webes „directory”-kat, címnyilvántartásokat készítve. Az első megoldásra az egyik legfontosabb példa a Neumann-ház által üzemeltetett WebKat.hu rendszer (http://www.webkat.hu/scripts/webkat), amely egyéb internetes források mellett az elektronikus időszaki kiadványok analitikus feltárását is elvégzi, lehetővé téve ezzel az online elérhető cikkek egy részének szakszerű kereshetőségét. A webes címlistákra nézve számos megoldáskísérlet született (l. http://www.epa.oszk.hu/html/virtual.html), meglehetősen széles gyűjtőkörrel, ilyenek a http://www.startlap.com oldalakon található listák, vagy a http://www.hirlap.com oldal, valamint ilyen volt a Magyar Elektronikus Könyvtár első webes változatáról elérhető ún. „Virtuális Folyóirat-olvasóterem” (http://www.mek.iif.hu/porta/virtua/magyar/efolyir/). Némileg átmeneti esetnek tekinthetők a további, nagyon hasznos nyilvántartás, a http://www.kontextus.hu „Lap-Tár-Lat” oldala (http://www.kontextus.hu/laptarlat/index.html), valamint az „inaplo – Irodalmi Internet Napló” (http://www.inaplo.hu) oldalairól elérhető webes kiadványok. (E két utóbbi egyébként tartalmi szempontból válogat, a kulturális és társadalomtudományi szférára korlátozza tevékenységét.) A felsorolt nyilvántartások többségében azonban nem volt lehetőség a leírt vagy felsorolt kiadványok tartós elérhetőségének ellenőrzésére. Míg ezek a kezdeményezések önmagukban mind nagyon hasznosnak bizonyultak, egyik sem nyújtott kellően átfogó képet arról, hogy mi is az, ami a periodikumok közül elérhető a weben. Ennek fő oka nem a szolgáltatások hiányosságaiban rejlett. Egyszerűen egyik sem tűzte ki céljául, hogy megpróbálja pontosan behatárolni az elektronikus időszaki kiadvány fogalmát, így a válogatás kritériumait mindig sajátos tényezők befolyásolták. Egyre fontosabbá vált tehát egy gyakorlati szempontú meghatározás megfogalmazása. A leggyakoribb és legkézenfekvőbb megoldás természetesen az volt, hogy biztosan elektronikus időszaki kiadványnak tekinthető egy nyomtatott periodikum digitális megfelelője. Ez a megközelítés hasznos, ha jól be akarjuk határolni a kört, amellyel foglalkozni kívánunk, minden egyebet sajátosan internetes tartalomnak tekintve; mégis, előbb-utóbb minden nyilvántartás túllépett ezen, egyszerűen mivel a gyorsan szaporodó csak elektronikus források egyre nagyobb teret hódítottak a tájékozódás és kultúra világában, kialakítva méltó helyüket a kulturális források között. Az EPA fejlesztése során nem volt mellőzhető a fenti képből kibontakozó, egyre sürgetőbb probléma: létre kell hozni egy kidolgozott tipológiai szempontrendszerrel működő, teljességre törekvő, szakmai igényeket szem előtt tartó és rendszeresen ellenőrzött nyilvántartást, melynek segítségével egy pontból elérhetővé és átláthatóvá válik a magyar webes lapok, folyóiratok világa. Így az EPA-koncepció már a fejlesztés második évétől magában foglalta egy nem pusztán helyi forrásokat feltáró nyilvántartás tervét is.2 A nyilvántartás leírja a digitális formában hozzáférhető, részben vagy egészben teljes szöveggel olvasható, magyar nyelvű, tárgyú vagy magyar kiadású, saját írásokat (is) közlő, azonosítható közreműködőkkel és archívummal rendelkező elektronikus folytatódó forrásokat. Ezzel azonban még nem értünk a lehetséges feladatkörök végére. A webes kiadványok és változatok létrehozásával párhuzamosan ugyanis egy újabb publikációs hullám indult meg – egyfelől kiadók, de még nagyobb részben közgyűjtemények közreműködésével –, melynek keretében megkezdődött a nagyobb ütemű retrospektív digitalizálás, s ez természetesen érintette a magyar folyóiratokat is. Számos digitális változat született, teljesen eltérő nyilvánossági szintekkel: a helyi hálózatról vagy PC-ről szolgáltatott állományoktól egészen a kereskedelmi forgalomban terjesztett CD-ROM-okig. Bár a digitalizálási folyamatok nyilvántartására a Neumann-ház is kísérletet tett,3 kifejezetten az időszaki kiadványokra koncentráló adattár még nem létezik. Logikusnak tűnt ezért, hogy az EPA-n keresztül megtalálható legyen minden digitalizált időszaki kiadvány, akkor is, ha az közvetlenül az interneten nem is érhető el. Fogalommeghatározási kísérletE három fő pontból álló küldetés felvázolása után az EPA-nak meg kellett fogalmaznia, hogy mit tekint elektronikus időszaki kiadványnak, hogyan képzeli el a gyűjtőkörét, valamint hogyan és milyen mélységig dolgozza fel az abba tartozó kiadványokat. Egy kellően általános és pragmatikus elveket is megfontoló definíciónak
szem előtt kell tartania a tárgy természetét, még akkor is, ha az kissé
szétfeszíti a hagyományos terminológia határait. Ezért figyelembe kellett
vennünk az időszakosság fogalmával kapcsolatos elméleti újításokat is,
amelyek esetleg még nem épültek be a szakmai gyakorlatba. Az 1990-es években
megkezdődött a jelentősebb nemzetközi specifikációk revíziója (ezek közül
a legdinamikusabban az AACR-elveké, melyek elméleti konzekvenciái azonban
világszerte megfontolandók). E folyamat keretében vezették be Crystal
Graham és Jean Hirons kutatásai a „folytatódó kiadvány”
(„ongoing publication”, későbbiekben „continuing
publication”) fogalmát, amely lehetővé teszi az e-periodikumok tipológiai
besorolását újabb, önálló kategória felvétele nélkül [3]. A felvetés lényege
abban áll, hogy a kiadványtípus sajátosságát a nem határozott időre való
megjelenésben, tehát a folytatás elvi szándékában látja. Így minden időbeli
kiterjedésű forrás besorolható egy „folytatódó” kategóriába,
függetlenül attól, hogy az részegységekben folytatódik (időszaki kiadvány),
avagy szervesen építi magába, írja felül tartalmát (integrálódó
kiadvány) [4]. E két utóbbi fogalommal egészült ki az a dokumentumtipológiai
modell, melyet Graham, Hirons, valamint Regina Reynolds dolgozott
ki. Remélvén, hogy a kiadványok evolúciójával párhuzamosan ez az elméleti
továbblépés majd dinamizálja a gyakorlatot a kiadványtípusok kezelésében,
az EPA – a kellő rugalmasság érdekében – ehhez a megközelítéshez
igazodott saját definíciójának megfogalmazásakor: Az elektronikus integrálódó kiadvány olyan elektronikus formában elérhető tartalmú forrás, melynek megjelenése nem határozott időtartamra tervezett, és tartalma bizonyos rendszerességgel frissül. A frissülés nem új, elkülöníthető részegységek formájában történik, hanem úgy, hogy új tartalom adódik a korábbihoz, esetleg a korábbi tartalom cserélődik. Az EPA tágabb, gyűjtőköri definíciója („digitális formában hozzáférhető, részben vagy egészben teljes szöveggel olvasható, magyar nyelvű, tárgyú vagy magyar kiadású, saját írásokat [is] közlő, azonosítható közreműködőkkel és archívummal rendelkező elektronikus folytatódó források”) a szolgáltatás perspektívájából határozza meg a kezelendő kiadványok körét. Globális igénnyel a definíció jóval tágabb lehetne, hiszen gyakorlatilag minden folyamatosan vagy időszakosan frissülő, saját tartalmat közlő elektronikus forrást leírhatna, azaz idevehetne minden portált, fórumot, blogokat, listaarchívumokat. Feldolgozhatná a hírcsoportarchívumokat és csak e-mail útján terjesztett hírleveleket is.4 Ezért az EPA az átláthatóság és a munkafolyamatok racionalizálása érdekében csatolt még pár további határozott kritériumot a defnícióhoz. Ezenkívül néhány, egészen praktikus szempont befolyásolhatja, hogy egy forrást felvesz-e a nyilvántartásba, avagy halasztja, illetve mellőzi a leírását. Ilyen szempont például a rendelkezésre álló tartalom mennyisége, hozzáférhetősége (szükséges-e regisztráció a böngészéshez, ingyenes-e), a forrás használhatósága (például nincs-e tele hibás hivatkozásokkal). Ezek a megfontolások természetesen nem elviek, a definíció megengedné ezen források felvételét is, de a szolgáltatás hatékonysága érdekében a biztos és releváns tartalom lehető leggyorsabb elérhetővé tétele élvez elsőbbséget. Az adatbázis tervezett kapacitása és a rendelkezésre álló erőforrások fényében becsléseink szerint ideális feltöltöttséggel egyszerre 1000–2000 online elérhető kiadvány adatait fogja nyilvántartani. Az „elektronikus periodikum” kiadványtípus alkategorizálására nézve részletes és több szempontból átgondolt tipológia található Stumpf-Benedek Anna tanulmányában [5]. Míg azt az EPA nem alkalmazza, sem elméleti hátterének nem része (valójában nem is kísérleteztünk univerzális érvényű tipológia kialakításával), a cikk elején felvázolt felosztáskísérletek nagyon hasznosak a kiadványtípus jellegzetességeinek áttekintéséhez. Még ezen a ponton, a definíció környezetében célszerű kitérni néhány, lokálisan megfigyelhető tényezőre. Amikor a könyvtártudományi kutatás (főként angolszász területeken) az elektronikus periodikumok problémájáról beszél, akkor a fogalomhasználat általában két értelmezési tartomány között ingadozik. Egyrészt az egészen általános, elméleti megközelítésekhez az online és fizikai hordozón terjesztett elektronikus források teljes körét kívánja felölelni, azaz a tudományos igény tulajdonképpen szeretné elhelyezni tipológiájában az összes frissülő tartalmú forrást, a portálokat, honlapokat, különböző témájú webarchívumokat, retrospektíve digitalizált forrásokat – és a sort még folytathatnánk. Mihelyt a könyvtári metodológia és feltárás kerül azonban terítékre, a megközelítés hirtelen léptéket vált, és igen gyakran a tudományos és szakfolyóiratok adatbázisokban, ún. aggregátorszolgáltatókon keresztül, többnyire cikkszinten elérhető tartalmára szűkül. Mit takar ez a kettősség? Valószínűleg azt, hogy az elektronikus periodikum mint jelenség már nyilvánvaló kihívásként áll a szakma előtt, bár a fogalom elméleti megalapozása még várat magára. A gyakorlat azonban itt sem várta be az elméletet, s míg az e-periodikum fogalma még nagyon is képlékeny a szakirodalomban, addig a felsőoktatási és tudományos szférában a könyvtárak már naponta elektronikus folyóiratcikkek nagy tömegét szolgáltatják. A gyakorlat természetesen ezen téren sem egységes: például az adatbázisformában, licenc útján szolgáltatott tételek megjelenése a könyvtári katalógusokban még angolszász területen sem egyforma [6]. Itt azonban túlléphetünk a könyvtári gyakorlaton, hiszen a gyakorlott felhasználó nem csupán a szakkönyvtárból vagy a campusról hívhatja be egy szakfolyóirat elektronikus változatát. A legtöbb jelentős, indexelt forrás már önállóan vagy online szolgáltatón keresztül is elérhető – térítés ellenében. Ebben a tekintetben azonban jelentős megoszlás tapasztalható a terjesztési és felhasználói szokások terén. Ott, ahol a webhasználat és főként az online fizetés beépült a mindennapi gyakorlatba (s a webes tartalom pénzért való letöltésére van is fizetőképes kereslet), az online tartalom elérhetővé tétele megtérül, ugyanakkor minőségi kritériumoknak kell megfelelni, így infrastruktúra épül ki rá, az internetes tartalomipar jelentős tényezője lesz. Az olyan területeken azonban, ahol az olvasó nem jelent egyben fogyasztót is a piacon, a megjelenő tartalom sokkal heterogénebb lesz. Ha összehasonlítjuk a magyar periodikumok webes elérhetőségét mondjuk az Egyesült Államokéval, akkor azt tapasztalhatjuk, hogy a magyar kiadványoknak arányaiban sokkal szélesebb körét fogjuk ingyenesen és korlátozás nélkül elérni, de vegyes mélységig és minőségben. A tartalomszolgáltatás terén vezető területek könyvtári gyakorlata – és ennek nyomán a köztudat – jó eséllyel ez utóbbi, szűk kör könyvtári kezelése mellett foglal majd állást, és az „elektronikus folyóirat” fogalma a könyvtári szakirodalomban a szabályozott, egységes formában, adatbázisban, például licenc útján szolgáltatott – jegyezzük meg, nagyon bőséges és egyre bővülő – tartalmat jelenti majd. Ezt azért merjük itt kijelenteni, mert az utóbbi évek kutatásaiban született publikációk túlnyomó többsége ezen a horizonton marad.5 Ez természetesen nem jelenti a szakma hiányosságát, sem pedig azt, hogy az egyedi formában, ingyenesen hozzáférhető e-periodikumok elmélet és metairodalom híján maradnának. Jelen helyzetben azonban nem várható, hogy a globális szabályozások nagyon szélesen értelmezett definíciókkal a források sokféleségét a könyvtári nyilvántartás hatókörébe utalnák. Hogy az EPA mégis ilyen megfontolások mentén alakult ki, azt a magyar online tartalom bősége és jellegzetessége alakította ki és igazolta. Mert bár a szabályozott és egységes formájú elektronikus publikáció is jelen van a tartalompiacon,6 addig a minőségi források nagy hányada önálló, korlátozatlan hozzáférésű forrásként létezik az interneten. Ezek láthatóvá tétele azonban létszükséglet, egyrészt a felhasználók kiszolgálása és a tartalomközlés infrastruktúrájának javítása, másrészt a publicitás növelésével, a minőséget szolgáló gyakorlat terjesztése érdekében. A leírás és a metaadatok az EPA-banMiután nagyjából körüljártuk, hogy milyen kiadványokat is ír le az EPA adatbázis, térjünk rá a leírás módjára. Az elektronikus források megjelenése már pár évtizede hatást gyakorol a könyvtári szabályozásra. Így született meg az ISBD CF (computer files) szabvány, amely elméletben már a távoli hozzáférésű elektronikus források leírására is alkalmas volt. A MARC adatcsere-formátum 856-os mezőjének megjelenése forradalmasította a hozzáférési sajátosságok tükrözésének módszertanát [7]. Abban a pillanatban, amikor az EPA struktúrájakirajzolódott, éppen bővében voltunk az alkalmazható szabályozásoknak. Elsősorban rendelkezésre állt a magyar bibliográfiai adatcsere-szabvány (HUNMARC) specifikációja,7 emellett viszonylag friss keletű volt az ISBD-ER és ISBD-S szabványok honosított revíziója is (az EPA tematikájában egyébként éppen e két utóbbi metszetében állt). A legkézenfekvőbb megoldás a HUNMARC szabvány alkalmazása lett volna, mivel ez a specifikáció elvileg minden forrástípus könyvtári kezelésére alkalmas, továbbá mivel hosszú távon elősegítheti a kooperációt a WebKat.hu szolgáltatással, melynek fejlesztői 20 000 analitikus online folyóiratcikk-leírást bocsátottak rendelkezésünkre, az említett formátumban. (Ennek beépítése természetesen akkor lesz lehetséges, ha az EPA bővül az analitikus feltárással.) A HUNMARC formátumú EPA azonban még jövőbeli tervek része. Nem értünk azonban a szóba jöhető szabályozások végére: a fejlesztés idejében új keletű és meglehetősen kézreálló megoldás volt az OCLC-fejlesztésű, kifejezetten a webes kommunikációs szabványok (W3C, Z39.50) figyelembevételével készült Dublin Core Metadata Initiative „Dublin Core Library Application Profile” (http://dublincore.org/documents/2001/10/12/library-application-profile/) adatstruktúrája (különösen a bibliográfiai kapcsolatok tükrözésében nyújtott nagy segítséget). Így, míg a HUNMARC formából eredő megkötéseket végig szem előtt tartottuk a későbbi adatkonverzió lehetőségét figyelembe véve, addig elsősorban a Dublin Core e könyvtári szempontú változatának helyi alkalmazása mellett döntöttünk. Minthogy a végső döntés helyi kialakítású adatstruktúrát írt elő, az adatszerkezet és a szolgáltatás alapfelépítésének modellje a Magyar Elektronikus Könyvtár saját fejlesztésű, de monografikus kiadványok leírására szolgáló rendszere lett. Az adatstruktúra 25 adatmezőjével (http://epa.oszk.hu/html/irattar/epa.htm) igyekszik lehetőséget adni a kiadványok minden sajátosságának tükrözésére, megmaradva a könyvtári terminológia és fogalomrendszer keretei között. A nyilvántartás elektronikus forrást ír le mint kiadványt (azaz egy rekord egy kiadványt azonosít, a leírások tehát összefoglaló jellegűek). A leírás alapja a forrás egésze, mindig megjelölve azonban azt, hogy milyen keltezésű vagy számozású annak a leírás pillanatában aktuális részegysége vagy frissített része. A kiadványon belül azonban nem rendelkezünk további fogódzókkal az adatok forrásáról. (Az ISBD-ER szabvány és honosított megfelelője is csak „dokumentumon belüli” és „dokumentumon kívüli” adatforrást különböztet meg.) Ezeknél a kiadványoknál a főcím forrása gyakran csak a honlap nyitólapja lehet, s a főcím a részegység főlapján gyakran nem is látható [8]. (Az egyes cikkeken belül pedig csak a legritkább esetben tüntetik fel.) Sőt, az is lehet, hogy más főcímként azonosítható adat szerepel a nyitólapon, és a leírás pillanatában aktuális részegység kezdőlapján. Ebből is látható, hogy milyen mértékben nő az ilyen források leírásánál a feldolgozó könyvtáros mérlegelésének, egyéni döntéseinek jelentősége. Az EPA-leírás „autopszia” alapján készül – amennyiben itt a használható ez a kifejezés –, a katalogizáló a forrás részletes áttekintése, elemzése alapján készíti el a leírást. Az adatstruktúra részletekbe menő ismertetése helyett most inkább azokat a pontokat emeljük ki, amelyek bevezetése, használata vagy értelmezése komolyabb töprengésre és döntéshozatalra késztetett a leírás megtervezése során. Ami a cím-, illetve szerzőségi (közreműködői) adatokat illeti, itt elsősorban a forráshűséggel kapcsolatban kényszerültünk kompromisszumra. Címváltozat („Egyéb cím”, „Alternative Title”) adatot pl. indokolt esetben a kiadványon kívülről is leírunk. A hagyományos formátumú időszaki kiadványoktól eltérően az e-folyóiratok általában nem közölnek friss impresszumadatokat minden részegységgel; ilyenkor – további forrás hiányában – a leírásnál be kell érnünk az általában a nyitólapra „bekötött” impresszummal. Ez főként a testületi és közreműködői adatokra van kihatással. A legsajátosabb a „Kiadó” adatcsoportjának értelmezése: csak akkor tüntetünk fel kiadót, ha annak egész biztosan köze van az elektronikus forrás közzétételéhez (a nyomtatott változat kiadóját itt testületként jelöljük meg).8 Hasonlóképpen, a „kiadásváltozat” helyén is gyakorlati jelentőségű adatokat igyekszünk feltüntetni. Ha a forrás nem közöl egyértelmű kiadásjelzést, az EPA egészíti ki a leírást ezzel az információval, melyben azt közöljük, hogy milyen viszonyban áll a forrás egyéb változataival (amennyiben vannak ilyenek). Ezzel el is érkeztünk az EPA-leírások sarkalatos pontjához: ez pedig a verziók, kiadásváltozatok kérdése. Hogyan közelítse meg egy könyvtári alapú nyilvántartás az egyre burjánzó formátumváltozatokat? A legegyszerűbb, kiinduló eset az, amikor egy nyomtatásban megjelenő kiadványnak létezik elektronikus változata, mondjuk az interneten, vagy CD-ROM hordozón. Kézenfekvő megoldásnak az tűnik, hogy ilyenkor a könyvtári nyilvántartásban a nyomtatott változatról készítünk leírást, a megjegyzésben pedig informáljuk a felhasználót az elektronikus változat létezéséről és elérhetőségéről. Jelenleg is vannak ennek az eljárásnak támogatói. Egyre több elektronikus periodikum születik azonban, amelynek már nincsen nyomtatott változata. Létjogot kapnak tehát a tisztán elektronikus kiadványokról készült rekordok is. Így azonban csak a kizárólagosan e-kiadványok kapnának külön leírást. Ezt a problémát azonban a nemzetközi bibliográfiai számbavétel gyakorlata sem így kezeli: önálló kiadásváltozatnak tekinti (azaz saját nemzetközi azonosítót ítél meg) ugyanazon kiadvány több hordozón megjelenő változatainak. A kiadásjelölés változása a bibliográfiai leírás elveinek értelmében új leírás készítését írja elő. Igazi elvi-gyakorlati összhangot az eredményezne, ha minden változatról (pl.nyomtatott–mikroforma–elektronikus) külön rekord készülne a nyilvántartásban (amely természetesen mindhárom hordozót gyűjtőkörébe vonja). Az EPA ellenben egy olyan könyvtári gondolkodású nyilvántartás, amely történetesen elektronikus forrásokat ír le. Mi legyen az a kritérium, amely alapján elkülönítheti a kiadásváltozatokat, vagy több elektronikus forrást azonosíthat egy kiadvány online változataiként? Röviden: mi azonosítja az EPA szempontjából a kiadványt? A főcím sajátos viselkedését már említettük. A kiadásjelzés sem megbízható kritérium, mivel ritkán van jelen, és akkor is gyakran beolvad a címbe vagy alárendelt címbe (pl. „online” megjelölés). A nemzetközi azonosító szám itt külön problémákat okoz. Egy nyomtatott kiadvány online változata a szabályok értelmében kaphat ISSN-számot. A gyakorlatban azonban viszonylag kevés e-változat rendelkezik saját azonosítóval, s ha igen, azok feltüntetése nem mindig következetes. (Így lehetséges például, hogy egyes katalógusokban a nyomtatott változat leírásánál az online ISSN is szerepel, azaz egy tételhez két azonosító szám tartozik.) Ha az azonosítók és a források között nincs egy az egyben megfelelés, akkor az azonosító funkciója veszélybe kerül. Mégis, a leggyakoribb eset az, hogy az elektronikus változat is a nyomtatott ISSN-t tünteti fel (a többi impresszumadattal együtt). Ebből is látható, hogy az ISSN-t sem használhatjuk fogódzóként.9 Egyéb kritérium híján az ISSN-hez legközelebb álló, azaz az URI-információk családjába tartozó adatot kezeljük egyedi azonosítóként, ez pedig az URL. Az EPA elektronikus forrásokat azonosít, s azon belül az egyes változatokat az URL megléte, illetve tartalma különíti el egymástól. Ez időnként azt eredményezi, hogy adott nyomtatott kiadványnak több elektronikus megfelelője lesz a rendszerben. Ezeket a változatokat azonban különböző tulajdonságok jellemezhetik (megjelenés, számozás, formátum, hozzáférés stb.), s csak elektronikus forrásokról lévén szó, ezek a különbségek a felhasználó szempontjából mind relevánsak. Tegyük fel, hogy az olvasó az Élet és Tudomány egy 1998-as számára kíváncsi! Miért keresné fel akkor azt a honlapot is, amely csak 2002-től tartalmazza a számokat, mikor a leírásban eleve fel tudjuk hívni a figyelmét a két elektronikus változat közötti – ezúttal az évadatokban előálló – különbségre (1. ábra)? Sajátos EPA-jellemzőkHozzáférésAz EPA-leírás szempontjából sarkalatos jellemző a hozzáférés, mivel ez a tulajdonság befolyásolja a legdöntőbb mértékben a kiadvány pozícióját és kezelését az adatbázisban, valamint azt is, hogy milyen mélységű tartalom érhető el a szolgáltatáson belül az adott forrásból. A legteljesebb körű elérést az archivált hozzáférési mód jelenti. Ez úgynevezett EPA-változatú10 forrást jelent. A kiadvány teljes tartalmát az EPA szolgáltatja, és garantálja annak hozzáférhetőségét. Tartalma teljes szöveggel visszakereshető, sőt bizonyos mértékig cikkszintű visszakeresés is biztosítható benne. A kiadványok többsége a hozzáférés szempontjából távoli. Ezek a források az http://www.epa.oszk.hu domainen kívülről, a web tetszőleges pontjáról érhetők el. Az EPA bibliográfiai adatokat és egyéb kísérőinformációkat társít azokhoz, működésüket heti rendszerességgel ellenőrzi. Speciális csoportot képeznek az offline tételek. Ezek többségükben digitalizált változatok, amelyek azonban nem érhetők el közvetlenül az interneten, viszont kezelhető felhasználói formátumban használhatók helyi vagy egyéb módon. Ilyenek például a CD-ROM-kiadások, vagy lokális fájlrendszerből szolgáltatott digitalizált változatok.11 ÁllapotA kiadványok állapota ránézésre egyértelműnek tűnhet, az e-periodikumok jellegéből fakadó sajátos értelmezés során azonban itt bizonyos értékek magyarázatra szorulnak. Egy kiadvány folyamatos, ha hozzáférhető, és rendszeresen frissül. Lezárt, ha hozzáférhető, de nem frissül többé. (Ez a hagyományosan értelmezett „megszűnt” fogalmát fedi le.) Ha egy forrás egy ideje észrevehetően nem frissül, de nem is deklarálta működésének felfüggesztését, akkor szünetelőként írjuk le. A szünetelés tünete lehet, amennyiben a kiadvány elektronikus változata él, de egy ideje nem változott, míg a nyomtatott változatnak újabb részegységei jelentek meg. Ez a jelenség nagyon gyakori a magyar elektronikus folyóiratok világában, mégpedig praktikus okokból: nincs mindig erőforrás az online változat fejlesztésére is.12 Az EPA értelmezésében az a megszűnt kiadvány, amely többé egyáltalán nem hozzáférhető (hajdani weblapja helyén csak a „lap nem található” üzenetet találja az olvasó). Felmerülhet a kérdés, hogy miért van szükség az ilyen tételek megőrzésére. Egyrészt, mivel nemritkán előfordul, hogy egy láthatólag teljesen „halott” weboldal hónapok elteltével újraéled, s ilyenkor esetleg új leírást kellene hozzá készítenünk. Másrészt, a leírt források sokfélesége idővel sajtó-, illetve médiatörténeti jelentőséggel bír. Az EPA megőrzi a hajdan létezett kiadványok leíró és járulékos adatait is, egyfajta kiadványtörténeti múzeum szerepét is betöltve. Témakör, tárgyszó, típusAz időszaki kiadványok tartalmi feltárása korántsem egyszerű feladat, sőt, egyes kiadványok nehezen írhatók le tematikus szempontból, torzítások nélkül. Az EPA adatbázis tervezésekor nem kis problémát okozott, hogy nem találtunk megfelelő, és az EPA infrastrukturális háttere által kezelhető léptékű13 tematikus leírási sémát. Végül a MEK-ben használt háromszintű tematikus osztályozás alkalmazása mellett döntöttünk. Ez a megoldás természetesen vitatható, mivel a MEK tematikus rendszere rendkívül robusztus és szigorúan hierarchikus felépítésű struktúra, nem igazán ad teret az interdiszciplináris jellegű és egyéb tematikus érintkezések kifejezésére. Letagadhatatlan előnye azonban, hogy használatával megoldható a közös tematikus lekérdezés az EPA és a MEK tartalmában, amivel két nagyon jelentős online tartalombázis kereshető egy lépésben. Az EPA-n belüli tartalmi jellemzés pontosságát elősegítendő két további adat áll rendelkezésre: az OSZK Tezaurusz-Köztaurusz alapján kiosztott tárgyszó, valamint egy tematikus-formai szempontokat felvonultató típus szerinti jellemzés (itt adhatjuk meg, hogy az adott periodikum például regionális érdekeltségű, portálként funkcionál, vagy hogy határon túli kiadvány). KapcsolatokAz EPA a kiadványok közötti kapcsolatok két fajtájával foglalkozik. Egyrészt kezeli a hagyományosan értelmezett bibliográfiai kapcsolatok nagy részét (előzmény, folytatás, további változat). Ezeket aktív rekordkapcsolatok tükrözik a leírásokban. A „Kapcsolódó kiadvány” viszont inkább tematikai összefüggést tükröz. Itt minden kiadványnál olyan, tipológiailag is hasonló forrásokat sorolunk fel, amelyben a felhasználó a tételéhez hasonló információt találhat. Ugyanakkor itt vehetők fel egyes speciális bibliográfiai kapcsolatok, mint például a társlap, illetve mutáció. A kapcsolódó oldalak feltárása egyébként túllép az egyedi katalogizáló folyamaton, mert a tematikusan releváns források felkutatásával mindig újabb és újabb feldolgozandó tételek kerülnek az adatbázis látókörébe. A harmadik lehetséges kapcsolat nem folytatódó forrásokra utal: az EPA külön mezőt vett fel az adott forrásra kialakított keresési segédletek, mutatók, online repertóriumok feltüntetéséhez. Az EPA-archívumAz EPA-szolgáltatás tervezésének első szakaszában erre a névre hallgatott: Elektronikus Periodika Archívum. Nem véletlen, hogy az „adatbázis” kifejezés annakidején hiányzott a fejlesztés nevéből. Az EPA létoka és küldetése – a Magyar Elektronikus Könyvtárhoz hasonlóan – a kulturális, illetve oktatási szempontból jelentős, de az internet létmódjából eredő veszélyeknek kitett értékes tartalom biztos tárhelyen való megőrzése volt. Ezért a kezdeti elképzelések egy olyan gyűjteményről szóltak, amely a MEK-hez hasonlóan weben elérhető tartalmat gyűjt, archivál és szolgáltat. Legfontosabb kihívása a digitális archiválás feladata, azaz a digitális formában keletkezett, illetve létező dokumentumok hosszú távú megőrzésének problematikája. A gyűjtemény felépítése kezdetben a MEK-hez lett volna hasonló – tulajdonképpen annak különgyűjteményeként –, azzal a sajátossággal, hogy ezek az archívumok a MEK területén belül is rendszeresen frissülnének. A részletes bibliográfiai feltárás és a nem helyi területről szolgáltatott tartalom nyilvántartása a fejlesztés kezdeti szakaszában kevéssé volt hangsúlyos. Kétségtelen, hogy a felhasználók szempontjából a legnagyobb áttörést egy olyan szolgáltatás jelentette volna, amely elektronikus időszaki kiadványok nagy tömegét képes szolgáltatni, biztos hozzáférésű tárhelyről, egységes formátumban és szerkezetben, közös felülettel és keresőművekkel. Ezt a célt igyekszik megvalósítani az EPA-ban archivált kiadványok köre, mely a szolgáltatás tulajdonképpeni első szintjét képezi (2. ábra). Az EPA-archívum sosem adott elektronikus kiadvány mechanikus másolatát vagy tükrözését jelenti. Az archiváló tevékenység lényege tulajdonképpen egy olyan változat létrehozása, amely megfelel a szolgáltatás által felállított minőségi kritériumoknak, melyek sok, online források böngészésnél sajnos gyakran tapasztalható hibát hivatottak kiküszöbölni. Az EPA-archívumok következő, egészen minimális kritériumai nem pusztán a szolgáltatáson belül, hanem az online publikáció minden területén megfontolandónak bizonyulhatnak. Formátum Fontos, hogy a közhasznú tartalom az olvasó által mindenképpen korlátozások nélkül elérhető és teljes mértékben használható formában álljon rendelkezésre. Erre nézve a legmegfelelőbbnek a szöveges információ esetében a HTML és PDF, képi anyag esetén pedig az ésszerűen tömörített JPG, illetve GIF állományok bizonyultak. Ezek a fájlformátumok a böngészők, illetve ingyenesen hozzáférhető szoftverek segítségével megnyithatók. Szöveges anyagok esetén a HTML és PDF formátumok lehetővé teszik a teljes szövegű kereséshez szükséges további feldolgozást. Képi anyagoknál pedig az említett formátumok nem nagy sávszélességű webhozzáférés mellett is használható minőségű letöltendő állományokat eredményeznek. Karakterkódolás Többségében magyar nyelvű információról lévén szó, a szöveges állományok online közzétételénél gyakran előfordul, hogy – különösen egyes ékezetes karakterek esetében – elvész a karakterinformáció, s ezáltal további szövegromlással kell számolni. Az EPA legfőbb elve az, hogy a HTML állományok esetében a dokumentum fejlécében megadott karakterkészlet-deklaráció és a tényleges kódolás összhangban legyen. Továbbá, magyar szövegek esetében két karakterkódolási szabvány elfogadható az EPA-archívumokban: az ISO 8859-2 számú, úgynevezett „latin-2” karakterkódolás, illetve a „windows-1250” („közép-európai”) karakterkészlet. (Az EPA-felület a kiadványok tartalomjegyzékeinek mélységéig igyekszik a latin-2-es szabványhoz igazodni.) Metainformációk Sok elektronikus kiadvány esetében jelent problémát, hogy a részegységek egyáltalán nem tartalmaznak a forrásdokumentumra vonatkozó információkat. Azaz ha például egy folyóiratcikket tartalmazó fájlra nem a forrás felépítése mentén lépegetve, hanem „kívülről” (esetleg webes kereső segítségével) jutunk el, gyakran egyáltalán nem derül ki, hogy az milyen periodikumban jelent meg. Ezért fontosnak tartjuk, hogy minden esetben cikkszinten is közöljük a forrásra vonatkozó információt, ha másképpen nem is, akkor a fájlformátum nyújtotta metainformációs mező kitöltésével. Ez a megoldás nem jelent járulékos ráfordítást, az adott formátumszabványok beépített eleme, viszont nagy szerepe lehet az olvasó orientációjában. Az EPA gyűjteménye a MEK-hez hasonlóan elektronikusan már létező tartalmat gyűjt. Nem tekinti elsődleges feladatának a primer digitalizálást (bár erre is volt már példa). A gyűjtemény gyarapításának legfőbb forrása a jogtulajdonosokkal való aktív kapcsolatépítés: többségében a kiadványukat egyébként is online rendelkezésre bocsátó kiadók, szerkesztőségek hozzájárulásával és közreműködésével kerülnek újabb források az EPA-ba. A szolgáltatás népszerűsödésével, terjedésével egyre több forrás gazdája keresi a kapcsolatot az EPA-val, hogy kihasználja az archiválás nyújtotta lehetőségeket. Előfordul, hogy az EPA-változat létrejöttével készül például PDF formátum az adott forrás számaiból. Az esetek többségében a forrásdokumentum minden részegységen való következetes megjelölése is az archiválás alkalmával történik meg. Az egyes részegységek, illetve cikkek stabil, egységes formátumú URL-eket kapnak, amelyek segítségével más, tartalomfeltáró szolgáltatások egyszerűen be tudják kötni a közlemények teljes szövegű tartalmát a távoli URL-t közölni képes nyilvántartásokba. Ez történik például a MATARKA14 adatbázis esetében, amely az ott is feltárt kiadványok cikktételeinél feltünteti a megfelelő EPA-URL-t. A jelenleg a tervezés szakaszában álló országos sajtórepertórium is alkalmazhatja majd ezt a megoldást, ahogy elődje, az Időszaki Kiadványok Repertóriuma (IKER)15 adatbázis webes változata annakidején sikeres kísérlet keretében ágyazta rekordjaiba az EPA-archívum önálló cikk-URL-jeit. Az archivált kiadványok tartalomfeltárásának további fontos tényezője a teljes szövegű keresés. Ezt az EPA szolgáltatás az ingyenes, nyílt terjesztésű SEARCH++ szoftver alkalmazásával oldotta meg, amely nagy hatékonysággal indexeli a HTML és megfelelő szövegindexszel rendelkező PDF-állományokat. Továbbá, a keresési eredmények megjelenítésékor képes a HTML és PDF formátumokban tárolt metainformációk automatikus kinyerésére, ezzel külön adatbázis-támogatás nélkül is korrekt bibliográfiai információ kíséretében juttatja el az olvasót a megtalált tételhez. Az archívum jelen feltöltöttségi állapotában 54 kiadványt tartalmaz, ezek között olyan tételek találhatók, mint a Nyugat teljes digitális változata, a Vasárnapi Újság első hét évfolyama, valamint jelentős kulturális és szakfolyóiratok, mint például az Új Forrás, a Fizikai Szemle vagy az Iskolakultúra. Ez az állomány 3-4000 részegységet jelent, azon belül körülbelül 60 000 cikket (melyből körülbelül 4000 analitikusan visszakereshető a MATARKA adatbázisában). Az EPA-archívum fő célja és vonzereje azonban az az infrastrukturális kiépítettség, mely által biztosítani tudjuk a kiadványok webes dimenziókban mindenképpen hosszú távú, biztos megőrzését és elérhetőségét. Nem egy olyan kiadványnak létezik EPA-változata, amely eredeti webhelyéről nyomtalanul eltűnt. A tartós hozzáférés az első lépés a tartalmi megbízhatósághoz. A következő kihívást a formátumok és szövegminőség sokfélesége jelenti. Ezt az EPA-archívum által felállított kritériumok igyekeznek leküzdeni. A nagy terjedelmű, biztos hozzáférésű tartalom alapozhat meg egy olyan szolgáltatást, amely bizonyos mennyiségi és megbízhatósági korlátok átlépésével hosszú távon a minőség felé fordíthatja figyelmét. Célunk, hogy az EPA-ba egyre jobb szöveg-, illetve képminőségben hozzáférhető forrásokat ágyazzunk. Ezt nem elsősorban szigorított szelekcióval akarjuk elérni, hanem a megfelelő elektronikus publikációs módszertan terjesztésével, elfogadható példák bemutatásával. Az EPA nem pusztán tartalomszolgáltatás, célja egyfajta műhellyé válni a digitális folyóiratok világában, és hozzájárulni az elektronikus folytatódó források fejlődéséhez, terjedéséhez, és főként presztízsük növeléséhez. Az EPA felületeHogyan fest a http://www.epa.hu weboldalra látogató felhasználó számára a szolgáltatás? A gyakorlott internethasználó számára elsősorban ismerősen, hiszen a webfelület kialakítása során az EPA szülő-gyűjteménye, a MEK megjelenési formáját örökölte. A gyűjteményt feltáró keresési és böngészési lehetőségek többsége pedig közvetlenül a nyitólapról elindítható. Beépített keresőpontok segítségével a gyűjtemény egy kattintásra lekérdezhető cím, EPA-ba kerülés dátuma, illetve sorrendje alapján; valamint ugyanígy rögtön elkülöníthetők az EPA-ban archivált kiadványok. Egy szinttel beljebb találhatjuk az összetett keresőfunkciókat, a szolgáltatásra vonatkozó információkat, és az online sajtóval kapcsolatos további hasznos források gyűjteményét. A kiadványok EPA-beli arculatát úgy alakítottuk ki, hogy a forrás megjelenése – sajátosságaitól függetlenül – egységes gyűjtemény benyomását keltse. Minden forrás azonos nyitóoldallal, úgynevezett „borítólappal” jelenik meg a felhasználó előtt, amelyen böngészéskor az összes alapvető információ azonos pontokon érhető el, függetlenül attól, hogy a feltárt forrás mely pontján találhatjuk meg őket (3. ábra). Ha létezik ilyen – mindig ugyanoda kattintva jeleníthető meg az impresszum, a folyóirat szöveges tartalmi ismertetője, az EPA által készített leírás katalóguscédulája (4. ábra), és az összes kiegészítő információ. Az EPA tehát azt a megoldást választotta, hogy a különböző keresési megoldások után a találati listákról nem rögtön a forrásra, hanem annak jellemzését és metainformációit tartalmazó előlapjára ugrik. Jogos a kérdés: miért kell a felhasználónak egy meglehetősen sok információt tartalmazó lap érintésével eljutnia a keresett kiadványhoz? Ennek indoka egyszerű: az EPA nemcsak interneten közvetlenül hozzáférhető kiadványokat ír le (gondoljunk csak az offline hozzáférésű, illetve megszűnt kiadványokra), de ezeket sem akarja kiszűrni az adatbázisban megtalálható források sorából. A metaadatok alapértelmezett megjelenési formája az ISBD-elvek által inspirált, az időszaki kiadványok és elektronikus dokumentumok bibliográfiai leírási szabványának ötvözésével16 kialakított „katalóguscédula”. Az összes adat megtekintésére a teljes („címkés”), illetve XML formátumú megjelenítéssel van lehetőség. Az archivált kiadványok nyilvántartását és szolgáltatását egy újabb adatbázis teszi lehetővé, ez az EPA állomány-nyilvántartása, melyet kardexnek is nevezünk, mivel ennek adminisztrációs felületén zajlik a számok érkeztetése, és az egyedi részegységek adatainak rögzítése. Az olvasó pedig a „kardex” felhasználói felületén navigálva keresheti ki az őt érdeklő folyóiratszámot (5. ábra). Az EPA kapcsolataiReményeink szerint az EPA önálló szolgáltatásként is mielőbb felzárkózik a Magyar Elektronikus Könyvtárhoz, mind látogatottság, mind referenciák tekintetében. Egy korszerű online gyűjtemény azonban ma már mit sem ér, ha nem tud sikeresen kommunikálni más elektronikus nyilvántartásokkal. Ezt a szempontot a fejlesztés kezdetétől fogva szem előtt tartottuk, és az adatbázis szerkezetének kialakításakor eleve számítottunk a többféle sémának megfelelő levetítések igényére. Az adatbázis tartalma már elérhető és lekérdezhető XML formátumban (Dublin Core-specifikáció), de előkészületben van a Nemzeti Digitális Adattár nyilvántartásával való kommunikáció kiépítése is. Továbbá bármikor lehetséges – ha igény mutatkozik rá – az adatok HUNMARC formátumban való kiadása is.17 Az EPA-ban őrzött tartalom másképp is dinamizálható, erre jó példa a MATARKA tartalomjegyzék-adatbázissal kialakított együttműködés. A két szolgáltatás összekötésével lehetővé vált, hogy az EPA (a MATARKA-n keresztül) cikkszinten lekérdezze azon archivált kiadványait, melyeket a tartalomjegyzék-adatbázis is feldolgoz. Ugyanígy a MATARKA és EPA-archívum metszetében lévő közlemények közvetlenül megtalálhatók a http://www.matarka.hu felől is. Az EPA kapcsolatai azonban nem merülhetnek ki a metaadatok és a lelőhelyek kommunikálásával. Az elektronikus folyóiratok sikeres promóciója és fejlődése a jelenlegi gazdagság megőrzésével csak úgy képzelhető el, ha az ilyen források megjelenését támogató vagy működtető tényezők egy ponton egymásra találhatnak. Az EPA-t üzemeltető Országos Széchényi Könyvtár és azon belül a MEK munkatársai a fejlesztés mellett dolgoznak azon is, hogy minél hatékonyabb kommunikáció induljon meg a tartalomszolgáltatók, közgyűjtemények és szerkesztőségek között, hogy lehetőleg minél jobban megismerjék egymást ennek a szakmai szférának a szereplői, és minél többet tudjanak egymásról. Az EPA a szakmai információ- és tapasztalatcsere katalizátora lehet, nem pusztán a szolgáltatás, hanem a köré kialakított virtuális és szerves közösség révén. Ezt hivatott elősegíteni például a Könyvtári Intézettel közösen indított, a közgyűjteményi periodikumdigitalizálási folyamatok feltérképezését célzó felmérés.18 Távolabbi cél olyan rendezvények, műhelykonfereciák szervezése, melyek keretében az elektronikus folyóiratok világát meghatározó összes szereplő részvételével kialakítható a speciálisan a mi kulturális régiónkhoz illeszkedő „best practice”, mind az elektronikus publikáció, mind a feltárás kérdéseiben. Beérkezett: 2005. I. 11-én. A szerző az Országos Széchényi Könyvtár Magyar Elektronikus Könyvtár
osztályán könyvtáros.
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 2.5 License. Jegyzetek
Irodalom
|