Зографската електронна научноизследователска библиотека. Интеграцията на електронните ресурси

Андрей Бояджиев

Увод

Електронното описание и издание на книжовните извори от Светата Зографска обител е процес, който обединява различни подходи и идеи1. От една страна, това е опит за интеграция на методите при описанието на различни книжовни документи – ръкописи, грамоти, архиви. От друга, екипът си дава сметка, че тези извори са писани на различни езици и при каталогизирането това налага съобразяваването с традициите на описание. От трета, описът и изданието е необходимо да се свържат със сведения за личните и местните имена, както и информация за събитията, срещани в изворите. Не на последно място е нужно да се изработят средства за извличане и търсене на данните от описанията и изданията.

Основа за развитие и сродни проекти

Електронната версия на Зографската научна библиотека разчита за описанието на изворите на опита, натрупан от проекта „Репертоар на старобългарската литература и книжнина“ (Repertorium). Двата проекта използват сроден начин за описание на изворите, разликите между тях произтичат от различните цели, които си поставят. Repertorium е проект, чиято основна насоченост е описание на съдържанието на славянските средновековни ръкописи. Описът на изворите от Зографския манастир обхваща както славянските ръкописи, така и всички останали ръкописи и архиви от Светата обител. От друга страна Repertorium няма за цел да опише само една сбирка, той е по-скоро електронен своден каталог. За разлика от него нашата дейност е съсредоточена върху описанието, изследването и изданието на книжовните извори от една-единствена колекция. При така поставена задача, електронната версия на каталога се предполага, че ще предостави връзки и информация за лица, места и събития, споменати в изворите. Това превръща изработката на сайта в особен вид енциклопедичен справочник, ориентиран към историята на едно книжовно средище и неговата история от появата на първите писмени сведения до наше време.

Подобен на Repertorium своден каталог, но със задача да опише ръкописното наследство само в една страна, Швеция, е проектът Manuscripta. За разлика от Repertorium той включва повече палеографски и кодикологически данни, както и дигитални копия от самите ръкописите.

В ранна фаза на развитие се намира един друг проект, този на колегите от Университета в Хамбург, посветен на дигитализацията на описанията на етиопските ръкописи заедно със снимки от самите извори (Beta Masaheft). По своите цели той много се приближава до проекта за електронно описание на Зографската Света обител, но има характер на своден каталог, посветен само на една езикова традиция – етиопската.

Нашите усилия се доближават и до тези на колегите, разработващи електронна среда за сирийската култура (Syriaca.org). При тях обаче, акцентът е върху информацията за местни и лични имена, а изворите са използвани само за данни, без да се представят техни детайлни описания.

В областта на електронното описание на ислямските ръкописи, нашата инициатива се приближава най-много до проекта за техния своден каталог във Великобритания (FIHRIST). Не ни е известен обаче проект, посветен на дигиталното описание на османските архиви, който да бъде достъпен в интернет пространството.

Дейността по атрибуция на текстовете е свързана с използване на различни енциклопедични справочници, които вече се откриват в изобилие и в електронна форма. За славянските ръкописни текстове от особен интерес е проектът Versiones Slavicae2, който представя сведения за заглавия и автори заедно с библиография на източниците и връзка към проекта Pinakes за гръцките текстове. Тази интеграция на данни е изключително важна, защото тя позволява да се посочват и обменят връзки между различните проекти, което в значителна степен улеснява работата по идентификация на източниците, съгласуване на формите и езиците при имената и заглавията. Всичко това допринася за унифицирането и стандартизирането на отделните форми. Подобна инициатива е въведена при проекта Repertorium, където научните заглавия на текстовете са дадени на три езика – български, руски и английски.

Една подобна инициатива, но в областта на проучването на хартията, е проектът Bernstein. Memory of Paper. Той позволява на изследователите да атрибуират и посочат точното дигитално копие на водния знак и да установят по този начин времето на появата на хартията. От друга страна, проектът изготвя речник и систематизация на термините в областта на хартията и водните знаци на няколко езика3.

Технологията

В съвременната хуманитаристика все повече се възприема схващането, че данните се обработват и подготвят за обнародване в електронен вид, а след това, техен вариант, ако е нужно, се представя на хартия. Този подход през последните години стана преобладаващ при описанието и каталогизацията на стари ръкописи и архиви. Това наложи създаването на електронни модели за описи, които да интегрират в себе си снимковите данни и да предоставят връзка с дигитални издания на текстове. Вече не се спори по въпроса възможен ли е единен модел за описания на ръкописи от различни езикови традиции – славянска, гръцка, османска или английска4. Технологиите вече позволяват това да става сравнително лесно. Различни погледи и подходи има по въпросите за съчетаването на описанията с изданията, с различни по тип данни и обвързването им в семантични мрежи (Semantic Web). В това отношение, мрежата се развива изключително бурно и е все по-лесно да се свърже даден локален проект с друга сходна инициатива в областта на дигиталната хуманитаристика.

Зографската електронна библиотека е основана на популярния стандарт за обмяна, архивиране и съхраняване на документи в електронен вид, известен като XML. Използваме модел за описание на ръкописи и архиви общ с проекта Repertorium (вариант на TEI), който се развива, променя и обогатява от 1995 г. до ден днешен5. Новото в Зографската библиотека се изразява не толкова в техническото съответствие между двата проекта, колкото в изискването технологията да позволи да се съчетаят различни типове описания на извори, отговарящи на различните езикови традиции. С други думи, въз основата на един компютърен модел е направен опит за интегриране на различен видове данни – описи, издания, терминологична информация, посочки и библиография. Така например, различието е във връзките към отпратки към интернет карти (GeoNames), към Versiones Slavicae, Pinakes и Repertorium за автори и научни наименования на текстове. В отделни случаи са дадени и отпратки към Виртуалния международен нормативен архив (VIAF).

Това позволи използването на голяма част от сродните на XML езика технологии в дигиталната хуманитаристика, като езици за трансформиране и публикуване на данните (XSLT, XSL-FO) и езици за търсене и заявки (XPath, XQuery). Самата информация бе поместена в базата данни eXist, а това ни позволи да съчетаем в едно извличането на данните и тяхното представяне във вид на HTML страници с помощта и на технологии, като CSS, JS, JQuery. Самите страници са оформени с помощта на Bootstrap, софтуерна библиотека, съчетаваща HTML със CSS и JS, a от Bootswatch е взет общия интерфейс и дизайн на страниците. По този начин цялостното електронно присъствие на Зографската библиотека е съчетание от технологии със свободен и отворен код.

Проектът използва идеята за връзките мжду описанията, изданията и т. нар авторитетни файлове6 от инициативата dsebaseapp.

Електронно описание и изследователски подходи

Тук ще се спрем само на няколко от важните подходи при съчетаването на данните от описанието от една страна с различни справочници, а от друга, с предишните каталожни номера и сигнатури.

Водните знаци

При наличието на свободно достъпни електронни бази от данни с водни знаци в интернет проектът предоставя възможност за връзка и сверка на извлечените от ръкописа сведения.

Пример 1:

            <watermark>
               <motif xmlns="http://www.ilit.bas.bg/repertorium/ns/3.0" 
               facs="http://www.ksbm.oeaw.ac.at/_scripts/php/loadRepWmark.php?rep=briquet&refnr=10731&lang=fr">
               Ръкавица със звезда отгоре</motif>
               <term type="watermarks">подобен</term>
               <rs type="work" ref="#Briquet1923">Briquet 1923</rs>
               <num>10731</num>
               <date>1509 г.</date>
            </watermark>
                
            

Връзката към външната база от данни се изразява с помощта на стойността на атрибута facs. В случая тя отвежда до електронния вариант на албума на Брике7. Характеристиката на водния знак е придружена от най-общите понятия при подобни посочки. В случая това е направено като част от елемента term (термин), който има съдържание подобен. Следва библиографска посочка rs (reference string, низ за посочка), номер в каталога (num) и дата (date). Където отсъства възможност за връзка и проверка в интернет се дава просто библиографска посочка.

Местните имена в изворите

В описанието местните имена се дават с отпратка към авторитетен файл със списък на съответните места. При описанието на славянските ръкописи са чести случаите, при които части от ръкописа в момента се съхраняват на други места по света.

Пример 2:

   
            <rs type="place" ref="#Sankt-Peterburg">Санкт Петербург</rs>
            

Тази посочка указва, че става въпрос за място (place) и отпраща към файла със списък от места (ref="#Sankt-Peterburg"). Съответното място с повече данни изглежда така в случая:

Пример 3:

               <place xml:id="Sankt-Peterburg">
                  <placeName type="pref" xml:lang="bul">Санкт Петербург</placeName>
                  <placeName type="alt" xml:lang="rus">Санкт-Петербург</placeName>
                  <location>
                     <geo decls="#LatLng">59.93863 30.31413</geo>
                  </location>
                  <idno>http://www.geonames.org/498817/</idno>
               </place>

Този код можем да разтълкуваме по следния начин. Всяка информация за място, независимо от типа на топонима, се обединява от елемента place със съответния идентификатор, стойността на атрибута xml:id. Името на мястото може да бъде на няколко езика (xml:lang) и формата на едно от имената може да бъде предпочетена (type="pref") пред другите (type="alt"). Следва информация за мястото с географските координати, които се въвеждат в елемента geo. Този елемент има постоянен атрибут decls (declarations, декларации) и стойност #LatLng (съкращение от географска ширина и дължина). Идентификаторът след това служи за отпратка към използвания в интернет ресурс (в случая към сайта geoNames). Идеята на съставянето на този файл е постепенното натрупване на географски данни, които могат да се използват при описанието на всички извори, както и при публикуване на електронните издания на текстове. Тези данни се придружават от карта с помощта на софтуерната библиотека Leaflet. Информацията в този файл би могла да се съчетае при търсене на други данни – отпратка към описанието, посочка към лични имена или термини.

Личните имена в изворите и описанието

За разлика от местните имена, които незавимо от типа, можем да придружим в повечето случаи с географски координати и да се ограничим с обща информация, при личните имена разнообразието е голямо. Една подробна класификация тук не е възможна, но най-малкото следните видове са важни при описанието и изданието на текстовете:

  • Име на книжовника (писача) на паметника;
  • Име на автора на текста;
  • Имена, споменати в бележки и приписки. От своя страна тези имена могат да бъдат на монаси, владетели от различен ранг, имена на светски личности.

Лесно можем да продължим тази класификация. Важното от гледната точка на електронното представяне е, че в някои случаи притежаваме допълнителна информация, а в други на този етап тя не е налична или не ни е известна.

Пример 4:

<person xml:id="Кирил_монах">
                      <persName xml:lang="bul">
                         <forename>Кирил </forename>
                      </persName>
                      <note>
                        ...
                         <p>монах</p>
                      </note>
                   </person>

В този случай единственият засега известен ни факт за Кирил е, че той е бил монах. При имената на авторите на текстове разполагаме със значително по-голяма информация, но вместо да се преписват и преработват данните от известни справочници, е по-добре да се даде отпратка към известни справочници и пособия. Сравнете, например, следния случай:

Пример 5:

                <person xml:id="Амфилохий_Иконийски">
                     <persName xml:lang="bul">
                        <addName>Иконийски</addName>
                        <forename>Амфилохий </forename>
                     </persName>
                      <note>
                         <p>Кесария Кападокийска ок. 330 – ок. 379 година Кесария Кападокийска</p>
                         <p>Автор</p>
                         <p>http://pinakes.irht.cnrs.fr/notices/auteur/152/</p>
                        ...
                      </note>
                  </person>

В този пример в първия абзац (p) се дава информация за времето когато е живял, във втория е поместена обща типология (Автор), а в третия е дадена връзка към проекта Pinakes за по-нататъшна информация за автора и неговите произведения.

Няма съмнение, че при натрупване на повече сведения за имената в Зографските книжовници информацията от първия тип постепенно ще придобие облика на данните от Пример 5.

История на изворите в колекцията

Историята на постъпването на изворите в дадена колекция и промяната на каталожните номера и сигнатура е една от най-трудните за проследяване при славянските ръкописи в Зографската света обител. Подобни данни принадлежат към малко изследваните части на сбирката. Една от целите при описанието е да се открои историята на съхраняването по пътя на проследяването на каталожните номера и сигнатурите от ръкописните каталози (съхранявани в библиотеката), печатните описания. Три са местата, от които можем да почерпим подобна информация:

  • Вече отпечатаните описи и каталози;
  • Ръкописните инвентарни описания, съхранявани в библиотеката на манастира;
  • Данните от подвързията, форзаците и самите страници на ръкописните книги.

Отначало се описва информацията за съвременното състояние на каталожния номер и сигнатурата:

Пример 6:

                     <idno type="shelfmark">Зогр. 2</idno>
                     <idno type="catalogue" n="2">2</idno>
                     <idno type="mss_cat" n="2">2</idno>
                     <note place="inline">
                        <locus>защитен лист</locus> с мастило. Под него написано 
                        <quote xml:lang="bul">Миней</quote>, зачертано и добавено <quote xml:lang="bul">Лѣствица в 1638</quote>.
                        <rs type="work" ref="#Райков1994">Райков и др. 1994: 29</rs>
                        <rs type="work" ref="#Стоилов1903">Стоилов 1903</rs>
                        <rs type="work" ref="#Каталог1">Каталог 1</rs>
                     </notes>

При съвременното описание на колекцията бе решено да се използват каталожните номера от последния каталог на славянските ръкописи, като те бъдат продължени с описанието на некаталогизираните досега ръкописи. В такъв случай каталожният номер се превръща и в сигнатура на ръкописа. В този пример сигнатурата е въведена с помощта на атрибута type и стойността му shelfmark. Когато има съвпадение елементът idno се повтаря с различни стойности на type. В случая type="catalogue" и type="mss_cat". Следват уточнени, поместени като бележка (note). Идеята на тази бележка е да даде допълнителни сведения, откъде е известна тази информация и да я придружи, по възможност, с библиографски посочки. Елементът locus посочва мястото в ръкописа, откъдето се вижда номерът, заедно с възможни бележки от библиотекарите или каталогизаторите. Оригиналният текст е поместен в елемента quote като се указва и на използвания език (xml:lang="bul"). Следват библиографски посочки, като се подреждат от най-новите публикации към най-старите. В случая тази информация е извлечена от печатен каталог8, от каталога на Антон Стоилов9 и от първия съхранен ръкописен каталог в самия манастир.

Следва информация за най-новия по време опис или каталог:

Пример 7:

  
                    </altIdentifier type="former">
                           </idno type="unioncatalogue">300<//idno>
                           <note>
                              <rs type="work" ref="#Турилов2016">Турилов, Мошкова 2016<//r>
                           <//note>
                    </altIdentifier>

Тези данни се поместват като част от елемента altIdentifier (alternative identifier, друг, алтернативен идентификатор), със съответните стойности на атрибута type ( в случая unioncatalogue, т.е. своден каталог) и се придружават с библиографска посочка10.

Следват данните от останалите каталози или номера на ръкописа, подредени от най-късните към по-ранните, последвани от регистрация на старите сигнатури, отново по същия ред.

Пример 8:

 
                           <altIdentifier type="former">
                               <idno type="catalogue">163 </idno>
                               <note>
                                  <locus>Преден защитен лист </locus> цифрата 2 зачертана с молив и написано със същия молив > Iljinskij!  
                                  <rs type="work" ref="#Каталог1937">Каталог 1937 </rs> 
                                  – допълнено по-късно с индекс а, т.е. 163а  <rs type="work" ref="#Ильинский1908">Ильинский 190811 </rs>
                               </note>
                            </altIdentifier>
                           
                            <altIdentifier type="former">
                               <idno type="mss_cat">45 </idno>
                               <note>
                                  <locus>1r </locus>номерът  <quote xml:lang="bul">148 </quote> 
                                  е зачертан с молив и написано отстрани  <quote xml:lang="bul">45 </quote>.
                               </note>
                            </altIdentifier>
                           
                            <altIdentifier type="former">
                               <idno type="mss_cat">148 </idno>
                               <note>
                                  <locus>1r </locus> с мастило:  <quote xml:lang="bul">З.Б. № 148 </quote>
                                  <rs type="work" ref="#Каталог2">Каталог 2 </rs>
                               </note>
                            </altIdentifier>

Идеята на този подход е постепенно да се съберат сведения за различните описания и движението на ръкописите в самата библиотека, като ги свърже заедно в единна информационна верига. По този начин историята на ръкописната сбирка ще бъде допълнено и ще стане възможно да се открие по-пълно нейната история.

Заключение

Няма съмнение, че с развитието на проекта някои решения и интеграции между отделните части на софтуера, както и връзки със сродни проекти, ще се променят. Важното е в случая, че заложените връзки между отделните структурни единици вече позволяват специализирани търсения, екстракция на данни и типология. Развитието им ще се определя занапред от необходимостта от извършване на специализирани анализи от типа на съчетаване и представяне в графичен вид на датите на изворите или на зависимостите между имената на лицата, местата, където се срещат и документите. В нашия случай описанието на изворите върви заедно с оформянето на авторитетните файлове и библиография, необходимост, която е продиктувана и от развитието на съвременните технологии.

Цитирана литература

Ильинский, Григорий А. 1908. Рукописи Зографского монастыря на Афоне. Известия Русского археологического института в Константинополе 13. 253–276.

Райков, Божидар, С. Кожухаров, Х. Миклас, Хр. Кодов. 1994. Каталог на славянските ръкописи в библиотеката на Зографския манастир в Света гора. София: CIBAL.

Стоилов, Антон. 1903: Преглед на славянските ръкописи в Зографския манастир. Библиотека (Приложение на „Църковен вестник“) 3 (7–9). 117–160.

Турилов, Анатолий, Л. Мошкова. 2016. Славянские рукописи Афонских обителей. 2. изд. Београд – Москва: Алетеа.

Bojadžiev, Andrej, A. Miltenova, D. Radoslavova 2003. A Unified Model for the Description of Medieval Manuscripts? In: A. Miltenova, D. Birnbaum, S. Slevinski (eds.), Computational Approaches to the Study of Early and Modern Slavic Languages and Texts. Proceedings of the “Electronic Description and Edition of Slavic Sources conference”, 24–26 September 2002, Pomorie, Bulgaria, 113–136. Sofia: Boyan Penev Publishing Center.

Bojadžiev, Andrej. 2009. Constructing Repertorium 3.0. Another View of the TEI P5 Model for Medieval Manuscript Descriptions. Scripta & e-Scripta 7. 13–48.

Bojadžiev, Andrej. 2012. Guidelines to Repertorium Initiative Model for Manuscript Descriptions. Scripta & e-Scripta 10–11, 9–103. http://repertorium.obdurodon.org/Bojadziev_Scripta_ 11.pdf

Briquet, C. M. 1923. Les Filigranes. Dictionnaire historique des marques du papier dés leurs apparition vers jusqu'en 1600. 4 Vol. 2ème édition. Leipzig: Hiersemann.

Frauenknecht, E., C. Kämmerer, P. Rückert, M. Stieglecker. 2018: Watermark-Terms. Vocabulary for Watermark Description. http://www.memoryofpaper.eu/products/watermark_ terms_v11.1_en.pdf

Hillman, D. I., R. Guenther, A. Hayes. 2008. Metadata Standards and Applications. Trainee Manual. Washington: Library of Congress. https://www.loc.gov/ catworkshop/courses/metadata standards/pdf/MSTraineeManual.pdf

Miltenov, Yavor and Aneta Dimitrova. 2018. The “Versiones Slavicae”. Database and the Old Church Slavonic Translations of John Chrysostom's Homilies. In: L. Sels, J. Fuchsbauer, V. Tomelleri & I. De Vos (eds.), Editing Medieval Texts from a Different Angle: Slavonic and Multilingual Traditions (Orientalia Lovanensia Analecta, 276). 213–224. Leuven–Paris–Bristol: CT.

Проекти

Bernstein: Bernstein. Memory of Paper.

Beta Masaheft: Beta maṣāḥǝft: Manuscripts of Ethiopia and Eritrea. (Schriftkultur des christlichen Äthiopiens: eine multimediale Forschungsumgebung).

dsebaseapp: Digital (scholarly) Editions Base Application.

FIHRIST: FIHRIST. Union catalogue of manuscripts from Islamicate world.

GeoNames: Geographical Database.

Manuscripta: Manuscripta. A digital catalogue of medieval and early modern manuscripts kept in Swedish libraries.

Pinakes: Pinakes | Πίνακες. Textes et manuscrits grecs.

Repertorium: „Репертоар на старобългарската литература и книжнина“ (Repertorium of Old Bulgarian Litterature and Letters).

Syriaca.org: Syriaca.org: The Syriac Reference Portal.

Versiones Slavicae: Versiones Slavicae. Catalogue of medieval Slavonic translations and their Greek sources.

VIAF: The Virtual International Authority File.

Стандарти, технологии, софтуер

Bootstrap: An opensource toolkit for developing with HTML, CSS, and JS.

Bootswatch: Free themes for Bootstrap.

CSS: Casscading Stylesheet Language.

eXist: A NoSQL document database and application platform.

HTML: HyperText Markup Language.

JQuery: JavaScript library.

JS: JavaScript / ECMAScript.

Leaflet: An open-source JavaScript library for mobile-friendly interactive maps.

Semantic Web: Web of Data.

TEI: Text Encoding Initiative.

XML: Extensible Markup Language (XML).

XPath: A language for addressing parts of an XML document. XQuery current status.

XQuery: An XML Query Language. XQuery current status.

XSL-FO: XSL Formating Objects.

XSLT: The Exstensible Stylesheet Language Family. Cover page.