Перспективы развития
Национальной Службы поддержки форматов RUSMARC.
В. Скворцов,
руководитель Национальной Службы развития системы форматов RUSMARC.
В этом году Национальной Службе
развития системы форматов RUSMARC, также как и центру ЛИБНЕТ, исполнилось 10 лет.
Соответствующий документ был подписан Министерством культуры 20 ноября 2001
года. Но в силу острого дефицита времени, я вынужден отойти от традиционной
схемы юбилейного доклада и не стану рассказывать о наших достижениях за
прошедший срок. С ними вы можете познакомиться на сайте Национальной Службы по
адресу: www.rusmarc.ru. Посещаемость сайта растёт из года в
год, причём растёт не только посещаемость, но
и скорость прироста посещений сайта из года в год возрастает. И это на
наш взгляд убедительней всего говорит о востребованности нашей деятельности.
Я попытаюсь оценить перспективы
развития Национальной Службы в ближайшем будущем. Давайте, прежде всего,
посмотрим на каком фоне предполагается осуществлять это развитие.
1.
Международный опыт.
Современные глобальные
технологические и концептуальные изменения, в первую очередь развитие INTERNET, в особенности web-технологий, заставляют библиотечное
сообщество пересмотреть будущее библиографического контроля, включая будущее
коммуникативных форматов MARC.
В частности, специальная рабочая
группа, созданная по инициативе Библиотеки Конгресса, цель работы которой
обозначена в её названии: Будущее библиографического контроля, сделала заключение
о том, что форматы MARC21 – а значит и все форматы семейства MARC - больше не соответствуют тем
задачам, которые призваны были решать, а именно: служить носителями
библиографической информации, способными вмещать полную область данных, представляющих интерес
для библиотек, и способствовать обмену такими данными, как внутри библиотечного
сообщества, так и со взаимосвязанными сообществами.
Ещё один важнейший побудительный
мотив для пересмотра существующего библиографического окружения - это серьёзные
бюджетные ограничения, которые испытывают библиотеки и информационные центры
всего мира. В этих условиях многие организации вынуждены упрощать стандарты
качества библиографических данных, поскольку от них требуют расширения
сервисов, особенно в отношении цифровых данных. Эффективность в создании и
разделении ресурсов становится, следовательно, обязательной: производители
информации должны пересмотреть то, как они используют свои небогатые финансовые
ресурсы, и это касается как отдельных организаций, так и всего библиотечного
сообщества в целом.
В самом общем плане можно выделить
три основные тенденции пересмотра библиографического концептуального окружения:
первая – это
разработка новых моделей организации данных, призванных обеспечить
пользователям навигацию по взаимосвязям между сущностями, такими как
персоналии, географические объекты, организации и понятия, - для осуществления
более точного поиска в библиотечных каталогах и во внешнем Интернете.
Вторая – это
разработка специальных средств интеграции библиотечных ресурсов в web-пространство.
И третья тенденция - это развитие средств семантического Webа,
с целью обеспечить максимальное использование существующих метаданных в
расширенном Web-овском поисковом окружении так, чтобы конечные пользователи могли
обращаться к более качественным метаданным и/или использовать их по-новому.
Кажется, что по существу третья
тенденция не сильно отличается от второй, однако мы нашли нужным выделить её,
поскольку она выражает совершенно новый уровень кооперации, когда библиотечные
сотрудники работают совместно с IT-специалистами на высшем уровне современных информационных
технологий. В данном случае речь идёт о работе совместно с консорциумом World Wide Web.
Первой тенденции
обязаны своим рождением Функциональные требования к библиографическим записям (Functional Requirements for Bibliographic
Records или FRBR) – модель
иерархической взаимосвязи сущностей, продвигаемая IFLA.
В 2010 году три
национальные библиотеки Соединённых Штатов (Библиотека Конгресса, Национальная Медицинская
библиотека и Национальная Сельскохозяйственная библиотека) организовали
проведение на национальном уровне тестирования RDA (Resource Description and Access) – набора инструкций по реализации FRBR, призванного заменить действующие ныне
Англо-Американские правила каталогизации (AACR2). По результатам тестирования, опубликованным 13 июня 2011 года,
рекомендовано начать пробное внедрение RDA в этих трёх национальных библиотеках с января 2013 года, проведя
необходимую подготовительную работу.
Что касается второй тенденции, т.е. развития XML форматов для библиографических и связанных с ними
данных, то более новые [по сравнению с MARCформатом] структуры, такие как
активно внедряемый XML (eXtensible Markup Language), имеют почти безграничные
возможности в части определения тегов полей и делают, например, возможным
создание вполне, или интуитивно, понятных тегов. К тому же XML инструменты не только хорошо
продуманы, но и продолжают развиваться быстрыми темпами, в частности,
вспомогательные XML стандарты, поддерживающие XML окружение, такие как XSLT (eXtensible Styleshit Language Transformation), обеспечивающий возможность
конверсии между различными XML схемами данных и XML Query (XQuery), дающий действенный метод поиска
информации в XML данных.
Также в последние годы была разработана альтернативная форматная структура MARCXML – и её развитие MarcXchange и ISO 25 577 – являющиеся простой
трансформацией стандарта ISO 2709 в XML структуру, но сохраняющие в неприкосновенности MARC- овские теги.
Нельзя не упомянуть также известный
уже довольно давно и широко используемый XML-формат представления и передачи
данных Dublin Core.
Ещё одно направление внедрения XML в деятельность библиотек - это
развитие MODS (Metadata Object Description Schema) и MADS (Metadata Authority Description Schema) – XML схемы, абсолютно совместимые с MARC-овскими библиографическими и
авторитетными данными, но имеющие более простые с точки зрения восприятия
словесно-ориентированные теги. Развитие этих схем вызвано также некоторыми
организационными нуждами, направленными на расширение области применения и
связей библиографических данных сегодня. Это попытка преодолеть ограничения в
определении MARC-овских тегов и организации данных в MARC-записи, при сохранении возможности
работы с насыщенными библиографическими данными, которые к тому же существуют в
современном техническом окружении. Отчасти в ответ на давление библиотечных
администраций в последнее десятилетие (финансовые ограничения и оперативность) MODS намеренно избегает подробной
простановки тегов и некоторой чрезмерности MARC-овских записей.
Как MARCXML, так и MODS развивались отчасти для того, чтобы
синхронизировать MARC-овские записи с такими коммуникационными протоколами, как SRU (Search and Retrive via URL) и OAI, и такими форматами, как METS (Metadata Encoding and Transfer Standard), для которых данные в XML являются либо предпочтительными,
либо вовсе необходимыми.
Необходимо обратить внимание на развитие сравнительно нового протокола OAI, как в версии OAI-PMH (протокол
сбора метаданных), так и в версии OAI-ORE (находящийся в стадии разработки протокол
сбора данных о Web-ресурсах).
Протокол OAI продвигается специально созданным OAI Technical Committee, в состав которого входят в
частности представители Библиотеки Конгресса, Британской библиотеки, CERN, OCLC, различных
университетов Соединённых Штатов Америки, а также ряд европейских
представителей.
Наиболее значительным примером
внедрения OAI-PMH в Европе является Европейская электронная библиотека
(TEL).
Третья тенденция – развитие
семантического Webа, т.е.
предоставление через Интернет специальным образом отформатированных смысловых
данных, так, что они становятся пригодными для компьютерной обработки.
В более узком смысле – это проект консорциума W3С, цель которого определить
стандартные пути выражения взаимосвязи между Web-страницами, так чтобы позволить
машинам понимать значение взаимосвязанной информации.
Библиотека Конгресса
объявила о начале экспериментов с семантическим Webом в рамках инициативы по пересмотру
библиографического концептуального окружения, о чём сделано соответствующее
заявление в мае этого года. В частности ведутся работы по внедрению словарей
Библиотеки Конгресса в качестве stable and trust словарей семантического webа.
2. Отражение рассматриваемых тенденций в России.
Первая тенденция: принципы FRBR нашли своё отражение в новых Российских Правилах
каталогизации главным образом в части терминологии и анализа структур
библиографических записей. Что касается RDA, библиотечное сообщество находится в
ожидании результатов экспериментов трёх американских национальных библиотек.
Однако наличие
инструментов, способных перевести решение проблемы из области теоретических
рассуждений в предметное исследование, позволило бы российским библиотекарям
сформировать свою точку зрения на пути и способы внедрения принципов FRBR в практику каталогизации.
Достаточно остро стоит
задача оптимальной организации больших многосвязных массивов данных, таких, как
СКБР, и в этой связи одной из первоочередных мер представляется построение или
обоснованный выбор моделей внедрения принципов FRBR (таких, например, как RDA), разработка инструментария их
реализации, анализ работоспособности и предложение готовых решений для
внедрения в стране.
Вторая тенденция:
В мае 2010 года на
конференции РБА Национальная Служба развития системы форматов RUSMARC озвучила своё предложение по
организации новой технологии работы с нормативной документацией, когда
требуемые стандартные параметры загружаются
в автоматизированные системы прямо из нормативного документа,
размещённого на сайте той организации, которая данный документ разработала. Мы
предлагали и предлагаем осуществить схему такого взаимодействия на примере RUSMARC/XML. При этом может быть разработан и стандартный
инструментарий для обработки записей в формате RUSMARC
и представления текста формата в различных средах.
Гораздо скромнее
подвижки по внедрению в стране протокола OAI. На базе протокола OAI-PMH реализовано и проходит апробацию
взаимодействие между Российской национальной библиотекой и Центром ЛИБНЕТ.
Национальной Службой развития системы форматов RUSMARC подготовлено техническое задание для
объединения распределённых полнотекстовых ресурсов в рамках НЭБ.
Третья тенденция: работы консорциума W3C по созданию семантического Webа и нового, следовательно, внедрения
библиографической информации непосредственно в web-пространство, пока лежат вообще вне
поля зрения российских библиотекарей, в отличие от наших коллег из
Библиотеки Конгресса.
Важнейший вопрос, связанный с
развитием структур Linking Data и семантического webа – как перевести огромные массивы
данных, существующие ныне в MARC-форматах в элементы семантического webа.
Вообще, возникновение различных схем
представления данных безусловно диктует необходимость указания правил переноса
данных из одной структуры в другую.
В своём докладе я постарался отразить
мощнейший пласт актуальных задач, ныне активно разрабатываемый за рубежом и
почти нетронутый в России.
Достаточно очевидно, что
библиографическое сообщество с достаточно высокой частотой генерирует
качественно новые стандарты, целый пласт таких стандартов, которые с одной
стороны являются IT-стандартами, с другой они – чисто библиографические.
И здесь огромное поле для
деятельности Национальной Службы развития системы форматов RUSMARC. У нас есть уже определённый опыт
работы в означенной сфере, у нас есть, или мы знаем, где найти специалистов в
выделенной тематике, и при определённой поддержке, в сотрудничестве и
координации с другими организациями, имеющими схожий опыт, работа Национальный
Службы может быть переведена на качественно новый уровень, соответствующий
требованиям сегодняшнего – да и завтрашнего – дня.
С другой стороны, нужно понимать, что
и MARC-форматы не
умрут немедленно и одномоментно. Колоссальная информация, накопленная в этих
форматах будет существовать и накапливаться ещё долгое время параллельно с
более новыми структурами. А значит и развиваться они должны в необходимой части
параллельно с этими структурами.
Результатом работы Службы может
являться, как и прежде, нормативная документация, в части форматов RUSMARC, а также, методические рекомендации
и, в необходимых случаях, логические схемы, функциональные требования,
технические задания и даже готовые программные решения, направленные на
адаптацию библиотечных процессов в
современной информационной среде и развитию необходимых сервисов.
В заключение я хотел бы вернуться к
юбилейной части своего доклада и выразить признательность Министерству культуры
Российской Федерации и центру ЛИБНЕТ за многолетнюю и постоянную поддержку
деятельности Службы. Эта поддержка всегда была очень значимой для нас, а в
нынешних условиях она приобрела буквально решающее значение.