Публикации
Форматы MARC21, UNIMARC, RUSMARC, их настоящее и будущее.
В. Скворцов
Действительный
член постоянного Комитета IFLA по формату UNIMARC,
Российская
национальная библиотека,
(Санкт-Петербург)
Определив в заглавии статьи тему разговора:
настоящее и будущее, поговорим о прошлом.
Ибо, если известно, что история никого и ничему не учит, то столь же известно,
что без знания прошлого нельзя понять настоящее.
Немного
истории.
Прежде всего, чью, собственно, историю мы собираемся
рассматривать.
Формат, по определению, это совокупность элементов
данных, их связей и правил их заполнения.
Библиографический
формат – это такая совокупность взаимосвязанных элементов данных, которая
служит для создания и обмена библиографическими записями в машиночитаемой
форме.
Принято считать, что правила заполнения элементов данных и определение
необходимых связей – это правила составления библиографического описания,
международные или национальные, в зависимости от назначения формата.
Это так и не совсем так. Все известные существующие
форматы действительно опираются на соответствующие правила описания: MARC21 –
AACR2, UNIMARC – ISBD, RUSMARC – ISBD и ГОСТ 7.1-84. Однако
- и это для подавляющего большинства
заинтересованных лиц очевидно, но почему-то мало отражается в практической деятельности
– нельзя ставить знак равенства между библиографической карточкой и
машиночитаемой библиографической записью, между карточным и электронным
каталогом. Все рассматриваемые форматы учитывают это положение, в большей или
меньшей степени, и, как результат, содержат ряд элементов, правил, а иногда и
связей, не предусмотренных стандартами и правилами составления
библиографических описаний.
Теперь непосредственно об истории.
Идея создания библиографического формата родилась,
по-видимому, уже тогда, когда уровень развития вычислительной техники позволил
создавать простейшие электронные каталоги.
Формат MARC (Machine-readable cataloguing)
появляется в начале 60-х годов в Соединенных Штатах. Главным его создателем и
двигателем являлась и является ныне Библиотека Конгресса Соединенных Штатов
Америки. С тех пор и по настоящее время библиографические записи в Соединенных
Штатах создаются и накапливаются в этом формате, причем сам формат непрерывно
развивается. Поскольку Библиотека Конгресса является фактически (хотя формально
это и не совсем так) монопольным законодателем в этой области в стране, то у
американцев нет тех проблем с созданием, с корпоративной каталогизацией, с
обменом библиографическими записями внутри страны, какие могли бы возникнуть,
если бы каталогизация проводилась в различных форматах.
Но “беда” в том, что другие страны, вслед за
Соединенными Штатами создают свои форматы.
Даже те, кто работает по тем же, Англо-Американским, правилам каталогизации.
Великобритания - UKMARC, Канада – CANMARC,
Австралия – AUSMARC.
Соответственно, MARC превращается в USMARC.
Все эти форматы имеют много общего, поскольку
строятся на единой, MARCовской основе, но и разнятся между собой, поскольку,
как выясняется, имеют значение не только правила, но и традиции каталогизации,
а также различие во взглядах на возможности и требования к электронному каталогу. Мы уже упоминали о том, что в этой-то части
творчество создателей форматов, фактически ничем не регламентировалось.
Например, Германия шла своим путем и создала формат MAB, не
похожий на все другие.
Трудности возникли тогда, когда дело дошло до
международного обмена.
Уже в 70-х годах появляются такие форматы,
предназначенные для международного обмена, как UNIMARC (Библиотека Конгресса),
UNISIST Reference Manual (UNESCO), МЕКОФ-2 (СЭВ), USSR-US Common Communication Format
(Совет Министров СССР, Государственный комитет по Науке и Технике, ГПНТБ СССР).
В апреле 1978 года представительный форум в
Таормине (Сицилия), с участием UNESCO, IFLA, ISO, принимает решение о необходисости
создания общего коммуникативного
формата (CCF) на базе всех перечисленных выше форматов. Первое
руководство по CCF появляется в 1984 году. Но уже в 1987 году под
эгидой IFLA выходит руководство по формату UNIMARC.
UNIMARC становится официальным
форматом, поддерживаемым IFLA.
С 1991 года формат CCF практически не развивается.
Здесь важно понимать, что же явилось причиной
увядания формата, который имел столь влиятельных родителей. По мнению Алана
Хопкинсона, эксперта по форматам из библиотеки Мидлсекского университета
(Великобритания) (http://www.acctbief.org/avenir/ccf.htm#ref4),
причина заключается в конфликте между простотой формата, что было одним из
ключевых решений при его создании, и требованиями национальных библиотек,
продолжавших развитие MARC-форматов в соответствии с
появлением новых видов документов, которые они описывали.
Отдельная тема – формат МЕКОФ. Мало того, что,
сохраняя нашу терминологию, он остался без родителей, но и, возобладавшие в
России, стремления внедриться в мировую информационную инфрастуктуру привели к
необходимости признания международного обменного формата в качестве обменного
формата страны. В связи с этим в октябре 1995 года в рамках программы ЛИБНЕТ Министерства
культуры Российской Федерации, под эгидой Российской Библиотечной ассоциации и
при поддержке Института «Открытое общество», начаты работы по адаптации формата
UNIMARC в качестве российского обменного формата.
В результате разработки появился Российский
коммуникативный формат (российская версия UNIMARC), которому Постоянным
Комитетом IFLA по формату UNIMARC присвоен международный код RUSMARC
как национальной адаптации этого формата.
В 90-х годах Европейский Союз признает формат UNIMARC
в качестве официального обменного формата стран, членов ЕС.
Итак, UNIMARC становится фактически
единственным международно-признанным коммуникативным форматом.
Казалось бы, горизонт прояснился. Существуют
национальные форматы, в которых создаются библиографические данные и
единственный формат-посредник, позволяющий производить обмен такими данными.
Однако, вдруг обнаруживаются две противоположные
тенденции во внедрении форматов в мировую практику. Причем обе исходят из одной
и той же рациональной посылки: зачем создавать данные в одном формате, а
обмениваться – в другом?
Первый вывод: раз UNIMARC
позволяет не только обмениваться данными, но и создавать их, то рациональнее
именно так и поступать. Но это требует принципиально иного отношения к
программному обеспечению. Если ранее речь шла лишь о конверторах, то теперь от
автоматизированных систем требуется полноценная поддержка формата. Это
серьезный камень преткновения. По многим причинам.
Противоположный
вывод: раз USMARC
позволяет не только создавать, но и обмениваться данными в рамках одной страны,
то можно согласовать правила и форматы между странами и в будущем отказаться от
отдельного обменного формата вообще.
Первый и естественный шаг в этом направлении –
согласовать форматы для стран, работающих по одним и тем же правилам
каталогизации. Планируются следующие
участники: США, Великобритания, Канада, Австралия и Новая Зеландия, но реальная
работа поначалу проводится только с участием США и Канады.
В это время мелькает название IMARC.
Этот формат в свое время пропагандировался у нас в стране и поэтому нелишне
было бы узнать, куда же он пропал?
Дело в том, что, строго говоря, IMARC никогда не существовал.
Необходимо было как-то обозначить то, что должно родиться в результате
согласования форматов USMARC и CANMARC, и в презентациях Салли
МакКалум появляется имя IMARC (International MARC).
В настоящее время этот формат получил название MARC21 с
очевидной претензией на 21 век.
О том, насколько он отличается от прототипа (USMARC)
мы поговорим чуть ниже.
Выбор для
России.
Чем
привлекателен UNIMARC?
Прежде всего тем, что UNIMARC создавался на основе ISBD,
так же как и наши Правила.
Он менее ориентирован на карточный каталог, и
определения Main Entry и Added Entry,
формально приписываемые полям, и ненужные в электронном каталоге, не играют
столь существенной роли в нем, как в
формате MARC21.
Он более алгоритмичен – т. е. при меньших объемах,
сохраняет те же возможности, что и MARC21, а в описании структур –
далеко его превосходит.
Механизм встроенных полей дает возможность более
гибкой организации связей между записями, чем это позволяет делать MARC21.
Чем
привлекателен MARC21?
Здесь есть три весьма существенных мотива. Следует
отметить, что все они – внешние по отношению к формату (т. е. не зависят от
того, насколько сам формат хорош или плох), но в силу особой значимости их
невозможно игнорировать.
Первое – формат MARC21 имеет более существенную
финансовую поддержку, чем UNIMARC.
Как результат: структура, ответственная за развитие
и внедрение формата MARC21 - Machine-Readable Bibliographic Information
Committee (MARBI), включающая в себя MARC Advisory Committee, выглядит достаточной мощной и
перспективной.
Второе – подавляющее большинство машиночитаемых
описаний в мире существуют в формате USMARC и есть понятный соблазн
работать в том же формате, чтобы без труда обмениваться библиографической
информацией.
Третье – подавляющее большинство фирм, производящих автоматизированные
библиотечные системы, ориентированы на MARC21.
Из всех перечисленных причин, на самом деле, для нас
существенную роль играет только первая.
Руководство IFLA предпринимает определенные
шаги с тем, чтобы изменить ситуацию.
В частности, в 2002 году, в Бостоне на Ежегодной
Генеральной Ассамблее IFLA принято решение об
организации консорциума пользователей формата UNIMARC, с тем, чтобы помочь
дальнейшему развитию формата.
Вторая причина, как это не покажется странным – не
столь существенна, хотя именно она часто приводится в качестве основной. Дело в
том, что куда более важную роль играют различия в правилах, чем различия в
форматах.
Например, при описании нормативно-технических и
технических документов наши Правила составления библиографического описания
выделяют область специфических сведений, которые по определению должны идти во
второй блок полей как в формате UNIMARC, так и формате MARC21.
Между тем AACR2 относит такие сведения в область примечаний (т.е.
3-ий блок формата UNIMARC или 5-ый блок формата MARC21). Следовательно, при
обмене записями необходимо перенести данные из одного блока в другой, т. е.
конвертировать запись, независимо от того, в каком формате мы работаем. Ну и
перевести примечания и данные из области физических характеристик на английский
язык.
Таким образом, работа в одном и том же формате, но
по разным правилам, не избавляет от головной боли при обмене записями.
Что касается третьего аргумента, то, видимо, он тоже
не столь неотразим, поскольку российским системам нового поколения только
предстояло (или предстоит) появиться, и, с этой точки зрения, ничто не мешало
свободному выбору формата.
Напомним, что UNIMARC по-прежнему является
официальным обменным форматом IFLA и ЕС.
Постоянный Комитет по формату UNIMARC
(PUC), ответственный за развитие формата, - поистине международный комитет
(в отличие от MARBI, где работают только представители США и Канады). В
настоящий момент туда входят представители Великобритании, Греции, Италии,
Литвы, Португалии, России, Соединенных Штатов, Франции и Хорватии.
Чрезвычайно важный аргумент в пользу выбора формата
UNIMARC – это равноправие пользователей в смысле развития формата., тогда как в
развитии формата MARC21, безусловно, ведущая роль принадлежит Соединенным
Штатам.
О настоящем.
Частично мы уже затронули настоящее, говоря об
истории и выборе формата.
Осталось добавить не так много.
MARC21.
В настоящий момент Великобритания реально
подключилась к процессу согласования форматов и в 2003 году объявлено о
переходе на MARC21. Но в течение последующих пяти лет Британская
библиотека поддерживает отечественных производителей программного обеспечения (UKMARC).
Что это в действительности означает – покажет время.
Одна из основных сложностей в согласовании форматов,
по словам Джона Байрама, возглавляющего работу как по пересмотру ISBD,
так и по согласованию форматов между США, Канадой и Великобританией в рамках MARC21 –
разный подход к описанию многотомников. Это важно учесть, поскольку, если
англичан не устраивает то, как описываются многотомники в MARC21,
то как это устроит нас даже при
пересмотре наших правил каталогизации?
Мы попытались проанализировать изменения в формате MARC21
за последние 4 года. Их немного.
На наш взгляд основное расширение области применения
формата достигается за счет использования подполя $2 в ряде полей. Т. е. поля,
ранее жестко связанные с конкретной библиотекой или классификационной схемой,
становятся более гибкими за счет возможности указания кода организации или
классификационной схемы в подполе $2.
Одно из изменений приближает формат MARC21 к
формату UNIMARC – коды языков, вносившиеся ранее подряд в одно
подполе, теперь вносятся в отдельные подполя, подобно тому, как это с самого
начала делается в поле 101 формата UNIMARC.
Кроме того, удален ряд полей, не использовавшихся в
течение ряда лет. Среди них поля 410 и 411 – аналоги соответствующих полей в
формате UNIMARC. Следует отметить, что эти поля не входят в формат RUSMARC
с самого момента его появления.
Вывод, который можно сделать: изменение названия формата с USMARC на MARC21 вызвано не качественным изменением самого формата, а лишь изменением
сферы его распространения.
UNIMARC
Как мы упоминали выше, говоря о применении
формата, следует иметь в виду два
аспекта: это его использование в качестве обменного формата и в качестве
формата для создания записей, т. е. формата каталогизации. Подавляющее
большинство современных автоматизированных систем имеют возможность загружать и
выгружать записи в формате UNIMARC.
Автоматизированные системы, способные создавать
записи в формате UNIMARC, распространены, хотя и не так широко, как те, что
работают с MARC21, но имеются практически во всех европейских
странах. В том числе и в пользующей свой собственный формат Германии
(библиотека Университета в Гейдельберге).
Ряд европейских стран, такие как Греция, Италия,
Литва, Португалия, Россия, Франция, Хорватия, Чехия внедряют этот формат на
национальном уровне. В 2001 году во Франции создан Национальный комитет по
формату UNIMARC.
Формат распространен также в Азии и Латинской
Америке. В этой связи необходимо упомянуть так называемую инициативу CJK – China, Japan, Korea,
ставящую своей целью внедрение формата UNIMARC в этих странах.
На постсоветском пространстве, если и можно говорить
с какой-то степенью определенности, дело обстоит следующим образом. Мы уже
упоминали Россию и Литву в смысле выбора формата UNIMARC. Нужно упомянуть еще и
Беларусь, где формат UNIMARC последовательно внедряется
уже в течение нескольких лет.
В Азербайджане создан Комитет по формату AZMARC,
который ставит своей целью внедрение формата UNIMARC в качестве национального
формата как обменного, так и формата каталогизации. Грузия и Армения, кажется, также остановили свой выбор на формате
UNIMARC, однако первая приобретает систему Aleph,
которая, как известно, работает с MARC21, и что произойдет в
результате – покажет время. Нам со своей стороны кажется, что само по себе
приобретение системы Aleph – еще недостаточный
аргумент в пользу формата MARC21.
Украина опубликовала свою версию формата UNIMARC,
но по разноречивым сведениям, доходящим оттуда, этот выбор вряд ли можно
считать окончательным. Впрочем, возможно, тут мы ошибаемся.
Нет никаких сведений о Молдове, очень мало о Средней
Азии.
Латвия остановила свой выбор на формате MARC21,
Эстония – FINMARC.
RUSMARC
Что же такое RUSMARC?
Так же как MARC21 и UNIMARC,
RUSMARС – это система взаимосвязанных форматов.
В настоящее время в нее входят: Российский
коммуникативный формат представления библиографических записей - RUSMARC/B – в
принятых международных обозначениях и Российский коммуникативный формат
представления авторитетных/нормативных записей (RUSMARC/A).
Формат RUSMARC, как уже упоминалось,
официально признан Постоянным Комитетом IFLA по формату UNIMARC
в качестве национальной адаптации последнего.
Формат RUSMARC зарегистрирован Комитетом
по Z39.50 как формат, совместимый с этим протоколом.
Приказом Министра культуры Российской Федерации № 45 от 27.01.1998 года формат RUSMARC
признан обязательным при организации обмена данными для подведомственных
библиотек.
Другой Приказ № 139 от 29.02.2000 года предписывает считать формат RUSMARC
”обязательным при разработке и внедрении автоматизированных
библиотечно-информационных систем для библиотек системы Министерства культуры
Российской Федерации”.
О внедрении формата.
Российская национальная библиотека проводит текущую
каталогизацию в формате RUSMARC.
Национальный информационно-библиографический Центр
«Либнет», учрежденный обеими национальными библиотеками России, при поддержке
Министерства культуры РФ организует проведение кооперативной каталогизации в
стране на современном уровне. Работа Центра ведется в формате RUSMARC.
Ассоциация Региональных Библиотечных Консорциумов (АРБИКОН), в который в настоящее время
входит 13
региональных библиотечных консорциумов, охватывающих значительную территорию
нашей страны, также работает в формате RUSMARC.
Создаются отечественные библиотечные системы
современного уровня, поддерживающие формат RUSMARC и как обменный формат, и
как формат каталогизации: это OPAC-GLOBAL (ДИТ-М, Москва), РУСЛАН
(СПбГУ, Санкт-Петербург) и др. Более подробную информацию о системах,
поддерживающих формат RUSMARC, можно получить на сайте
Национальной Службы развития системы форматов RUSMARC по адресу: http://www.rba.ru/.
На этом сайте доступны постоянно обновляемые полные
тексты форматов RUSMARC/B и RUSMARC/A, а также все новые
разработки, начиная со стадии эскизного проекта и материалы, способствующие
внедрению формата.
Посещаемость сайта, по сравнению с началом года,
возросла в 2,5 раза.
Обучение формату RUSMARC проводилось к настоящему
моменту в 17 городах России. В некоторых городах такие семинары проводились
неоднократно, для различных библиотек. Например, в Москве такие семинары
проводятся ежегодно для библиотек Москвы и Московской области. Ежегодно же проводятся
семинары в Санкт-Петербурге для
библиотек Санкт-Петербурга, Ленинградской области и Северо-Западного
региона, а также дополнительно к приведенным данным, еще 9-и городов России.
Кроме того, семинары проводились в Баку
(Азербайджан) и Усть-Каменогорске (Казахстан).
Пакет заявок на обучение всегда полон.
В настоящее время, наряду с сохранением традиционной
формы обучения, планируется проведение семинаров и подготовка методических
материалов для преподавателей Вузов Культуры с целью организации в дальнейшем
системы регулярного обучения формату RUSMARC.
Несколько слов
о будущем.
Есть только две основных составляющих, которые
определяют будущее каждого из трех форматов, которым посвящена эта статья.
Первая составляющая – это развитие систем форматов и
самих форматов, их способность описывать все новые и новые виды документов,
взаимодействовать с новыми поисковыми системами и способами передачи данных.
Вторая составляющая – развитие и внедрение
программного обеспечения, эти форматы поддерживающего.
Системы
форматов:
MARC21
Как система MARC21состоит из 5 форматов: MARC 21 Format for Authority Data; MARC 21 Format for Bibliographic Data; MARC 21 Format for Classification Data; MARC 21 Format for Community
Information и MARC 21 Format for Holdings Data.
UNIMARC
В настоящее время состоит из двух форматов: UNIMARC Format for Authority Data; UNIMARC Format for Bibliographic
Data. Разработка третьего формата системы UNIMARC for Classification Data практически завершена и с краткой версией этого формата можно
ознакомиться по адресу:
http://www.ifla.org/VI/3/p1996-1/concise.htm
Четвертый формат UNIMARC for Holding Data также почти
готов и можно с уверенностью сказать, что он будет опубликован раньше, чем
кто-то реально почувствует необходимость в обменном формате такого рода.
RUSMARC
Как уже упоминалось, состоит из двух
форматов. На сайте Национальной Службы развития системы форматов RUSMARC проводится обсуждение формата RUSMARC для классификационных данных.
Развитие библиографических форматов:
UNIMARC
Формат UNIMARC имеет к настоящему времени 6 дополнительных руководств по
описанию различного рода документов в этом формате:
-
Составление аналитических описаний в формате UNIMARC
http://www.ifla.org/VI/3/p1996-1/guid1.htm
-
Составление описаний микроформ
http://www.ifla.org/VI/3/p1996-1/guid2.htm
-
Составление описаний старопечатных изданий
http://www.ifla.org/VI/3/p1996-1/guid3.htm
-
Записи минимального уровня в формате UNIMARC
http://www.ifla.org/VI/3/p1996-1/guid4.htm
-
Многоуровневые описания в формате UNIMARC
http://www.ifla.org/VI/3/p1996-1/guid5.htm
-
Описание электронных ресурсов
http://www.ifla.org/VI/3/p1996-1/guid6.htm
RUSMARC
Подготовлены методические материалы по
составлению аналитических описаний в формате RUSMARC.
Завершена разработка форматов и
методических материалов для:
-
нормативно-технических, технических и неопубликованных документов
-
старопечатных изданий
-
картографических материалов
-
нотных изданий
-
аудиовизуальных материалов
-
электронных ресурсов
-
изографических материалов
Взаимодействие с поисковыми системами и
способами передачи данных:
MARC21, UNIMARC, RUSMARC
Все три формата активно адаптируются к
постоянно меняющимся внешним условиям.
Все три формата успешно работают под
протоколом Z39.50.
Для всех трех форматов существуют
таблицы соответствия их элементов данных и набора данных Dublin Core.
Если говорить о перспективах способов
передачи данных, то, вероятно, в этом смысле представляет интерес использование
языка XML.
В отношении MARC21 информация такого рода может быть получена из: http://xmlmarc.stanford.edu/
"Тонкая" XML-схема
(RUSMARCXML/Slim) для библиографических записей в формате RUSMARC размещена
на сайте национальной Службы развития системы форматов RUSMARC.
Нелишне упомянуть и о следующем опыте использования
формата RUSMARC в XML.
Несколько лет назад
издательство «Символ-Плюс» из Санкт-Петербурга
Предложило использовать двумерный штриховой код для
размещения на книге краткого библиографического описания в формате RUSMARC.
Тогда, используя стандартный считыватель и
соответствующую программу, комплектатор любой библиотеки вместе с книгой
получал бы и готовую опознавательную запись.
В двух словах, запись готовится следующим образом:
определяется базовый набор элементов UNIT и для него представление
записи формата RUSMARC в XML выглядело бы так:
<RA>
a
5-93286-003-0
3000
##$a19990215d1999####
| | | y0rusy0102####ca
Веб-дизайн:
книга Дмитрия Кирсанова
$aКирсанов$gДмитрий
СПб
Символ-Плюс
372
http://books.ru/cgi-bin/v3/book_inf.cgi?5-93286-003-0
#0$aRU$bСимвол-Плюс$c19990215$gPSBO
</RA>
Эта же запись в штрихкоде:
Если необходимо
добавить поле (поля), которое не предусмотрено набором UNIT, то его можно поместить
после закрывающего тега </RA>, между тегами <E> и
</E> в явном виде (то есть в том виде, в котором они записываются в
формате RUSMARC. Например:
….
</RA>
<E>
606 1#$aАнглийский язык$xГрамматика$xСправочники учебные$2rkp
</E>
Если пытаться определить наиболее важные тенденции в
нашем разговоре о будущем форматов, то хотелось бы выделить те процессы
согласования, которые происходят на разных уровнях библиотечного универсума.
Мы упоминали уже, что рабочую группу IFLA по
пересмотру ISBD возглавляет Джон Байрам – сотрудник Библиотеки
Конгресса. Он же возглавляет группу по согласованию форматов США, Канады и
Великобритании.
Мы также отмечали те решения в формате MARC21,
которые, пусть немного, но делают его ближе к формату UNIMARC.
Постоянный Комитет по формату UNIMARC
прилагает максимум усилий к тому, чтобы новые решения не углубляли расхождение
между форматами.
Россия явочным порядком отказывается от формата
МЕКОФ в пользу действительно международного формата.
При этом, правда, нужно отметить, что ГОСТ 7.19 ныне
здравствует и пересматривается вновь в пользу формата МЕКОФ.
Безусловно, плоды процессов согласования – весьма
робкие и часто не очевидные. Очевидно лишь естественное стремление людей лучше
понимать друг друга.
В заключение, автор хотел бы поблагодарить за
оказанную помощь в подготовке материалов к этой статье:
Джона Байрама (Библиотека Конгресса), Мари-Франс
Плассар (IFLA, Программа UBCIM, директор), Мирну Виллер
(Постоянный Комитет по формату UNIMARC, Председатель),
Алана Данскина (Британская библиотека), Тони Кевина
(EU, CERL, эксперт по формату UNIMARC), Александра Галунова
(Издательство «Символ-Плюс», генеральный директор),
А также сотрудницу Службы поддержки форматов
Российской национальной библиотеки Наталью Филину.