Досвід наповнення бази даних Державного реєстру національного культурного надбання
М.І.Жарких
База даних Державного реєстру національного культурного надбання наповнювалась в Науково-дослідному інституті пам’яткоохоронних досліджень Міністерства культури і мистецтв України в 2001 – 2002 рр. Згідно завдання до цієї черги робіт було включено пам’ятки історії, археології, монументального мистецтва національного значення.
Програмне забезпечення. В якості програмної оболонки бази даних була використана універсальна ієрархічна база даних "Мислене древо", розроблена в НДІ пам’яткоохоронних досліджень. Оскільки ця програма дозволяє зберігати форматований текст і зображення, то її можливості були цілком достатні для виконання поставленого завдання. Потрібно було тільки провести невелике навчання працівників використанню цієї програми (загалом знайомство з текстовими редакторами і програмами перегляду цифрових зображень є достатнім для того, щоб приступати до наповнення баз даних "Мисленого древа").
Джерела інформації. В основі робіт по наповненню бази лежав список пам’яток. Спочатку ми керувались проектом списку, опублікованим у журналі "Пам’ятки України" (2000 р., № 2). Остаточний варіант списку був затверджений постановою Кабінету міністрів України № 1761 від 27.12.2001 р., тобто майже через рік після початку робіт. Це привело до певних перевитрат часу, оскільки частина вже опрацьованих пам’яток була виключена з остаточної редакції списку.
В основу наповнення бази покладено паспорти пам’яток, які зберігаються у методичному відділі охорони пам’яток Національного музею історії України. Із приблизно 600 пам’яток списку нам вдалося отримати і опрацювати біля 400 паспортів. На решту пам’яток паспортів у методвідділі не виявилось, і повторні звернення до областей з проханнями надіслати паспорти, яких нема в Києві, допомогли дуже мало (додатково отримано не більше 40 паспортів). Дивна особливість національної пам’яткоохоронної справи полягає в тому, що навіть на пам’ятки національного значення (тобто найбільш показові, яскраві, значущі пам’ятки) не скрізь складено паспорти.
Обробка джерел : тексти. Переважна частина використаних паспортів була заповнена в 1978 – 1985 рр. на стандартних друкованих бланках Міністерства культури СРСР. Папір цих бланків – досить жовтий, заповнювались бланки на друкарських машинках; часто наявні паспорти представлені другими чи третіми примірниками. Наші спроби сканувати ці тексти і розпізнавати їх програмами оптичного розпізнавання текстів були невдалими – через зазначені особливості виконання паспортів якість розпізнавання тексту була низькою. Тому було обрано шлях клавіатурного набору текстів паспортів. Було складено шаблон документу MS Word, який відповідає формі паспорта, і працівники інституту почали вводити текстову інформацію з паспортів за принципом "один паспорт – один документ MS Word на основі шаблону".
На початку цієї роботи з’ясувалось, що механічним переносом текстів обмежитись не можна. По-перше, ряд паспортів було складено російською мовою – їх ми перекладали українською мовою. По-друге, багато паспортів, виконаних українською мовою, містили грубі русизми або недоладні кальки термінів з російської (особливо це стосувалось пам’яток археології); траплялось, що навіть важко було зрозуміти зміст написаного без зворотнього перекладу на російську – все це довелось виправляти. По-третє, часто замість конкретних описів пам’яток в паспортах фігурували шаблонні фрази, запозичені з передових статей газети "Правда" чи навіть просто з політінформацій. Ці загальники вирішено було скорочувати, залишаючи тільки те, що безпосередньо стосується пам’яток. При цьому ми намагались уникнути перескладання паспортів.
Обробка джерел : зображення. Паспорти містять багато зображень (ситуаційних схем, планів, фотографій загальних видів і деталей). Ці зображення здебільшого є чорно-білими фотографіями розміром 18:24 см на глянцевому папері. Плани і креслення представлені переважно у вигляді фотокопій, що дуже часто утруднювало їх використання. Натурні фотографії також були дуже різної якості, часто траплялись надмірно контрасні або недбало надруковані відбитки.
Всі ці зображення сканувались на планшетних сканерах з роздільною здатністю 300 точок на дюйм в режимі 256 градацій сірого кольору. В якості проміжного формату було обрано формат TIF. Відскановані зображення піддавались ретушуванню, обрізанню полів і потім приводились до прийнятого нами стандартного розміру (максимальний бік зображення – 800 пікселів). Креслення перетворювались у формат GIF, півтонові зображення – у формат JPG.
Під час обробки зображень виявилось, що пояснення до них у паспортах часто є недокладними. Наприклад, важко бувало зрозуміти, з якої точки зору відносно пам’ятки виконано той чи інший знімок. Бувало, ми всім колгоспом міркували – що б то могло бути зображено і з якого боку. В деяких випадках брак зображень у самих паспортах змушував нас вдаватись до інших джерел зображень.
Топографічна інформація. В ряді випадків у паспортах дуже бракувало ситуаційних планів розміщення пам’яток на місцевості, схем під’їзду/підходу до пам’яток. З цим пов’язані і прикрі недоліки у топографічній прив’язці пам’яток (був випадок, коли точка прив’язки знаходилась на віддалі цілих 14 км від самої пам’ятки і до того ж напрямок був позначений невірно). Такого не могло би бути, якби під час складання паспортів виконувались ситуаційні схеми. Найбільш кричущі помилки в топографічних прив’язках виправлялись, але цілком можливо, що частина такого роду помилок залишилась непоміченою через те, що ми не були знайомі з детальною інформацією по цих пам’ятках.
Також часто бракувало планів охоронних зон або ці зони були визначені цілком формально. Наприклад, для будинків, які є пам’ятками історії, майже скрізь сказано, що зона охорони співпадає з контуром будинку. Тобто по силі такого паспорту викопати котлован за півметра від стіни будинку – це не порушення, але чи вціліє при цьому будинок ?
Загальна оцінка джерел. Найбільшим недоліком наявних паспортів є надмірна ідеологізація, яка була неодмінною рисою всієї пам’яткоохоронної роботи за панування комуністів. Впадає також в око сильний різнобій якості : поруч з цілком фахово і старанно обробленими паспортами є паспорти, складені нашвикоруч, недбало, формально. На цьому фоні приємно відзначити серію нових паспортів пам’яток Полтавської області, складених під керівництвом О.Б.Супруненка – вони відзначаються дуже високим рівнем фахової обробки.
Навіть з урахуванням усіх зазначених недоліків оброблений нами масив паспортів дає досить повну інформацію про наше національне надбання.
Результати наповнення бази даних. Підготована в описаний вище спосіб текстова і графічна інформація вставлялась в базу даних адміністративно-територіального поділу України (ця база була підготована нами раніше). Окрім того, робились резервні копії всіх проміжних матеріалів на компакт-дисках однократного запису (CD-R дисках).
Внаслідок виконання всього циклу робіт зміст бази виноситься на досить поважні числа : 50 авторських аркушів тексту, 1170 ілюстрацій, що в загальних рисах відповідає тому енциклопедії. Звичайно, у вигляді книги ця інформація не буде представлена ніколи (це теж національна особливість пам’яткоохоронної справи), але у вигляді бази даних вона доступна на компакт-диску. У питанні придбання диску слід звертатись до НДІ пам’яткохоронних досліджень.
Перспективи роботи над базою даних. Ми розглядаємо виконаний етап роботи як початковий крок у наповненні широкомасштабної бази даних пам’яток України, яка має охопити всі 140 тисяч наших пам’яток. Окрім цілком очевидного напрямку росту в бік наповнення бази даними про пам’ятки місцевого значення слід продовжити роботу і над тими пам’ятками, які уже введено до бази. Тут треба ставити завдання наукового опрацювання історії кожної окремої пам’ятки, збирання максимальної кількості даних про них, поповнення літератури, рядів зображень, опрацювання сучасного стану пам’яток (і тут використані паспорти дають прекрасний хронологічний зріз стану пам’яток, віддалений від нашої доби на 20 – 25 років).
Книжкова форма не підходить для такої роботи, але форма бази даних ідеально для неї пристосована. Тому я люблю говорити, що у наповненні баз даних є початок і середина, але не може бути кінця, тому що наші знання про пам’ятки мають поповнюватись постійно.
18.04.2003 р.
Паперова публікація статті : : дослідження та охорона історичного середовища. – К. : АртЕк, 2003 р., с. 70 – 74.