Първа част. Дигитализация на
културното и научно наследство на човечеството
- Значението на дигитализацията - какво се дигитализира, защо
СЃРµ
дигитализира, как се дигитализира?
- Технологии за дигитализация на документи
- Хардуер и софтуер за дигитализация и разпознаване на текст
- Търсене в текстови документи
- Рнсталиране Рё работа СЃ програмата ABBYY FineReader
Значението на дигитализацията - какво се дигитализира, защо
СЃРµ
дигитализира, как се дигитализира? Технологии за дигитализация на
документи. Хардуер и софтуер за дигитализация и разпознаване на текст
Текст + образ + звук
Рсторическа памет + знание
Примери:
- Български фолклор - народни песни, хора, обичаи, вярвания,
традиции
- Стари ръкописи, архивни документи
- Научна литература
- Дигитализация за архитектурния, строителен и инженерен сектори
- Специализирани GIS услуги - дигитализация на карти, изграждане на
бази данни
Цели на дигитализацията - съхранение, достъп, изследване
Защо електронен архив?
- Незабавно намиране и визуализиране на търсения документ
- Освобождаване на работно пространство
- Едни и същи документи могат да се използват от много хора
едновременно
- Лесно Рё Р±СЉСЂР·Рѕ разпространение – РїРѕ локалната мрежа, Рнтернет или
факс
- Възможност за принтиране върху хартия (копието е идентично с
оригинала)
- Предпазване на оригиналите от похабяване
Какво е сканиране на документи?
Сканирането на документи е процес на
преобразуване на информацията от парче хартия във (електронен) файл,
който
може да бъде показан на компютър. "Електронните" изображения се
индексират чрез система за документално архивиране и това дава
възможност за бързо намиране на търсения документ измежду милиони други
чрез написване на желания индекс или комбинация от тях - "име",
"номер", "дата" ...
Какво може да се прави със сканираните документи?
- Намирате необходимото за секунди чрез изписване на търсеното име.
- Документът се визуализира на екрана.
- Можете да го четете, принтирате върху хартия, изпращате директно
по факс или E-mail.
Действията на PULMAN за
електронна Европа
Министри, политици на най-високо равнище и професионалисти от 36
европейски страни, се обединиха около следните приоритети на
стратегическата конференция на PULMAN в Оейраш, Португалия, 13-14 март
2003.
Необходимо е да се осигури
финансиране и подкрепа на национално и регионално равнище:
- за да се издигне ролята на
обществените библиотеки, работещи съвместно с архивите и музеите, като
важни обединения за изпълнението на целите на Плана за действие за
електронна Европа, ускорявайки тяхното развитие като центрове за достъп
до дигиталните ресурси.
- за да отговорят на
потребностите на всички граждани в информационното общество,
насърчавайки възприемането на политики и практики, поощрени от мрежата
РЅР° PULMAN.
За да постигнат тези цели, библиотеките трябва:
- да предложат нови
качествени услуги, базирани на дигиталните
технологии, които ще дадат възможност на гражданите да постигат
своите лични цели в променящия се свят и които допринасят за сплотяване
на обществото и за успешна, основана на знанието икономика в Европа.
- да търсят значително
подобрение в използването на услугите от гражданите, особено от тези,
които са застрашени от социална и дигитална
изолация. Това подобрение да се развие върху
съществуващата база от около 150 милиона регистрирани ползуватели на
обществените библиотеки в 36-те страни на мрежата на PULMAN.
Българската фондация
“БРОРАЗНООБРАЗРЕ” (БФБ) Рµ неправителствена
организация, регистрирана а с предмет на дейност опазване на
биологичното разнообразие и прилагане принципите на устойчивото
развитие.
....
Позволявам си да използвам случая, да изкажа своята дълбока
благодарност и за финансовата подкрепа, която оказвате на Националния
природонаучен музей за нашите научни издания и за техническото
оборудване, предоставено ни за ползване при предстоящата дигитализация на музейните
колекции.
Като ви пожелаваме нови големи успехи в благородната ви мисия, оставаме
ваши приятели.
За колектива на Националния природонаучен музей при БАН
Директор: ст.н.с. д-р Петър Берон
София, 27 януари 2005 г.
Отпускат 650 000 лева за
реконструкция на Народната библиотека
Дата: 13-05-2005
Част от средствата ще се използат за изграждане на Център за
дигитализация на ценни ръкописи, архивни документи и стара
българска
периодика, която вече не се използва в оригинал. Този център ще е първи
по рода си у нас и на Балканите, обяви директорът на библиотеката проф.
Боряна Христова.
Сп. Пламък, брой 5-6,
01.05.2002
Програмата „Книжовно наследство“ РЅР° издателство ПЕРО-КЛАСРРљРђ цели РґР°
задоволи интересите на широка аудитория - ученици, кандидат-студенти,
студенти, преподаватели, научни работници и всички, интересуващи се от
българското и световното книжовно наследство. Проектът предвижда
издаването на многотомна мултимедийна поредица, включваща най-ценното
от българската и световната писмена култура. Чрез съчетаването на
класическите издателски технологии и дигитализацията
на писменото
културно наследство издателите се стремят:
• Да се запълни празнотата в дигитализацията на книжовното наследство у
нас и се създаде възможност за четене и анализ както през класическия
носител - книгата, така Рё чрез CD-ROM Рё Рнтернет.
• ...
• Да се достави естетическо удоволствие и на двата типа читатели - на
ползващите предимно компютъра и на онези, които предпочитат
книгата.
РќР° българския читател СЃРµ предлага изданието „ХРРРЎРўРћ РЎРњРРНЕНСКР- РќРћР’РРЇРў
РџР РћР§РТ“ - включва том СЃ избрано РЅР° представяния автор Рё CD-ROM,
съдържащ своеобразния аналитичен критически „колаж“, тестовете и
адио/видео приложенията;
Новото в изданието, разбира се, не е самата дигитализация, а възможностите за
търсене и анализ, които тя
предоставя.
Обучителен семинар в рамките на
проект “Коопериран абонамент - 2005”
Стопанска Академия “Д. Рђ. Ценов” Рё Български Рнформационен Консорциум
имат удоволствието РґР° РІРё поканят РЅР° ОБУЧРТЕЛЕН СЕМРРќРђР РІ рамките РЅР°
проект “Коопериран абонамент - 2005”
на тема
“СЪЗДАВАНЕ РќРђ Р”РР“РТАЛНО СЪДЪРЖАНРЕ”
Днес информацията е жизненоважна за съвременните организации. Тяхното
функциониране и развитие зависи в голяма степен от ефективното
управление на тази информация. Много време и усилия за търсене на
документи в действащия архив могат да бъдат спестени чрез създаване на
електронен архив паралелно с
хартиения. Архив, който не заема
пространство и може да се използва от много работи места едновременно.
Семинарът ще се проведе от 8. 04. 2005 г. до 9. 04. 2005 г.
в Стопанска Академия “Д. А. Ценов”, гр. Свищов.
ПРОГРАМА
Начало: 8.04. 2005 г., 11,00 ч.
I. Защо е необходимо създаването на дигитално съдържание?
II. Какво е необходимо за да започне процеса на дигитализиране?
- Компютър;
- Скенер;
- Софтуер за сканиране и обработка на текст и изображения.
III. Какво включва процеса на дигитализиране на съдържанието
1. Дигитализиране на изображения:
- предварително сканиране;
- установяване на разделителната способност;
- настройка на цветовете и контраста;
- изрязване;
- сканиране;
- допълнителна обработка със софтуер за работа със
изображения;
- запис на изображението в подходящ формат.
2. Дигитализиране на текст:
- оценяване на съдържанието и настройка на разделителната
способност и метода на сканиране;
- предварително сканиране;
- изрязване;
- сканиране;
- разпознаване на текста;
- коригиране и запис на текста като MS Word документ;
- създаване на PDF документи.
IV. Публикуване на дигитализираното съдържание и достъп до него.
Търсене в текстови документи
Видове текстови документи - възраст, значение, състояние
Примери:
- Машинописен текст: 313, 314
- Р СЉРєРѕРїРёСЃ: 01
- Печатен текст: p104
Постановка на задачата за търсене в текстови
документи
Стандартна технология:
- сканиране на текста;
- разпознаване и произвеждане на ASCII или Unicode файл;
- търсене в текстов файл.
Стандартни програми за OCR - как работят тези програми?
Трудности при прилагане на тази технология за стари документи:
- сканиране - лошо състояние на документа:
- пожълтяла хартия;
- избледняло мастило;
- зацапвания и допълнителни бележки върху текста.
- разпознаване -
- наличие на шум;
- трудности при сегментирането на символите;
- наличие на букви, които не са от съвременната азбука;
- остарели думи, които ги няма в съвременен речник;
- СЂСЉРєРѕРїРёСЃРё.
Друг подход за търсене в стари документи:
- сканиране в сивата скала (gray-scale);
- трансформация на изображението за получаване на качествено
черно-бяло изображение;
- сегментиране на думите;
- търсене на дума, поредица от думи или части от думи в
черно-бялото
изображение.
Рнсталиране Рё работа СЃ програмата ABBYY FineReader
Примери:
Резултати от работата на програмата: