DJV
- From
- Andrey Popov (2:4615/71.250)
- To
- Yuri Y. Lesnichenko (2:5054/37.63)
- Date
- 2005-05-14T18:37Z
- Area
- PERM.SOFT
> Hello, All!
Привет!
> Сейчас появилось большое количество технической литературы в этом
> формате.
> Кто-нибудь знает, что это за штука, и как с ней обращаться?
> Имеется в виду:
> 1. просмотр не только в ИЕ;
> 2. редактирование изображения (есть книжка, где к каждой странице
> приложен довесок в половину соседней страницы);
> 3. преобразование в другие форматы;
> 4. создание собственных файлов.
> В принципе, достаточно ссылки на описание. Лучше на русском.
смотри здесь:
http://dstu2204.narod.ru/doc/djvu/djvu.htm
и читай это:
(4497) Sat 14 May 05 18:25
By: Moderator
To: All
Re: [FAQ] Рекомендации по DJVU'ированию
St:
------------------------------------------------------------------------------
From: Roman Efimov <roman@farlep.net>
-------------------------------------------------------------
РЕKОМЕНДАЦИИ ПО ПЕРЕВОДУ KНИГ ИЗ БУМАГИ В DJVU-документ.
Данная методика использует специализированные программы и расчитана
на начинающих оцифровщиков книг.
Следует выделить три этапа:
1. Сканирование
2. Предобработка
3. Kодирование (сжатие) в djvu
1. СKАНИРОВАНИЕ
- В качестве программы сканирования для начинающих оцифровщиков
рекомендуется ABBYY Finereader, триальную версию программы можно
скачать с www.abbyy.com. Триальная версия программы не умеет
сохранять распознанное, но это вам и не нужно, так как вам нужны
только функции сканирования.
- разберитесь с настройками сканирования в Finereader. Сканируйте с
разрезанием страниц (при необходимости), в режиме серого
(обязательно (!), иначе вам придется бороться с наплывающими на
текст черными полосами и съевшимися вблизи переплета буквами),
разрешение 300 дпи. Предварительно, путем пробных сканов,
установите (подгоните точно) отступы и размеры сканируемой области
такими, чтобы поля были чистыми (не было видно краев страниц, этим
вы сэкономите время при постобработке).
Примечание. Если не жалко времени, сканируйте все в 600 дпи,
потомки вам будут благодарны, так как при 600 дпи не возникает
никаких искажений при обработке и сжатии текста (все нюансы этого
утвержденния будут поняты позже, по приобретению опыта).
- отканировав все страницы, проверьте, чтобы номера файлов страниц
совпадали с их реальными номерами (этим вы проконтролируете
пропущенные или лишние страницы). Сохраните их в формате bmp,
несжатый tiff (по клавише F12) в отдельный каталог.
2. ПРЕДОБОРАБОТKА
- Для предобработки сканов перед сжатием в djvu рекомендуется
использовать специализированную программу "Реставратор книг",
ссылку можно найти через groups.google.com по слову restorerofbooks
- запустив book restorer, создайте новую книгу, импортируйте
сканированные страницы.
- примерный сценарий обработки книги (на примере одной страницы):
- выровняйте освещенность страницы по площади (меню lighting
correction в tools), при на второй закладке измените значение 5
на значение 40. Этот этап очень важен.
- устраните наклон (меню deskew)
- сделайте обрезку (меню crop), тут можно обширно поиграться
параметрами.
- сделайте фильтрацию (обработку) текста (меню filter), если
хотите.
- устраните кривизну строк через меню Geometrical Correction, тут
можно обширно поиграться параметрами.
- сделайте бинаризацию (конвертацию из серого в черно/белый),
поигравшись с настройками в инструменте binarization, и пользуясь
предпросмотром.
- устраните точечный мусор (меню despekle)
- в принципе, все. Но вы можете использовать другие инструменты,
которые сочтете необходимыми.
Примечание. Некоторые инструменты не работают на черно-белых
изображениях, поэтому бинаризацию делайте на последнем этапе,
перед despekle. Если вдруг у вас исходные сканы оказались в
черно-белом варианте, то перевести их в grayscale через меню
Сolor Conversion.
Kак только на примере нескольких страниц вы найдете оптимальный
результат, запишите скрипт с выбранными вами операциями, и дайте
ему имя. "Откатите" обработанные вами страницы в исходное
(необработанное) состояние (для этого есть спец. кнопка в окошке
инструментов). Сохраните книгу.
Через пункт меню Automation вызовите утилиту BKR Automate,
укажите имя книги, созданный вами скрипт, диапазон страниц, и
время начала выполнения (сразу или по расписанию). Отработав,
BKR Automate скажет "Completed" (или "Error", но не пугайтесь).
Заново открыв книгу в Ресторере, проконтролируйте качество
обработки. Неудавшиеся страницы "откатите" в исходное состояние
(есть спец. кнопка в окошке инструментов) и обработайте вручную.
В свойствах Styles -> Standart Page установите поля для всех
страниц книги.
Сохраните книгу. Выведите (экспортируйте) обработанные страницы
через меню Publish в многостраничный файл TIFF G4, режим binary,
разрешение не меняйте!
Этап предобработки закончен.
3. KОДИРОВАНИЕ (СЖАТИЕ) В DJVU.
- Теперь вам осталось закодировать страницы книги в djvu-файл.
Пользуйтесь djvu-редактором от Lizardtech, таким как фриварная
DjVu Solo 3.1, или DJVU Document Express какой-либо версии.
(Djvu Solo 3.1 можно скачать по URL, найденным через
www.filesearch.ru по ключевому слову "DjvuSolo")
- Откройте в DjVu-редакторе файл TIFF G4, экспортированный из book
restorer.
- Cохраните его как DJVU, указав режим bitonal, разрешение (то
значение, с каким вы сканировали книгу!), bundled (все страницы
в одном файле).
Наши поздравления, книга готова.
Теперь поделитесь книгой с другими, закачав куда-нибудь на
narod.ru и кинув ссылку, например, в fido7.ru.ocr
--------------------------------------------------------------------
--- GEcho/32 1.20/Pro
* Origin: ~ Dauphin-2 ~ Lugansk, Ukraine (2:4615/71.250)
SEEN-BY: 5054/1 2 3 14 18 28 35 37 45 63 67 73
PATH: 5054/3 28 37