Lizardtech DjVu Document Express Editor 6.0.1 Build 1259
Document Express with DjVu - группа приложений, позволяющих создавать, управлять, записывать и распространять файлы в формате DjVu. » Подробнее о Document Express with DjVu «
Одна из наиболее распространенных программ для создания и просмотра DjVu-документов на локальном компьютере – программа компании LizardTech Document Express Editor. Правда, в отличие от плагина для браузера программа эта не бесплатна, но есть возможность скачать пробную (trial) версию с ограниченным сроком использования на сайте компании. Однако мы знаем, что не все так просто. Рассмотрим коротко ее основные возможности и кратко опишем принцип создания DjVu-документов.
В Document Express Editor, можно открывать и конвертировать файлы таких форматов: DjVu (*.djvu, *.djv), BMP (*.bmp), GIF (*.gif), JPEG (*.jpeg, *.jpg), PNM (*.pnm, *.ppm, *.pgm, *.pbm), TIFF (*.tiff, *.tif), PICT (*.pict).
Для создания DjVu-файла нужно отсканировать страницу (меню “File” -> “Scan Pages”), либо открыть уже готовое изображение поддерживаемого формата (меню “File” -> “Open”). Если в документ должен быть многостраничный, то при помощи меню “Edit” > “Insert Pages(s) Before” или “Edit” > “Insert Pages(s) After” вставить в документ до или после открытого изображения остальные изображения.
Затем при помощи меню “File” -> “Save As” сохранить документ в формате DjVu.
При сохранении файла программа предложит выбрать настройки: распознавать ли текст; профиль; разрешение (от 100 до 600 dpi); качество текста (возможны 5 уровней от «агрессивного», т.е. со значительной потерей до «без потери»), сохранять изображения каждое в отдельном или все в одном файле.
Так называемый профиль – это тоже настройки, только пользователь выбирает тип документа, а программа автоматически подстраивается под тип изображения.
Всего доступны 7 профилей:
1. «Нормальный» – для большинства отсканированных печатных документов
2. «Электронный» – для растровых изображений электронного происхождения, таких, как скриншоты и т.п.
3. «Фото» - для фотографий. При этом функция OCR не работает, поэтому функция поиска и копирования текста в созданном документе не будет работать.
4. «Битональный» - для черно-белых изображений
5. «Рукопись» - для старых или рукописных изданий без рисунков или фотографий
6. «Рисунок» - похож на «Рукопись», но с поддержкой рисунков и фотографий
7. «Карта» - похож на «Рисунок», но с лучшей поддержкой перевернутого текста
Этими настройками, как правило, действительно можно добиться удовлетворительного результата. После того, как настройки заданы, нужно выбрать место на локальном диске и сохранить файл в формате DjVu.
После сохранения добавляется возможность подсвечивать области в документе, вставлять внутренние (для самого документа) и внешние гиперссылки и т.п. Так же если при создании DjVu-документа не было задано распознавание текста, это можно сделать позже. Document Express Editor 6.0.1 умеет распознавать около 100 языков, в том числе русский и украинский.
Вообще вопрос о необходимости добавления текстового OCR-слоя при создании DjVu-документа является дискуссионным. Помимо того, что процедура распознавания текста занимает значительное время, OCR-слой увеличивает размер DjVu-файла. Однако наличие текстового слоя очень удобно при дальнейшей работе с электронной книгой. Во-первых, появляется возможность копировать нужные фрагменты текста для последующей обработки; во-вторых – искать по ключевому слову или выражению в самом DjVu-документе и среди всего множества DjVu-документов как на локальных дисках, так и в сети. Функция поиска по ключевому слову присутствует практически во всех DjVu-программах. Для поиска в Интернет нужно использовать специальные программные средства, например, Google Desktop Search + DjVu Indexer Plugin или LizardTech DjVu IFilter 1.1.
Так как многие DjVu-документы содержат текстовый OCR-слой, у некоторых пользователей создается впечатление, что их можно конвертировать в формат DOC, или подобный. Однако формат DjVu – это графический, а не текстовый формат. Поэтому напрямую конвертировать DjVu-документ в формат "Word-processor" – подобного редактора нельзя. DjVu-файл может лишь содержать встроенный OCR-слой – простой текст без какого-либо форматирования. Используя буфер обмена этот текстовый слой можно перенести в текстовый редактор и вручную форматировать.

» Подробнее о формате DjVu «
DjVu (дежа-вю) - графический формат, разработанный фирмой AT&T, оптимизированный для хранения отсканированных документов. Особое значение этот формат приобретает для переноса в сеть математической и вообще технической литератуы, где обилие схем и формул делает распознавание и перевод в текстовый формат практически невыполнимым. . В настоящее время DjVu становится фактическим стандартом для электронных библиотек технической и научной литературы. Отныне существует компромисный вариант - перевод отсканированных картинок в формат DjVu (дежа-вю). При этом текст и контрастные рисунки сохраняются с разрешением 300dpi, все остальное считается фоном и сохраняется с пониженным разрешением. Это позволяет хорошо сжать электронный документ без потери его читаемости. Размер файла отсканированной книги оказывается в пределах нескольких мегабайт, что вполне приемлемо. Технология DjVu обеспечивает для файлов с черно-белыми монохромными изображениями сжатие порядка 500:1. Выигрыш в размере файла по сравнению с форматом GIF составляет в среднем 20 раз. Суть технологии DjVu заключается в автоматическом разбиении изображения на несколько участков (например, текст, логотип фирмы и растровая фотография), для каждого из которых выбирается оптимальный для данного графического образа алгоритм сжатия. Право на коммерческое использование технологии DjVu продано компании LizardTech.