djvuocr.ucoz.ru
DjvuOCR 2.2 beta - конвертор файла в формате Djvu


Твой софтовый форум


Программа DjvuOCR представляет собой конвертор файла в формате Djvu в любой другой графический формат (jpg,tiff,png,gif,bmp)
и позволяет сохранить файл Djvu в заданное при конвертации количество страниц с заданным разрешением сканирования (от 25 до 2500) ,а также сохранять текст и изображения или весь документ, откидывать фон ,выбирать размер сохраняемого файла ...
После того, как программа перевела файлы Djvu в графический формат , их легко можно распознать ABBYY FineReader и сохранить в любом удобном Вам формате (doc,pdf,txt) ,если Вы скачали книгу или оставить файлы в графическом формате ,если это чертежи ,схемы или фотографии ,что позволяет легко просматривать и редактировать нужную информацию.


Программа для добавление OCR информации к DJVU-книги
с помощью програму распознавания текста FineReader версии 7.x/8.x

OCR-информация в DJVU-книга позволяет поиск и копирование текста.


Основная идея програмы:

1) Есть Djvu-книга
2) Программа помогает извлечь из нее графические изображения страниц - тиффы;
3) Загружаем их в FineReader и распознаем;
4) Программа обрабатывает рабочие файлы FineReader-а, извлекается нужная информация и создает OCR-слой в первоначальную книгу.


Используем FineReader как лучший продукт распознавания текста. Вполне достаточно использовать try&buy или demo версию.

Нужная документация как работает программа и что еще можно с ней сделать, находится в папке \doc.


Программы:

FRFGrab - консольная версия
DjvuOCR - Win32 GUI версия
cvthtml2 - конверсия выходного OCR-текста в HTML (UTF8)
Djvused - стандартная утилита пакета djvulibre
DjvuDecoder - стандартная утилита для извлечение графических изображении страниц из DJVU-книги