SSinchuk
4.03.2007 - 10:06
Плохое качество книги DJVU
чем можна сконвертировать в TXT
SSinchuk,
это вряд ли. Если только попробовать FineReader_om, по крайней мере pdf он берет...
DJVU может содержать текстовый слой. И в этом случае - он переводится на раз любыми програмами по обработке DJVU. Однако, дежавшка с текстовым слоем - сейчас очень редкая штука. Сейчас литература сканируется, рисунки загоняются в дежавю - и на этом процесс создания завершается. В результате, в дежавюшках есть только графический слой.
Следовательно: переводим дежавюшку в любой графический формат, и распознаем ФайнРидером.
QUOTE(Laryx @ 4.03.2007 - 10:24)
переводится на раз любыми програмами по обработке DJVU
WinDjVu через экспрт текста переводит довольно криво.. альтернативы?
QUOTE
WinDjVu через экспрт текста переводит довольно криво.. альтернативы?
Если я не ошибаюсь, WinDjVu - если нет текстового слоя, пытается распознать. Но наврядли она это сможет сделать лучше ФайнРидера.
А вот если текстовый слой есть - ВинДежаВю - должен выплевывать его без всяких проблем...
Или я ошибаюсь ?
она действительно выдаёт его. просто текст при этом разваливается довольно сильно. наверное действительно я слишком много от неё хочу=)
поскольку текст в моём случае вообщем то в текстовом слое я думаю я проганю его через графику в файфридер, он должен по идее и распознать без ошибок и структуру с картинками сохранить.
Экспортируй с WinDjVu в BMP нужную страницу при помощи любой програмы читающей WinDjVu, и распознай текст FineReader-ом
Для просмотра
полной версии этой страницы, пожалуйста, пройдите по ссылке:
DJVU в TXT
SoftoRooM © 2004-2024