T.o.h.a
17.02.2008 - 15:08
Вобщем ситуация такая. Имеется большая работа экономического содержания в *pdf. FineReader без проблем распознает текст, но как только дело доходит до каких-либо формул, то начинается настоящий хаос!
Можно ли каким-нибудь образом распознать "математические" символы (бетта, гамма, лямбда, знак арифметической суммы, квадратный корень и т.п)? Может есть что-то типо специального добалнения к FineReader'у (ведь по сути нет ничего нового, все эти символы есть в Ворде)? Чем вообще в принципе, какой программой, можно распознать такого рода символы?
romualdino
17.02.2008 - 16:30
Даже если удастся (но все равно, только теоретически) распознать все символы (сделать это можно через редактор пользовательских эталонов), добиться необходимого их взаимного положения возможно % на 70-80...
Поэтому лучшим решением в процессе распознавания будет выделять формулы как рисунки - их невозможно будет редактировать, но при достаточном качестве оригинала (pdf может содержать и растр, встречалось даже70 dpi) на печати они будут выглядеть отлично. Попробуй также при этом отключить преобразование распознаваемой страницы в 300 dpi.
T.o.h.a
18.02.2008 - 2:32
Да, в общем-то так и делал....больше 2-х часов убил на 300 страниц...
SoftoRooM © 2004-2024