От буквы к документу
От буквы к документу




ABBYY выпускает новую версию FineReader

16:56 28.09.2009   |  Людмила Яремчук |

Рубрика События |   318 прочтений



 

В отличие от большинства существующих OCR-программ ABBYY FineReader 10 умеет распознавать документ на уровне его структуры Новая версия ABBYY FineReader стала десятой по счету, а с момента выхода первой прошло 16 лет. Екатерина Прокашева, руководитель службы продуктового маркетинга компании ABBYY, углубилась в историю создания программы и напомнила, что уже первая версия FineReader (тогда еще компании Bit Software), появившаяся в 1993 году, была "омнифонтовой", то есть умела распознавать любые шрифты. Спустя два года появилась вторая версия, в ней был реализован принцип адаптивного самообучения, что значительно расширило возможности по распознаванию символов и улучшило качество распознавания. К третьей версии программа научилась использовать контекст и выдвигать гипотезы о целых словах. Таким образом, был осуществлен переход на новый уровень - от букв к целому слову.

Известность ABBYY принесла четвертая версия, с которой компания вышла на мировой рынок и в которой была, в частности, реализована процедура повторной обработки неуверенно распознанных символов и увеличено количество распознаваемых языков. Следующий шаг в развитии OCR (Optical Character Recognition - "оптическое распознавание символов") – распознавание на уровне страницы – был сделан частично в пятой и в особенности в шестой версии, которая научилась производить анализ физической структуры документа, то есть отделять текст от таблиц и изображений. Как заявила Прокашева, большинство известных OCR-программ работает на первых трех уровнях распознавания, в то время как ABBYY удалось перейти от уровня страницы к уровню документа.

В FineReader 10, при помощи второго поколения адаптивной технологии распознавания документов ADRT (Adaptive Document Recognition Technology), документ анализируется как единое целое, с полным восстановлением его логической структуры, что облегчает пользователю дальнейшую работу, поскольку избавляет от повторного форматирования распознанного текста. Программа также научилась лучше работать с документами, содержащими сложный фон. Кроме того, был сделан следующий шаг в технологии обработки изображений, полученных с помощью фотоаппарата, и в десятой версии появилась возможность распознавать снимки, сделанные камерой мобильного телефона.

Количество распознаваемых языков достигло 186. В частности, появилась возможность работать с документами на идиш, а также на корейском языке, что Прокашева объяснила растущим интересом ABBYY к продвижению на восточных рынках. Что касается точности распознавания, то в юбилейной версии программы она повысилась на 30% для азиатских языков и на 20% – для европейских. Был существенно переработан пользовательский интерфейс: в редакторе предварительной обработки появился ряд специальных настроек для распознавания изображений, полученных с камеры мобильного телефона, а во встроенном текстовом редакторе наиболее популярные настройки вынесены на верхнюю панель, что существенно облегчило доступ пользователя.

Изменения претерпел также процесс постобработки документов и экспорт их в популярные форматы. Так, при создании pdf-файлов в FineReader 10 используется позволяющая получить меньший размер файла без потери качества технология сжатия MRC (Mixed Raster Content), которая разбивает полученное изображение на слои, исходя из содержимого (текст, картинка, таблица) и сжимает каждый слой отдельно, наиболее эффективным способом. Еще одно изменение коснулось сохранения в формате HTML: программа может автоматически сохранять главы книги в отдельные HTML-файлы и восстанавливать ссылки в содержании на соответствующие им главы книги, что облегчает создание электронных книг.

Выход ABBYY FineReader 10 Professional Edition намечен на октябрь, FineReader 10 Corporate Edition с возможностью сетевой установки и совместной работы над документами в сети появится на рынке в ноябре. Рекомендованная розничная цена FineReader 10 Professional Edition – 3990 руб., корпоративной версии – 9990 руб. Традиционно предусмотрены скидки на загружаемые через Internet версии, а также для пользователей предыдущих версий. Кроме того, пользователи, которые приобретут версию FineReader 9.0 Professional Edition с 22 сентября по 15 октября или FineReader 9.0 Corporate Edition с 22 сентября по 31 октября, смогут до 31 декабря 2009 года бесплатно обменять их на соответствующие версии ABBYY FineReader 10.


Теги: