CuneiForm — это программа для оптического распознавания текста документов в редактируемый вид. Результаты работы программы можно редактировать в офисных программах и текстовых редакторах и сохранять в популярных форматах, проводить по ним полнотекстовый поиск. Собственно, OCR CuneiForm является интеллектуальной системой распознавания текста. Обеспечивает быстрое и качественное преобразование бумажных документов и электронных графических файлов в редактируемый текст для последующей работы с ним в офисных программах и текстовых редакторах. Результаты можно сохранять в популярных форматах и проводить по ним полнотекстовый поиск.
OCR CuneiForm – одна из лучших бесплатных программ для сканирования и распознавания отсканированных текстов (кроме, рукописных). Она считается прямым аналогом программы FineReader. Для наиболее качественного распознания текстов с распечаток и отсканированных листов, программа использует специальные алгоритмы OCR (Optical Character Recognition), которые способны легко и быстро определить язык, шрифты и т.д. OCR CuneiForm – одна из лучших программ на мировом рынке, созданная русской компанией Cognitive Technologies для быстрого, а также качественного сканирования и распознавания отсканированных документов (распечатка, ксерокопия) в текст. Cognitive Technologies сделала CuneiForm бесплатной программой и открыла для сообщества OpenSource ее исходные коды, которые можно свободно скачать на странице загрузки программы. Новый открытый проект, в котором может принять участие любой желающий, получил название OpenOCR. Для координации работы над проектом действует сайт OpenOCR.org http://openocr.org c русскоязычным форумом http://openocr.org/forum . На этом же сайте осуществляется и поддержка пользователей.
В отличие от других программ (за исключение ABBYY FineReader) данная программа качественно и быстрее распознает тексты документов с любыми машинострочными шрифтами. В отличие от ABBY FineReader программа OCR CuneiForm является самообучающейся системой. Благодаря этому повышается вероятность распознавания текстов на 30-40%. Кроме этого, распространяется бесплатно, без регистрации и смс.
Для распознавания "сложных" документов, содержащих (таблицы, текст, рисунки или изображения плохого качества) лучше использовать ручную фрагментацию, а не мастер распознавания. Чтобы воспользоваться данной возможностью нужно выполнить следующие действия: "Получить изображение" -> "Разметка" -> "Отредактируйте изображения" и нажать "Распознавание".
Особенности программы:
- Экспорт/импорт во многие форматы файлов (TXT, RTF, GIF, BMP и другие).
- Поддержка локального и сетевого сканирования.
- Выбор параметров сканирования документа.
- Определение области распознавания. Программа OCR CuneiForm в автоматическом режиме определяет расположение страницы, где и как расположен текст документа.
- Предварительный просмотр.
- Распознавание языков. В программе есть функция по распознаванию языков с латинским алфавитом, кириллическим алфавитом или двуязычных текстов. Кроме того, можно добавлять новые языки. Распознавание документов более чем на 20 языках
- Распознавание шрифтов. Возможность распознания любых шрифтов (за исключение рукописных).
- Распознавание таблиц. Возможность распознания табличных блоков (таблиц) и изображений.
- Распознавание текста. Программа хорошо распознает тексты на плохих ксерокопиях и распечатках, не изменяя структуру документа.
- Распознавание символов.
- Распознавание индексов и сносок.
- Сохранение структуры документа и его форматирования
- Словарная проверка для повышения качества распознавания
- Использование словарей. Для распознания текстов используются специальные словари, позволяющие распознавать слова в правильной форме.
- Проверка на орфографические ошибки сканируемого документа.
- Экспорт результатов сканирования в документы с расширением .txt, .rtf.
- Поддержка технологии Intel Pentium MMX для увеличения скорости распознавания текста на 30%.
- Поддержка интеграции с системой Евфрат.
- Поддержка справочной информации по работе с программой.
- Мультиязычный интерфейс, русский язык устанавливается по умолчанию в русскоязычных ОС Windows
- Программа полностью бесплатна
Важно, от разработчиков программы
Ошибка передачи данных при работе со сканерами HP, Epson, BENQ, Canon, Xerox, Mustek и др.
Описание ошибки:
Причина в особенностях работы TWAIN драйверов сканера, в CuneiForm используются 2 режима передачи memory-buffered (режим по умолчанию) и memory-native. Раньше драйвера сканера не всегда реализовали оба, или один из них был не очень стабилен. Была ситуация когда это зависело и от производителя, и от версии драйвера. Сейчас у производителей промышленных сканеров (Fujitsu, Kodak и др.) поддерживаются все режимы, а у остальных производителей видимо ситуация с режимами передачи иногда остается нестабильной.
Лекарство:
Необходимо отредактировать файл face.ini, который находится в директории windows. Находим в файле ключ TWAIN_TransferMode и делаем его равным memory-native. То есть должно быть TWAIN_TransferMode=memory-native
Системные требования:
- Процессор с тактовой частотой 1200 MHz или более мощный
- Оперативная память 256 Мб или больше
- Свободное место на жёстком диске от 60 Мб
- Архитектура с разрядностью 32 бит или 64 бит (x86 или x64)
- Операционная система Windows XP, Windows Vista, Windows 7, Windows 8
|