Google запустила конкурента FineReader

Сервиса Google Docs может распознавать текст PDF-файлов, а также на отсканированных изображений и фотографий. Полученный текст импортируется в отдельный документ. OCR-система, встроенная в Google Docs, в некоторых случаях может успешно заменить платное специализированное программное обеспечение.
Напомним, что компания запустила OCR-систему в Google Docs летом прошлого года. Изначально сервис поддерживал только пять языков: английский, французский, итальянский, немецкий и испанский. Разработчики системы говорят, что обновленная версия теперь намного лучше распознает тексты на этих языках. Также сервис бережнее относиться к форматированию исходных документов и старается максимально приблизить вид распознанного текста к оригиналу.

Для распознавания текста нужно на странице загрузки документа установить флажок "Convert text from PDF or image files to Google Docs documents" и выбрать язык документа.
В результате на страницы сервиса будет загружен документ в исходном формате. Такой документ будет распознан системой и при его просмотре будет отображен оригинал и результат распознавания. Возможные ошибки, то есть слова, записанные с ошибками, система подчеркнет красным цветом.

Авторы сервиса утверждают, что в системе был улучшен алгоритм распознавания, что позволит электронной копии точнее воспроизводить оригинал.
Новый OCR-сервис компании Google будет конкурировать с проектом FineReader. Разработчик самого популярного приложения для распознавания тоже недавно запустил свой онлайновый сервис распознавания, который позволяет бесплатно распознавать ограниченное количество страниц текста.
Появление OCR-системы компании Google является положительным фактором и с точки зрения конкуренции на рынке, и с точки зрения улучшения возможностей онлайнового офисного пакета Google Docs.
Комментарии Facebook
Комментарии ВКонтакте