Google запустила конкурента FineReader

В официальном блоге Google появилось сообщение о том, что компания Google добавила к системе оптического распознавания текста (OCR), доступного в рамках своего сервиса Google Docs, поддержку дополнительных 29 языков, в том числе русского. На данный момент OCR-система сервиса поддерживает 34 языка, большинство из которых европейские, а также упрощенный китайский. В будущем планируется значительное расширение списка языков.
Оцените:


Сервиса Google Docs может распознавать текст PDF-файлов, а также на отсканированных изображений и фотографий. Полученный текст импортируется в отдельный документ. OCR-система, встроенная в Google Docs, в некоторых случаях может успешно заменить платное специализированное программное обеспечение.
Напомним, что компания запустила OCR-систему в Google Docs летом прошлого года. Изначально сервис поддерживал только пять языков: английский, французский, итальянский, немецкий и испанский. Разработчики системы говорят, что обновленная версия теперь намного лучше распознает тексты на этих языках. Также сервис бережнее относиться к форматированию исходных документов и старается максимально приблизить вид распознанного текста к оригиналу.



Для распознавания текста нужно на странице загрузки документа установить флажок "Convert text from PDF or image files to Google Docs documents" и выбрать язык документа.

В результате на страницы сервиса будет загружен документ в исходном формате. Такой документ будет распознан системой и при его просмотре будет отображен оригинал и результат распознавания. Возможные ошибки, то есть слова, записанные с ошибками, система подчеркнет красным цветом.



Авторы сервиса утверждают, что в системе был улучшен алгоритм распознавания, что позволит электронной копии точнее воспроизводить оригинал.

Новый OCR-сервис компании Google будет конкурировать с проектом FineReader. Разработчик самого популярного приложения для распознавания тоже недавно запустил свой онлайновый сервис распознавания, который позволяет бесплатно распознавать ограниченное количество страниц текста.

Появление OCR-системы компании Google является положительным фактором и с точки зрения конкуренции на рынке, и с точки зрения улучшения возможностей онлайнового офисного пакета Google Docs.
Оцените:

Комментарии Facebook

Комментарии ВКонтакте