0
0
0
0 Корзина

«Яндекс» научился искать текст на фото

korallmicro-logo

Компания «Яндекс» анонсировала новую функцию в «Яндекс.Диске». Теперь пользователи могут осуществлять поиск текста на изображениях – за счет использования технологии распознавания.

В компании отметили, что за несколько лет у пользователей накопилось огромное количество отсканированных изображений – документы, объявления, визитки. В большинстве случаев такие файлы хранятся с шаблонными названиями, поэтому оперативно найти нужное изображение часто довольно сложно. Новый инструмент позволяет осуществлять поиск по «Диску» среди текста на картинках.

Сервис способен распознавать турецкие, украинские, английские и русские символы. Среди поддерживаемых файлов – PNG, GIF и JPEG.

Для запуска новой функции «Яндекс» просканировал все изображения, загруженные пользователями в сетевое хранилище. Анализ показал, что на 22% изображений находится текст. В настоящее время все загружаемые картинки автоматически проверяются на присутствие текста.

В основе нового инструмента лежит стандартная технология оптического распознавания текста. Компания разработала собственную универсальную систему, которая способна распознавать символы на картинках. Сервис состоит из двух компонентов – модуля распознавания и классификатора изображений.

Сначала система отбирает из массива картинок те, на которых может находиться текст. Далее алгоритм выделяет линии, на которых предположительно находится текст. После этого система оставляет только линии текста, в которых максимально уверена. На следующем этапе текст разбивается на отдельные символы. В процессе распознавания для каждого символа выделяются возможные варианты. К примеру, это могут быть символы, очень похожие между собой (цифра «0» и буквы «о», «О»). После этого применяется языковая модель – программа принимает решение, какой символ подходит лучше для данного текстового окружения.

Назад
Вперед
Нам важно ваше мнение