Нейросети «Яндекса» смогут расшифровывать архивы с дореволюционной орфографией

Для обучения сети ученые использовали данные из сотен тысяч рукописных строк из реальных текстов XVIII - XIX веков и десятков миллионов сгенерированных примеров.
Для обучения сети ученые использовали данные из сотен тысяч рукописных строк из
реальных текстов XVIII — XIX веков и десятков миллионов сгенерированных
примеров.

Нейросети компании «Яндекс» смогут расшифровывать архивные записи с дореволюционной орфографией. Технологией можно воспользоваться через сервис «Поиск по архивам». Об этом сообщили РИА Новости со ссылкой на пресс-службу компании.

Как поделились в сообщении, в сервисе архивного поиска открыт доступ к более чем к 2,5 миллиона страниц исторических документов с текстовой расшифровкой. Сервис будет оптически распознавать символы, учитывать особенности почерка, восстановит утратившие актуальность буквы и поймет особенную структуру архивных материалов.

Для обучения нейросети ученые использовали данные из сотен тысяч рукописных строк из реальных текстов XVIII — XIX веков и десятков миллионов сгенерированных примеров. Специалисты перевели шифры, а затем проконтролировали качество распознавания сетью. 

По данным представителей компании, новая функция повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье. В скором будущем объем хранилища и доступных отсканированных материалов увеличат.

Документы все желающие смогут найти по каталогу или через строку поиска. Еще их можно будет отфильтровать по годам, архивам, фондам и описям.

Ранее KazanFirst писал, что приложения «ВК», «Яндекс» и «Рутуб» будут предустанавливать на ввозимые в Россию устройства.


Читайте также: Яндекс Доставка отправит посылки из Татарстана в другие города. Новый сервис в Яндекс Go будет полезен как предпринимателям, так и простым жителям Татарстана


Comment section

Добавить комментарий

Войти: 

Ваш адрес email не будет опубликован. Обязательные поля помечены *