реальных текстов XVIII — XIX веков и десятков миллионов сгенерированных
примеров.
Нейросети компании «Яндекс» смогут расшифровывать архивные записи с дореволюционной орфографией. Технологией можно воспользоваться через сервис «Поиск по архивам». Об этом сообщили РИА Новости со ссылкой на пресс-службу компании.
Как поделились в сообщении, в сервисе архивного поиска открыт доступ к более чем к 2,5 миллиона страниц исторических документов с текстовой расшифровкой. Сервис будет оптически распознавать символы, учитывать особенности почерка, восстановит утратившие актуальность буквы и поймет особенную структуру архивных материалов.
Для обучения нейросети ученые использовали данные из сотен тысяч рукописных строк из реальных текстов XVIII — XIX веков и десятков миллионов сгенерированных примеров. Специалисты перевели шифры, а затем проконтролировали качество распознавания сетью.
По данным представителей компании, новая функция повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье. В скором будущем объем хранилища и доступных отсканированных материалов увеличат.
Документы все желающие смогут найти по каталогу или через строку поиска. Еще их можно будет отфильтровать по годам, архивам, фондам и описям.
Ранее KazanFirst писал, что приложения «ВК», «Яндекс» и «Рутуб» будут предустанавливать на ввозимые в Россию устройства.
Comment section