Ученые Татарстана загрузили татарский язык в нейросеть

Разработчики утверждают, что татарстанский машинный онлайн-переводчик даже превосходит аналогичные сервисы таких интернет-гигантов, как «Яндекс» и Google.

Академия наук Татарстана открыла неделю научных мероприятий и круглых столов, приурочив их к Году родных языков и народного единства в республике. Президент АН РТ Мякзюм Салахов заявил, что современный мир диктует новые условия для деятельности ученых. На передний план выходит необходимость чаще прибегать к мероприятиям (круглые столы, конференции, заседания и так далее) в режиме онлайн, а также популяризация. Салахов признался, что у научного сообщества Татарстана есть проблемы с последним.

- Недостаток нашей Академии, может, и российской науки в целом - нет идеи популяризации, идеи довести знание до населения, до других ученых. Вот те достижения, которые мы знаем, - они в основном в узком кругу ученых, которые друг друга знают, ну 500 человек. Для меня была откровением тема по татарским говорам. На уровне ученых много что решено. Но на новом этапе тема опять всплыла. Нам в Академии нужно большое внимание уделять популяризации. Мы каждый год об этом говорим, - заявил Салахов.

В качестве примера он привёл слова советского и американского физика Роальда Сагдеева, который рассказал президенту АН РТ, в какой логике работают западные ученые. Суть в том, что физики, химики и другие деятели науки, конечно, подсчитывают свои достижения, но они также заинтересованы обращаться в СМИ, обсуждать свои новации по телевидению, радио, в интернете. Таким образом, они доказывают свою полезность обществу, чтобы получить государственный грант на дальнейшие изыскания. Почему сами ученые заинтересованы в популяризации? Потому что на Западе налогоплательщики оплачивают их труд и хотели бы получить от них и научное просвещение.

Салахов также рассказал, например, что относительно недавно узнал о достижениях в науке татарстанских диалектологов в вопросе изучения татарского языка. Наукообразное описание татарского языка, всех его говоров, диалектов было уже осуществлено Институтом языка, литературы и искусства имени Ибрагимова АН РТ, ещё в конце 90-х годов прошлого века составлен Атлас татарского языка как в виде книжных изданий, так и электронного сайта. Мякзюм Салахов тут, конечно, недоговорил, но явно имел в виду историю с «северо-западным диалектом башкирского», которая обострилась накануне проведения Всероссийской переписи населения. Атлас татарского языка - это как раз своеобразная перепись татарских населенных пунктов за пределами Татарстана, в том числе и в Башкортостане. А там казанские диалектологи на протяжении всего ХХ века никакого «северо-западного диалекта башкирского языка» не обнаруживают.

Директор Института прикладной семиотики АН РТ Ринат Гильмуллин рассказал о современных IT-разработках для татарского языка. Вообще, Институт сыграл в последние 30 лет одну из решающих ролей для татарского языка. Именно благодаря его специалистам, например, в 1995 году татарский был включен в список языков операционной системы Windows.

Ринат Гильмуллин также рассказал о сайте Tatsoft.tatar, где на сегодня собраны все программы и программные обеспечения, локализованные с татарским, практически на всех современных платформах (в том числе Android, Linux, Mac, iOS и так далее). На сегодня с этого сайта приложения скачали более 300 тысяч раз.

Замдиректора Института прикладной семиотики Айдар Хусаинов рассказал о сайте машинного перевода «тат-рус» и «рус-тат» Translate.tatar. Ресурс работает уже около года, поэтому можно подвести кое-какие итоги его функционирования.

- Для кого нужен этот сайт? Как мы поняли по количеству пользователей, он нужен для студентов и школьников, которые изучают татарский язык. Но и бывает нужен для подготовки докладов, в переводе каких-то книг или информации на том или ином языке, - заявил Хусаинов.

По его словам, татарстанский машинный онлайн-переводчик даже превосходит «Яндекс-переводчик» и «Google-переводчик». С недавних пор у республиканского переводчика появилась возможность озвучивания татарского текста или слов.

Совсем недавно у сайта появился подраздел (Turk., где есть уже не только татарский язык, но и ещё пять тюркских языков (киргизский, казахский, узбекский, чувашский, крымско-татарский). Функции все те же - перевод отдельных слов, перевод текстов. Но пока без озвучивания текста.

Хусаинов рассказал, что русско-татарский словарь представляет собой нейросетевую систему, которая учится переводить с каждым разом всё лучше и лучше, по мере того, как часто пользуются этим переводчиком.

С добавлением в эту сеть пяти тюркских языков машина ещё лучше стала учиться переводу.

- Например, мы на казахском загрузили какую-то информацию об одном из казахских писателей. Наша машина запомнила много слов из его биографии, как точно переводится фамилия этого писателя. Полученную информацию система теперь может использовать, например, при переводах с русского на крымско-татарский язык, - заключил ученый.

Понравился материал? Поделись в соцсетях
2 КОММЕНТАРИЯ
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Катя
Само приложение нужная вещь, часто нужно что-то перевести и в переводчиках всегда ошибки, надеюсь это будет справляться лучше
6
1
Ответить

downloadfile-iconquotessocial-inst_colorwrite