В Сети создан Национальный корпус башкирского языка16.04.2019
В интернете заработал сайт Национального корпуса башкирского языка — результат безвозмездного сотрудничества специалистов по компьютерной лингвистике и языковых активистов сообщества «Башкирские проекты». Появление корпуса стало возможным благодаря специальной компьютерной программе, способной делать морфологический анализ башкирской словоформы. Программа создана доцентом Школы лингвистики Национального исследовательского университета «Высшая школа экономики» (Москва) Борисом Ореховым, уроженцем города Уфы.

«Такой крупный и развитый язык, как башкирский, давно нуждался в своем корпусе. Национальный корпус является важной частью современной цифровой жизни родного языка, способствует её сохранению и развитию, служит стилистическим и грамматическим справочником, помогает в преподавании и в научных исследованиях, а также может быть базой для разработки сложных систем искусственного интеллекта, понимающих башкирский язык. В данный момент в корпусе башкирского языка более 20 миллионов словоупотреблений, что соответствует примерно 180 томам бумажных книг. В корпус включены художественные произведения, законы, газетные и журнальные статьи, некоторые статьи башкирского раздела Википедии. У сайта дружественный интерфейс, позволяющий любому человеку проверить свою языковую интуицию, правильно ли он употребляет то или иное башкирское слово. Есть простейшая инструкция как пользоваться корпусом.

Хотя один человек за целый год не прочтет все его содержание, по современным меркам корпус считается небольшим. И важно, чтобы он продолжал расти как по объему, так и по качеству. Мы очень надеемся, что люди и организации, заинтересованные в развитии башкирского языка, помогут нам сделать корпус лучше», — рассказал агентству «Башинформ» главный разработчик Национального корпуса башкирского языка Борис Орехов.


Вернуться назад