В ХМАО создадут корпус хантыйского языка с четырьмя диалектами
Источник: Служба новостей NEFT
В ХМАО приступают к созданию национального корпуса хантыйского языка. На реализацию проекта власти округа выделили 6,8 млн рублей. Соответствующий тендер размещен на портале госзакупок.
Исполнителю предстоит обработать 80 100 параллельных предложений «хантыйский — русский» в сервисе разметки Югорского НИИ информационных технологий. Самый большой массив придется на казымский (не менее 40,5 тыс. предложений) и сургутский (не менее 32 тыс.) диалекты. Также в корпус войдут ваховский и среднеобской варианты языка.
Каждая карточка будет сопровождаться профессиональной аудиозаписью. Все материалы пройдут двойную экспертизу — при выявлении ошибок их вернут на доработку. Работы разделены на три этапа и должны завершиться к 30 ноября 2026 года, при этом ежемесячно планируется обрабатывать не менее 10 тыс. карточек.
Ранее проект анонсировал губернатор ХМАО Руслан Кухарук. Заказчиком выступает департамент госзаказа, инициатором — Обско-угорский институт прикладных исследований и разработок.
Проект станет продолжением цифровизации языков коренных народов. Созданный корпус мансийского языка уже интегрирован в сервисы «Яндекса». Новый ресурс будет доступен онлайн и предназначен для педагогов, студентов и исследователей.
Ранее NEFT рассказывала, что мессенджере MAX запустили первого ИИ-собеседника, который может общаться на мансийском языке.