• Картограмма коррупции
  • Комплаенс-служба
Вестник Жетісу
  • Главная
  • Общество
  • Новости Казахстана
  • Экономика
  • Происшествия
  • Спорт
Нет результата
Посмотреть все результат
+24°C
$ 485.34
€ 564.45
₽ 6.53
  • Главная
  • Общество
  • Новости Казахстана
  • Экономика
  • Происшествия
  • Спорт
Нет результата
Посмотреть все результат
Вестник Жетісу
Главная Новости Новости Казахстана

«Қазақ тілі» и OpenAI: первые итоги цифровизации казахского языка

Созданные текстовые и аудиоресурсы станут важной основой для дальнейшего развития казахского языка в эпоху искусственного интеллекта и расширения его присутствия в глобальном цифровом пространстве.

Вестник Жетісу
Сегодня в 13:46
Новости Казахстана
«Қазақ тілі» и OpenAI: первые итоги цифровизации казахского языка

Пресс-служба Международного общества «Қазақ тілі»

9
просм.
WhatsappTelegram

В Астане представители Международного общества «Қазақ тілі» и компании OpenAI подвели первые итоги сотрудничества, направленного на расширение возможностей казахского языка в цифровой среде, передает Vestnik19.kz со ссылкой на пресс-службу Международного общества «Қазақ тілі».

Экспертам были представлены ключевые разработки проекта: текстовый корпус казахского языка объемом более 10 миллиардов токенов, аудиокорпус, включающий свыше 10 тысяч часов записей живой речи, а также система оценки больших языковых моделей AI Evaluation Benchmark Suite.

РЕКЛАМА

Соглашение о партнерстве между сторонами было подписано в ноябре 2025 года в Вашингтоне. Его цель — создание качественной языковой базы для совершенствования технологий искусственного интеллекта на казахском языке.

Текстовый корпус охватывает различные этапы развития языка, включая материалы казахской диаспоры за рубежом. В него вошли данные из сфер образования, науки, технологий, экономики, права, медицины, истории, этнографии и медиа. Все материалы прошли многоэтапную обработку, очистку и обезличивание данных.

В ходе презентации также были продемонстрированы достижения в области цифровизации. Точность системы оптического распознавания казахских текстов достигла 99%, аналогичный показатель зафиксирован у инструмента анализа сложных макетов документов.

Для оценки качества языковых моделей разработан специализированный бенчмарк, учитывающий особенности казахского языка и культуры. Он проверяет понимание текста, грамматику, использование пословиц и устойчивых выражений, качество перевода, а также другие параметры. Первые результаты показали высокие показатели в переводческих задачах — от 85 до 89 процентов.

Особое внимание уделяется развитию технологий распознавания речи. На сегодняшний день собрано и обработано 10 810 часов аудиоданных, включая тысячу часов вручную проверенных записей. Точность распознавания казахской речи уже превышает 92%, а в перспективе разработчики планируют довести этот показатель до 99%.

По мнению участников встречи, созданные текстовые и аудиоресурсы станут важной основой для дальнейшего развития казахского языка в эпоху искусственного интеллекта и расширения его присутствия в глобальном цифровом пространстве.

Тэги: казахский языктехнологияцифровизация

Будьте в центре событий!

Подписывайтесь на наши официальные каналы и получайте новости первыми:

Telegram Telegram Instagram Instagram
Президент Казахстана подписал конституционные законы о новой системе госуправления

Президент Казахстана подписал конституционные законы о новой системе госуправления

Вестник Жетісу
Сегодня в 17:39

Главой государства подписаны конституционные законы в целях реализации положений Конституции, принятой 15 марта 2026 года: 1. Конституционный закон «О Президенте...

Принцип «Закон и Порядок» должен стать частью национальной идентичности — Токаев

Принцип «Закон и Порядок» должен стать частью национальной идентичности — Токаев

Вестник Жетісу
Сегодня в 17:10

Выступление Главы государства на международном форуме «Административная юстиция и ее роль в обеспечении верховенства права». Уважаемые участники форума! Прежде всего,...

Более 6,9 млн человек приняли участие в экоакции «Таза Қазақстан»

Более 6,9 млн человек приняли участие в экоакции «Таза Қазақстан»

Вестник Жетісу
4 июня 2026, 18:42

В преддверии Дня экологии в Службе центральных коммуникаций состоялся брифинг с участием представителей министерства экологии и природных ресурсов РК. Спикеры...

Новости Казахстана

Президент Казахстана подписал конституционные законы о новой системе госуправления

Сегодня в 17:39
Новости Казахстана

Принцип «Закон и Порядок» должен стать частью национальной идентичности — Токаев

Сегодня в 17:10
Общество

Дебатный турнир, посвященный Дню госсимволов, прошел в Талдыкоргане

Сегодня в 16:18
Общество

В Жетісу разоблачили коллекторов с базой данных миллионов казахстанцев

Сегодня в 15:32
Общество

Встреча «Час эколога» прошла в Жетісу

Сегодня в 14:39

Сетевое издание www.vestnik19.kz

Собственник: ГКП на ПХВ «Жетісу Медиа» ГУ «Управление внутренней политики области Жетісу»

Редактор веб-сайта: Далекенова М.А.

Номер телефона приёмной: + 7 (7282) 40-20-43

Адрес редакции
Республика Казахстан, область Жетісу, г. Талдыкорган, ул. Балапанова, 28

Газета «Вестник Жетісу» поставлена на учет в Комитете информации Министерства информации и общественного развития Республики Казахстан.
№KZ27VPY00064533 от 13.02.2023 года.

Сетевое издание «www.vestnik19.kz» поставлено на учет в Комитете информации Министерства информации и общественного развития Республики Казахстан.  №KZ78VPY00064973 от 20.02.2023 года.

По вопросам коррупции: +7 (777) 388 0990 

age-registration-sign-18-plus-on-transparent-background-free-png
  • Главная
  • О газете
  • Подписка
  • Реклама
  • Контакты
Реклама +7 (747) 286 2041
© 2023-2025 «Вестник Жетісу». При копировании материалов ссылка на сайт обязательна | Политика конфиденциальности
Нет результата
Посмотреть все результат
  • Главная
  • Общество
  • Новости Казахстана
  • Экономика
  • Происшествия
  • Спорт

© 2025 vestnik19.kz