• Картограмма коррупции
  • Комплаенс-служба
Вестник Жетісу
  • Главная
  • Общество
  • Новости Казахстана
  • Экономика
  • Происшествия
  • Спорт
Нет результата
Посмотреть все результат
+29°C
$ 485.34
€ 564.45
₽ 6.53
  • Главная
  • Общество
  • Новости Казахстана
  • Экономика
  • Происшествия
  • Спорт
Нет результата
Посмотреть все результат
Вестник Жетісу
Главная Новости Новости Казахстана

«Қазақ тілі» и OpenAI: первые итоги цифровизации казахского языка

Созданные текстовые и аудиоресурсы станут важной основой для дальнейшего развития казахского языка в эпоху искусственного интеллекта и расширения его присутствия в глобальном цифровом пространстве.

Вестник Жетісу
Сегодня в 13:46
Новости Казахстана
«Қазақ тілі» и OpenAI: первые итоги цифровизации казахского языка

Пресс-служба Международного общества «Қазақ тілі»

6
просм.
WhatsappTelegram

В Астане представители Международного общества «Қазақ тілі» и компании OpenAI подвели первые итоги сотрудничества, направленного на расширение возможностей казахского языка в цифровой среде, передает Vestnik19.kz со ссылкой на пресс-службу Международного общества «Қазақ тілі».

Экспертам были представлены ключевые разработки проекта: текстовый корпус казахского языка объемом более 10 миллиардов токенов, аудиокорпус, включающий свыше 10 тысяч часов записей живой речи, а также система оценки больших языковых моделей AI Evaluation Benchmark Suite.

РЕКЛАМА

Соглашение о партнерстве между сторонами было подписано в ноябре 2025 года в Вашингтоне. Его цель — создание качественной языковой базы для совершенствования технологий искусственного интеллекта на казахском языке.

Текстовый корпус охватывает различные этапы развития языка, включая материалы казахской диаспоры за рубежом. В него вошли данные из сфер образования, науки, технологий, экономики, права, медицины, истории, этнографии и медиа. Все материалы прошли многоэтапную обработку, очистку и обезличивание данных.

В ходе презентации также были продемонстрированы достижения в области цифровизации. Точность системы оптического распознавания казахских текстов достигла 99%, аналогичный показатель зафиксирован у инструмента анализа сложных макетов документов.

Для оценки качества языковых моделей разработан специализированный бенчмарк, учитывающий особенности казахского языка и культуры. Он проверяет понимание текста, грамматику, использование пословиц и устойчивых выражений, качество перевода, а также другие параметры. Первые результаты показали высокие показатели в переводческих задачах — от 85 до 89 процентов.

Особое внимание уделяется развитию технологий распознавания речи. На сегодняшний день собрано и обработано 10 810 часов аудиоданных, включая тысячу часов вручную проверенных записей. Точность распознавания казахской речи уже превышает 92%, а в перспективе разработчики планируют довести этот показатель до 99%.

По мнению участников встречи, созданные текстовые и аудиоресурсы станут важной основой для дальнейшего развития казахского языка в эпоху искусственного интеллекта и расширения его присутствия в глобальном цифровом пространстве.

Тэги: казахский языктехнологияцифровизация

Будьте в центре событий!

Подписывайтесь на наши официальные каналы и получайте новости первыми:

Telegram Telegram Instagram Instagram
Более 6,9 млн человек приняли участие в экоакции «Таза Қазақстан»

Более 6,9 млн человек приняли участие в экоакции «Таза Қазақстан»

Вестник Жетісу
4 июня 2026, 18:42

В преддверии Дня экологии в Службе центральных коммуникаций состоялся брифинг с участием представителей министерства экологии и природных ресурсов РК. Спикеры...

Токаев: Уважение к государственным символам — высшая мера патриотизма

Токаев: Уважение к государственным символам — высшая мера патриотизма

Вестник Жетісу
4 июня 2026, 13:56

Выступление Главы государства Касым-Жомарта Токаева на церемонии поднятия Государственного флага. ​Уважаемые соотечественники! ​Поздравляю вас с Днем государственных символов! Это праздник,...

В Астане отдали дань уважения государственным символам страны

В Астане отдали дань уважения государственным символам страны

Вестник Жетісу
4 июня 2026, 12:59

В Астане, на территории этномемориального комплекса «Атамекен», состоялась торжественная церемония поднятия Государственного Флага Республики Казахстан с участием Президента страны Касым-Жомарта...

Общество

Дебатный турнир, посвященный Дню госсимволов, прошел в Талдыкоргане

Сегодня в 16:18
Общество

В Жетісу разоблачили коллекторов с базой данных миллионов казахстанцев

Сегодня в 15:32
Общество

Встреча «Час эколога» прошла в Жетісу

Сегодня в 14:39
Новости Казахстана

«Қазақ тілі» и OpenAI: первые итоги цифровизации казахского языка

Сегодня в 13:46
Общество

XXII трудовой сезон молодежных отрядов «Жасыл ел» откроется в Жетісу

Сегодня в 13:02

Сетевое издание www.vestnik19.kz

Собственник: ГКП на ПХВ «Жетісу Медиа» ГУ «Управление внутренней политики области Жетісу»

Редактор веб-сайта: Далекенова М.А.

Номер телефона приёмной: + 7 (7282) 40-20-43

Адрес редакции
Республика Казахстан, область Жетісу, г. Талдыкорган, ул. Балапанова, 28

Газета «Вестник Жетісу» поставлена на учет в Комитете информации Министерства информации и общественного развития Республики Казахстан.
№KZ27VPY00064533 от 13.02.2023 года.

Сетевое издание «www.vestnik19.kz» поставлено на учет в Комитете информации Министерства информации и общественного развития Республики Казахстан.  №KZ78VPY00064973 от 20.02.2023 года.

По вопросам коррупции: +7 (777) 388 0990 

age-registration-sign-18-plus-on-transparent-background-free-png
  • Главная
  • О газете
  • Подписка
  • Реклама
  • Контакты
Реклама +7 (747) 286 2041
© 2023-2025 «Вестник Жетісу». При копировании материалов ссылка на сайт обязательна | Политика конфиденциальности
Нет результата
Посмотреть все результат
  • Главная
  • Общество
  • Новости Казахстана
  • Экономика
  • Происшествия
  • Спорт

© 2025 vestnik19.kz