Казахстанский стартап создал первую в Центральной Азии ИИ-модель для распознавания тюркских языков
Казахстанский технологический стартап Cybernet AI представил революционную разработку в области искусственного интеллекта — первую в Центральной Азии полноценную модель автоматического распознавания речи (ASR), созданную специально для тюркских языков. Это не адаптация западных решений, а уникальная система, изначально разработанная с учётом лингвистических, фонетических и культурных особенностей тюркской языковой группы. До сих пор страны региона были вынуждены использовать международные ASR-модели, ориентированные в первую очередь на английский язык. Такие системы плохо справлялись с распознаванием тюркской фонетики, специфических звуков, акцентов и, что особенно важно, с явлением языкового кода — смешанной тюркско-русской речи. Именно на этом гибридном формате общения строится множество повседневных диалогов в сфере обслуживания, бизнеса и при получении государственных услуг в Казахстане, Узбекистане, Кыргызстане и других странах. Как сообщают последние новости технологий, новая модель от Cybernet AI была обучена на обширных массивах речевых данных на казахском, турецком, узбекском, кыргызском, азербайджанском и татарском языках. Её ключевое преимущество — способность корректно и с высокой точностью распознавать естественную, «живую» речь, где предложения могут начинаться на одном языке и заканчиваться на другом. Система устойчива к фоновым шумам и различным акцентам, что критически важно для её практического применения.
«Мы сознательно отказались от пути простой адаптации англоязычных моделей. Наша цель — создать технологию, которая глубоко понимает реальную речь нашего региона. Это больше, чем продукт. Это вклад в формирование собственной технологической экосистемы и цифрового суверенитета», — подчеркнул CTO Cybernet AI Рашид Исмаилов.
Разработка открывает новые возможности для бизнеса и государства. Модель ориентирована на секторы с огромными объёмами голосовых коммуникаций: банки и финтех, телекоммуникации, контакт-центры, логистика, сервисные компании и госорганы. Внедрение такой системы позволит автоматизировать анализ звонков, повысить качество клиентского сервиса, создать голосовых помощников, понимающих местный контекст, и сделать цифровые услуги по-настоящему инклюзивными.
Проект был реализован при стратегической поддержке международного технопарка IT-стартапов Astana Hub и Министерства искусственного интеллекта и цифрового развития Казахстана, с использованием мощной GPU-инфраструктуры Microsoft.
«Эта разработка — важный шаг от роли потребителя глобальных ИИ-решений к статусу разработчика конкурентоспособных на международном уровне технологий. Она даёт всему тюркоязычному миру инструмент для масштабирования цифровых сервисов на родных языках без потери качества», — отметил управляющий директор Astana Hub Танат Ускембаев.
Успех Cybernet AI является частью более масштабного тренда. Напомним, что в 2025 году стартап получил грант в $350 000 и вошёл в престижную программу Microsoft for Startups, а Казахстан официально выразил готовность участвовать в создании большой языковой модели (LLM) для тюркских языков. Создание собственной ASR-модели — это фундаментальный кирпичик в построении целостной и независимой экосистемы искусственного интеллекта, которая говорит и понимает на языках региона.

Комментарии