Сбер обновил ГигаЧат — теперь нейросеть понимает более 30 языков народов РФ и стран СНГ
В обновлении ГигаЧата участвовали носители языков народов РФ и стран СНГ
Благодаря обновлению ГигаЧат стал лучше понимать более 30 языков, среди них:
- татарский,
- башкирский,
- чувашский,
- удмуртский,
- якутский,
- бурятский,
- осетинский,
- чеченский,
- карачаево-балкарский.
Для развития своей языковой ИИ-модели Сбер привлёк множество партнёров: например, Дом народов России, команду интернет-энциклопедии Рувики, а также региональные академии наук, университеты и профильные фонды.
Читайте также: Нейросети на «русском» — Алиса AI, ГигаЧат и другие: зачем бизнесу свой ИИ в 2026-м
Наборы данных для обучения нейросетей формировались на основе:
- архивных и современных текстов библиотек и образовательных учреждений,
- новостных и публицистических материалов,
- научных и учебных источников.
Во время обучения объём данных по каждому из языков составил от сотен тысяч до миллионов документов. В процессе также участвовали носители языков, которые проверяли корректность, грамматику и соответствие ответов нейросети естественной речи.
Обновление нейросети расширит доступ к технологиям для пользователей разных возрастов
Пользователю достаточно текстом задать запрос на нужном языке, и ИИ-помощник будет использовать его в ответах. Благодаря этому представители народов России и стран СНГ на своём родном языке смогут:
- искать информацию с помощью ИИ-модели и обучаться,
- готовить документы,
- взаимодействовать с цифровыми сервисами и госорганами.
В Сбере отмечают, что обновление нейросети расширяет доступ к технологиям для пользователей разных возрастов и способствует сохранению языкового и культурного наследия.
ГигаЧат понимает литературный и разговорный стиль общения пользователя
Разработчики ГигаЧата адаптировали алгоритмы обработки национальных языков в ИИ-модели. Теперь нейросеть выдаёт более качественные ответы даже при относительно небольших наборах данных для обучения.
Эффективность работы нейросети на языках народов России и стран СНГ стала выше благодаря тому, что ГигаЧат обучили и литературному, и разговорному вариантам языка — нейросеть понимает любой стиль общения пользователя.
Контекст
Ранее Сбер представил новую версию помощника на базе модели ГигаЧат Ультра. Среди ключевых обновлений:
- модель запоминает диалог с пользователем,
- персонализация ответов с учётом интересов и предпочтений человека,
- автоматический поиск информации в интернете,
- увеличение скорости генерации ответов нейросети в 2 раза.
Читайте также: Сбер обновил свой ГигаЧат: ИИ-помощник научился запоминать данные о пользователе и стал вдвое быстрее
