SHERKALA — революционная языковая модель для казахского языка

SHERKALA — революционная языковая модель для казахского языка

Запущена первая казахская языковая модель под названием Sherkala. Проект направлен на расширение возможностей более 13 миллионов носителей казахского языка, обеспечивая им доступ к передовым технологиям генеративного ИИ.

Ведущий разработчик AI-решений эмиратская компания Inception (G42) совместно с Университетом искусственного интеллекта Мохаммеда бин Зайеда (MBZUAI) и при поддержке Cerebras объявили о запуске SHERKALA — первой высокоточной казахской языковой модели (LLM).

SHERKALA — это модель с восьми миллиардами параметров, обученная на 45 миллиардах слов с основным фокусом на казахском языке, а также поддержкой английского, русского и турецкого. Она использует Llama 3.1, адаптированную для казахского языка, с расширением токенизатора на 25%, что повышает эффективность понимания и генерации текста. Обучение модели проходило на Condor Galaxy, одном из самых мощных суперкомпьютеров для ИИ, созданном G42 и Cerebras.

Запуск SHERKALA — это важный шаг в поддержке языковых сообществ, которые раньше были недостаточно представлены в AI. Вместе с MBZUAI мы создали модель, которая поможет носителям казахского языка и изменит рынок LLM, сделав технологии более доступными и эффективными. С моделями JAIS для арабского, NANDA для хинди и теперь SHERKALA для казахского мы продолжаем расширять границы AI и обеспечивать языковое разнообразие в цифровом мире», — отметил доктор Эндрю Джексон, CEO Inception (G42).

SHERKALA задаёт новый уровень для казахских языковых моделей, отлично справляясь с пониманием и созданием текстов. Благодаря эффективной работе с токенами и продвинутым диалоговым возможностям, она обходит более крупные модели, включая те, что в несколько раз превышают её по параметрам.

Мы рады работать с Inception над SHERKALA — передовой казахской AI-моделью. Этот проект помогает развивающимся рынкам, делает AI доступнее, сохраняет язык и поддерживает цифровые сообщества», — заявил Преслав Наков, заведующий кафедрой и профессор обработки естественного языка в MBZUAI.

SHERKALA теперь доступна как open-source модель на Hugging Face.

#партнёрский
Читайте также
Читайте также
Читайте также
Читайте также
Читайте также
Читайте также
Читайте также
Читайте также
Читайте также
Читайте также
Читайте также
Дунхуа: как китайцы делают аниме
Культура
#кино
Дунхуа: как китайцы делают аниме
Park Live Almaty объявил хедлайнеров
Город
#события
Park Live Almaty объявил хедлайнеров
В Казахстане представлен первый в мире прозрачный и беспроводной телевизор LG OLED T
Бизнес
#технологии
В Казахстане представлен первый в мире прозрачный и беспроводной телевизор LG OLED T
Из алгоритмов в чарты: ребрендинг Эддисон Рэй
Культура
#музыка
Из алгоритмов в чарты: ребрендинг Эддисон Рэй
«Грешники» — маленькая победа большого авторского кино
Культура
#кино
«Грешники» — маленькая победа большого авторского кино