Технология позволяет структурировать контент иначе: модель способна генерировать фрагменты текста в произвольном порядке, самостоятельно определяя логику построения ответа. По словам инженера Сбера Даниила Тихонова, такой подход эффективнее использует обучающие данные и дает больше свободы при работе с генерацией. Помимо самой нейросети, банк опубликовал инструменты для оптимизации обучения диффузионных моделей, которые позволяют снизить количество необходимых видеокарт. Поддержка новинки уже интегрирована в SGLang. Технический директор фундаментальных моделей GigaChat Федор Минькин подчеркнул, что проект стал важным шагом для российского ИИ-сообщества, так как масштабные диффузионные решения для текста ранее не были доступны в открытом сегменте.
Комментарии (0)
Пока нет комментариев. Будьте первым!