«Авито» открыла исходный код своих ИИ-моделей

Компания «Авито» представила обновленные версии своих ИИ-моделей – текстовую A-Vibe и мультимодальную A-Vision, каждая из которых содержит 8 миллиардов параметров. Эти нейросети стали первыми открытыми разработками российской компании, специально разработанными для задач в области электронной коммерции и адаптированными для работы с русским языком. Об этом сообщил IT Speaker в пресс-службе «Авито».

Разработчики, стартапы, исследователи и бизнес теперь могут воспользоваться готовыми инструментами для анализа документов, автоматизации создания контента и разработки ИИ-ассистентов. Как подчеркивают в компании, использование этих моделей позволяет снизить затраты на запуск и эксплуатацию до 50% по сравнению с другими открытыми нейросетями. Модели имеют собственный токенизатор и поддерживают вызов внешних инструментов, что открывает возможности для создания автономных систем и агентов. Общий объем инвестиций в разработку составил около полумиллиарда рублей, включая расходы на оборудование, команду и эксперименты.

Текстовая модель A-Vibe уже заняла первое место в категории легких нейросетей в популярных открытых тестах на понимание русского языка, работу с кодом и решение сложных задач. Обе модели распространяются под лицензией Apache 2.0, что позволяет их свободное использование для любых целей.

«Запуск наших генеративных ИИ-моделей – это вложение в будущее российской технологической экосистемы. Благодаря таким инициативам ИИ становится доступным не только для крупных компаний, но и для студентов, стартапов, исследователей и небольших команд. Чем больше разработчиков участвует в создании ИИ-решений, тем быстрее развивается вся отрасль. Мы стремимся внести свой вклад в этот процесс», – прокомментировал управляющий директор по искусственному интеллекту «Авито» Андрей Рыбинцев.

Модели A-Vibe и A-Vision были разработаны технологическим отделом компании на основе открытых архитектур Qwen3 и Qwen2.5-VL, но были глубоко адаптированы к особенностям российского рынка. Ключевым преимуществом стало создание собственного токенизатора для русского текста, который увеличивает скорость генерации почти вдвое и обеспечивает более точные результаты по сравнению с зарубежными аналогами.

Обучение проводилось на реальных данных из области электронной коммерции, благодаря чему модели понимают контекст онлайн-торговли и эффективно работают с описаниями товаров, каталогами и запросами покупателей без дополнительной доработки. Нейросети способны обрабатывать до 100 страниц текста за один запрос и готовы к использованию без сложной настройки, понимая простые команды, такие как «сделай резюме документа» или «проанализируй таблицу».

Поддержка вызова внешних инструментов позволяет создавать ИИ-агентов, которые не только отвечают на вопросы, но и самостоятельно выполняют действия: ищут информацию в базах данных, производят расчеты, обращаются к другим сервисам через API.

Модели могут быть применены в различных областях: бизнес сможет автоматизировать обработку документов и создание контента, разработчики получат возможность дообучать модели под конкретные задачи, а образовательные и научные учреждения – использовать их в учебных процессах и исследованиях.

«Рынок остро нуждается в качественных русскоязычных моделях с открытым кодом. Компании тратят месяцы на адаптацию зарубежных решений под российские реалии. Мы предоставляем готовые инструменты, которые экономят миллионы рублей на разработке. Наши модели компактны и оптимизированы для эффективного использования ресурсов, что особенно важно для стартапов и образовательных инициатив», – отметила руководитель разработки больших языковых моделей «Авито» Анастасия Рысьмятова.

Для объективной оценки качества работы с русским языком команда «Авито» перевела четыре ведущих международных бенчмарка (MATH-500, GPQA Diamond, DROP_RU и DROP_RU) и опубликовала их в открытом доступе. Модели уже продемонстрировали высокие результаты в тестах на решение математических задач, понимание научных текстов и работу с внешними инструментами.

Ранее команда искусственного интеллекта «Авито» разработала платформу BAT (Benchmark for Auto-bidding Task). Это первый отечественный open-source тренажер, с помощью которого можно тестировать и оптимизировать алгоритмы ставок в рекламных аукционах. Тренажер уже доступен всем разработчикам на GitHub.

Вас может заинтересовать:

В «Авито» появилась должность управляющего директора по ИИ

«Авито» открыла исходный код своих ИИ-моделей

Популярные новости

Ремейк Assassin’s Creed IV: Black Flag слили за день до релиза

«Ростелеком» обновил систему защиты от DDoS-атак

Госдума приняла закон о маркировке ИИ-контента

edna: цифровая нагрузка россиян выросла на 80%

Спецкостюм позволит тараканам-киборгам дышать под водой до трех часов

Последние новости

Ремейк Assassin’s Creed IV: Black Flag слили за день до релиза

«Ростелеком» обновил систему защиты от DDoS-атак

Госдума приняла закон о маркировке ИИ-контента

edna: цифровая нагрузка россиян выросла на 80%

Спецкостюм позволит тараканам-киборгам дышать под водой до трех часов

НазадВКонтакте представила «Тренды» в клипах — новый инструмент для авторов

ДалееLime стал лидером среди российских брендов одежды в этом году

«Авито» открыла исходный код своих ИИ-моделей

Популярные новости

Последние новости

НазадВКонтакте представила «Тренды» в клипах — новый инструмент для авторов

ДалееLime стал лидером среди российских брендов одежды в этом году

Лучшее от AllWeb.ru

Минцифры признало срыв импортозамещения и ищет новые стимулы для бизнеса

Что такое промт-инжиниринг и кто такие промпт-инженеры — простыми словами

Selectel запустил сервис аварийного восстановления инфраструктуры