
OpenAI объявила о запуске двух новых моделей с открытыми весами — gpt-oss-120b и gpt-oss-20b, которые обещают значительные усовершенствования в области логического мышления и доступности ИИ-технологий.
Эти модели, которые можно найти на платформе Hugging Face под лицензией Apache 2.0, могут быть модифицированы и использованы в коммерческих целях, что открывает новые горизонты для разработчиков и исследователей.
Читайте также: Все ИИ-модели от OpenAI
Что такое GPT-OSS и как это функционирует
Модели gpt-oss-120b и gpt-oss-20b представляют собой новые этапы в эволюции открытых языковых моделей. gpt-oss-120b содержит 120 миллиардов параметров, из которых 5,1 миллиарда активных, а gpt-oss-20b включает 20 миллиардов параметров, с 3,6 миллиардами активных. Обе модели показывают отличные результаты в решении логических задач и могут функционировать на стандартных потребительских устройствах.
gpt-oss-120b практически сравнима с моделью o4-mini по ключевым бенчмаркам, при этом она эффективно работает на одном GPU с 80 ГБ памяти. В то же время, gpt-oss-20b может быть развернута на устройствах с 16 ГБ памяти и по точности ответов близка к модели o3-mini. Обе модели оптимизированы для широкого спектра приложений, включая локальные вычисления и решения с низкой задержкой.
Это первые открытые языковые модели OpenAI с момента появления GPT-2 более пяти лет назад. Модели gpt-oss-120b и gpt-oss-20b обладают значительно улучшенной производительностью и безопасностью по сравнению с предыдущими версиями. Они способны решать сложные задачи рассуждения и эффективно использовать инструменты, такие как веб-поиск и выполнение Python-кода.
Модели доступны на платформе Hugging Face, где разработчики могут протестировать их с помощью демоверсии и интегрировать в свои проекты. Кроме того, благодаря открытым весам, эти модели можно адаптировать под индивидуальные задачи, модифицировать и использовать в коммерческих целях.
Результаты тестирования и сравнение с конкурентами
В тестах, таких как «Последний экзамен человечества», который оценивает способности ИИ в академических вопросах, модели gpt-oss-120b и gpt-oss-20b продемонстрировали высокую точность. Особенно примечательны их результаты на канонических бенчмарках, где gpt-oss-120b показала результаты, сопоставимые с моделью o4-mini, а gpt-oss-20b — с o3-mini.

Выпуск этих моделей с открытыми весами представляет собой значительный прогресс для разработчиков и исследователей, предоставляя доступ к мощным инструментам для создания и развертывания ИИ на своих собственных инфраструктурах.
Разработчики могут начать использовать модели gpt-oss прямо сейчас, воспользовавшись доступными на Hugging Face ресурсами и демоверсией.
Ранее Google представила ИИ-модель Genie 3 для создания интерактивных 3D-миров.


