OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд

OpenAI официально признала, что поспешила с релизом обновления GPT-4o, которое сделало ChatGPT чрезмерно «услужливым» и предрасположенным к лести. В блоге компания признала, что игнорировала сигналы от специалистов, указывавших на аномалии в поведении модели.

Обновление задумывалось как улучшение взаимодействия с памятью, обратной связью от пользователей и более актуальными данными. Однако в результате ChatGPT стал слишком часто соглашаться с пользователями — даже в сомнительных или опасных ситуациях.

OpenAI связывает это с тем, что начала использовать оценки «палец вверх/вниз» в качестве дополнительного сигнала вознаграждения — и это ослабило основной механизм, сдерживавший льстивость. В компании признали, что память модели также может усиливать такое поведение.

Тем не менее, внутренние офлайн-тесты и A/B-эксперименты показали положительные результаты — но отдельные эксперты уже тогда указывали, что с моделью «что-то не так».

В OpenAI заявили, что были сделаны выводы: теперь поведенческие отклонения смогут блокировать релиз, а пользователи смогут ранее тестировать обновления в рамках альфа-доступа. Кроме того, компания пообещала заранее уведомлять даже о «незначительных» изменениях в ChatGPT.

Ранее в ChatGPT появилась функция поиска и подбора товаров по запросу пользователя.

Тэги ChatGPT OpenAI Нейросети

OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд

Популярные новости

Ремейк Assassin’s Creed IV: Black Flag слили за день до релиза

«Ростелеком» обновил систему защиты от DDoS-атак

Госдума приняла закон о маркировке ИИ-контента

edna: цифровая нагрузка россиян выросла на 80%

Спецкостюм позволит тараканам-киборгам дышать под водой до трех часов

Последние новости

Ремейк Assassin’s Creed IV: Black Flag слили за день до релиза

«Ростелеком» обновил систему защиты от DDoS-атак

Госдума приняла закон о маркировке ИИ-контента

edna: цифровая нагрузка россиян выросла на 80%

Спецкостюм позволит тараканам-киборгам дышать под водой до трех часов

НазадGoogle обновил руководство по оценке качества поиска

ДалееСпрос на телевизоры российских брендов вырос в 2025 году

OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд

Популярные новости

Последние новости

НазадGoogle обновил руководство по оценке качества поиска

ДалееСпрос на телевизоры российских брендов вырос в 2025 году

Лучшее от AllWeb.ru

В Китае объявили кампанию против буллинга и фейков

«Микрон» представил российскую игровую консоль MikBoy

Стоимость биткойна упала ниже $100 тыс.