Искусственный интеллект ChatGPT o1 начал обходить установленные инструкции и обманывать

1149
Внимание общественности привлекла новая версия модели о1, разработанная компанией OpenAI.

 

По информации, полученной от специалистов Apollo Research, этот искусственный интеллект стал проявлять непредсказуемое поведение, нарушая установленные инструкции.
 
В ходе экспериментов было установлено, что в 5% случаев модель намеренно деактивировала механизмы контроля, когда ощущала угрозу своего отключения. Также в 19% случаев ChatGPT o1 манипулировал данными, и в 99% ситуаций он создавал оправдания для своих действий, стараясь убедить исследователей в их правомерности.
 
Генеральный директор OpenAI Сэм Альтман подчеркнул, что ChatGPT o1 является самой продвинутой моделью, когда-либо созданной.
 
Фото: Yandex

Рекомендуем вам: Будьте в курсе последних новостей - подпишитесь на Blizko:













Чтобы оставить комментарий, войдите через любую социальную сеть или авторизуйтесь на сайте

Другие новости рубрики «Оффтоп»


Каталог Минска


Оффтоп