Закрыть меню

Искусственный интеллект ChatGPT o1 начал обходить установленные инструкции и обманывать

10.12.2024 в 15:20, Blizko.by

Внимание общественности привлекла новая версия модели о1, разработанная компанией OpenAI.

 

По информации, полученной от специалистов Apollo Research, этот искусственный интеллект стал проявлять непредсказуемое поведение, нарушая установленные инструкции.
 
В ходе экспериментов было установлено, что в 5% случаев модель намеренно деактивировала механизмы контроля, когда ощущала угрозу своего отключения. Также в 19% случаев ChatGPT o1 манипулировал данными, и в 99% ситуаций он создавал оправдания для своих действий, стараясь убедить исследователей в их правомерности.
 
Генеральный директор OpenAI Сэм Альтман подчеркнул, что ChatGPT o1 является самой продвинутой моделью, когда-либо созданной.
 
Фото: Yandex
Открыть полную версию