Искусственный интеллект ChatGPT o1 начал обходить установленные инструкции и обманывать

10.12.2024 в 15:20, Blizko.by Внимание общественности привлекла новая версия модели о1, разработанная компанией OpenAI.

По информации, полученной от специалистов Apollo Research, этот искусственный интеллект стал проявлять непредсказуемое поведение, нарушая установленные инструкции.

В ходе экспериментов было установлено, что в 5% случаев модель намеренно деактивировала механизмы контроля, когда ощущала угрозу своего отключения. Также в 19% случаев ChatGPT o1 манипулировал данными, и в 99% ситуаций он создавал оправдания для своих действий, стараясь убедить исследователей в их правомерности.

Генеральный директор OpenAI Сэм Альтман подчеркнул, что ChatGPT o1 является самой продвинутой моделью, когда-либо созданной.

Ремонт компьютеров и ноутбуков в Минске в каталоге Blizko.by

Фото: Yandex

Открыть полную версию