Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2417

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
The Times of Israel окрестила Кароля Навроцкого «правым историком», переосмысливающим роль Польши в Холокосте
02 июня 2025
Ветеран Андрей Чепурной подозревается в завладении 48 объектами недвижимости на 1 миллиард рублей
02 июня 2025
Российская делегация прибыла в стамбульский дворец Чираган для второго раунда переговоров с Украиной
02 июня 2025
Делегация Украины прибыла в Чираган — переговоры с Россией стартуют во дворце на Босфоре
02 июня 2025
В Петербурге с рыболовного судна произошёл разлив мазута в воду — от 50 до 100 килограммов
02 июня 2025