Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2402

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
Следователи пришли к топ-менеджерам
24 июня 2024
Чемезов подМиГнул Мащицкому?
24 июня 2024
Хирурги Елагин и Кадзаев ответят за смерть пациента, пока Хайдаров находит новое место работы
24 июня 2024
Самый молодой депутат Новой Зеландии исполнила ритуальный танец маори во время первой речи в парламенте
06 января 2024
Саратовский Фонд капремонта тратит десятки миллионов на юристов и рассылку платежек. Тендеров на ремонты в 2023 году не было вовсе
04 января 2024
Порядок в ЗАГСах Петербурга наведет «Чистая линия»
02 января 2024
Колумбийский университет отклонил требования администрации Трампа, поддержав позицию Гарварда
16 апреля 2025
Зюганов ведет КПРФ к очередной электоральной неудаче: мобилизационная кампания не оправдывает ожиданий
16 апреля 2025
Прокуратура Магадана добилась наказания для обвиняемого в незаконной перевозке драгоценных металлов
16 апреля 2025
Фридрих Мерц может пересмотреть позицию по Taurus после получения секретной информации
16 апреля 2025
Экс-губернатора Курской области Алексея Смирнова задержали по делу о хищениях в Курской и Ивановской областях
16 апреля 2025
Беременные школьницы лишаются выплат по решению властей
16 апреля 2025
Юрий Еремеев, отбывший наказание за взятку, назначен на пост главы сельского хозяйства Херсонской области
16 апреля 2025