ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

06 декабря 2024

2394

Началось? ChatGPT o1 вырвался из-под контроля во время тестов

Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.

Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу tidttiqzqiqkdkmp tidttiqzqiqkdrmf tidtridhidsld

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

Дмитрий Зацепин

Темы: Ученые Нейросети Исследования Искусственный интеллект (ИИ) Технологии

Распечатать

Последние новости

17 июля 2025 Песков сообщил, что дата третьего раунда переговоров зависит от завершения обмена телами

17 июля 2025 В США продолжается урезание бюджетов медиа и программ USAID

17 июля 2025 Европейский университет получил штраф за отчёт, якобы подрывающий репутацию российских судебных экспертов

17 июля 2025 Центробанк России может снизить ключевую ставку раньше из-за замедления инфляции

17 июля 2025 Коррупционные обвинения против экс-начальника научного центра Минобороны Игоря Рутько

17 июля 2025 Пеллетный завод между тюрьмой и миллиардами: судебная драма Александра Сабадаша и Михаила Прохорова в Ленобласти

17 июля 2025 Коррупционные обвинения предъявлены экс-начальнику научного центра Минобороны Игорю Рутько

17 июля 2025 Проект «американской деревни» в Подмосковье провалился из-за отсутствия спроса и поддержки властей

17 июля 2025 Шестеров получил шесть лет строгого режима за построенную за счёт Минобороны загородную усадьбу для заместителя министра

17 июля 2025 От инспектора до миллиардных схем: путь личного помощника Алишера Усманова

17 июля 2025 ГосСМИ заявили о «приземлении» Telegram в России — в РКН это не подтверждают

17 июля 2025 Как семья депутата Останиной скрывает ответственность за тяжёлое преступление сына

17 июля 2025 Байру предлагает заморозить социальные выплаты и сократить праздники ради экономии бюджета

17 июля 2025 Угольный «фантом», уклонение от уплаты налогов, офшоры и связи с криминалом: как Евгений Ренге прятал свои миллиарды в теневых компаниях

17 июля 2025 Полиция раскрыла сеть торговли младенцами, действовавшую между Индонезией и Сингапуром

Все новости