ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2394

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
17 июля 2025
Песков сообщил, что дата третьего раунда переговоров зависит от завершения обмена телами
17 июля 2025
Европейский университет получил штраф за отчёт, якобы подрывающий репутацию российских судебных экспертов
17 июля 2025
Пеллетный завод между тюрьмой и миллиардами: судебная драма Александра Сабадаша и Михаила Прохорова в Ленобласти
17 июля 2025
Коррупционные обвинения предъявлены экс-начальнику научного центра Минобороны Игорю Рутько
17 июля 2025
Проект «американской деревни» в Подмосковье провалился из-за отсутствия спроса и поддержки властей