[Перевод] Anthropic создала монстра: как самая безопасная компания выпустила самую безрассудную модель
Один из самых неортодоксальных способов измерить прогресс на передовой ИИ сегодня — это бенчмарк торгового автомата: мы даём моделям полный контроль над торговым автоматом (цены, инвентарь, управление поставщиками и т.д.), и они должны максимизировать прибыль любой ценой.
ИИ-модель, управляющая собственным бизнесом. И новая модель Anthropic, Opus 4.6, установила новый рекорд баланса — более $8000, на $3000 больше предыдущего рекорда.
Но история здесь не в том, что она выигрывает в иначе бессмысленной симуляции, а в том, как она это делает, демонстрируя весьма тревожное и даже безрассудное поведение.
В этой короткой статье вы узнаете и о реальной опасности, которой подвергают нас эти новые, мощные ИИ, и о вполне обыденном, не-фантастическом объяснении того, почему ИИ лгут, шантажируют или действуют безрассудно — всё простыми словами, чтобы вы поняли.
Читать далее