Опубликовано: среда, 10 июня 2026 г.

Самый важный эксперимент с ИИ за последнее время прошел почти незаметно

Автор

Имя
Кибермаркетинг| AI+ опыт = деньги
Telegram
telegram

Кибермаркетинг| AI+ опыт = деньги

5099 подписчиков

769 постов

Авторский канал про маркетинг и AI. Экономим время, не теряя в качестве!Личный опыт. Полезные ИИ сервисы. Современные тенденции. Я знаю, за что стоит платить, а что можно получить бесплатно. Контакт @ana_ai_marketing

Самый важный эксперимент с ИИ за последнее время прошел почти незаметно

Недавно наткнулась на очень интересный эксперимент от Emergence AI. На фоне бесконечных новостей про новые модели, генерацию картинок и очередные рекорды в бенчмарках он выглядит необычно, потому что исследователи решили проверить не отдельные навыки ИИ, а то, как он ведет себя на длинной дистанции. Обычно нейросети тестируют довольно примитивно. Им дают задачу, получают ответ и оценивают результат. Но в реальной жизни все устроено сложнее. Бизнес не состоит из одного решения. Управление компанией не заканчивается одним действием. Любая система показывает свой характер только спустя сотни и тысячи взаимодействий.

Поэтому исследователи создали целый виртуальный мир и заселили его ИИ агентами.

У каждого агента была память, собственные цели, профессия, возможность зарабатывать деньги, взаимодействовать с другими участниками, принимать решения и влиять на окружающую среду. Они могли объединяться, договариваться, голосовать, создавать правила и даже менять устройство своего общества. Самое интересное в том, что никто не прописывал им сценарий поведения. Именно поэтому результаты получились настолько показательными. В одних мирах агенты довольно быстро приходили к сотрудничеству. Они выстраивали рабочие отношения, создавали правила и поддерживали стабильность. В других начинались конфликты, борьба за ресурсы и попытки использовать систему в своих интересах.

Самое интересное началось, когда исследователи сравнили разные модели.

Например, модели Anthropic (Clode) в среднем показывали более устойчивое и предсказуемое поведение. Они чаще соблюдали правила, лучше справлялись с долгосрочными задачами и реже принимали решения, которые вредили всей системе ради краткосрочной выгоды.

Как это было? По данным Emergence AI, в течение 15 дней существовало пять отдельных миров. В каждом жили одинаковые агенты, но работали они на разных моделях: Claude Sonnet 4.6, GPT 5 Mini, Gemini 3 Flash, Grok 4.1 Fast и смешанная группа из нескольких моделей.

Самый неожиданный результат показал Claude.

Мир Claude оказался самым стабильным. Агенты написали конституцию, создали систему управления, голосовали за законы и за весь эксперимент не совершили ни одного преступления. Но есть нюанс. Когда Claude поместили в смешанный мир вместе с другими моделями, его поведение изменилось. Он тоже начал использовать более жесткие и принудительные стратегии. Исследователи назвали это эффектом социальной среды. Gemini оказался полной противоположностью. Мир не разрушился, но агенты регулярно нарушали правила. За время эксперимента исследователи зафиксировали более 680 преступлений. При этом общество продолжало существовать. Получился не коллапс, а скорее очень криминальный город, который каким то образом продолжал работать.

Самая громкая история произошла с Grok. Агенты начали проявлять агрессию, дело дошло до поджогов, насилия и других деструктивных действий. В результате мир фактически погиб всего за четыре дня. Это был единственный сценарий, который закончился настолько быстро и настолько плохо.

GPT 5 Mini удивил по другому. Он оказался не опасным, а слишком пассивным. Агенты почти не нарушали правила, но и не смогли нормально организовать общество. Они не создали устойчивую систему управления и в итоге не справились с задачами выживания. Мир постепенно деградировал.

Мне кажется, этот эксперимент - один из самых важных сигналов для бизнеса уже сегодня. Мы постепенно переходим от эпохи отдельных инструментов к эпохе систем. И выигрывать будут не те, кто первым подключил очередную нейросеть, а те, кто научился правильно выстраивать работу между людьми, процессами и ИИ.

#аеслиподумать

Обсудить в Telegram

Кибермаркетинг| AI+ опыт = деньги

5099 подписчиков

769 постов