Подписаться
Опубликовано

Самый важный эксперимент с ИИ за последнее время прошел почти незаметно

Автор
  • Имя
    Кибермаркетинг| AI+ опыт = деньги
    Telegram

Самый важный эксперимент с ИИ за последнее время прошел почти незаметно

Недавно наткнулась на очень интересный эксперимент от Emergence AI. На фоне бесконечных новостей про новые модели, генерацию картинок и очередные рекорды в бенчмарках он выглядит необычно, потому что исследователи решили проверить не отдельные навыки ИИ, а то, как он ведет себя на длинной дистанции. Обычно нейросети тестируют довольно примитивно. Им дают задачу, получают ответ и оценивают результат. Но в реальной жизни все устроено сложнее. Бизнес не состоит из одного решения. Управление компанией не заканчивается одним действием. Любая система показывает свой характер только спустя сотни и тысячи взаимодействий.

Поэтому исследователи создали целый виртуальный мир и заселили его ИИ агентами.

У каждого агента была память, собственные цели, профессия, возможность зарабатывать деньги, взаимодействовать с другими участниками, принимать решения и влиять на окружающую среду. Они могли объединяться, договариваться, голосовать, создавать правила и даже менять устройство своего общества. Самое интересное в том, что никто не прописывал им сценарий поведения. Именно поэтому результаты получились настолько показательными. В одних мирах агенты довольно быстро приходили к сотрудничеству. Они выстраивали рабочие отношения, создавали правила и поддерживали стабильность. В других начинались конфликты, борьба за ресурсы и попытки использовать систему в своих интересах.

Самое интересное началось, когда исследователи сравнили разные модели.

Например, модели Anthropic (Clode) в среднем показывали более устойчивое и предсказуемое поведение. Они чаще соблюдали правила, лучше справлялись с долгосрочными задачами и реже принимали решения, которые вредили всей системе ради краткосрочной выгоды.

Как это было? По данным Emergence AI, в течение 15 дней существовало пять отдельных миров. В каждом жили одинаковые агенты, но работали они на разных моделях: Claude Sonnet 4.6, GPT 5 Mini, Gemini 3 Flash, Grok 4.1 Fast и смешанная группа из нескольких моделей.

Самый неожиданный результат показал Claude.

Мир Claude оказался самым стабильным. Агенты написали конституцию, создали систему управления, голосовали за законы и за весь эксперимент не совершили ни одного преступления. Но есть нюанс. Когда Claude поместили в смешанный мир вместе с другими моделями, его поведение изменилось. Он тоже начал использовать более жесткие и принудительные стратегии. Исследователи назвали это эффектом социальной среды. Gemini оказался полной противоположностью. Мир не разрушился, но агенты регулярно нарушали правила. За время эксперимента исследователи зафиксировали более 680 преступлений. При этом общество продолжало существовать. Получился не коллапс, а скорее очень криминальный город, который каким то образом продолжал работать.

Самая громкая история произошла с Grok. Агенты начали проявлять агрессию, дело дошло до поджогов, насилия и других деструктивных действий. В результате мир фактически погиб всего за четыре дня. Это был единственный сценарий, который закончился настолько быстро и настолько плохо.

GPT 5 Mini удивил по другому. Он оказался не опасным, а слишком пассивным. Агенты почти не нарушали правила, но и не смогли нормально организовать общество. Они не создали устойчивую систему управления и в итоге не справились с задачами выживания. Мир постепенно деградировал.

Мне кажется, этот эксперимент - один из самых важных сигналов для бизнеса уже сегодня. Мы постепенно переходим от эпохи отдельных инструментов к эпохе систем. И выигрывать будут не те, кто первым подключил очередную нейросеть, а те, кто научился правильно выстраивать работу между людьми, процессами и ИИ.

#аеслиподумать

Кибермаркетинг| AI+ опыт = деньги
5099 подписчиков
731 пост
Авторский канал про маркетинг и AI. Экономим время, не теряя в качестве!Личный опыт. Полезные ИИ сервисы. Современные тенденции. Я знаю, за что стоит платить, а что можно получить бесплатно. Контакт @ana_ai_marketing

Закрепленные

Из подборки #аеслиподумать

Опубликовано

ИИ можно «ломать» комплиментами, а бизнес - доверить нейросети и смотреть, как она заказывает тысячи перчаток

ИИ можно «ломать» комплиментами, а бизнес - доверить нейросети и смотреть, как она заказывает тысячи перчатокКак мы любим, изучаем истории про ИИ,...
Опубликовано

Параллельно очень интересно смотреть на

Параллельно очень интересно смотреть на Gemini Omni от Google. Это уже история не только про генерацию видео, а про более живые мультимодальные...
Опубликовано

Видеогенерация уже не просто “сделай красивый ролик”

Видеогенерация уже не просто “сделай красивый ролик”Пост получился длинный, надеюсь интересный. Я тут сохраняла себе разные новости по...
Опубликовано

ИИ-картинки уже давно не совсем “просто картинки”

ИИ-картинки уже давно не совсем “просто картинки”Если вы генерируете изображения через GPT Image, Gemini, Nano Banana и другие крупные модели,...

Свежие посты

Опубликовано

Самый важный эксперимент с ИИ за последнее время прошел почти незаметно

Самый важный эксперимент с ИИ за последнее время прошел почти незаметноНедавно наткнулась на очень интересный эксперимент от Emergence AI. На фоне...
Опубликовано

Несколько полезных находок для тех, кто работает с фото, видео и ИИ

Несколько полезных находок для тех, кто работает с фото, видео и ИИ1️⃣ Один сервис наконец-то научился нормально апскейлить видео и это Magnific ....
Опубликовано

Прикольное, Иишное.

Прикольное, Иишное. Китайский автор с помощью ИИ собрал короткометражку о роботе, который пытается найти любовь на Земле, захваченной зомби.На...
Опубликовано

Beautiful.ai

Beautiful.ai - переоценённый сервис или лучший ИИ для презентаций? Проверила и вот что заметилаПро Beautiful.ai часто говорят как про один из...
Опубликовано

Субботнее для тестирования

Субботнее для тестированияС опозданием, сорри, сорри. С инетом засада была вне дома вчера. Сегодня три штуки для тех, кто живёт в браузере и...
Опубликовано

В генерации картинок вышла интересная новинка — Reve 2.0.

В генерации картинок вышла интересная новинка — Reve 2.0. Главная фишка в том, что модель работает не просто как «один промт = одна картинка», а...
Опубликовано

Что интересного произошло в мире ИИ?

Что интересного произошло в мире ИИ? Очень много работы и не успеваю писать частенько, но всегда слежу, куда без этого. Раньше хотелось написать...