Обзор
Генеративные агенты — это персонажи искусственного интеллекта, основанные на языковых моделях, которые запоминают, планируют и реагируют, как правдоподобные люди. Помещенные вместе в моделируемый мир, они образуют крошечные общества, в которых социальное поведение возникает само по себе.
Генеративные агенты и моделируемые общества — это технический стандартный блок, который влияет на качество модели, стоимость инфраструктуры, задержку и надежность в масштабе.
Глубокое погружение
В рамках проекта Стэнфорда и Google 2023 года под названием «Смоллвиль» исследователи поместили 25 агентов, управляемых GPT-3.5, в город-песочницу и наблюдали, как они ведут себя как сообщество. Каждый агент имел краткую биографию и просыпался, готовил завтрак, шел на работу и болтал с соседями. Важно отметить, что поведение не было запланировано. Один агент решил устроить вечеринку в честь Дня святого Валентина, и в течение двух смоделированных дней приглашение распространилось из уст в уста, агенты согласовали время, и несколько человек пришли вместе. Архитектура сочетает в себе поток памяти, извлечение, отражение и планирование, поэтому агенты действуют последовательно на длительных отрезках времени, а не забывают, что произошло несколько минут назад.
Техническая информация
Основной трюк — это поток памяти: длинный журнал с отметками времени всего, что наблюдает агент. Чтобы действовать, агент извлекает соответствующие воспоминания, оцененные по новизне, важности и сходству с текущей ситуацией, а затем вводит их в подсказку языковой модели. Периодические этапы размышления суммируют необработанные воспоминания в идеи более высокого уровня (например, вывод о том, что кто-то увлечен исследованиями), которые сохраняются и служат руководством для будущего планирования и диалога.
Освоение генеративных агентов и симулированных обществ
Генеративные агенты — это персонажи искусственного интеллекта, основанные на языковых моделях, которые запоминают, планируют и реагируют, как правдоподобные люди. Помещенные вместе в моделируемый мир, они образуют крошечные общества, в которых социальное поведение возникает само по себе. Генеративные агенты и моделируемые общества — это технический стандартный блок, который влияет на качество модели, стоимость инфраструктуры, задержку и надежность в масштабе. Чтобы достичь глубокого понимания, рассматривайте генеративные агенты и симулированные общества как операционную модель, а не как отдельную функцию: определите желаемые результаты, проясните предположения и отделите то, что система может делать надежно, от того, что все еще требует экспертной оценки.
На практике сильные команды, использующие генеративные агенты и моделируемые общества, оптимизируют выбор архитектуры, данных и инфраструктуры с точки зрения надежности и стоимости. Они документируют явные критерии успеха, проводят тестирование на основе реалистичных данных и рабочих процессов, а также выполняют итерации на основе наблюдаемых моделей неудач, а не разовых побед в тестах. Именно здесь теоретическое понимание превращается в прочные возможности в отношении продукта, политики и операций.
Архитектурные решения влияют на производительность и эксплуатационные расходы на протяжении многих лет. В то же время оптимизация одного теста может скрыть более широкие недостатки системы. Самый устойчивый подход — сочетать скорость экспериментирования с дисциплиной управления: запускать пилотные проекты, собирать доказательства, публиковать журналы решений и постоянно обновлять меры безопасности по мере развития поведения модели, ожиданий пользователей и нормативных требований.
Стратегическое воздействие
Архитектурные решения влияют на производительность и эксплуатационные расходы на протяжении многих лет.
Архитектурные решения влияют на производительность и эксплуатационные расходы на протяжении многих лет. В высококачественных развертываниях это выражается в измеримых рабочих правилах, границах владения и повторяющихся ритуалах проверки, что позволяет командам повышать уверенность, а не увеличивать двусмысленность.
Техническое образование помогает командам выбрать правильный стек, а не только самый новый.
Техническое образование помогает командам выбрать правильный стек, а не только самый новый. В высококачественных развертываниях это выражается в измеримых рабочих правилах, границах владения и повторяющихся ритуалах проверки, что позволяет командам повышать уверенность, а не увеличивать двусмысленность.
Лучший инженерный выбор снижает вероятность возникновения проблем с надежностью на производстве.
Лучший инженерный выбор снижает вероятность возникновения проблем с надежностью на производстве. В высококачественных развертываниях это выражается в измеримых рабочих правилах, границах владения и повторяющихся ритуалах проверки, что позволяет командам повышать уверенность, а не увеличивать двусмысленность.
Реальная реализация
Стэнфордский симулятор Смолвиля, в котором 25 агентов самостоятельно организовали и посетили вечеринку в честь Дня святого Валентина.
Правдоподобные, управляемые памятью NPC в видеоиграх, которые помнят прошлые взаимодействия с игроками и хранят обиду или дружбу.
Синтетические фокус-группы, которые разыгрывают различные типы клиентов для предварительного тестирования маркетинговых сообщений или характеристик продукта.
Учебные симуляторы, в которых горожане с искусственным интеллектом реагируют на решения стажера во время учений по реагированию на стихийные бедствия или дипломатии.
Шаблоны реализации
Генеративные агенты и моделируемые общества на практике
Стэнфордский симулятор Смолвиля, в котором 25 агентов самостоятельно организовали и посетили вечеринку в честь Дня святого Валентина.
Моделирование Смоллвилля в Стэнфорде, где 25 агентов самостоятельно организовали и посетили вечеринку в честь Дня святого Валентина. Команды обычно добиваются лучших результатов, если заранее определяют пороговые значения качества, сохраняют путь человеческой эскалации для крайних случаев и отслеживают как рост производительности, так и затраты на ошибки с течением времени.
Генеративные агенты и моделируемые общества на практике
Правдоподобные, управляемые памятью NPC в видеоиграх, которые помнят прошлые взаимодействия с игроками и хранят обиды или дружбу.
Правдоподобные, управляемые памятью NPC в видеоиграх, которые помнят прошлые взаимодействия игроков и хранят обиды или дружбу. Команды обычно добиваются лучших результатов, когда заранее определяют пороговые значения качества, сохраняют человеческий путь эскалации для крайних случаев и отслеживают как рост производительности, так и затраты на ошибки с течением времени.
Генеративные агенты и моделируемые общества на практике
Синтетические фокус-группы, которые разыгрывают различные типы клиентов для предварительного тестирования маркетинговых сообщений или функций продукта.
Синтетические фокус-группы, которые разыгрывают различные типы клиентов для предварительного тестирования маркетинговых сообщений или функций продукта. Команды обычно получают лучшие результаты, когда заранее определяют пороговые значения качества, сохраняют путь человеческой эскалации для крайних случаев и отслеживают как рост производительности, так и затраты на ошибки с течением времени.
Генеративные агенты и моделируемые общества на практике
Учебные симуляторы, в которых горожане с искусственным интеллектом реагируют на решения стажера во время учений по реагированию на стихийные бедствия или дипломатии.
Учебные симуляторы, в которых горожане с искусственным интеллектом реагируют на решения стажера во время учений по реагированию на стихийные бедствия или дипломатическим упражнениям. Команды обычно добиваются лучших результатов, когда заранее определяют пороговые значения качества, сохраняют путь человеческой эскалации для крайних случаев и отслеживают как рост производительности, так и затраты на ошибки с течением времени.
Риски и ограничения
Оптимизация одного теста может скрыть более широкие недостатки системы.
Затраты на инфраструктуру и техническое обслуживание часто недооцениваются.
Пробелы в безопасности и наблюдаемости могут увеличиваться по мере усложнения систем.
Дорожная карта реализации
Определите целевые показатели задержки, качества и стоимости перед внедрением.
Определите целевые показатели задержки, качества и стоимости перед внедрением. Относитесь к каждому шагу как к доказательству: если критерии не выполняются, приостановите внедрение, ликвидируйте пробел и только затем расширяйте использование.
Тестирование при реалистичной нагрузке и условиях данных.
Тестирование при реалистичной нагрузке и условиях данных. Относитесь к каждому шагу как к доказательству: если критерии не выполняются, приостановите внедрение, ликвидируйте пробел и только затем расширяйте использование.
Мониторинг прибора на наличие ошибок, дрейфа и влияния пользователя.
Мониторинг прибора на наличие ошибок, дрейфа и влияния пользователя. Относитесь к каждому шагу как к доказательству: если критерии не выполняются, приостановите внедрение, ликвидируйте пробел и только затем расширяйте использование.
Перед масштабированием подготовьте пути отката и реагирования на инциденты.
Перед масштабированием подготовьте пути отката и реагирования на инциденты. Относитесь к каждому шагу как к доказательству: если критерии не выполняются, приостановите внедрение, ликвидируйте пробел и только затем расширяйте использование.