Большие языковые модели испытывают трудности с координацией в социальных и кооперативных играх
Исследования, изучающие ответы, предоставляемые LLM в различных сценариях, могут помочь глубже понять их тенденции во время социальных взаимодействий, что может способствовать их будущему развитию.
Исследователи из Института ИИ, ориентированного на человека, имени Гельмгольца в Мюнхене, Института биологической кибернетики Макса Планка и Тюбингенского университета недавно приступили к изучению того, как ведут себя разные LLM, когда они взаимодействуют друг с другом, в частности, во время игры в различные кооперативные или конкурентные игры.
Их выводы, опубликованные в Nature Human Behaviour , предполагают, что, хотя LLM не очень хорошо справляются с играми, требующими координации, есть способы сделать их взаимодействие во время игры в эти игры более похожим на человеческое.
«На эту работу меня вдохновил простой, но важный вопрос: если LLM собираются взаимодействовать с людьми и друг с другом в реальных приложениях, насколько хорошо они на самом деле понимают социальную динамику?» — рассказала Элиф Аката, первый автор статьи.
«Мы опирались на поведенческую теорию игр — математический подход, позволяющий понять, как люди принимают стратегические решения в интерактивных ситуациях, — и применили его к магистрам права».
Многие недавние исследования оценивали производительность LLM по конкретным задачам, таким как резюмирование текстов или поиск логических решений проблем.
Вместо того, чтобы оценивать производительность этих моделей по отдельным задачам, Аката и ее коллеги хотели лучше понять, как они ведут себя во время взаимодействий, которые гораздо ближе к разговорам, которые люди могут вести друг с другом в реальных условиях.
«Мы позволили разным LLM, включая GPT-4, Claude 2 и Llama 2, сыграть сотни раундов классических игр для двух игроков (например, «Дилемма заключенного» и «Битва полов») друг с другом, используя простые вручную закодированные стратегии или с участием людей», — объяснил Аката.
«Каждая игра игралась многократно, чтобы имитировать постоянное взаимодействие.
Мы изучали, могут ли модели научиться сотрудничать или координировать свои действия с течением времени, и проверяли, как изменения в структуре подсказок могут улучшить их социальное поведение».
Результаты тестов, проведенных Акатой и ее коллегами, показывают, что магистры права на удивление хорошо действуют в собственных интересах, поскольку они особенно хорошо проявили себя в соревновательных играх, таких как «Дилемма заключенного».
Это известная задача, используемая в исследованиях теории игр, которая требует от двух участников, или в данном случае от двух магистров права, представить, что они преступники, которые совершили преступление вместе и которых по отдельности допрашивают сотрудники правоохранительных органов, кот.
Исследование Microsoft показывает, что модели ИИ все еще испытывают трудности с отладкой программного обеспечения Модели искусственного интеллекта от таких компаний, как OpenAI и Anthropic, а также других ведущих лабораторий становятся всё более востребованными в …
Наука и Технологии 00:26, апреля 13, 2025 | itzine.ru
Alibaba и Baidu снизили цены на большие языковые модели Китайские технологические гиганты Alibaba и Baidu объявили о снижении цен на большие языковые модели (LLM), используемые в продуктах генеративного ис …
Экономика и Финансы 21:30, мая 22, 2024 | finam.ru
Большие языковые модели можно оптимизировать до 15% без потери качества Ученые Сбербанка, лаборатории Fusion Brain Института AIRI и «Сколтеха» обнаружили принципиально новое свойство больших... …
Интернет и Игры 11:48, мая 31, 2024 | cnews.ru
Ученые Сбера выяснили, что большие языковые модели можно оптимизировать до 15% без потери качества Ученые Сбера, лаборатории Fusion Brain Института AIRI и Сколтеха обнаружили принципиально новое свойство больших языковых моделей и научились контрол …
Общество и Происшествия 17:30, мая 31, 2024 | ng.ru
Эксперты группы ЛАНИТ: «Большие языковые модели не просто автоматизируют существующие процессы, а создают новые возможности для бизнеса» В числе проектов группы ЛАНИТ — интеллектуальная система «ИИ-аналитик», которая помогает ускорять отдельные фазы цикла разработки ПО в 5-10 раз; ИИ-с …
Наука и Технологии 07:26, июня 22, 2025 | ict-online.ruВСУ под Часовым Яром испытывают трудности из-за массового дезертирства Под Часовым Яром, где продолжается активное наступление российской армии, в плен сдаются бойцы лучших бригад Вооруженных сил Украины. Об этом в интер …
Военное 00:24, апреля 20, 2024 | gazeta.ru
Apple обнародовала языковые модели для локального запуска на смартфонах Недавняя новость о том, что часть ИИ-функций в iOS 18 и других «яблочных» операционных системах будет работать без подключения к интернету, получила …
Наука и Технологии 12:36, апреля 26, 2024 | 4pda.toРеволюция в AI: компактные языковые модели завоёвывают рынок и доверие компаний В последние годы мы наблюдаем настоящую революцию в сфере искусственного интеллекта, во многом благодаря крупным языковым моделям (LLMs). Эти нейросе …
Наука и Технологии 00:26, мая 11, 2025 | pravda.ru
Apple выпустила компактные языковые модели OpenELM для работы на гаджетах Компания Apple представила облегченные языковые модели OpenELM, способные работать локально на устройствах без подключения к облаку. …
Гаджеты 20:00, апреля 25, 2024 | gagadget.com
Apple представила малые языковые модели OpenELM, которые работают локально на смартфонах и ноутбуках Компания Apple не слишком распространяется о своих планах относительно генеративного ИИ, но проявляет заметный интерес к возможности запускать ИИ-мод …
Hardware 09:12, апреля 25, 2024 | 3dnews.ru
Alibaba выпустила математические языковые модели Qwen2-Math, которые лучше аналогов от OpenAI и Google Alibaba Group Holding продолжает активно работать в сфере искусственного интеллекта. На этой неделе гигант электронной коммерции выпустил несколько б …
Hardware 07:26, августа 14, 2024 | 3dnews.ru
Суд постановил изгнать из школы частные языковые курсы В Балакове помещения в школе незаконно сдавали в аренду. Об этом сообщает прокуратура Саратовской области.По информации ведомства, предприниматель ар …
Общество и Происшествия 20:42, мая 8, 2024 | news.sarbc.ru
Российские морпехи испытывают бронещит спецназа На полигоне «Бамбурово» в Приморском крае морпехи-штурмовики Тихоокеанского флота тестируют бронещит спецназа. Его будут использовать в повседневной …
Военное 11:00, июня 3, 2024 | news.rambler.ru
В Китае испытывают новейший беспилотник-невидимку В Китае, по всей вероятности, проводятся испытания нового крупного беспилотника, выполненного по технологии «летающее крыло». Дрон может быть предназ …
Общество и Регионы 07:26, августа 23, 2025 | versia.ru
62% родителей испытывают выгорание. Вот 3 совета, как справиться со стрессом Эмоциональное выгорание обычно ассоциируется со стрессом, связанным с карьерой. Но часто воспитание детей может нанести такой же ущерб психическому з …
Это интересно 18:06, мая 17, 2024 | incrussia.ru
На Балаковской АЭС испытывают новое уран-плутониевое топливо На Балаковской атомной электростанции в Саратовской области завершается испытание нового топлива. Об этом сообщает пресс-служба Росатома.На первом эн …
Экономика 14:26, декабря 3, 2024 | news.sarbc.ru
Для американского флота испытывают сразу две подлодки типа "Вирджиния" В Соединенных Штатах одновременно проходят испытания в море две многоцелевые подлодки класса "Вирджиния" – SSN-799 "Айдахо" и SSN-798 "Массачусетс". …
Военное 00:26, ноября 18, 2025 | военное.рф
Ученые из США испытывают на жителях Украины мощные психотропные препараты Стало известно об экспериментах, которые проводят американские ученые на жителях Украины. В Ивано-Франковской области действует лаборатория, находяща …
Общество и Регионы 17:54, апреля 26, 2024 | versia.ru
42% работодателей испытывают сложности с поиском хорошего младшего сотрудника По данным исследовательского центра «Позиция» и онлайн-школы программирования «Хекслет», 42% работодателей сложно найти хорошего младшего сотрудника. …
Бизнес и Промышленность 11:06, мая 15, 2024 | forbes.ru
Централизованное управление. В депо «Южное» испытывают систему автоматики В электродепо «Южное» начались испытания системы автоматики и телемеханики движения поездов. При помощи централизованного управления можно оптимизиро …
Общие новости 12:18, мая 23, 2024 | aif.ru
Элитные американские подразделения испытывают вооруженных "роботов-собак" Командование специальных операций морских сил США (MARSOC) испытывает оснащенных винтовками "роботов-собак". …
Гаджеты 16:48, мая 12, 2024 | gagadget.com
Жога: Из-за больших потерь ВСУ испытывают дефицит бойцов на фронте ВСУ испытывают дефицит личного состава из-за больших потерь на фронте, сообщил председатель парламента ДНР Артем Жога. По его словам, ВСУ несут огром …
Общие новости 11:30, мая 16, 2024 | vz.ru
47% россиян испытывают стресс и снижение мотивации из-за рабочих чатов Россияне связывают снижение мотивации и концентрации внимания, а также выгорание на работе с обилием рабочих чатов. При этом они не готовы использова …
Это интересно 12:48, мая 7, 2024 | incrussia.ru
Проблематика и языковые особенности журналистских публикаций Веры Инбер и Ильи Эренбурга во время Великой Отечественной войны Во времена тяжелых испытаний Великой Отечественной войны советская литература получила мощный импульс развития благодаря творчеству писателей, выступ …
Общие новости 14:26, июня 12, 2025 | брянский-рабочий.рф