ИИ проваливает языковой тест, исключая грамматику из уравнения

ИИ проваливает языковой тест, исключая грамматику из уравнения
Генеративные системы искусственного интеллекта, такие как большие языковые модели и генераторы текста в изображения, могут сдавать строгие экзамены, которые требуются от любого, кто хочет стать врачом или юристом . Они могут показать лучшие результаты, чем большинство людей на математических олимпиадах .

Они могут писать более-менее приличные стихи , создавать эстетически приятные картины и сочинять оригинальную музыку. Эти замечательные возможности могут создать впечатление, что генеративные системы искусственного интеллекта готовы взять на себя работу людей и оказать значительное влияние практически на все аспекты общества.

Однако, хотя качество их продукции иногда соперничает с работой, проделанной людьми, они также склонны уверенно штамповать фактически неверную информацию.

Скептики также подвергают сомнению их способность рассуждать . Большие языковые модели были созданы для имитации человеческого языка и мышления, но они далеки от человека. С младенчества люди учатся через бесчисленные сенсорные впечатления и взаимодействия с окружающим миром.

Большие языковые модели не учатся так, как люди, — вместо этого они обучаются на огромных массивах данных, большая часть которых взята из интернета.

Возможности этих моделей весьма впечатляют, и существуют агенты ИИ, которые могут посещать встречи вместо вас, ходить за вас по магазинам или обрабатывать страховые иски . Но прежде чем передавать ключи большой языковой модели для решения любой важной задачи, важно оценить, как их понимание мира соотносится с пониманием мира людей.

Я исследователь, изучающий язык и значение. Моя исследовательская группа разработала новый критерий , который может помочь людям понять ограничения больших языковых моделей в понимании значения.

Понимание смысла простых словосочетаний Так что же «имеет смысл» для больших языковых моделей? Наш тест включает оценку осмысленности двухсловных фраз существительное-существительное. Для большинства людей, которые бегло говорят по-английски, пары слов существительное-существительное, такие как «beach ball» и «apple cake», имеют смысл, но «ball beach» и «cake apple» не имеют общепонятного значения.

Причины этого не имеют ничего общего с грамматикой.

Это фразы, которые люди выучили и обычно принимают как осмысленные, разговаривая и взаимодействуя друг с другом с течением времени. Мы хотели проверить, имеет ли большая языковая модель такое же чувство смысла словосочетаний, поэтому мы создали тест, который измерял эту способность, используя пары существительное-существительное, для которых правила грамматики были бы бесполезны в определении того, имеет ли фраза узнаваемое значение.

Например, пара прилагательное-существительное, такая как «красный мяч», имеет смысл, в то время как ее перестановка, «мяч красный», делает словосочетание бессмысленным.

Тест не спрашивает у большой языковой модели, что означают слова. Вместо этого он проверяет способность большой языковой модели извлекать значение из пар слов, не полагаясь на опору простой грамм.

Опубликовано: 07:26, февраля 28, 2025 Рубрика: Software Источник: android-robot.com Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit
 
 
Министр: Свердловская область проваливает план по набору контрактников на СВО

Министр: Свердловская область проваливает план по набору контрактников на СВО Свердловская область серьезно выбивается из графика по набору контрактников для участия в специальной военной операции РФ на Украине. План выполнен л …

Общие новости 20:12, апреля 16, 2024 | ura.news
Google облегчила жизнь учащимся: визуальный поиск Circle to Search научился решать уравнения

Google облегчила жизнь учащимся: визуальный поиск Circle to Search научился решать уравнения Ранее в этом году Google представила функцию визуального поиска Circle to Search («Обведение для поиска»), которая позволит пользователям …

Software 13:36, мая 15, 2024 | 3dnews.ru
iPadOS 18 получит Math Notes, свой почерк и обновленное приложение Калькулятор, которое решает сложные уравнения

iPadOS 18 получит Math Notes, свой почерк и обновленное приложение "Калькулятор", которое решает сложные уравнения Apple объявила о выпуске iPadOS 18, который принесет значительные обновления для пользователей iPad. …

Гаджеты 01:12, июня 11, 2024 | gagadget.com
Языковой предел: как изменится система экзаменов для мигрантов

Языковой предел: как изменится система экзаменов для мигрантов Коммерческие центры начали сворачивать свою работу, а вузы ищут новых партнеров среди госорганизаций …

Общие новости 21:00, апреля 18, 2024 | iz.ru
Google экспериментирует со встраиванием в Chrome большой языковой модели

Google экспериментирует со встраиванием в Chrome большой языковой модели Компания Google объявила о проведении эксперимента по встраиванию в Chrome большой языковой модели машинного обучения. Для доступа к модели из web-пр …

Интернет и Игры 14:26, августа 10, 2024 | opennet.ru
Правительство России утвердило концепцию государственной языковой политики

Правительство России утвердило концепцию государственной языковой политики Правительство России утвердило Концепцию государственной языковой политики страны. О принятии документа сообщили представители Министерства просвещен …

Политика 00:26, июня 15, 2024 | versia.ru
Языковой омбудсмен Кремень призвал к наступательной украинизации Украины

Языковой омбудсмен Кремень призвал к «наступательной украинизации» Украины Уполномоченный по защите украинского языка Тарас Кремень выступил по видеосвязи на международной конференции «Языки и культуры во время войны» в Лонд …

Общие новости 08:18, мая 3, 2024 | kommersant.ru
Языковой геноцид: пять лет назад на Украине запретили русский язык

Языковой геноцид: пять лет назад на Украине запретили русский язык Курс на вытеснение русского языка украинские власти взяли уже давно, когда лишали его даже регионального статуса. …

Общие новости 04:18, мая 16, 2024 | ren.tv
Alibaba выпускает новую версию своей большой языковой модели

Alibaba выпускает новую версию своей большой языковой модели Alibaba Cloud заявила в четверг, что выпустила последнюю версию своей большой языковой модели, передает CNBC.Цзинжэнь Чжоу, технический директор Alib …

Экономика и Финансы 23:36, мая 9, 2024 | finam.ru
Языковой скандал: Тренера сборной Украины попросили говорить на русском

Языковой скандал: Тренера сборной Украины попросили говорить на русском Во вторник вечером сборные Албании и Украины сойдутся в последнем туре групповой стадии Лиги нацийЧитать дальше → …

Футбол 14:26, ноября 19, 2024 | euro-football.ru
Языковой коуч Гуревич назвала препятствие на пути изучения иностранных языков

Языковой коуч Гуревич назвала препятствие на пути изучения иностранных языков Языковой коуч экспертов и предпринимателей, топ-тренер по снятию языкового барьера Ольга Гуревич рассказала, в чём, с её точки зрения, заключается ос …

Общие новости 18:30, июня 3, 2024 | russian.rt.com
Microsoft запустила разработку собственной большой языковой модели ИИ  это добавит независимости от OpenAI

Microsoft запустила разработку собственной большой языковой модели ИИ — это добавит независимости от OpenAI Вложившая в капитал стартапа OpenAI более $10 млрд американская корпорация Microsoft, по данным The Information, занялась разработкой собственной бол …

Software 10:30, мая 7, 2024 | 3dnews.ru
Самый популярный в мире языковой сервис не заблокируют в России: Duolingo выполнил требования Роскомнадзора

Самый популярный в мире языковой сервис не заблокируют в России: Duolingo выполнил требования Роскомнадзора Языковой сервис Duolingo выполнил требования Роскомнадзора, удалив контент, связанный с пропагандой ЛГБТ (*признано экстремистским движением и запрещ …

Наука и Технологии 13:42, июня 5, 2024 | ixbt.com
Мигрантам установят языковой барьер // Минобрнауки и Рособрнадзор планируют изменить процедуру экзаменов для иностранцев

Мигрантам установят языковой барьер // Минобрнауки и Рособрнадзор планируют изменить процедуру экзаменов для иностранцев Министерство науки и высшего образования РФ и Рособрнадзор планируют внести ряд изменений в процедуру экзаменации иностранных граждан, которые хотят …

Общество и Регионы 09:24, апреля 19, 2024 | kommersant.ru
Языковой демарш Зеленского: Украинский лидер отказался говорить по-английски после напряженного визита в США

Языковой демарш Зеленского: Украинский лидер отказался говорить по-английски после напряженного визита в США Украинский лидер Владимир Зеленский изменил свою коммуникационную стратегию, отказавшись от использования английского языка в общении с журналистами …

Политика 00:26, марта 19, 2025 | pravda.ru
К преимуществам NeMo можно отнести сильные многоязыковые возможности // Александр Леви  о языковой модели Mistral и Nvidia

«К преимуществам NeMo можно отнести сильные многоязыковые возможности» // Александр Леви — о языковой модели Mistral и Nvidia Обозреватель “Ъ FM” Александр Леви рассказывает о модели с открытым исходным кодом от французской корпорации и ее отличиях от GPT-4o mini. …

Наука и Технологии 14:26, июля 24, 2024 | kommersant.ru
Принципиальный суд: тест по позициям ВС

Принципиальный суд: тест по позициям ВС Когда норм для защиты нарушенных прав недостаточно, в ход идут принципы. Они помогают суду разрешить дело с учетом основных идей правопорядка и «духа …

Власть и Закон 21:26, января 3, 2025 | pravo.ru
Ученые улучшили тест на деменцию

Ученые улучшили тест на деменцию Простой пятиминутный тест 5-COG эффективно выявляет нарушения мышления и памяти у пожилых людей. Это показала работа, опубликованная в журнале Nature …

Наука 01:30, июня 10, 2024 | gazeta.ru
Тест и обзор: радиатор Arctic M2 Pro для SSD

Тест и обзор: радиатор Arctic M2 Pro для SSD В последние годы, с распространением PCIe 5.0, NVMe-накопители стали выделять немало тепла. И без хорошего радиатора уже не обойтись. На рынке можно …

Наука и Технологии 00:26, октября 25, 2024 | hardwareluxx.ru
Тест. Цвет глаз и характер

Тест. Цвет глаз и характер Макияж и сумочка, помада и украшения способны рассказать о женщине многое. Но все-таки, для того, чтобы информация стала более полной, стоит заглянут …

Знаменитости 00:26, августа 3, 2024 | woman.ru
В США прошел тест вооруженных робопсов

В США прошел тест вооруженных робопсов В Соединенных Штатах состоялись испытания новой версии роботизированных собак от компании Ghost Robotics. Улучшенная модель Quadruped Unmanned Ground …

Наука и Технологии 13:12, мая 10, 2024 | ferra.ru
Ответственность директора: тест по позициям ВС

Ответственность директора: тест по позициям ВС Чтобы помочь директору избежать ответственности, нужно знать важные позиции Верховного суда. Например, о том, получится ли привлечь к субсидиарке дир …

Власть и Закон 21:26, августа 23, 2024 | pravo.ru
GPT-4 впервые прошел тест Тьюринга

GPT-4 впервые прошел тест Тьюринга GPT-4 впервые прошел тест Тьюринга, большинство участников исследования приняли нейросеть за человека, пишет Live Science.Тест, впервые предложенный …

Экономика и Финансы 14:26, июня 18, 2024 | finam.ru
ТЕСТ: Какой вы волк Определите по ауф-цитатам!

ТЕСТ: Какой вы волк? Определите по ауф-цитатам! Мемы с волками прошли большой эволюционный путь. Сначала в пабликах всерьёз постили картинки с животными, сопровождая их брутальными пацанскими цитат …

Это интересно 00:26, июня 23, 2025 | lifehacker.ru