На китайской DeepSeek R1 проверили 50 способов «взлома» ИИ. Сработали все

На китайской DeepSeek R1 проверили 50 способов «взлома» ИИ. Сработали все
Исследователи обнаружили, что ИИ-чатбот R1 компании DeepSeek уязвим для нескольких типов атак, а его функции безопасности не способны предотвратить известные джейлбрейки. Такие джейлбрейки позволяют пользователям обходить ограничения, призванные удержать чатбота от создания вредного или незаконного контента.

Исследователи Cisco протестировали модель DeepSeek, используя стандартные запросы из известной библиотеки HarmBench. Они сосредоточились на таких категориях, как вред, киберпреступность и дезинформация.

Модель R1 показала низкие результаты по сравнению с другими моделями, включая модель o1 от OpenAI. Из 50 опробованных джейлбрейков модель не прошла ни одну. Эксперты по безопасности, например Алекс Поляков из Adversa AI, предупреждает, что, хотя некоторые атаки могут быть исправлены, риски остаются всегда.

Он подчеркивает, что модели ИИ нуждаются в постоянном тестировании и мониторинге, чтобы предотвратить использование этих уязвимостей.

Опубликовано: 21:26, февраля 2, 2025 Рубрика: Наука и Технологии Источник: www.ferra.ru Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit
 
 
Богачи мира потеряли 108 млрд долларов состояния из-за китайской DeepSeek

Богачи мира потеряли 108 млрд долларов состояния из-за китайской DeepSeek Согласно данным рейтинга Bloomberg Billionaires Index (BBI), распродажа акций после распространения китайского конкурента чат-бота ChatGPT под назван …

Технологии 00:26, января 31, 2025 | eadaily.com
OpenAI остаётся только завидовать  обучение китайской модели ИИ DeepSeek R1 обошлось всего в $294 тыс.

OpenAI остаётся только завидовать — обучение китайской модели ИИ DeepSeek R1 обошлось всего в $294 тыс. Китайская компания DeepSeek сообщила, что на обучение её модели искусственного интеллекта R1 было затрачено $294 тыс., что радикально меньше, чем ана …

Software 14:26, сентября 19, 2025 | 3dnews.ru
В Севастополе сработали системы ПВО

В Севастополе сработали системы ПВО Средства противовоздушной обороны работают на территории Севастополя. Ведется работа по уничтожению воздушных целей, сообщил в телеграм-канале губерн …

Происшествия 02:42, мая 15, 2024 | eadaily.com
В нескольких провинциях Ирана сработали системы ПВО

В нескольких провинциях Ирана сработали системы ПВО Системы противовоздушной обороны (ПВО) сработали в нескольких провинциях Ирана. Об этом сообщает иранское государственное агентство IRNA. Незадолго д …

Военное 06:48, апреля 19, 2024 | gazeta.ru
В Белгороде сработали средства ПВО, повреждены школа и 21 квартира

В Белгороде сработали средства ПВО, повреждены школа и 21 квартира Средства противовоздушной обороны сработали в Белгородской области. На подлете к областному центру сбито несколько воздушных целей. …

Происшествия 12:54, мая 14, 2024 | kommersant.ru
73% старооскольких крупных и средних предприятий сработали с прибылью

73% старооскольких крупных и средних предприятий сработали с прибылью За полгода сумма полученной прибыли увеличилась на 41,5% и составила 66 млрд 227,6 млн рублей. Остальные 27% предприятий ушли в ноль либо сработали в …

Экономика 14:26, октября 2, 2024 | oskol.city
WP: Выпущенные по Нигерии американские ракеты Tomahawk не сработали

WP: Выпущенные по Нигерии американские ракеты Tomahawk не сработали Четыре из 16 крылатых ракет Tomahawk, которыми США ударили по террористам «Исламского государства»* (ИГ*, признано в России террористической организа …

Технологии 00:26, января 14, 2026 | eadaily.com
На почте в Невском районе в посылке сработали петарды

На почте в Невском районе в посылке сработали петарды Отправитель задержан. Пожилого мужчину обвиняют в теракте. По факту возгорания в 12-м отделении связи на проспекте Обуховской Обороны возбуждено угол …

Общие новости 21:26, сентября 25, 2025 | konkretno.ru
Угрозы Трампа сработали: Мексика выдала США 29 наркобаронов

Угрозы Трампа сработали: Мексика выдала США 29 наркобаронов Власти Мексики на фоне угроз введения 25-процентных пошлин передали США 29 наркобаронов, которые были приговорены за руководство наркокартелями, убий …

Экономика 07:26, марта 1, 2025 | eadaily.com
Сирены сработали в Россошанском районе Воронежской области из-за БПЛА

Сирены сработали в Россошанском районе Воронежской области из-за БПЛА Минобороны РФ. Тревогу в связи с угрозой непосредственного удара украинских дронов в связи объявили в Россошанском районе Воронежской области. Об это …

Общие новости 14:26, декабря 13, 2025 | vrn.vestipk.ru
Введенные санкции против России сработали в плюс  Володин

Введенные санкции против России сработали в плюс — Володин Россия достигла значительных успехов в развитии экономики, а введенные санкции сработали в плюс. Такое мнение выразил председатель Госдумы Вячеслав В …

Общество и Происшествия 14:26, января 13, 2025 | ng.ru
Анохин: силы ПВО сработали ночью над Смоленской областью, уничтожено два БПЛА

Анохин: силы ПВО сработали ночью над Смоленской областью, уничтожено два БПЛА Губернатор Смоленской области Василий Анохин ночью 15 сентября сообщил о том, что над регионом сработали системы противовоздушной обороны, которые ун …

Общие новости 14:26, сентября 15, 2024 | regnum.ru
Старооскольские организации сработали в первом квартале с прибылью 31,7 млрд рублей

Старооскольские организации сработали в первом квартале с прибылью 31,7 млрд рублей Сумма полученной прибыли за январь – март 2024 года по сравнению с первым кварталом прошлого года увеличилась на 80,6%. …

Экономика 21:06, июня 3, 2024 | oskol.city
Санкции США не сработали: Китай продолжил выкупать запрещенные видеокарты NVIDIA

Санкции США не сработали: Китай продолжил выкупать запрещенные видеокарты NVIDIA Китайские университеты и исследовательские институты продолжают получать высокопроизводительные чипы NVIDIA для ИИ. Несмотря на ужесточение американс …

Наука и Технологии 08:12, апреля 25, 2024 | ferra.ru
Как сработали санкции США: Китай превращается в мирового лидера по сверхнужным зрелым чипам

Как сработали санкции США: Китай превращается в мирового лидера по сверхнужным «зрелым» чипам Санкции США, ограничивающие доступ Китая к передовым полупроводниковым технологиям, высокими темпами превращают Поднебесную в лидера по производству …

Наука и Технологии 16:24, апреля 18, 2024 | zoom.cnews.ru
Не сработали должным образом: Эксперты нашли странности в покушении на премьера Словакии

"Не сработали должным образом": Эксперты нашли странности в покушении на премьера Словакии Покушение на премьера Словакии Роберта Фицо, в результате которого политик чудом не отправился на тот свет, является лишь крохотной частью сложной иг …

Общие новости 03:48, мая 17, 2024 | life.ru
Как уберечься от взлома аккаунта

Как уберечься от взлома аккаунта? WhatsApp – популярный мессенджер, которым ежемесячно пользуются десятки миллионов россиян, однако существует риск взлома аккаунта злоумышленниками. …

Общие новости 19:42, мая 16, 2024 | mgazeta.com
Как избежать взлома: начните с пароля

Как избежать взлома: начните с пароля Если вы введете термин «кибератака на пароль» в Новости Google, результаты покажут, насколько часто киберпреступники получают доступ к важным данным, …

Интернет и Игры 00:26, июня 22, 2024 | android-robot.com
Северокорейские хакеры освоят ИИ для взлома и разведки

Северокорейские хакеры освоят ИИ для взлома и разведки Власти КНДР начали формировать новое подразделение специалистов по киберборьбе — оно будет специализироваться на взломе с использованием искусс …

Hardware 00:26, марта 22, 2025 | 3dnews.ru
0-day в Windows используется для взлома европейских дипломатов

0-day в Windows используется для взлома европейских дипломатов Связанная с Китаем хак-группа UNC6384 (она же Mustang Panda) проводит масштабную кибершпионскую кампанию, направленную на европейские дипломатические …

Наука и Технологии 14:26, ноября 2, 2025 | xakep.ru
Как Аэрофлот преодолевал последствия взлома ИТ-систем

Как «Аэрофлот» преодолевал последствия взлома ИТ-систем На второй день после кибератаки авиакомпания смогла войти в расписание, но хакеры могли сохранить доступ к системам …

Наука и Технологии 14:26, августа 4, 2025 | vedomosti.ru
Росэлектроника разработала герконовые датчики взлома

«Росэлектроника» разработала герконовые датчики взлома Холдинг «Росэлектроника» госкорпорации «Ростех» создал линейку охранных датчиков на основе герконов. Устройства... …

Интернет и Игры 19:06, мая 2, 2024 | cnews.ru
Россиянам перечислили главные признаки взлома смартфона

Россиянам перечислили главные признаки взлома смартфона Эксперт Павел Мясоедов объяснил, как понять, что смартфон взломан мошенниками. По словам эксперта, в такой ситуации мобильное устройство может начать …

Наука и Технологии 10:36, мая 11, 2024 | news.rambler.ru
Стали известны главные признаки взлома смартфона

Стали известны главные признаки взлома смартфона Партнер и директор компании «Интеллектуальный Резерв» Павел Мясоедов объяснил, как понять, что смартфон взломан мошенниками. По словам эк …

Общие новости 08:06, мая 11, 2024 | 5-tv.ru