Новый метод защиты ИИ защищает модели от атак противников

Новый метод защиты ИИ защищает модели от атак противников
Нейронные сети, тип искусственного интеллекта, смоделированный на основе связей человеческого мозга, являются движущей силой критических прорывов в широком спектре научных областей. Но эти модели сталкиваются со значительной угрозой со стороны враждебных атак, которые могут свести на нет прогнозы и выдавать неверную информацию.

Исследователи из Национальной лаборатории Лос-Аламоса разработали новую стратегию очистки, которая противодействует состязательным атакам и сохраняет надежную работу нейронных сетей .

Их исследование опубликовано на сервере препринтов arXiv . «Атаки на системы искусственного интеллекта могут принимать форму крошечных, почти невидимых изменений в изображениях ввода, тонких модификаций, которые могут направить модель к желаемому злоумышленником результату», — сказал Маниш Бхаттараи, компьютерный ученый из Лос-Аламоса.

«Такие уязвимости позволяют злоумышленникам наводнять цифровые каналы обманчивым или вредоносным контентом под видом подлинных выходных данных, что создает прямую угрозу доверию и надежности технологий, управляемых искусственным интеллектом».

Метод низкоранговой итерационной диффузии (LoRID) удаляет вредоносные вмешательства из входных данных, используя мощь генеративных шумоподавляющих диффузионных процессов в тандеме с передовыми методами тензорной декомпозиции.

В серии тестов на эталонных наборах данных LoRID достиг непревзойденной точности в нейтрализации вредоносного шума в сценариях атак, потенциально продвигая более безопасные и надежные возможности ИИ.

Победа над опасным шумом Диффузия — это метод обучения моделей ИИ путем добавления шума к данным и последующего обучения моделей его удалению. Обучаясь очистке шума, модель ИИ эффективно изучает базовую структуру данных, что позволяет ей самостоятельно генерировать реалистичные образцы.

При очистке на основе диффузии модель использует свое усвоенное представление «чистых» данных для выявления и устранения любых враждебных помех, внесенных во входные данные.

К сожалению, применение слишком большого количества шагов по очистке от шума может привести к потере важных деталей из данных (представьте себе, что вы так агрессивно очищаете фотографию, что она теряет четкость), в то время как слишком малое количество шагов оставляет место для сохранения вредных возмущений.

Метод LoRID позволяет найти этот компромисс, используя несколько раундов шумоподавления на ранних этапах процесса диффузии, помогая модели устранить ровно столько шума, сколько нужно, не ставя под угрозу содержательное содержание данных, тем самым защищая модель от атак.

Важно, что состязательные входы часто раскрывают тонкие «низкоранговые» сигнатуры — шаблоны, которые могут проскользнуть мимо сложной защиты.

Используя технику, называемую тензорной факторизацией, LoRID выявляет эти низкоранговые аспекты, усиливая защиту модели в крупных состязательных режимах атак. Команда протестировала LoRID, используя общепризнанные наборы данных эталонных тестов, такие как CIFAR-10, CIFAR-100, Celeb-HQ и Imag.

Опубликовано: 07:26, марта 12, 2025 Рубрика: Интернет и Игры Источник: android-robot.com Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit
 
 
Ученые создали новый метод защиты хирургических швов от микроорганизмов

Ученые создали новый метод защиты хирургических швов от микроорганизмов Ученые создали эффективный способ предотвращения роста бактерий на хирургических швах с использованием наносеребра. Микроорганизмы, привязываясь к по …

Наука и Технологии 00:18, апреля 17, 2024 | ferra.ru
Ученые разработали метод защиты от клонирования голоса

Ученые разработали метод защиты от клонирования голоса Ученые выработали новый метод защиты от голосового клонирования, который поможет предотвратить возможные мошеннические действия. С помощью адверсариа …

Наука и Технологии 23:48, апреля 22, 2024 | ferra.ru
В NixOS предложен метод защиты от подстановки бэкдоров, таких как в XZ

В NixOS предложен метод защиты от подстановки бэкдоров, таких как в XZ Для включения в репозиторий пакетов nixpkgs, применяемый в дистрибутиве NixOS, предложен режим повторяемых сборок, позволяющий выявлять случаи внедре …

Наука и Технологии 00:26, марта 29, 2025 | opennet.ru
Учёные обнаружили необычный метод защиты от хищников у водяных ужей

Учёные обнаружили необычный метод защиты от хищников у водяных ужей Сербские ученые из Белградского университета обнаружили, что водяные ужи используют необычный метод защиты, притворяясь мертвыми и гнилыми, чтобы изб …

Наука и Технологии 06:54, мая 12, 2024 | pravda.ru
Виды атак и методы защиты Guardant SLK против них

Виды атак и методы защиты Guardant SLK против них «Предупрежден — значит вооружен» — очень важный принцип в информационной безопасности. Если вы знаете основные типы атак, которые могут применять взл …

Наука и Технологии 07:26, июня 23, 2025 | ict-online.ru
В Московском Политехе представили эффективный метод защиты электронной почты от нежелательных сообщений

В Московском Политехе представили эффективный метод защиты электронной почты от нежелательных сообщений В Московском Политехе докторант третьего курса обучения кафедры «Криптология» Ташкентского университета... …

Интернет 13:54, июня 4, 2024 | internet.cnews.ru
Новак сообщил о совершенствовании защиты объектов ТЭК от атак беспилотников

Новак сообщил о совершенствовании защиты объектов ТЭК от атак беспилотников Вице-премьер Александр Новак сообщил, что топливно-энергетические комплекс (ТЭК) совершенствует механизмы защиты объектов от ударов беспилотников. Он …

Бизнес 16:36, мая 22, 2024 | kommersant.ru
В РФ разработали систему Пятница для защиты инфраструктуры от атак БПЛА

В РФ разработали систему «Пятница» для защиты инфраструктуры от атак БПЛА Созданную в России систему безопасности «Пятница» для защиты масштабных и значимых объектов инфраструктуры от атак дронов намерены представить на фор …

Общие новости 08:42, апреля 22, 2024 | iz.ru
Систему Пятница для защиты инфраструктуры от атак БПЛА создали в России

Систему «Пятница» для защиты инфраструктуры от атак БПЛА создали в России Российскую систему безопасности «Пятница» для защиты инфраструктурных объектов от атак БПЛА планируется представить на форуме «Арми …

Общие новости 10:12, апреля 22, 2024 | 5-tv.ru
Шольц: Украина может использовать немецкое оружие для защиты от атак из РФ

Шольц: Украина может использовать немецкое оружие для защиты от атак из РФ Канцлер Германии Олаф Шольц вновь заявил, что Украина может применять западное оружие, чтобы «защититься от атак с российской территории». Как переда …

Общие новости 15:00, июня 6, 2024 | kommersant.ru
OCS предлагает сервисы StormWall для защиты от DDoS-рисков и хакерских атак

OCS предлагает сервисы StormWall для защиты от DDoS-рисков и хакерских атак Компания StormWall предлагает рынку решения в области информационной безопасности — сервисы на основе искусственного интеллекта для защиты от DDoS-ат …

Наука и Технологии 14:42, мая 16, 2024 | cwr.osp.ru
Обход защиты от атак Spectre и эксплоит для извлечения данных из памяти другого процесса

Обход защиты от атак Spectre и эксплоит для извлечения данных из памяти другого процесса Исследователи из Швейцарской высшей технической школы Цюриха выявили два способа обхода защиты от атак класса Spectre, основанной на использовании пр …

Интернет и Игры 21:26, октября 20, 2024 | opennet.ru
MWS: спрос на облачные сервисы защиты от DDoS-атак в России за год вырос более чем в 1,7 раза

MWS: спрос на облачные сервисы защиты от DDoS-атак в России за год вырос более чем в 1,7 раза MTS Web Services (MWS; входит в группу МТС) сообщил о том, что закупки российскими компаниями сервисов информационной безопасности... …

Интернет и Игры 16:30, мая 27, 2024 | cnews.ru
Спрос на облачные сервисы защиты от DDoS-атак в России за год вырос более чем в 1,7 раза

Спрос на облачные сервисы защиты от DDoS-атак в России за год вырос более чем в 1,7 раза MTS Web Services (MWS), входит в группу МТС, сообщает о том, что закупки российскими компаниями сервисов информационной... …

Интернет и Игры 16:30, мая 27, 2024 | cnews.ru
Sitronics Group и Servicepipe объявили о партнерстве в сфере защиты российского бизнеса от интернет-атак

Sitronics Group и Servicepipe объявили о партнерстве в сфере защиты российского бизнеса от интернет-атак Российская ИТ-компания Sitronics Group и разработчик ИБ-решений Servicepipe объявили о сотрудничестве, благодаря которому... …

Интернет и Игры 22:36, апреля 22, 2024 | cnews.ru
Blog Post: Компания PRO32 дополнила продуктовый портфель решением для защиты от DDoS-атак Qrator Labs

Blog Post: Компания PRO32 дополнила продуктовый портфель решением для защиты от DDoS-атак Qrator Labs Компания PRO32, поставщик ИТ-решений для бизнеса любого размера, государственных структур и домашних пользователей, заключила партнерское соглашение …

Наука и Технологии 04:00, апреля 20, 2024 | old.sk.ru
Uber и Lyft заключили сделку с Миннесотой. Теперь принят новый закон, который защищает водителей и их зарплату

Uber и Lyft заключили сделку с Миннесотой. Теперь принят новый закон, который защищает водителей и их зарплату Водители Uber и Lyft в Миннесоте получат более высокую зарплату благодаря сделке между штатом и двумя из крупнейших в стране компаниями, предоставляю …

Это интересно 11:36, июня 13, 2024 | incrussia.ru
Новый метод ускорит онлайн-транзакции в 20 раз

Новый метод ускорит онлайн-транзакции в 20 раз Австралийские ученые совместно с коллегами создали способ ускорить работу цифровых подписей в 20 раз. Это обеспечит более быстрые и безопасные онлайн …

Наука и Технологии 05:12, мая 17, 2024 | ferra.ru
Алексей Колодка (RAMAX Group): В 2025 году усилится работа в направлении решений для защиты от DDoS-атак и кражи персональных данных

Алексей Колодка (RAMAX Group): «В 2025 году усилится работа в направлении решений для защиты от DDoS-атак и кражи персональных данных» В 2024 году у RAMAX Group появились новые заказчики, с которыми запущены несколько комплексных проектов. Компания постоянно расширяет линейку стратег …

Наука и Технологии 00:26, февраля 24, 2025 | ict-online.ru
Создан новый метод лечения депрессии и тревоги

Создан новый метод лечения депрессии и тревоги Ученые из Университета Флориды в США обнаружили, что неинвазивная стимуляция мозга током облегчает симптомы депрессии и тревоги у пожилых людей. Резу …

Наука 23:54, апреля 21, 2024 | gazeta.ru
Учёные из MIT разработали новый метод позиционирования атомов

Учёные из MIT разработали новый метод позиционирования атомов Ученые из MIT разработали новый метод позиционирования атомов с точностью до 50 нанометров, что в 10 раз точнее предыдущих методов, где минимальное р …

Наука и Технологии 02:24, мая 5, 2024 | pravda.ru
Открыт новый метод фильтрации и опреснения воды

Открыт новый метод фильтрации и опреснения воды Группа американских исследователей разработала инновационный подход к очистке воды. Этот метод может применяться как в системах опреснения воды, так …

Наука и Технологии 18:30, апреля 16, 2024 | pravda.ru
Ученые MIT разработали новый метод обучения роботов

Ученые MIT разработали новый метод обучения роботов Ученые Массачусетского технологического института (MIT) создали технику, позволяющую обучать многоцелевых роботов на основе данных из разных источник …

Наука и Технологии 13:00, июня 4, 2024 | ferra.ru
Ученые разработали новый метод очистки радиоактивных вод

Ученые разработали новый метод очистки радиоактивных вод Корейские ученые разработали новый метод очистки радиоактивных вод, образующихся при работе атомных электростанций. Новая технология использует наном …

Наука и Технологии 11:00, мая 2, 2024 | ferra.ru