Разрабатывают новую модель генеративно-состязательных сетей, которая стабилизирует обучение и производительность

В последние годы искусственный интеллект (ИИ) и модели глубокого обучения быстро развивались, становясь легкодоступными. Это позволило людям, даже не имеющим специальных знаний, выполнять различные задачи с ИИ.

Среди этих моделей генеративно-состязательные сети (GAN) выделяются своей выдающейся производительностью в создании новых экземпляров данных с теми же характеристиками, что и обучающие данные, что делает их особенно эффективными для создания изображений, музыки и текста.

GAN состоят из двух нейронных сетей , а именно генератора, который создает новые распределения данных, начиная со случайного шума, и дискриминатора, который проверяет, является ли сгенерированное распределение данных «реальным» (соответствующим обучающим данным) или «поддельным».

По мере обучения генератор совершенствуется в генерации реалистичных распределений, а дискриминатор — в идентификации сгенерированных данных как поддельных.

GAN используют функцию потерь для измерения различий между поддельными и реальными распределениями.

Однако этот подход может вызывать такие проблемы, как исчезновение градиента и нестабильное обучение, напрямую влияющие на стабильность и эффективность.

Несмотря на значительный прогресс в улучшении GAN, включая структурные модификации и корректировки функции потерь, такие проблемы, как исчезновение градиента и коллапс мод, когда генератор выдает ограниченное разнообразие, продолжают ограничивать их применимость.

Для решения этих проблем группа исследователей под руководством доцента Минхёка Ли из Школы электротехники и электроники в Университете Чунг-Анг, Республика Корея, разработала новую стратегию.

«Представьте, что вы обучаете художника рисовать пейзажи. Последовательное руководство может привести к тому, что он будет создавать похожие сцены, явление, называемое коллапсом мод в машинном обучении.

Чтобы предотвратить это, наша модель PMF-GAN совершенствует возможности дискриминатора, наказывая генератор за создание слишком похожих выходных данных, тем самым способствуя разнообразию», — объясняет доктор Ли.

Их результаты были опубликованы в журнале Applied Soft Computing в октябре 2024 года.

Фреймворк PMF-GAN вводит два ключевых усовершенствования. Во-первых, он использует оптимизацию ядра для улучшения возможностей дискриминатора, предлагая значительное преимущество в решении проблем коллапса модели и исчезновения градиента.

Ядра — это математические функции, которые преобразуют данные в более многомерное пространство, что упрощает обнаружение закономерностей даже в сложных данных.

Выходные данные дискриминатора обрабатываются с помощью функций ядра, производя оценку плотности ядра (KDE). Во-вторых, PMF-GAN применяет математический метод, называемый преобразованием гистограммы, к выходным данным KDE, что позволяет проводить более интуитивный анализ результатов.

Во время обучения модель минимизирует разницу между преобразованными ядром-гистограммой поддельными и реальными распределениями, меру, называемую расстоянием PMF.

В частности, этот по.

Опубликовано: 07:26, октября 24, 2024 Рубрика: Интернет и Игры Источник: android-robot.com Поделиться:

В Башкирии участники нацпроекта «Производительность труда» смогут пройти обучение по программе «Рационализатор» В Башкортостане работники предприятий, участвующих в национальном проекте «Производительность труда», смогут пройти обучение по программе «Рационализ …

Общие новости 02:18, мая 30, 2024 | mgazeta.com

Разрабатывают 3D-модель для лучшего лечения неврологических расстройств 3D-модель, разработанная нейробиологами Университета Западной Вирджинии, показывает, как имплантируемые стимуляторы — те, которые используются для ле …

Наука и Технологии 12:36, мая 29, 2024 | android-robot.com

В РЖД разрабатывают новую систему оборота билетов В РЖД внедряют новшества в системе покупки и обмена билетов. РЖД работают над созданием листа ожидания для покупки новых или возвращённых билетов онл …

Общество и Регионы 01:00, мая 23, 2024 | pravda.ru

Банки разрабатывают новую платёжную систему без карт Крупнейшие российские банки, включая «Сбер», Альфа-банк и Т-банк, инициировали разработку новой платёжной системы, функционирующей без использования …

Общество и Регионы 07:26, октября 16, 2025 | versia.ru

Новую систему защиты от телефонных мошенников разрабатывают в России Разработка позволит с вероятностью 99% выявить, что клиент общался со злоумышленниками и предупредить его о рисках …

Общие новости 03:06, июня 7, 2024 | atvmedia.ru

Региональная команда Брянской области завершила обучение методам бережливого производства на базе регионального центра компетенций в рамках нацпроекта «Производительность труда» На базе Регионального центра компетенций в сфере производительности труда Брянской области в рамках реализации нацпроекта «Производительность труда» …

Общие новости 17:54, мая 22, 2024 | desnyanskaya-pravda.ru

Разрабатывают новую стратегию 3D-печати с пористыми структурами с контролируемыми градиентами Технология экструзии материалов 3D-печати широко используется в биопроизводстве/биопечати, тканевой инженерии, гибкой электронике и мягкой робототехн …

Наука и Технологии 14:26, июля 3, 2024 | android-robot.com

Каждому – по "однушке": в Алтайском крае разрабатывают новую строительную стратегию Через шесть лет на одного жителя Алтайского края должно приходиться 33 кв. метра жилья. Через девять лет – 38 кв. метров. Путь к этим показателям опи …

Общие новости 05:06, мая 25, 2024 | tolknews.ru

Napoleon IT разработал LLM-модель для аналитики комментариев из социальных сетей и маркетплейсов ИИ-компания Napoleon IT улучшила свой продукт по интеллектуальному анализу обратной связи «Наполеон.Отзывы». Теперь... …

Интернет 14:18, апреля 18, 2024 | internet.cnews.ru

Разрабатывают новую технологию 3D-печати для ультратонких трубчатых конструкций из нескольких материалов Новая технология 3D-печати, разработанная исследователями из Университета Бэйхан, позволила печатать трубчатые конструкции из нескольких материалов с …

Hardware 15:30, мая 4, 2024 | android-robot.com

Ученые СКФУ разрабатывают новую концепцию для оценки потенциальной радоноопасности территорий Исследования проводятся совместно с коллегами из МГУ И РАН на территории Кавказских Минеральных Вод, в Алтайском крае и Московском регионе …

Общие новости 15:18, июня 1, 2024 | atvmedia.ru

Китайская MiniMax представила ИИ-модель M1 — её обучение обошлось в 200 раз дешевле GPT-4 Это становится привычной практикой: каждые несколько месяцев малоизвестная компания из Китая выпускает большую языковую модель (LLM), которая опровер …

Hardware 07:26, июня 22, 2025 | 3dnews.ru

Новая модель ИИ улучшит создание анимации и обучение роботов Ученые из Пекинского университета и Пекинского института технологий представили новую модель искусственного интеллекта (ИИ), способную генерировать в …

Наука и Технологии 00:48, апреля 24, 2024 | ferra.ru

Брянский священник освятил новую партию маскировочных сетей для воинов СВО Благочинный Навлинского церковного округа, настоятель храма в честь Казанской иконы Божией Матери поселка Навля и руководитель Координационного центр …

Общие новости 00:26, октября 2, 2025 | брянский-рабочий.рф

Alibaba представила открытую ИИ-модель, которая лучше OpenAI Китайская компания Alibaba представила модель искусственного интеллекта с открытым исходным кодом под названием QwQ-32B-Preview. Модель способна реша …

Гаджеты 07:26, ноября 30, 2024 | 24gadget.ru

Alibaba представила большую языковую модель, которая отчасти превзошла GPT-4 Компания Alibaba Cloud анонсировала выпуск улучшенной версии своей большой языковой модели Qwen2.5. Новая нейросеть продемонстрировала превосходство …

Hardware 09:06, мая 10, 2024 | 3dnews.ru

Alibaba представила ИИ-модель Qwen VLo, которая умеет редактировать картинки Alibaba представила ИИ нового поколения, который существенно упростит пользователям создание и редактирование изображений на основе текстов и визуаль …

Hardware 07:26, июня 28, 2025 | 3dnews.ru

OpenAI представила новую ИИ-модель GPT-4o Американская компания OpenAI представила мультимодальную модель генеративного искусственного интеллекта GPT-4o, которая может анализировать звук, изо …

Наука и Технологии 00:48, мая 15, 2024 | kommersant.ru

В Китае представлена модель генерации видео, которая превращает изображение в видеоролик Новый ИИ от ByteDance создает реалистичные видео из одной фотографии. Исследователи ByteDance разработали систему искусственного интеллекта, которая …

Software 07:26, февраля 7, 2025 | android-robot.com

Vodafone разрабатывает собственную модель ИИ, которая будет работать как помощник оператора Компания разработала собственную ИИ-модель, которая будет работать как супервизор в контакт-центрах, фактически выполняя роль помощника оператора. Vo …

Гаджеты 15:06, мая 29, 2024 | gagadget.com

xAI представила Grok-1.5V — свою первую мультимодальную модель, которая теперь обрабатывает и изображения Стартап Илона Маска (Elon Musk) xAI анонсировал выход своей первой мультимодальной модели под названием Grok-1.5 Vision, или Grok-1.5V. В отличие от …

Гаджеты 21:48, апреля 16, 2024 | gagadget.com

OpenAI представила o1 — модель, которая может сама себя проверять. Она в разы круче GPT-4o Компания OpenAI, занимающаяся разработкой ChatGPT, объявила о выпуске своего нового продукта — генеративная модель искусственного интеллекта под кодо …

Это интересно 07:26, сентября 14, 2024 | incrussia.ru

Topaz Labs представила диффузную ИИ-модель, которая автоматически улучшает старые видео Компания Topaz Labs, специализирующая на разработке программного обеспечения для редактирования фотографий и видео, представила модель ИИ Project Sta …

Software 21:26, февраля 7, 2025 | 3dnews.ru

В России введут новую модель высшего образования Заместитель председателя правительства России Дмитрий Чернышенко заявил, что в стране введут новую модель высшего образования. …

Общество и Регионы 15:48, мая 12, 2024 | news.rambler.ru