Разрабатывают новую модель генеративно-состязательных сетей, которая стабилизирует обучение и производительность
Среди этих моделей генеративно-состязательные сети (GAN) выделяются своей выдающейся производительностью в создании новых экземпляров данных с теми же характеристиками, что и обучающие данные, что делает их особенно эффективными для создания изображений, музыки и текста.
GAN состоят из двух нейронных сетей , а именно генератора, который создает новые распределения данных, начиная со случайного шума, и дискриминатора, который проверяет, является ли сгенерированное распределение данных «реальным» (соответствующим обучающим данным) или «поддельным».
По мере обучения генератор совершенствуется в генерации реалистичных распределений, а дискриминатор — в идентификации сгенерированных данных как поддельных.
GAN используют функцию потерь для измерения различий между поддельными и реальными распределениями.
Однако этот подход может вызывать такие проблемы, как исчезновение градиента и нестабильное обучение, напрямую влияющие на стабильность и эффективность.
Несмотря на значительный прогресс в улучшении GAN, включая структурные модификации и корректировки функции потерь, такие проблемы, как исчезновение градиента и коллапс мод, когда генератор выдает ограниченное разнообразие, продолжают ограничивать их применимость.
Для решения этих проблем группа исследователей под руководством доцента Минхёка Ли из Школы электротехники и электроники в Университете Чунг-Анг, Республика Корея, разработала новую стратегию.
«Представьте, что вы обучаете художника рисовать пейзажи. Последовательное руководство может привести к тому, что он будет создавать похожие сцены, явление, называемое коллапсом мод в машинном обучении.
Чтобы предотвратить это, наша модель PMF-GAN совершенствует возможности дискриминатора, наказывая генератор за создание слишком похожих выходных данных, тем самым способствуя разнообразию», — объясняет доктор Ли.
Их результаты были опубликованы в журнале Applied Soft Computing в октябре 2024 года.
Фреймворк PMF-GAN вводит два ключевых усовершенствования. Во-первых, он использует оптимизацию ядра для улучшения возможностей дискриминатора, предлагая значительное преимущество в решении проблем коллапса модели и исчезновения градиента.
Ядра — это математические функции, которые преобразуют данные в более многомерное пространство, что упрощает обнаружение закономерностей даже в сложных данных.
Выходные данные дискриминатора обрабатываются с помощью функций ядра, производя оценку плотности ядра (KDE). Во-вторых, PMF-GAN применяет математический метод, называемый преобразованием гистограммы, к выходным данным KDE, что позволяет проводить более интуитивный анализ результатов.
Во время обучения модель минимизирует разницу между преобразованными ядром-гистограммой поддельными и реальными распределениями, меру, называемую расстоянием PMF.
В частности, этот по.
В Башкирии участники нацпроекта «Производительность труда» смогут пройти обучение по программе «Рационализатор» В Башкортостане работники предприятий, участвующих в национальном проекте «Производительность труда», смогут пройти обучение по программе «Рационализ …
Общие новости 02:18, мая 30, 2024 | mgazeta.comРазрабатывают 3D-модель для лучшего лечения неврологических расстройств 3D-модель, разработанная нейробиологами Университета Западной Вирджинии, показывает, как имплантируемые стимуляторы — те, которые используются для ле …
Наука и Технологии 12:36, мая 29, 2024 | android-robot.comВ РЖД разрабатывают новую систему оборота билетов В РЖД внедряют новшества в системе покупки и обмена билетов. РЖД работают над созданием листа ожидания для покупки новых или возвращённых билетов онл …
Общество и Регионы 01:00, мая 23, 2024 | pravda.ruБанки разрабатывают новую платёжную систему без карт Крупнейшие российские банки, включая «Сбер», Альфа-банк и Т-банк, инициировали разработку новой платёжной системы, функционирующей без использования …
Общество и Регионы 07:26, октября 16, 2025 | versia.ruНовую систему защиты от телефонных мошенников разрабатывают в России Разработка позволит с вероятностью 99% выявить, что клиент общался со злоумышленниками и предупредить его о рисках …
Общие новости 03:06, июня 7, 2024 | atvmedia.ru
Региональная команда Брянской области завершила обучение методам бережливого производства на базе регионального центра компетенций в рамках нацпроекта «Производительность труда» На базе Регионального центра компетенций в сфере производительности труда Брянской области в рамках реализации нацпроекта «Производительность труда» …
Общие новости 17:54, мая 22, 2024 | desnyanskaya-pravda.ruРазрабатывают новую стратегию 3D-печати с пористыми структурами с контролируемыми градиентами Технология экструзии материалов 3D-печати широко используется в биопроизводстве/биопечати, тканевой инженерии, гибкой электронике и мягкой робототехн …
Наука и Технологии 14:26, июля 3, 2024 | android-robot.comКаждому – по "однушке": в Алтайском крае разрабатывают новую строительную стратегию Через шесть лет на одного жителя Алтайского края должно приходиться 33 кв. метра жилья. Через девять лет – 38 кв. метров. Путь к этим показателям опи …
Общие новости 05:06, мая 25, 2024 | tolknews.ru
Napoleon IT разработал LLM-модель для аналитики комментариев из социальных сетей и маркетплейсов ИИ-компания Napoleon IT улучшила свой продукт по интеллектуальному анализу обратной связи «Наполеон.Отзывы». Теперь... …
Интернет 14:18, апреля 18, 2024 | internet.cnews.ru
Разрабатывают новую технологию 3D-печати для ультратонких трубчатых конструкций из нескольких материалов Новая технология 3D-печати, разработанная исследователями из Университета Бэйхан, позволила печатать трубчатые конструкции из нескольких материалов с …
Hardware 15:30, мая 4, 2024 | android-robot.com
Ученые СКФУ разрабатывают новую концепцию для оценки потенциальной радоноопасности территорий Исследования проводятся совместно с коллегами из МГУ И РАН на территории Кавказских Минеральных Вод, в Алтайском крае и Московском регионе …
Общие новости 15:18, июня 1, 2024 | atvmedia.ru
Китайская MiniMax представила ИИ-модель M1 — её обучение обошлось в 200 раз дешевле GPT-4 Это становится привычной практикой: каждые несколько месяцев малоизвестная компания из Китая выпускает большую языковую модель (LLM), которая опровер …
Hardware 07:26, июня 22, 2025 | 3dnews.ru
Новая модель ИИ улучшит создание анимации и обучение роботов Ученые из Пекинского университета и Пекинского института технологий представили новую модель искусственного интеллекта (ИИ), способную генерировать в …
Наука и Технологии 00:48, апреля 24, 2024 | ferra.ru
Брянский священник освятил новую партию маскировочных сетей для воинов СВО Благочинный Навлинского церковного округа, настоятель храма в честь Казанской иконы Божией Матери поселка Навля и руководитель Координационного центр …
Общие новости 00:26, октября 2, 2025 | брянский-рабочий.рф
Alibaba представила открытую ИИ-модель, которая лучше OpenAI Китайская компания Alibaba представила модель искусственного интеллекта с открытым исходным кодом под названием QwQ-32B-Preview. Модель способна реша …
Гаджеты 07:26, ноября 30, 2024 | 24gadget.ru
Alibaba представила большую языковую модель, которая отчасти превзошла GPT-4 Компания Alibaba Cloud анонсировала выпуск улучшенной версии своей большой языковой модели Qwen2.5. Новая нейросеть продемонстрировала превосходство …
Hardware 09:06, мая 10, 2024 | 3dnews.ru
Alibaba представила ИИ-модель Qwen VLo, которая умеет редактировать картинки Alibaba представила ИИ нового поколения, который существенно упростит пользователям создание и редактирование изображений на основе текстов и визуаль …
Hardware 07:26, июня 28, 2025 | 3dnews.ru
OpenAI представила новую ИИ-модель GPT-4o Американская компания OpenAI представила мультимодальную модель генеративного искусственного интеллекта GPT-4o, которая может анализировать звук, изо …
Наука и Технологии 00:48, мая 15, 2024 | kommersant.ru
В Китае представлена модель генерации видео, которая превращает изображение в видеоролик Новый ИИ от ByteDance создает реалистичные видео из одной фотографии. Исследователи ByteDance разработали систему искусственного интеллекта, которая …
Software 07:26, февраля 7, 2025 | android-robot.com
Vodafone разрабатывает собственную модель ИИ, которая будет работать как помощник оператора Компания разработала собственную ИИ-модель, которая будет работать как супервизор в контакт-центрах, фактически выполняя роль помощника оператора. Vo …
Гаджеты 15:06, мая 29, 2024 | gagadget.com
xAI представила Grok-1.5V — свою первую мультимодальную модель, которая теперь обрабатывает и изображения Стартап Илона Маска (Elon Musk) xAI анонсировал выход своей первой мультимодальной модели под названием Grok-1.5 Vision, или Grok-1.5V. В отличие от …
Гаджеты 21:48, апреля 16, 2024 | gagadget.com
OpenAI представила o1 — модель, которая может сама себя проверять. Она в разы круче GPT-4o Компания OpenAI, занимающаяся разработкой ChatGPT, объявила о выпуске своего нового продукта — генеративная модель искусственного интеллекта под кодо …
Это интересно 07:26, сентября 14, 2024 | incrussia.ru
Topaz Labs представила диффузную ИИ-модель, которая автоматически улучшает старые видео Компания Topaz Labs, специализирующая на разработке программного обеспечения для редактирования фотографий и видео, представила модель ИИ Project Sta …
Software 21:26, февраля 7, 2025 | 3dnews.ru
В России введут новую модель высшего образования Заместитель председателя правительства России Дмитрий Чернышенко заявил, что в стране введут новую модель высшего образования. …
Общество и Регионы 15:48, мая 12, 2024 | news.rambler.ru