Новая структура может генерировать изображения, более соответствующие ожиданиям пользователя

Новая структура может генерировать изображения, более соответствующие ожиданиям пользователя
Генеративные модели, искусственные нейронные сети, которые могут генерировать изображения или тексты, стали все более продвинутыми в последние годы. Эти модели также могут быть полезны для создания аннотированных изображений для обучения алгоритмов компьютерного зрения, которые предназначены для классификации изображений или содержащихся в них объектов.

Хотя многие генеративные модели, в частности генеративные состязательные сети (GAN), могут создавать синтетические изображения, которые напоминают те, что сняты камерами, надежный контроль содержания изображений, которые они производят, оказался сложной задачей.

Во многих случаях изображения, созданные GAN, не соответствуют точным требованиям пользователей, что ограничивает их использование для различных приложений.

Исследователи из Сеульского национального университета науки и технологий недавно представили новую структуру генерации изображений , разработанную для включения контента, который пользователи хотели бы видеть в сгенерированных изображениях.

Эта структура, представленная в статье, опубликованной на сервере препринтов arXiv , позволяет пользователям осуществлять больший контроль над процессом генерации изображений, создавая изображения, которые больше соответствуют тем, которые они себе представляли.

«Благодаря внедрению генеративных моделей был достигнут значительный прогресс в создании изображений», — пишут Джанг Х.

Ле, Ань К. Нгуен и исследователи в своей статье. «Однако точный контроль содержимого генерируемых изображений остается сложной задачей из-за их фундаментальной цели обучения.

В данной статье рассматривается эта проблема путем предложения новой структуры генерации изображений, специально разработанной для включения желаемого содержимого в выходные изображения».

В отличие от многих существующих моделей для генерации изображений, структура, разработанная Ле, Нгуеном и их коллегами, может быть загружена в реальное изображение, которое затем используется для руководства процессом генерации изображения.

Таким образом, содержание синтетических изображений, которые она генерирует, очень похоже на содержание эталонного изображения, даже если сами изображения отличаются.

«Фреймворк использует передовые методы кодирования, интегрируя подсети, называемые модулями слияния контента и частотного кодирования», — пишут Ле, Нгуен и их коллеги.

«Модуль кодирования частоты сначала фиксирует особенности и структуры эталонных изображений, фокусируясь исключительно на выбранных частотных компонентах. Затем модуль слияния контента генерирует вектор, направляющий контент, который инкапсулирует желаемые особенности контента».

Таким образом, структура, разработанная исследователями, имеет два отдельных компонента. Первый — это кодер, модуль, который извлекает связанные с контентом особенности из эталонного изображения, подаваемого в модель.

Второй — это модуль слияния контента, который генерирует векторы для вновь сгенерированных изображений, которые руководствуются контентом, извлеченным из эталонн.

Опубликовано: 21:26, декабря 5, 2024 Рубрика: Software Источник: android-robot.com Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit
 
 
Новая нейросеть от Microsoft может генерировать видео по одному изображению

Новая нейросеть от Microsoft может генерировать видео по одному изображению Американская корпорация Microsoft представила новую нейросеть VASA-1, которая может создавать видео на основе одного изображения. Для использования н …

Наука и Технологии 16:00, апреля 19, 2024 | kommersant.ru
Nvidia придумала, как с помощью ИИ генерировать точные изображения без текстовых запросов  подойдёт он не всем

Nvidia придумала, как с помощью ИИ генерировать точные изображения без текстовых запросов — подойдёт он не всем Nvidia выпустила мощный инструмент, позволяющий разработчикам генерировать изображения в Blender, используя в качестве основы 3D-модель, а не текстов …

Software 21:26, мая 1, 2025 | 3dnews.ru
Синицын: Мусаев может выстроить игру, которая будет соответствовать ожиданиям Краснодара

Синицын: «Мусаев может выстроить игру, которая будет соответствовать ожиданиям «Краснодара» Экс-вратарь «Краснодара» Андрей Синицын отреагировал на продление клубом контракта с главным тренером Мурадом Мусаевым. …

Футбол 05:06, мая 30, 2024 | sport-express.ru
Новая функция Windows 11 позволит записывать все действия пользователя

Новая функция Windows 11 позволит записывать все действия пользователя Американская корпорация Microsoft представила новую функцию Recall для операционной системы Windows 11 — она позволит отслеживать и фиксировать дейст …

Наука и Технологии 21:06, мая 21, 2024 | kommersant.ru
Новая ИИ-функция в Windows 11 будет запоминать все действия пользователя

Новая ИИ-функция в Windows 11 будет запоминать все действия пользователя Инсайдер под ником Xeno в предварительных сборках Windows 11 обнаружил упоминание новой функции для ИИ-инструмента Microsoft AI Explorer. Эта функция …

Наука и Технологии 20:18, мая 7, 2024 | 4pda.to
Особая значимость. Раскрыто, о чем говорит новая структура правительства РФ

Особая значимость. Раскрыто, о чем говорит новая структура правительства РФ Эксперт отметил, что серьезных изменений в структуре правительства нет, но ее посыл говорит о многом. …

Общие новости 18:00, мая 11, 2024 | aif.ru
Харьков больше не может самостоятельно генерировать электричество

Харьков больше не может самостоятельно генерировать электричество Мэр Харькова Игорь Терехов объявил, что у города больше нет возможности самостоятельно генерировать электричество из-за серьезных разрушений энергети …

Общие новости 16:36, апреля 24, 2024 | kommersant.ru
Новая структура машинного обучения повышает точность и эффективность 3D-печати металлом

Новая структура машинного обучения повышает точность и эффективность 3D-печати металлом Исследователи из Инженерного университета Торонто под руководством профессора Юй Цзоу используют машинное обучение для улучшения аддитивного производ …

Наука и Технологии 00:26, марта 23, 2025 | android-robot.com
Новая 3D-полимерная структура сочетает в себе легкий вес с высокой плотностью энергии

Новая 3D-полимерная структура сочетает в себе легкий вес с высокой плотностью энергии Исследовательская группа разработала трехмерную полимерную структуру, легкую структуру, которая облегчает транспортировку ионов лития (Li). Их исслед …

Hardware 14:36, мая 27, 2024 | android-robot.com
Новая структура позволяет роботам обучаться с помощью онлайн-видеороликов с демонстрацией действий людей

Новая структура позволяет роботам обучаться с помощью онлайн-видеороликов с демонстрацией действий людей Для успешного использования в реальных условиях роботы должны быть способны надежно выполнять различные повседневные задачи, начиная от домашних дел …

Software 14:26, августа 11, 2024 | android-robot.com
Бить цифрой, разить процентом // Как новая структура правительства скажется на работе исполнительной власти

Бить цифрой, разить процентом // Как новая структура правительства скажется на работе исполнительной власти Формирование нового состава правительства во главе с премьер-министром Михаилом Мишустиным пришлось на майские праздники и уже практически завершилос …

Экономика 22:48, мая 13, 2024 | kommersant.ru
Найденная под пирамидой структура может переписать всю историю

Найденная под пирамидой структура может переписать всю историю Комплекс пирамид Гизы, включающий пирамиды Хуфу, Хафра и Менкаура, был построен около 4500 лет назад. …

Наука и Технологии 14:26, января 27, 2026 | news.rambler.ru
Сторонники ИГИЛ используют искусственный интеллект, чтобы генерировать ролики о терактах. Эксперты опасаются, что технологии делают исламистскую проп

Сторонники ИГИЛ используют искусственный интеллект, чтобы генерировать ролики о терактах. Эксперты опасаются, что технологии делают исламистскую пропаганду более эффективной Через четыре дня после теракта в московском «Крокус Сити Холле» террористическая группировка «Вилаят Хорасан» опубликовала видео о нападении. В ролик …

Общие новости 01:24, июня 9, 2024 | meduza.io
Структура, близкая к Газпром нефти, может заняться выпуском авиакомпонентов

Структура, близкая к «Газпром нефти», может заняться выпуском авиакомпонентов Сейчас авиапрому критически не хватает поставщиков комплектующих для российских самолетов, отмечают эксперты …

Бизнес и Промышленность 21:26, октября 23, 2025 | vedomosti.ru
Последняя новая модель Volkswagen с двигателем внутреннего сгорания. Изображения и подробности о Volkswagen T-Roc 2025

Последняя новая модель Volkswagen с двигателем внутреннего сгорания. Изображения и подробности о Volkswagen T-Roc 2025 Компактный кроссовер Volkswagen T-Roc оказался очень популярной моделью в Европе и Азиатско-Тихоокеанском регионе, поэтому к новому поколению машины …

Наука и Технологии 00:30, июня 10, 2024 | ixbt.com
Структура ИКС Холдинга может получить из бюджета 9,3 млрд рублей на спутники связи

Структура "ИКС Холдинга" может получить из бюджета 9,3 млрд рублей на спутники связи Проект космической компании "Бюро 1440" (входит в IT-группу "ИКС Холдинг") по обеспечению спутникового широкополосного доступа в интернет (ШПД) может …

Общие новости 09:18, июня 4, 2024 | interfax.ru
Новый антивирус в мобильном приложении СберБизнес может обнаружить уязвимость в момент авторизации пользователя и защитить его от киберугрозы

Новый антивирус в мобильном приложении «СберБизнес» может обнаружить уязвимость в момент авторизации пользователя и защитить его от киберугрозы 800 тыс. пользователей мобильного приложения «СберБизнес» на платформе Android теперь лучше защищены от вирусов и... …

Интернет 14:26, марта 23, 2025 | internet.cnews.ru
В интернете появились изображения, характеристики и цена на Vivo V40 Lite, который может появится в Европе

В интернете появились изображения, характеристики и цена на Vivo V40 Lite, который может появится в Европе Скоро состоится запуск смартфона среднего класса Vivo V40 Lite и свежая утечка предоставила новую информацию о его дизайне и спецификациях. Наши колл …

Гаджеты 20:30, июня 10, 2024 | gagadget.com
Вопреки ожиданиям: Фильм Сто лет тому вперед собрал первый миллиард

Вопреки ожиданиям: Фильм «Сто лет тому вперед» собрал первый миллиард Сборы фильма «Сто лет тому вперед» в российском кинопрокате перевалили за миллиард рублей, хотя изначально картина «не зашла» молодым зрителям. …

Общие новости 13:30, мая 11, 2024 | nsn.fm
Роман Смирнов (Девелоника): Текущий уровень включения ИТ в медицине и цифровизации этой отрасли экономики полностью соответствует ожиданиям рынка

Роман Смирнов (Девелоника): «Текущий уровень включения ИТ в медицине и цифровизации этой отрасли экономики полностью соответствует ожиданиям рынка» Среди проектов «Девелоники» (ГК Softline) в сфере медицины ключевыми являются разработка сервисов для удаленной записи к врачу, кабинеты пациентов, г …

Наука и Технологии 00:26, сентября 5, 2024 | ict-online.ru
Новая напасть: в Афганистане более 700 семей пострадали из-за дождей

Новая напасть: в Афганистане более 700 семей пострадали из-за дождей Более 700 семей пострадали от наводнений в трёх провинциях Афганистана. Их дома полностью или частично разрушены, более 1000 акров сельскохозяйственн …

Экология 14:26, октября 9, 2025 | eadaily.com
Новая надежда: на чем может вырасти рынок M&A

Новая надежда: на чем может вырасти рынок M&A Российский рынок слияний и поглощений подошел к 2025 году с минимальным за десять лет числом сделок, снижением активности иностранных инвесторов и вы …

Власть и Закон 21:26, мая 28, 2025 | pravo.ru
Alphacool Core DDCzero PWM: новая более мощная и эффективная помпа

Alphacool Core DDCzero PWM: новая более мощная и эффективная помпа Выставка Computex откроет свои двери на следующей неделе. Компания Alphacool уже представила одну из своих выставочных новинок – помпу Core DDCzero P …

Наука и Технологии 09:24, июня 1, 2024 | hardwareluxx.ru
Новая метрика Visa: более 90% транзакций со стейблкоинами не являются подлинными

Новая метрика Visa: более 90% транзакций со стейблкоинами не являются подлинными Сектору стейблкоинов не чужды противоречия, но недавнее исследование ставит под сомнение, широко ли используются эти активы, как утверждается. Соглас …

Крипто 02:00, мая 7, 2024 | cryptobrokers.ru