Google рассказала о технологии масштабирования изображений без потери качества

Разработчики Brain Team рассказали в блоге Google AI о достижениях компании в области искусственного интеллекта. Специалисты создали новую технологию масштабирования изображений, способную воспроизвести высококачественную фотографию из снимка с низким разрешением.

Для этого используются две диффузионные модели. Первая называется SR3 или супер-разрешение посредством повторного уточнения. Она принимает на вход картинку с низким разрешением, а затем постепенно добавляет к ней шум, пока изображение не обретёт чёткие формы. Модель учится, обращает процесс вспять, начиная с начала и постепенно удаляя шум для достижения заявленного результата.

Сотрудники Google обнаружили, что SR3 хорошо зарекомендовала себя при масштабировании портретов и фотографий природы. При 8-кратном приближения лиц модель выдаёт результат лучше таких генеративных алгоритмов, как PULSE и FSRGAN.

Второй подход получил название CDM или модель условно-классовой диффузии. Она воспроизводит высокочёткое изображение с помощью данных ImageNet.

Google опубликовала примеры работы, демонстрирующие каскадное масштабирование изображений с низким разрешением: фотографии 32 × 32 увеличивают до 64 × 64, а затем до 256 × 256, а фото размером 64 × 64 — до 256 × 256 и до 1024 × 1024.