Кредит: Pixabay/CC0 Public Domain
Исследователи продемонстрировали новый инструмент сжатия изображений, который сочетает рекурсивные алгоритмы со сверточными нейронными сетями (CNN), чтобы превзойти другие подходы к сжатию изображений из компьютерного искусства и дизайна взаимодействия. Исследование опубликовано в Международном журнале вычислительной системной инженерии.
Цифровое искусство и дизайн все больше полагаются на большие объемы визуальных данных, поэтому эффективное сжатие изображений важно для снижения требований к хранению на компьютере без ущерба качеству. Дуань Сун из отделения изящных искусств в колледже профессионального искусства провинции Хэбэй в Шицзячжуане, Китай, предложил алгоритм, который решает проблемы путем интеграции традиционных и современных методов.
Рекурсивные алгоритмы, которые упрощают сложные проблемы путем многократного применения правил. Сун объясняет, что этот подход работает путем разбиения изображения на более простые компоненты. Применяя процесс итеративно, можно поддерживать качество.
Интеграция CNN в подход к сжатию основана на том, как такие системы изначально вдохновлялись тем, как человеческий мозг обрабатывает визуальную информацию. Они широко используются в глубоком обучении для распознавания и обработки изображений.
Инновационное слияние рекурсивных методов с CNN Сонга позволяет ему преодолеть некоторые ограничения более ранних методов сжатия изображений, которые обычно испытывают трудности в достижении полезных коэффициентов сжатия из-за растущей сложности и масштаба современных данных изображений.
Song протестировал алгоритм на двух известных наборах данных изображений, Kodak1 и Kodak2, чтобы оценить его производительность. Результаты показывают, что алгоритм последовательно уменьшал среднюю квадратическую ошибку (MSE) между исходными и сжатыми изображениями. Более низкая MSE означает лучшее сохранение качества изображения.
После 800 итераций алгоритм достиг самого низкого MSE по сравнению с другими методами, а также показал хорошие результаты с точки зрения пикового отношения сигнал/шум и многомасштабного структурного сходства. Эти результаты показывают, что предлагаемый метод может эффективно сжимать изображения без значительной потери качества.
Этот подход будет полезен в области компьютерного искусства, но также может быть полезен в моделировании анимации, дизайне интерфейсов для искусства и медицинской визуализации.
Дополнительная информация: Дуань Сонг, Моделирование рекурсивного количественного анализа взаимодействия компьютерного искусства и дизайна, Международный журнал вычислительной системной инженерии (2024). DOI: 10.1504/IJCSYSE.2024.139715 Предоставлено Inderscience