Полный текст
1. Предварительные сведения
В настоящее время активно разрабатывается новый метод сжатия информации, основанный на снижении размерности данных. Простейшая модель такого сжатия выглядит так.
Рассмотрим линейную систему уравнений с прямоугольной матрицей [13]
Например, для k=3, n=2 система принимает вид:
Исходная информация моделируется вектором сжатая вектором меньшей размерности. Матрицу принято называть словарем, а её столбцы атомами.
Предполагая, что ранг матрицы полный, система имеет бесконечное число решений. Для создания быстрых алгоритмов восстановления информации предпочтение отдается векторам, имеющим наибольшее количество нулевых координат. Такие решения называются разреженными. Тематика, связанная с разреженными представлениями, широко освещена в литературе, включая источники [110]. В общем виде можно сформулировать следующую задачу: найти такой функционал минимизируя который можно было бы добиться единственности в выборе решения. Формально постановка задачи выглядит следующим образом: и Традиционный выбор в качестве функционала евклидовой нормы позволяет найти единственное решение, которое, однако, не является разреженным [1]. Для поиска разреженных решений интересно рассмотреть нормы и псевдонормы, отличные от евклидовой.
В данной работе будут рассмотрены функционалы вида .
Для функционал определяет количество ненулевых координат вектора
Для этого функционала формулируется задача минимизации такая, что .
Представляет интерес и такая постановка задачи. Допускается -отклонение от точного решения системы, но по-прежнему сохраняется требование получить разреженное решение [4]. Одна из возможных постановок такой задачи выглядит так: такое, что
2. Основные результаты
В данной работе в качестве словаря рассматривается вещественная ортогональная -матрица и для такого словаря решаются задачи Для решения поставленных задач составляется целевая функция [1] с параметром с классическими нормами при и с псевдонормой при
и задача сводится к нахождению вектора который минимизирует определенную таким образом функцию,
Используя ортогональность матрицы имеем:
В первом переходе использовалось свойство унитарности, . Второй осуществляется с использованием точного решения . Последний переход использует изометрию унитарного преобразования относительно евклидовой нормы.
Получившееся равенство можно записать следующим образом:
Такая форма записи позволяет заменить задачу векторной оптимизации серией задач скалярной оптимизации.
3. Задача
В этой задаче оптимальные координаты принимают вид:
при и
при
Минимум первой функции достигается при и равен а минимум второй достигается при и равен
Сравним найденные экстремумы для получения условий для
Соответственно
Рис. 1. График зависимости оптимальных координат от параметра λ для ℓ0 квазинормы
Fig. 1. Graph of the dependence of the optimal coordinates αj on the parameter λ for the ℓ0 quasi-norm
Данный график (рис. 1) известен как жесткий порог. Для оптимальным представлением будет . Когда , оптимальное представление . Таким образом, варьируя невязку и параметр , можно сделать нулевыми те координаты точного решения , которые удовлетворяют условию .
4. Задача
При рассмотрении нормы функции , используя целевую функцию , можно получить оптимизационную задачу [4]
Находим значение , при котором достигает минимума.
Для этого найдем критические точки, в которых или не существует. Производная представлена следующим выражением:
разбивается на два случая
Рассмотрим случай
Приравниваем к нулю, получаем одну критическую точку
Проделаем то же самое с Приравниваем к нулю, получаем одну критическую точку
Для доказательства того, что данные критические точки является точками минимума, необходимо взять вторую производную и проверить найденные критические точки. и минимумы функции.
Далее, необходимо узнать, при каких условиях найденные минимумы меньше 0
Проверяем оставшуюся критическую точку
При сравнении и получаем, что или . Так как , можно прийти к выводу, что используется при , а при .
Таким образом, решение задачи минимизации для нормы можно записать в таком виде:
Рис. 2. График зависимости оптимальных координат αj от параметра λ для ℓ1 нормы
Fig. 2. Graph of the dependence of the optimal coordinates αj on the parameter λ for the ℓ1 norm
Таким образом, варьируя невязку и параметр , получаем возможность сделать нулевыми те координаты точного решения , которые удовлетворяют условию (рис. 2).
5. Задача
При рассмотрении нормы функции Q, получаем
Таким образом, оптимизационная задача сводится к следующему виду:
Находим значение , при котором достигает минимума.
Приравниваем к нулю, получаем одну критическую точку
Данная точка является точкой минимума функции. Следовательно, .
Рис. 3. График зависимости оптимальных координат αj от параметра λ для ℓ2 нормы
Fig. 3. Graph of the dependence of the optimal coordinates αj on the parameter λ for the ℓ2 norm
Таким образом, получаем, что норма не позволяет получить дополнительных нулевых координат (рис. 3).
6. Примеры нахождения разреженных решений
В качестве словаря возьмем единичную матрицу
Возьмем . Для нормы оптимальным решением будет:
Таким образом, мы получили более разреженное решение для вектора Нетрудно заметить, что при использовании нормы всегда можно получить более разреженное решение путем соответствующего выбора .
Также можно заметить, что при использовании нормы и невозможно получить , отличное от 0 при . Таким образом, норма не может решить поставленную задачу.
Используя псевдонорму имеем
и, изменяя параметр можно получить любое количество нулевых координат приближенного решения.
В качестве словаря возьмем ортогональную матрицу
Возьмем . Для нормы оптимальным решением будет:
Таким образом, мы получили одну дополнительную нулевую координату.
Выводы
Выбор параметра позволяет регулировать количество нулевых координат в зависимости от выбранной невязки . При использовании или нормы всегда можно получить более разреженное решение путем соответствующего выбора .
Также можно заметить, что при использовании нормы и невозможно получить отличное от 0, при . Таким образом, норма не позволяет получить дополнительных нулевых координат в приближенном представлении точного решения.