Iterative algorithm for offsets, scale and rotate estimation for television image superposition with additive and multiplicative noise

Rinat R. Diyazitdinov; Диязитдинов Ринат Радмирович

doi:10.18469/1810-3189.2022.25.1.36-44

Итерационный алгоритм оценки смещения, масштаба и поворота для совмещения телевизионных сигналов при влиянии аддитивных и мультипликативных помех

Авторы: Диязитдинов Р.Р.¹
Учреждения:
1. Поволжский государственный университет телекоммуникаций и информатики
Выпуск: Том 25, № 1 (2022)
Страницы: 36-44
Раздел: Статьи
URL: https://journals.ssau.ru/pwp/article/view/10147
DOI: https://doi.org/10.18469/1810-3189.2022.25.1.36-44
ID: 10147

Цитировать

Полный текст

Аннотация
Полный текст
Об авторах
Список литературы
Дополнительные файлы
Статистика

Аннотация

В статье представлен итерационный алгоритм совмещения телевизионных изображений. Совмещение определяется параметрами смещения, масштабом и поворотом. Также на изображения оказывают влияние аддитивная и мультипликативная помеха. Алгоритм разрабатывался с целью уменьшения времени обработки изображений при вычислении параметров совмещения. Уменьшение времени обработки происходит за счет значительного сокращения вариантов перебора реперных точек, от которых зависит результат совмещения. Первоначально выбранные координаты реперных точек уточняются в ходе работы алгоритма и обеспечивают приемлемое совмещение телевизионных сигналов. Параметры совмещения разделены на две группы: смещения вдоль координатных осей (первая группа), масштаб и поворот (вторая группа). Они оцениваются отдельно друг от друга. Итерационная процедура заключается в использовании смещений для оценки масштаба и поворота, а затем в использовании масштаба и поворота для оценки смещений. Этот процесс повторяется несколько раз, и с каждой новой итерацией вычисленные параметры приближаются к действительным значениям. Разработанный алгоритм позволил уменьшить время обработки в 25 раз по сравнению с алгоритмом полного перебора для изображений, использованных для тестирования. Первое изображение имело размеры 288 × 384 пикселя, второе – 128 × 128 пикселя. Второе изображение являлось фрагментом первого. В заключении статьи приведены результаты численного моделирования, определяющие зависимость погрешности оценки параметров от мощности шума.

Ключевые слова

совмещение, изображение, итерационный, смещение, масштаб, поворот, аддитивный, мультипликативный

Полный текст

Введение

Совмещение телевизионных изображений является важной задачей в научных исследованиях и технических приложениях. Вопросы совмещения решаются в медицине (совмещение гистологических изображений, трехмерная реконструкция и т. д.) [1], в авиационной технике (совмещение подстилающей поверхности) [2; 3], в железнодорожной сфере (поиск эталонных изображений в видеопотоке для оценки смещения рельсов относительно шпальной решетки), а также в различных системах индексации данных (сопоставление портретных фотографий, поиск изображения по фрагменту и т. д.) [4–7].

Из-за большого объема данных, содержащихся в изображениях, использование алгоритмов оценки параметров, основанные на методе полного перебора, приводит к существенному снижению производительности алгоритма совмещения.

Оценка параметров происходит по метрике (как правило, по коэффициенту корреляции). Количество метрик равно количеству сочетаний оцениваемых параметров. При этом снижение производительности связано с преобразованием изображений, которых будет столько же, сколько и сочетаний параметров.

По этой причине актуальной проблемой является разработка принципов оценки параметров, отличных от принципов полного перебора. Они должны обеспечивать более высокую производительность. Одним из таких принципов является итерационный метод оценки параметров. В данной статье представлен алгоритм совмещения, в основе которого лежит итерационная процедура.

Обзор существующих работ

Задача совмещения изображений известна очень давно и по этой причине разработаны различные подходы, позволяющие повысить скорость обработки.

Также следует отметить, что ряд подходов не являются универсальными и позволяют решить задачу, если выполняются определенные ограничения.

Если совмещаемые изображения связаны между собой только плоскопараллельным смещением, то для повышения скорости вычислений может быть использовано:

– расчёт свёрток на базе преобразования Фурье [4; 7–9];

– метод «пирамид изображений» для уменьшения размерности данных в 2ⁿ × 2ⁿ раз [10; 11].

Если совмещаемые изображения связаны между собой плоскопараллельным смещением и смещение сравнимо по величине с шагом дискретизации, то для повышения скорости вычислений может быть использован метод линеаризации [12]. Производиться разложение сигналов в ряд и параметры оцениваются в результате решения системы линейных уравнений.

Также существует модификация этого метода для учета поворота, если угол не превышает 15°. Авторы статьи [13] предлагают кроме разложения сигналов в ряд вводить замену тригонометрических функций синуса и косинуса на приближенные значения. Повышение скорости вычислений также обеспечивается за счет решения в аналитическом виде.

Если совмещаемые изображения связаны между собой смещением, масштабом и поворотом, то для повышения скорости вычислений может быть использован метод сопоставления реперных точек. Реперные точки – это, как правило, локальные экстремумы. Сопоставление реперных точек проводиться за счет совмещения фрагментов в окрестности этих точек. Фрагменты содержат меньшее количество элементов, чем исходные изображения. За счет этого получается выигрыш в скорости обработки. Этот метод часто ассоциируется с дескрипторами [14–16], который представляет собой вектор, описывающий фрагмент изображения, малочувствительный к масштабным искажениям и повороту. Серьезным недостатком этого метода является неверное сопоставление отдельных фрагментов и, соответственно, последующее исправление данной ситуации.

Если смещение не превышает +/–10 % исходного изображения, масштаб +/–20 %, а поворот +/–30°, то можно использовать метод раздельной оценки [4–7]. В методе отдельно друг от друга оцениваются две группы параметров:

– смещения вдоль координатных осей;

– масштаб и поворот.

При этом используется декартовая и логарифмически-полярная система координат. Метод позволяет уменьшить число преобразований изображений (в сравнении с методом проверки всех возможных комбинаций), тем самым обеспечивая повышение скорости обработки.

Разработанный итерационный алгоритм наиболее близок к алгоритмам раздельной оценки параметров совмещения. Но он характеризуется менее строгими органическими по масштабу (+/–50 %) и повороту (+/–180°).

Исходные данные

На рис. 1 представлены изображения, которые будут использованы для совмещения.

Рис. 1. Исходные изображения: f(x, y) (а), g(x, y) (б)

Fig. 1. Initial images: f(x, y) (a), g(x, y) (b)

На рис. 1, а показано изображение f(x, y), которое является фрагментом изображения g(x, y). На рис. 1, б на изображении g(x, y) показана область, соответствующая f(x, y).

Параметры совмещения:

– смещение вдоль оси абсцисс: h = 200 пикселей;

– смещение вдоль оси ординат: p = 20 пикселей;

– масштаб: a = 0,8;

– поворот: j = 30°;

– мультипликативная помеха: l = 1,2;

– аддитивная помеха: g = 20 у.е.

Примечание: у.е. описывает яркости пикселя изображения, кодируемая числом от 0 до 255 у.е.

Эти сигналы будут использованы для проведения численного моделирования для тестирования разработанного алгоритма.

Исходные данные

Изображение представляет собой двумерный сигнал с равномерным шагом дискретизации.

Параметрическая модель, связывающая между собой изображения, имеет следующий вид:

$\{\begin{cases} f (x_{i}, y_{i}) = s (x_{i}, y_{i}) + k (x_{i}, y_{i}); \\ g (x_{i}, y_{i}) = λ s (u_{i}, w_{i}) + γ + m (x_{i}, y_{i}), \end{cases}$ (1)

$\{\begin{cases} u_{i} = α x_{i} \cos (φ) - α y_{i} \sin (φ) + h; \\ w_{i} = α x_{i} \sin (φ) + α y_{i} \cos (φ) + p, \end{cases}$ (2)

где f(x, y), g(x, y) – совмещаемые изображения, h, p – смещения вдоль оси абсцисс и ординат, $α$ – масштаб, $φ$ – поворот, $λ, γ$ – мультипликативная и аддитивная помеха.

Совмещение определяется параметрами {h, p, $α, φ, λ, γ} .$ Для оценки параметров будет использован критерий максимума коэффициента корреляции:

$\begin{array}{l} R (θ) = \{(\sum_{i = 1}^{N} g (x_{i}, y_{i}) \cdot f (x_{i}, y_{i}, θ)) / N - \\ - ((\sum_{i = 1}^{N} g (x_{i}, y_{i})) / N) ((\sum_{i = 1}^{N} f (x_{i}, y_{i}, θ)) / N)\} / \\ / \{{(\sum_{i = 1}^{N} g^{2} (x_{i}, y_{i}) - {(\sum_{i = 1}^{N} g (x_{i}, y_{i}))}^{2} / N)}^{\frac{1}{2}} \times \\ \times {(\sum_{i = 1}^{N} f^{2} (x_{i}, y_{i}, θ) - {(\sum_{i = 1}^{N} f (x_{i}, y_{i}, θ))}^{2} / N)}^{\frac{1}{2}}\}, \end{array}$ (3)

$\hat{θ} = \underset{θ}{argmax} (R (θ)),$ (4)

где $θ = {h, p, α, φ, λ, γ},$ N – это количество пикселей изображения.

Критерий, основанный на вычислении коэффициента корреляции, не зависит от параметров $λ$ и $γ .$ В этом можно убедиться, рассчитав коэффициент корреляции для двух произвольных векторов {I_i, Y_i} и для ${Z_{i} = λ I_{i} + γ, Y_{i}} .$ Коэффициент корреляции для {I_i, Y_i} будет равен коэффициенту для {Z_i, Y_i}.

По этой причине, если оценены параметры ${\hat{h}, \hat{p}, \hat{α}, \hat{φ}},$ то параметры ${λ, γ}$ могут быть оценены по методу наименьших квадратов:

$\begin{array}{l} 〈\hat{λ}, \hat{γ}〉 = \\ = \underset{λ, γ}{argmin} (\sum_{i = 1}^{N} {(λ f (x_{i}, y_{i}, θ) + γ - g (x_{i}, y_{i}))}^{2}) . \end{array}$ (5)

$\hat{λ} = \frac{S g \cdot S f - N \cdot S f g}{S f^{2} - N \cdot E f},$ (6)

$\hat{γ} = \frac{S g \cdot S f g - S g \cdot E f}{S f^{2} - N \cdot E f},$ (7)

где

$S f = \sum_{i = 1}^{N} f (x_{i}, y_{i}, θ), S g = \sum_{i = 1}^{N} g (x_{i}),$

$S f g = \sum_{i = 1}^{N} f (x_{i}, y_{i}, θ) g (x_{i}),$

$E f = \sum_{i = 1}^{N} f^{2} (x_{i}, y_{i}, θ), θ = \{\hat{h}, \hat{p}, \hat{α}, \hat{φ}\},$

$f (x_{i}, y_{i}, θ)$ – сигнал после преобразования с учетом найденный смещений, масштаба и угла поворота.

Таким образом, количество параметров, которые достаточно оценить уменьшается с шести до четырех.

Оценка масштаба и поворота

Если известно соответствие между двумя точками на изображениях, то можно оценить масштаб и поворот, используя логарифмически-полярную систему координат.

Пусть точка (x₀, y₀) изображения f соответствует точке (u₀, w₀) изображения g и пусть эти точки связаны между собой выражением (2), т. е. индекс i = 0. Пусть некоторая точка (x, y) изображения f соответствует точке (u, w) изображения g.

Обозначим координату точки (x, y) относительно (x₀, y₀) в логарифмически-полярной системе координат как (r, ang). Их значения будут определяться по формулам:

$ρ = \sqrt{{(x - x_{0})}^{2} + {(y - y_{0})}^{2}},$ (8)

$r = {log}_{2} (ρ),$ (9)

$a n g = atan 2 (x - x_{0}, y - y_{0}) .$ (10)

Примечание: atan2 – это функция с двумя параметрами, возвращает значение арктангенса выражения (y – y₀)/(x – x₀) в радианах, в отличие от арктангенса имеет область значений (–π; π) (в арктангенса – (–π/2; π/2)).

Координаты точки (u, w) относительно (u₀, w₀) в логарифмически-полярной системе координат обозначим как (r', ang'). Ниже представлен вывод выражений для них.

$u - u_{0} = α (\cos (φ) x - \sin (φ) y) .$

$w - w_{0} = α (\sin (φ) x + \cos (φ) y) .$

$\begin{array}{l} ρ^{'} = \sqrt{{(u - u_{0})}^{2} + {(w - w_{0})}^{2}} = \\ = |α| \sqrt{{(x - x_{0})}^{2} + {(y - y_{0})}^{2}} . \end{array}$

С учетом того, что $α > 0,$ то:

$ρ^{'} = α \sqrt{{(x - x_{0})}^{2} + {(y - y_{0})}^{2}} = α ρ .$

$r' = \log_{2} (ρ') = \log_{2} (α) + \log_{2} (ρ) = \log_{2} (α) + r .$ (11)

Рассмотрим выражение:

$\begin{array}{l} tg (a n g^{'}) = \frac{w - w_{0}}{u - u_{0}} = \\ = \frac{\sin (φ) (x - x_{0}) + \cos (φ) (y - y_{0})}{\cos (φ) (x - x_{0}) - \sin (φ) (y - y_{0})} . \end{array}$

Если умножить числитель и знаменатель дроби на выражение $\frac{1}{\cos (φ) (x - x_{0})},$ то выражение tg(ang') можно записать в виде:

$\begin{array}{l} tg (a n g^{'}) = \frac{tg (φ) + \frac{(y - y_{0})}{(x - x_{0})}}{1 - g (φ) \frac{(y - y_{0})}{(x - x_{0})}} = \\ = \frac{tg (φ) + tg (a n g)}{1 - g (φ) tg (a n g)} = tg (φ + a n g) . \end{array}$

$a n g^{'} = a n g + φ .$ (12)

Таким образом, можно записать, что:

$(r^{'}, a n g^{'}) = (r + \log_{2} (α), a n g + φ) .$ (13)

На рис. 2 показан пример оценки масштаба и поворота по изображениям в логарифмически-полярной системе координат. На рис. 2, а показано изображение g. На рис. 2, б показан фрагмент, соответствующий изображению f. Он выделен прямоугольником. Смещения вдоль осей определяют масштаб и поворот.

Рис. 2. Оценка масштаба и поворота

Fig. 2. Evaluation of scale and rotation

При известном значении масштаба и поворота изображение f можно преобразовать таким образом, чтобы оно являлось фрагментом изображения g, которое можно совместить плоскопараллельным смещением. Оценить смещения можно известными способами [8–11].

Сложность реализации описанного подхода заключается в том, что не известны реперные точки (x₀, y₀) и (u₀, w₀) на изображениях f и g, которые позволили бы оценить сначала масштаб и поворот, а затем смещения.

Однако, если координаты этих точек известны с некоторой погрешностью, то разработанный алгоритм позволяет уточнить первоначально выбранные координаты реперных точек, тем самым обеспечивая совмещение телевизионных сигналов.

Описание алгоритма

Исходными данными являются: f(x_i, y_i), i = 1, .. N – первое изображение, g(u_j, w_j), j = 1, .. K – второе изображение.

Примечание: координаты пикселов сигнала g переобозначены как (u, w) вместо (x, y), чтобы было очевидно, какое изображение обрабатывается на том или ином шаге алгоритма.

Выходными данными являются: $\hat{h}, \hat{p}$ – смещения вдоль координатных осей; $\hat{φ}, \hat{α}$ – угол поворота и масштаб; $\hat{γ}, \hat{λ}$ – значение аддитивной и мультипликативной помехи.

Алгоритм состоит из следующих шагов.

Загрузка изображений f(x_i, y_i) и g(u_j, w_j).
Предварительный выбор точек (x₀, y₀) и (u₀, w₀).

Примечание: так как изображение f является фрагментом изображения g, то координаты (x₀, y₀) фиксируются и не меняются; для удобства представления в логарифмически-полярной системе они равняются координатам центрально пикселя (т. е. при размере 128 × 128 пикселей, (x₀, y₀) = (64, 64)); координаты (u₀, w₀) неизвестны, по этой причине используется метод перебора, однако шаг может выбираться из условия 0,1 размера изображения, при размерах 128 × 128 пикселей шаг был выбран равным 10 пикселей (т. е. немного меньше, чем 12,8); другими словами проверялись координаты u₀= 1, 11 .. 381, w₀ = 1, 11, .. 281 (размер изображения g равняется 288 × 384).

Выбор количества итераций L (примеч.: в работе L = 4).
Инициализация матрицы преобразования в соответствии с количеством итераций:

$M_{1} = (\begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{matrix}), M_{2} = (\begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{matrix}) M {}_{L}= (\begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{matrix}) .$

Цикл по количеству итераций, k = 1.

5.1. Определение промежуточной матрицы преобразования Mres:

если k = 1, то Mres = M₁,

если k = 2, то Mres = M₂M₁,

…

если k = L, то Mres = M_L···M₂M₁.

5.2. Вычисление положение точек первого изображения (x_j', y_j') в соответствии с матрицей преобразования Mres:

x'_i = x_iMres(1,1) + y_iMres(1,2) + Mres(1,3),

y'_i = x_iMres(2,1) + y_iMres(2,2) + Mres(2,3),

5.3. Вычисление координат реперных точек, относительно которых происходит преобразование из декартовой в логарифмически-полярную систему координат:

X₀ = x₀Mres(1,1) + y₀Mres(1,2) + Mres(1,3),

Y₀ = x₀Mres(2,1) + y₀Mres(2,2) + Mres(2,3),

U₀ = X₀,

W₀ = Y₀.

5.4. Вычисление матрицы M_k по данным f(x'_i, y'_i), (X₀, Y₀), g(u_j, w_j), (U₀, W₀) согласно процедуре раздельной оценки параметров (процедура описана ниже).

5.5. Проверка на выход из цикла: k = k +1, если k ≥ L, то выход из цикла, в противном случае переход к п. 5.1.

Оценка параметров $\hat{h}, \hat{p}, \hat{φ}, \hat{α}$ по матрице Mres:

$\hat{h} = M r e s (1,3), \hat{p} = M r e s (2,3),$

$\hat{α} = \sqrt{M r e s^{2} (1,1) + M r e s^{2} (1,2)},$

$\hat{φ} = \arcsin (\frac{M r e s (2,1)}{\sqrt{M r e s^{2} (1,1) + M r e s^{2} (1,2)}}) 180 / π .$

Оценка параметров $\hat{γ}, \hat{λ}$ по формулам (6-7)
Выход из программы.

Ниже описана процедура раздельной оценки параметров (п. 5.4).

Входные данные: f(x'_i, y'_i), i = 1, .. N – первое изображение, g(u_j, w_j), j = 1, .. K – второе изображение. (X₀, Y₀), (U₀, W₀) – реперные точки.

Выходные данные: M – матрица преобразования размером [3 × 3].

1. Преобразование координат (x'_i, y'_i) в логарифмически-полярную систему координат относительно точки (X₀, Y₀).
2. Преобразование координат (u_j, w_j) в логарифмически-полярную систему координат относительно точки (U₀, W₀).
3. Совмещение сигналов f и g в логарифмически-полярной системе. В результате оцениваются смещения $\log_{2} (α r)$ и $φ r$ (см. рис. 2).
4. Вычисление промежуточной матрицы преобразования:

$\begin{array}{l} m A = [\begin{matrix} α r \cos (φ r) & - α r \sin (φ r) \\ α r \sin (φ r) & α r \cos (φ r) \\ 0 & 0 \end{matrix} \\ \begin{matrix} U_{0} - (x_{0} \cos (φ r) - y_{0} \sin (φ r)) \\ W_{0} - (x_{0} \sin (φ r) + y_{0} \cos (φ r)) \\ 1 \end{matrix}] . \end{array}$

Преобразование координат (x'_i, y'_i) в соответствии с матрицей mA. Формирование (x''_i, y''_i).
Совмещение сигналов f(x''_i, y''_i) и g(u, w) в декартовой системе координат. В результате оцениваются смещения вдоль координатах осей hr и pr.
Вычисление промежуточной матрицы преобразования:

$m B = [\begin{matrix} 1 & 0 & h r \\ 0 & 1 & p r \\ 0 & 0 & 1 \end{matrix}] .$

Вычисление выходной матрицы М:

$M = m B \cdot m A .$

Численное моделирование

Для определения погрешности оценки параметров совмещения было проведено численное моделирование, которое заключалось в добавлении помехи с гауссовым распределением к ординатам одномерных сигналов.

При выбранном значении мощности (дисперсии помехи, $σ_{n}^{2})$ проводилась серия опытов, по которым оценивалась погрешность оценки параметра.

В качестве погрешности выступало значение среднеквадратичной величины (RMS):

$R M S = \sqrt{\frac{\sum_{i = 1}^{n} {(a_{i} - a)}^{2}}{n}},$ (14)

где a – действительное значение параметра; a_i – измеренное значение параметра в i-м опыте; n – количество опытов.

По результатам численного моделирования был построен график зависимости RMS от среднеквадратичного отклонения (СКО) помехи $(σ_{n}) .$

Результаты численного моделирования приведены на рис. 3.

Рис. 3. Погрешность оценки параметров

Fig. 3. Error in parameter estimation

Разработанный алгоритм сравнивался с алгоритмом полного перебора: проверялись все возможные варианты точки (u₀, w₀), т. е. u₀ = 1,2 .. 384, w₀ = 1,2 .. 288. И для каждой точки происходило преобразование в логарифмически-полярную систему координат. Погрешности у обоих алгоритмов почти совпадают. Различия наблюдаются при мощности шума $σ_{n} > 20$ у.е. Различия возникают вследствие того, что итерационный процесс не приводит к верной оценке параметров за четыре итерации. При увеличении количества итераций до шести графики погрешностей у сравниваемых алгоритмов совпадают. Однако, увеличение итераций, ожидаемо, приводит к снижению скорости обработки и оправдано только при высоком уровне шума, который, как правило, свидетельствует о нештатной работе телевизионного оборудования.

Скорость вычисления у разработанного алгоритма при четырех итерациях в 25 раз выше, чем у алгоритма полного перебора.

Таким образом, разработанный алгоритм характеризуется погрешностью оценки параметров, как в алгоритме полного перебора, но обладает более высоким быстродействием.

Заключение

Разработанный алгоритм был апробирован для поиска изображений в потоковом видео в видеосистеме вагона-путеизмерителя в рамках задачи индексации («быстрого поиска»).

Разработанный алгоритм может быть использован в медицинских целях, в аэрокосмической отрасли, охранных системах и для расширения функциональных возможностей многокамерных систем технического зрения.

Разработанный алгоритм обеспечивает высокую скорость обработки видеоданных и может быть использован в задачах совмещения изображений, ориентированных на работу в режиме реального времени.

Об авторах

Ринат Радмирович Диязитдинов

Поволжский государственный университет телекоммуникаций и информатики

Автор, ответственный за переписку.
Email: rinat.diyazitdinov@gmail.com
ORCID iD: 0000-0001-6360-0351

кандидат технических наук, доцент кафедры сетей и систем связи

Россия, Самара

Список литературы

Сунгатуллина Д.И. Быстрый алгоритм совмещения контуров изображений, связанных изотропным аффинным преобразованием // Графикон 2014. 2014. C. 92–95.
Ефимов А.И. Разработка и исследование алгоритмов совмещения изображений от бортовых видеодатчиков с виртуальной моделью местности: дис. … канд. тех. наук. Рязань: Издательство Рязанского государственного радиотехнического университета, 2016. 172 c.
Ефимов А.И., Новиков А.И. Алгоритм поэтапного уточнения проективного преобразования для совмещения изображений // Компьютерная оптика. 2016. Т. 40, № 2. C. 258–265. DOI: https://doi.org/10.18287/2412-6179-2016-40-2-258-265
Мясников Е.В. Определение параметров геометрических трансформаций для совмещения портретных изображений // Компьютерная оптика. 2007. Т. 31, № 3. C. 77–82.
Reddy B., Chatterji B. An FFT-based technique for translation, rotation, and scale-invariant image registration // IEEE Transactions on Image Processing. 1996. Vol. 5, no. 27. P. 1266–1271. DOI: https://doi.org/10.1109/83.506761
Phase correlation based image alignment with subpixel accuracy / A. Alba [et al.] // 11th Mexican International Conference on Artificial Intelligence (MICAI 2012). 2012. Vol. 7629. P. 171–182. DOI: https://doi.org/10.1007/978-3-642-37807-2_15
Evangelidis G., Psarakis E. Parametric image alignment using enhanced correlation coefficient maximization // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2008. Vol. 30, no. 27. P. 1858–1865. DOI: https://doi.org/10.1109/TPAMI.2008.113
Богатырева В.В., Дмитриев А.Л. Оптические методы обработки информации. СПб.: СПбГУ ИТМО, 2009. 74 с.
Акаев А.А., Майоров С.А. Оптические методы обработки информации: репринтное воспроизведение издания 1988 года. СПб.: СПбГУ ИТМО, 2005. 259 с.
Pyramid methods in image processing / E.H. Adelson [et al.] // Computer Science. 1988. P. 33–41.
Бессмельцев В.П., Булушев Е.Д., Быстрый алгоритм совмещения изображений для контроля качества лазерной микрообработки // Компьютерная оптика. 2014. Т. 38, № 2. C. 343–350.
Lucas B.D., Kanade T. An iterative image registration technique with an application to stereo vision // Proceedings of the 7th International Joint Conference on Artificial Intelligence (IJCAI, Vancouver, Canada, 24–28 August 1981). 1981. P. 121–130.
Мачнев А.М., Жук С.Я. Беспоисковый алгоритм определения угла поворота изображений // Вісник Національного технічного університету України «КПІ». 2008. № 37. С. 33–37.
Lowe D.G. Distinctive image features from scale-invariant keypoints // International Journal Computer Vision. 2004. Vol. 60, no. 2. P. 91−110. DOI: https://doi.org/10.1023/B:VISI.0000029664.99615.94
Applicability of the SIFT operator to geometric SAR image registration / P. Schwind [et al.] // International Journal Remote Sens. 2010. Vol. 31, no. 8. P. 1959−1980. DOI: https://doi.org/10.1080/01431160902927622
SURF: Speeded up robust features / H. Bay [et al.] // Computer Vision and Image Understanding. 2008. Vol. 110, no. 3. P. 346−359. DOI: https://doi.org/10.1016/j.cviu.2007