Improving noise immunity of homography superposition for television signals

Cover Page

Cite item

Full Text

Abstract

The algorithm of homography superposition of the television signals was shown in this article. The algorithm allows improving noise immunity for homography parameters of television signal with textural fragments. The core of the estimation procedure of homography parameters for image superposition is the matching of the feature points. The feature points are local extremes of the pixel brightness of the image. The matching is defined by the maximum correlation coefficient between a region of the image of a neighbor area of the feature point. The log-polar system of the images provides an invariant correlation of scale and rotate are proportional offsets along the axis in this coordinate system. The noise immunity is provided due to the developing procedure of removing feature points in the textural region. This procedure leads to decreasing probability of error matching of the feature points. The numerical modeling shows high noise immunity of the developed procedure in comparing the current researches.

Full Text

Введение

Задача проективного совмещения изображений решается при детектировании и распознавании объектов, трехмерной реконструкции, получении единого изображения в многокамерных системах видеонаблюдения, уменьшении объема сохраняемых данных и т. д. [7; 8].

Повышение помехоустойчивости при проективном совмещении телевизионных сигналов является актуальной задачей в системах технического зрения.

Основными источниками помех, приводящих к неверной оценке параметров и, соответственно, к неверному совмещению, являются:

  • неверное сопоставление особых точек;
  • погрешности оценки координат особых точек из-за шумов и из-за динамических воздействий, приводящих к вибрации и «дрожанию» изображений.

В ряде случаев ситуация осложняется самими изображениями, содержащими периодически повторяющиеся (текстурные) фрагменты. По этой причине одной особой точке могут соответствовать несколько точек на втором изображении.

В статье описан разработанный алгоритм проективного совмещения телевизионных сигналов. Основная процедура алгоритма – это сопоставление особых точек. Для этой цели используется сравнение по коэффициенту корреляции фрагментов изображений в логарифмически полярной системе координат. Для корректного совмещения областей изображения с периодически повторяющимися (текстурными) фрагментами разработана процедура, удаляющая особые точки на подобных областях.

1. Обзор существующих работ

Проблемой оценки параметров проективного совмещения занималось много исследователей.

В работах [2; 4] был предложен способ сопоставления точек с одновременной оценкой параметров по методу RANSAC [3].

Рассматриваются различные сочетания между особыми точками, после чего рассчитываются параметры совмещения.

Преобразовывая точки в соответствии с вычисленным совмещением, оценивают количество совпавших точек (примечание: совпавшими считаются такие точки, между которыми расстояние меньше заданного порога). Сочетание с наибольшим количеством совпавших точек определяет действительное совмещение.

Авторами отмечается, что количество сочетаний равно CN4 где N – количество особых точек. Данное обстоятельство приводит к значительным временным затратам, что ограничивает применение данного способа.

В работе [1] предполагается двухэтапная процедура обработки совмещений изображений. Однако смещения между опорными точками на изображении не превышает 1 % от размера изображения, что в значительной степени ограничивает круг прикладного использования.

В многочисленных работах, использующих дескрипторы [5; 6] для сопоставления точек и дальнейшего вычисления параметров совмещения, авторами отмечается тот факт, что методы ограничены параметром масштабирования. Если масштаб отличается более чем в 2 раза, то эффективность сопоставления резко снижается.

Предлагаемый способ совмещения ближе всего к способам, использующим дескрипторы. За счет этого достигается более высокая скорость обработки, существенно меньше ограничений на возможные искажения изображений.

Для устранения недостатка, связанного со снижением эффективности из-за масштабных искажений, используется представление изображения в логарифмически полярной системе координат, которая обеспечивает инвариантность к масштабу и повороту при вычислении коэффициента корреляции между двумя фрагментами.

Проективное преобразование описывается следующими формулами:

x=h11x'+h12y'+h13h31x'+h32y'+1,y=h21x'+h22y'+h23h31x'+h32y'+1. (1)

В матричной форме:

λxλyλ=h11h12h13h21h22h23h31h321x'y'1 (2)

Как можно видеть из формул (1), (2), проективное совмещение описывается 8 параметрами. Соответственно, для их оценки необходимо иметь 4 пары точек (каждая точка содержит по 2 координаты,  чисел для оценки 8 неизвестных).

В случае если количество точек больше четырех, то используется метод наименьших квадратов, который обеспечивает оценку параметров с минимальным среднеквадратичным отклонением между двумя наборами данных. Подробное описание и вывод формул по методу наименьших квадратов приведены в работе [4].

В качестве точек, по которым оцениваются параметры проективного совмещения, используются так называемые особые точки (другие названия: точки интереса, feature points, corners).

В этих точках, как правило, наблюдаются локальные максимумы или минимумы. Существует большое множество вычисления особых точек. В работе был использован так называемый Harris defector [9].

2. Преобразование из декартовой системы координат в логарифмически полярную систему

Одним из ключевых этапов в обработке телевизионных сигналов для предварительного сопоставления точек и дальнейшего вычисления параметров проективного преобразования является представление изображения в логарифмически полярной системе координат.

Идея сопоставления особых точек была заимствована из теории совмещения изображений при аффинном преобразовании, которые оперируют такими параметрами, как смещение вдоль координатных осей, угол поворота и масштаб [10].

Если рассматривать окрестность вокруг особой точки, то проективные искажения будут приводить приблизительно к тем же преобразованиям изображения, что и аффинные искажения. С практической точки зрения это означает, что для сопоставления точек при проективных искажениях можно использовать тот же механизм сопоставления, что и при аффинных искажениях.

Также следует отметить, что в данной задаче есть существенное упрощение. Так как известны координаты особой точки на обоих изображениях, то нет необходимости оценивать смещения. Единственными неизвестными параметрами являются поворот и масштаб.

Ниже представлена процедура представления фрагмента изображения, центром которого является особая точка, в логарифмически полярную систему координат.

Исходными данными являются:

  1. img [1:h, 1:w] – изображение высотой h и шириной w;
  2. (x0, y0) – координаты точки (как правило, особой точки), относительно которой проводится преобразование в логарифмически полярную систему координат;
  3. r_beg – начало диапазона для радиуса;
  4. r_end – конец диапазона для радиуса;
  5. log_r_step – шаг дискретизации логарифма от радиуса;
  6. fi_beg – начало диапазона для угла;
  7. fi_end – конец диапазона для угла;
  8. fi_step – шаг дискретизации для угла.

Выходными данными являются:

img_lp [1:h_lp, 1:w_lp] – представление изображения в логарифмически полярной системе координат, где h_lp – количество элементов вдоль оси «log2 (радиус)» и w_lp – количество элементов вдоль оси «угол поворота».

h_lp – это количество элементов вектора [log2 (r_beg); log2(r_beg) + log_r_step; log2(r_beg) + +  …; log2(r_end)].

w_lp – это количество элементов вектора [fi_beg; fi_beg + fi_step; fi_beg +  …; fi_end].

Рассмотрим элемент изображения img_lp с номером N и M (N – номер элемента вдоль оси «log2(радиус)», M – номер элемента вдоль оси «угол поворота»).

Этому элементу будет соответствовать значение:

  • радиуса
  • поворота

В исходном изображении этим параметрам будет соответствовать координата:

x=Rcos(φ)+x0,y=Rsin(φ)+y0. (3)

Так как значения (x, y) являются в общем случае вещественными числами, а координаты изображения – целыми числами, то используется линейная аппроксимация по трем точкам:

x1 = round(x);

y1 = round(y);

z1 – значение яркости img в точке (x1, y1);

x2 = x1 +1;

y2 = y1;

z2 – значение яркости img в точке (x2, y2);

x3 = x1;

x3 = y1 + 1;

z3 – значение яркости img в точке (x3, y3).

Вычисляется уравнение плоскости Ax + By + Cz + + D = 0, проходящей через три точки (x1 y1 z1), (x2 y2 z2), (x3 y3 z3).

Значение яркости в точке (x, y) расчитывается как:

z=D-Ax-ByC (4)

Таким образом, в изображении img_lp с номерами N и M будет поставлено значение яркости z, вычисленное по формуле (4).

Пример представления фрагмента изображения в логарифмически полярной системе координат показан на рис. 1.

 

Рис. 1. Изображение в декартовой (а) и логарифмически полярной системе координат (б)

Fig. 1. Image in Cartesian (a) and logarithmic-polar coordinate systems (b)

 

Используя данное представление, можно осуществить сопоставление особых точек на совмещаемых изображениях.

3. Сопоставление особых точек

На рис. 2 представлены два изображения: первое совмещаемое изображение, на котором отмечены особые точки, и фрагмент второго изображения в окрестности некоторой особой точки.

 

Рис. 2. Вычисление коэффициента корреляции между фрагментами изображений: изображение первой камеры в окрестности особой точки в декартовой (а) и логарифмически полярной системе координат (б), изображение второй камеры в окрестности особой точки в декартовой (в) и логарифмически полярной системе координат (г)

Fig. 2. Calculation of the correlation coefficient between image fragments: the image of the first camera in the vicinity of the singular point in the Cartesian (a) and logarithmically polar coordinate systems (b), the image of the second camera in the vicinity of the singular point in the Cartesian (c) and logarithmically polar coordinate systems (d)

 

На первом изображении этой особой точке соответствует точка, выделенная кружком.

Проводя представление фрагментов изображений в логарифмически полярную систему координат, можно видеть, что фрагмент № 2 является частью фрагмента № 1.

На рис. 2 выделена соответствующая область. Смещения вдоль осей координат «log2(радиус)» и «угол поворота» соответствуют масштабу и повороту.

Однако для решаемой задачи сопоставления ключевым является тот факт, что коэффициент корреляции между фрагментами в окрестности особой точки близок к единице.

Это свойство и используется для сопоставления особых точек.

На первом изображении выбирается фрагмент вокруг одной точки, и путем сравнения со всеми другими фрагментами на втором изображении определяется сопоставление по максимуму коэффициента корреляции.

4. Повышение помехоустойчивости

Одной из проблем при сопоставлении является низкая помехозащищенность сопоставления особых точек, принадлежащих областям изображения с регулярно повторяющимся (текстурным) сигналом.

На рис. 3 показаны две особые точки на подобной области.

 

Рис. 3. Особые точки в области изображения с текстурным сигналом

Fig. 3. Special points in the image area with a texture signal

 

Фрагменты вокруг этих особых точек похожи друг на друга. Это означает, что при сопоставлении будет высока вероятность выбора не той точки (во всех случаях коэффициент корреляции будет близок к единице).

Чтобы избежать этого, в процессе сопоставления проводится контроль коэффициента корреляции. Если найдены два и более фрагмента с высоким коэффициентом корреляции (примечание: в работе использовалось пороговое значение 0,9), то такая точка не будет использоваться для оценки параметров проективного совмещения.

5. Алгоритм обработки и результаты совмещения

На рис. 4 представлены этапы обработки изображений.

 

Рис. 4. Этапы обработки изображений

Fig. 4. Stages of image processing

 

6. Результаты обработки изображений

На рис. 5 представлены телевизионные изображения многокамерной системы видеонаблюдения.

 

Рис. 5. Результат совмещения сигналов многокамерной системы наблюдения: а – изображение первой камеры; б – изображение второй камеры

Fig. 5. Result of combining signals from a multi-camera surveillance system: a – image of the first camera; b – image of the second camera

 

На рис. 6 показан один из примеров неверного сопоставления особых точек на изображениях. На рис. 6, а обозначены четыре особые точки, при этом точки, отмеченные номерами 1 и 2, соответствуют фрагментам изображения в областях с текстурным сигналом.

 

Рис. 6. Результат неверного совмещения сигналов многокамерной системы наблюдения: а – сопоставление опорных точек; б – результат совмещения

Fig. 6. Result of incorrect alignment of signals from a multi-camera surveillance system: a – comparison of reference points; b – result of combining

 

Если рассмотреть фрагмент изображения в окрестности особой точки № 1, то на втором изображении найдется сразу несколько похожих фрагментов. Процедура сопоставления привела к неверному совмещению фрагментов изображений.

Аналогичная ситуация произошла и с точкой № 2.

В результате вычисления параметров проективного преобразования изображения были совмещены неверно, что отчетливо видно на рис. 6, б.

Использование предложенной процедуры повышения помехоустойчивости позволило удалить особые точки, соответствующие фрагментам изображения в областях с текстурным сигналом. Эти точки не участвовали в расчете параметров проективного преобразования, что дало возможность верно совместить изображения.

На рис. 7 показан пример верного совмещения телевизионных изображений.

Рис. 7. Результат верного совмещения сигналов многокамерной системы

Fig. 7. Result of correct alignment of signals of a multi-camera system

 

В результате совмещения сигналы визуально сформировали единое изображение без каких-либо заметных проективных артефактов (искажений).

7. Численное моделирование

Для оценки помехоустойчивости совещания телевизионных изображений использовался параметр среднеквадратичной величины (SKV):

SKV=i=1Nx'ix''i2+y'iy''i2N, (5)

где (xi, yi) – координаты опорных точек первого телевизионного изображения; xi'; yi' – координаты опорных точек второго телевизионного изображения; xi''; yi'' – координаты опорных точек, пересчитанные с учетом вычисленных параметров проективного совмещения; N – количество опорных точек.

Координаты (xi, yi), xi'; yi', xi''; yi'' связаны между собой:

x'i=xih11+yih12+h13xih31+yih32+1, y'i=xih21+yih22+h23xih31+yih32+1, (6)

x''i=xih'11+yih'12+h'13xih'31+yih'32+1, y''i=xih'21+yih'22+h'23xih'31+yih'32+1, (7)

где h11, h12, ..., h32 – действительные параметры преобразования; h11', h12', ..., h32' – оценка параметров по алгоритму обработки.

На рис. 8 представлены результаты вычисленных погрешностей с использованием алгоритмов сопоставления опорных точек [1; 6] при различной мощности шума.

 

Рис. 8. Результаты численного моделирования

Fig. 8. Results of numerical simulation

 

Из рис. 8 видно, что наименьшее значение погрешностей обеспечивает разработанный алгоритм. Алгоритм [1] характеризуются более высокими погрешностями, что связано с наличием масштабных искажений, которые не могут быть скомпенсированы данным алгоритмом. Алгоритм [6] совпадает с разработанным алгоритмом при малых значениях мощности шума. Но дескрипторы [6] более чувствительны к мощности шума, что приводит к резкому увеличению погрешностей с ростом мощности шума.

Заключение

В статье представлен алгоритм проективного совмещения телевизионных сигналов и описана процедура, направленная на повышение помехоустойчивости при оценке параметров совмещения.

Наиболее близкими по способу обработки к предложенному алгоритму являются решения, использующие дескрипторы.

Однако существенным достоинством является снижение чувствительности к масштабным искажениям.

Разработанный алгоритм, в частности, можно использовать в многомерных системах видеонаблюдения для автоматического расчета параметров совмещения. Проблема совмещения текстурных областей решается путем контроля коэффициента корреляции на этапе сопоставления особых точек.

Статья может быть полезна разработчикам систем технического зрения и разработчикам алгоритмов обработки телевизионных сигналов.

×

About the authors

Alfiya A. Diyazitdinova

Povolzhskiy State University of Telecommunications and Informatics

Author for correspondence.
Email: a.miftahova@psuti.ru
ORCID iD: 0000-0001-8940-4543

head of the Research Department, Povolzhskiy State University of Telecommunications and Informatics, Samara, Russia.

Research interests: computer signal processing, television signals superposition, television signals parameters estimation, object’s recognition at machine vision.

Russian Federation, 23, L. Tolstoy Street, Samara, 443010

References

  1. Goshin E.V., Kotov A.P., Fursov V.A. Two-step spatial transform shaping for aligning images. Komp’juternaja optika, 2014, vol. 38, no. 4, pp. 886–891. DOI: https://doi.org/10.18287/0134-2452-2014-38-4-886-891 (In Russ.)
  2. Novikov A.I. et al. The contour analysis and image-superimposition problem in computer vision systems. Pattern Recognition and Image Analysis, 2015, vol. 25, no. 1, pp. 73–80. DOI: https://doi.org/10.1134/S1054661815010149
  3. Hast A., Nysjö J., Marchetti A. Optimal RANSAC – Towards a repeatable algorithm for finding the optimal set. Journal of WSCG, 2013, vol. 21, no. 1, pp. 21–30.
  4. Efimov A.I., Novikov A.I. Algorithm for step-by-step refinement of projective transformation for image alignment. Komp’juternaja optika, 2016, vol. 40, no. 2, pp. 258–265. DOI: https://doi.org/10.18287/2412-6179-2016-40-2-258-265 (In Russ.)
  5. Loeckx D. et al. Nonrigid image registration using free-form deformations with a local rigidity constraint. Medical Image Computing and Computer-Assisted Intervention – MICCAI 2004. Lecture Notes in Computer Science, 2004, vol. 3216, pp. 639–646. DOI: https://doi.org/10.1007/978-3-540-30135-6_78
  6. Ke Y., Sukthankar R. PCA-SIFT: A more distinctive representation for local image descriptors. Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2004, vol. 2, pp. 506–513. DOI: https://doi.org/10.1109/CVPR.2004.1315206
  7. Gruzman I.S. et al. Digital Image Processing in Information Systems. Novosibirsk: Izd-vo NGTU, 2002, 351 p. (In Russ.)
  8. Kulyas O.L. et al. Measurement of characteristics and assessment of the capabilities of cameras with ultra-wide angle optics. Physics of Wave Processes and Radio Systems, 2020, vol. 23, no. 1, pp. 89–99. DOI: https://doi.org/10.18469/1810-3189.2020.23.1.89-99 (In Russ.)
  9. Harris С., Stephens M. A combined corner and edge detector. Proceedings of the Alvey Vision Conference, 1988, pp. 147–151. DOI: https://doi.org/10.5244/C.2.23
  10. Mjasnikov E.V. Determination of parameters of geometric transformations for blending portrait images. Komp’juternaja optika, 2007, vol. 31, no. 3, pp. 77–82. URL: http://www.computeroptics.smr.ru/KO/Annot/KO31-3/14.html (In Russ.)

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1. Image in Cartesian (a) and logarithmic-polar coordinate systems (b)

Download (258KB)
3. Fig. 2. Calculation of the correlation coefficient between image fragments: the image of the first camera in the vicinity of the singular point in the Cartesian (a) and logarithmically polar coordinate systems (b), the image of the second camera in the vicinity of the singular point in the Cartesian (c) and logarithmically polar coordinate systems (d)

Download (365KB)
4. Fig. 3. Special points in the image area with a texture signal

Download (173KB)
5. Fig. 4. Stages of image processing

Download (153KB)
6. Fig. 5. Result of combining signals from a multi-camera surveillance system: a – image of the first camera; b – image of the second camera

Download (1MB)
7. Fig. 6. Result of incorrect alignment of signals from a multi-camera surveillance system: a – comparison of reference points; b – result of combining

Download (1MB)
8. Fig. 7. Result of correct alignment of signals of a multi-camera system

Download (456KB)
9. Fig. 8. Results of numerical simulation

Download (225KB)

Copyright (c) 2021 Diyazitdinova A.A.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ФС 77 - 68199 от 27.12.2016.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies