Повышение помехоустойчивости при оценке параметров проективного совмещения телевизионных сигналов

Обложка

Цитировать

Полный текст

Аннотация

В статье представлен алгоритм проективного совмещения телевизионных сигналов. Алгоритм позволяет повысить помехоустойчивость при оценке параметров при анализе телевизионных сигналов, содержащих регулярно повторяющиеся текстурные фрагменты. В основу оценки параметров проективного совмещения положено сопоставление изображений по так называемым особым точкам. Это точки с локальным экстремумом по яркости. Сопоставление точек определяется по максимуму коэффициента корреляции двух фрагментов изображений, в центре которых находится особая точка. Для обеспечения инвариантности к искажению по углу и поворота, и масштаба фрагменты изображений преобразовываются в логарифмически полярную систему координат. В этой системе координат угол поворота и масштаб будут соответствовать смещению вдоль соответствующих координатных осей. Повышение помехоустойчивости обеспечивается благодаря разработанной процедуре удаления особых точек на текстурных фрагментах, что уменьшает вероятность неверного сопоставления. Численное моделирование показало, что разработанный алгоритм, обеспечивает высокую помехоустойчивость в сравнении с аналогичными алгоритмами.

Полный текст

Введение

Задача проективного совмещения изображений решается при детектировании и распознавании объектов, трехмерной реконструкции, получении единого изображения в многокамерных системах видеонаблюдения, уменьшении объема сохраняемых данных и т. д. [7; 8].

Повышение помехоустойчивости при проективном совмещении телевизионных сигналов является актуальной задачей в системах технического зрения.

Основными источниками помех, приводящих к неверной оценке параметров и, соответственно, к неверному совмещению, являются:

  • неверное сопоставление особых точек;
  • погрешности оценки координат особых точек из-за шумов и из-за динамических воздействий, приводящих к вибрации и «дрожанию» изображений.

В ряде случаев ситуация осложняется самими изображениями, содержащими периодически повторяющиеся (текстурные) фрагменты. По этой причине одной особой точке могут соответствовать несколько точек на втором изображении.

В статье описан разработанный алгоритм проективного совмещения телевизионных сигналов. Основная процедура алгоритма – это сопоставление особых точек. Для этой цели используется сравнение по коэффициенту корреляции фрагментов изображений в логарифмически полярной системе координат. Для корректного совмещения областей изображения с периодически повторяющимися (текстурными) фрагментами разработана процедура, удаляющая особые точки на подобных областях.

1. Обзор существующих работ

Проблемой оценки параметров проективного совмещения занималось много исследователей.

В работах [2; 4] был предложен способ сопоставления точек с одновременной оценкой параметров по методу RANSAC [3].

Рассматриваются различные сочетания между особыми точками, после чего рассчитываются параметры совмещения.

Преобразовывая точки в соответствии с вычисленным совмещением, оценивают количество совпавших точек (примечание: совпавшими считаются такие точки, между которыми расстояние меньше заданного порога). Сочетание с наибольшим количеством совпавших точек определяет действительное совмещение.

Авторами отмечается, что количество сочетаний равно CN4 где N – количество особых точек. Данное обстоятельство приводит к значительным временным затратам, что ограничивает применение данного способа.

В работе [1] предполагается двухэтапная процедура обработки совмещений изображений. Однако смещения между опорными точками на изображении не превышает 1 % от размера изображения, что в значительной степени ограничивает круг прикладного использования.

В многочисленных работах, использующих дескрипторы [5; 6] для сопоставления точек и дальнейшего вычисления параметров совмещения, авторами отмечается тот факт, что методы ограничены параметром масштабирования. Если масштаб отличается более чем в 2 раза, то эффективность сопоставления резко снижается.

Предлагаемый способ совмещения ближе всего к способам, использующим дескрипторы. За счет этого достигается более высокая скорость обработки, существенно меньше ограничений на возможные искажения изображений.

Для устранения недостатка, связанного со снижением эффективности из-за масштабных искажений, используется представление изображения в логарифмически полярной системе координат, которая обеспечивает инвариантность к масштабу и повороту при вычислении коэффициента корреляции между двумя фрагментами.

Проективное преобразование описывается следующими формулами:

x=h11x'+h12y'+h13h31x'+h32y'+1,y=h21x'+h22y'+h23h31x'+h32y'+1. (1)

В матричной форме:

λxλyλ=h11h12h13h21h22h23h31h321x'y'1 (2)

Как можно видеть из формул (1), (2), проективное совмещение описывается 8 параметрами. Соответственно, для их оценки необходимо иметь 4 пары точек (каждая точка содержит по 2 координаты,  чисел для оценки 8 неизвестных).

В случае если количество точек больше четырех, то используется метод наименьших квадратов, который обеспечивает оценку параметров с минимальным среднеквадратичным отклонением между двумя наборами данных. Подробное описание и вывод формул по методу наименьших квадратов приведены в работе [4].

В качестве точек, по которым оцениваются параметры проективного совмещения, используются так называемые особые точки (другие названия: точки интереса, feature points, corners).

В этих точках, как правило, наблюдаются локальные максимумы или минимумы. Существует большое множество вычисления особых точек. В работе был использован так называемый Harris defector [9].

2. Преобразование из декартовой системы координат в логарифмически полярную систему

Одним из ключевых этапов в обработке телевизионных сигналов для предварительного сопоставления точек и дальнейшего вычисления параметров проективного преобразования является представление изображения в логарифмически полярной системе координат.

Идея сопоставления особых точек была заимствована из теории совмещения изображений при аффинном преобразовании, которые оперируют такими параметрами, как смещение вдоль координатных осей, угол поворота и масштаб [10].

Если рассматривать окрестность вокруг особой точки, то проективные искажения будут приводить приблизительно к тем же преобразованиям изображения, что и аффинные искажения. С практической точки зрения это означает, что для сопоставления точек при проективных искажениях можно использовать тот же механизм сопоставления, что и при аффинных искажениях.

Также следует отметить, что в данной задаче есть существенное упрощение. Так как известны координаты особой точки на обоих изображениях, то нет необходимости оценивать смещения. Единственными неизвестными параметрами являются поворот и масштаб.

Ниже представлена процедура представления фрагмента изображения, центром которого является особая точка, в логарифмически полярную систему координат.

Исходными данными являются:

  1. img [1:h, 1:w] – изображение высотой h и шириной w;
  2. (x0, y0) – координаты точки (как правило, особой точки), относительно которой проводится преобразование в логарифмически полярную систему координат;
  3. r_beg – начало диапазона для радиуса;
  4. r_end – конец диапазона для радиуса;
  5. log_r_step – шаг дискретизации логарифма от радиуса;
  6. fi_beg – начало диапазона для угла;
  7. fi_end – конец диапазона для угла;
  8. fi_step – шаг дискретизации для угла.

Выходными данными являются:

img_lp [1:h_lp, 1:w_lp] – представление изображения в логарифмически полярной системе координат, где h_lp – количество элементов вдоль оси «log2 (радиус)» и w_lp – количество элементов вдоль оси «угол поворота».

h_lp – это количество элементов вектора [log2 (r_beg); log2(r_beg) + log_r_step; log2(r_beg) + +  …; log2(r_end)].

w_lp – это количество элементов вектора [fi_beg; fi_beg + fi_step; fi_beg +  …; fi_end].

Рассмотрим элемент изображения img_lp с номером N и M (N – номер элемента вдоль оси «log2(радиус)», M – номер элемента вдоль оси «угол поворота»).

Этому элементу будет соответствовать значение:

  • радиуса
  • поворота

В исходном изображении этим параметрам будет соответствовать координата:

x=Rcos(φ)+x0,y=Rsin(φ)+y0. (3)

Так как значения (x, y) являются в общем случае вещественными числами, а координаты изображения – целыми числами, то используется линейная аппроксимация по трем точкам:

x1 = round(x);

y1 = round(y);

z1 – значение яркости img в точке (x1, y1);

x2 = x1 +1;

y2 = y1;

z2 – значение яркости img в точке (x2, y2);

x3 = x1;

x3 = y1 + 1;

z3 – значение яркости img в точке (x3, y3).

Вычисляется уравнение плоскости Ax + By + Cz + + D = 0, проходящей через три точки (x1 y1 z1), (x2 y2 z2), (x3 y3 z3).

Значение яркости в точке (x, y) расчитывается как:

z=D-Ax-ByC (4)

Таким образом, в изображении img_lp с номерами N и M будет поставлено значение яркости z, вычисленное по формуле (4).

Пример представления фрагмента изображения в логарифмически полярной системе координат показан на рис. 1.

 

Рис. 1. Изображение в декартовой (а) и логарифмически полярной системе координат (б)

Fig. 1. Image in Cartesian (a) and logarithmic-polar coordinate systems (b)

 

Используя данное представление, можно осуществить сопоставление особых точек на совмещаемых изображениях.

3. Сопоставление особых точек

На рис. 2 представлены два изображения: первое совмещаемое изображение, на котором отмечены особые точки, и фрагмент второго изображения в окрестности некоторой особой точки.

 

Рис. 2. Вычисление коэффициента корреляции между фрагментами изображений: изображение первой камеры в окрестности особой точки в декартовой (а) и логарифмически полярной системе координат (б), изображение второй камеры в окрестности особой точки в декартовой (в) и логарифмически полярной системе координат (г)

Fig. 2. Calculation of the correlation coefficient between image fragments: the image of the first camera in the vicinity of the singular point in the Cartesian (a) and logarithmically polar coordinate systems (b), the image of the second camera in the vicinity of the singular point in the Cartesian (c) and logarithmically polar coordinate systems (d)

 

На первом изображении этой особой точке соответствует точка, выделенная кружком.

Проводя представление фрагментов изображений в логарифмически полярную систему координат, можно видеть, что фрагмент № 2 является частью фрагмента № 1.

На рис. 2 выделена соответствующая область. Смещения вдоль осей координат «log2(радиус)» и «угол поворота» соответствуют масштабу и повороту.

Однако для решаемой задачи сопоставления ключевым является тот факт, что коэффициент корреляции между фрагментами в окрестности особой точки близок к единице.

Это свойство и используется для сопоставления особых точек.

На первом изображении выбирается фрагмент вокруг одной точки, и путем сравнения со всеми другими фрагментами на втором изображении определяется сопоставление по максимуму коэффициента корреляции.

4. Повышение помехоустойчивости

Одной из проблем при сопоставлении является низкая помехозащищенность сопоставления особых точек, принадлежащих областям изображения с регулярно повторяющимся (текстурным) сигналом.

На рис. 3 показаны две особые точки на подобной области.

 

Рис. 3. Особые точки в области изображения с текстурным сигналом

Fig. 3. Special points in the image area with a texture signal

 

Фрагменты вокруг этих особых точек похожи друг на друга. Это означает, что при сопоставлении будет высока вероятность выбора не той точки (во всех случаях коэффициент корреляции будет близок к единице).

Чтобы избежать этого, в процессе сопоставления проводится контроль коэффициента корреляции. Если найдены два и более фрагмента с высоким коэффициентом корреляции (примечание: в работе использовалось пороговое значение 0,9), то такая точка не будет использоваться для оценки параметров проективного совмещения.

5. Алгоритм обработки и результаты совмещения

На рис. 4 представлены этапы обработки изображений.

 

Рис. 4. Этапы обработки изображений

Fig. 4. Stages of image processing

 

6. Результаты обработки изображений

На рис. 5 представлены телевизионные изображения многокамерной системы видеонаблюдения.

 

Рис. 5. Результат совмещения сигналов многокамерной системы наблюдения: а – изображение первой камеры; б – изображение второй камеры

Fig. 5. Result of combining signals from a multi-camera surveillance system: a – image of the first camera; b – image of the second camera

 

На рис. 6 показан один из примеров неверного сопоставления особых точек на изображениях. На рис. 6, а обозначены четыре особые точки, при этом точки, отмеченные номерами 1 и 2, соответствуют фрагментам изображения в областях с текстурным сигналом.

 

Рис. 6. Результат неверного совмещения сигналов многокамерной системы наблюдения: а – сопоставление опорных точек; б – результат совмещения

Fig. 6. Result of incorrect alignment of signals from a multi-camera surveillance system: a – comparison of reference points; b – result of combining

 

Если рассмотреть фрагмент изображения в окрестности особой точки № 1, то на втором изображении найдется сразу несколько похожих фрагментов. Процедура сопоставления привела к неверному совмещению фрагментов изображений.

Аналогичная ситуация произошла и с точкой № 2.

В результате вычисления параметров проективного преобразования изображения были совмещены неверно, что отчетливо видно на рис. 6, б.

Использование предложенной процедуры повышения помехоустойчивости позволило удалить особые точки, соответствующие фрагментам изображения в областях с текстурным сигналом. Эти точки не участвовали в расчете параметров проективного преобразования, что дало возможность верно совместить изображения.

На рис. 7 показан пример верного совмещения телевизионных изображений.

Рис. 7. Результат верного совмещения сигналов многокамерной системы

Fig. 7. Result of correct alignment of signals of a multi-camera system

 

В результате совмещения сигналы визуально сформировали единое изображение без каких-либо заметных проективных артефактов (искажений).

7. Численное моделирование

Для оценки помехоустойчивости совещания телевизионных изображений использовался параметр среднеквадратичной величины (SKV):

SKV=i=1Nx'ix''i2+y'iy''i2N, (5)

где (xi, yi) – координаты опорных точек первого телевизионного изображения; xi'; yi' – координаты опорных точек второго телевизионного изображения; xi''; yi'' – координаты опорных точек, пересчитанные с учетом вычисленных параметров проективного совмещения; N – количество опорных точек.

Координаты (xi, yi), xi'; yi', xi''; yi'' связаны между собой:

x'i=xih11+yih12+h13xih31+yih32+1, y'i=xih21+yih22+h23xih31+yih32+1, (6)

x''i=xih'11+yih'12+h'13xih'31+yih'32+1, y''i=xih'21+yih'22+h'23xih'31+yih'32+1, (7)

где h11, h12, ..., h32 – действительные параметры преобразования; h11', h12', ..., h32' – оценка параметров по алгоритму обработки.

На рис. 8 представлены результаты вычисленных погрешностей с использованием алгоритмов сопоставления опорных точек [1; 6] при различной мощности шума.

 

Рис. 8. Результаты численного моделирования

Fig. 8. Results of numerical simulation

 

Из рис. 8 видно, что наименьшее значение погрешностей обеспечивает разработанный алгоритм. Алгоритм [1] характеризуются более высокими погрешностями, что связано с наличием масштабных искажений, которые не могут быть скомпенсированы данным алгоритмом. Алгоритм [6] совпадает с разработанным алгоритмом при малых значениях мощности шума. Но дескрипторы [6] более чувствительны к мощности шума, что приводит к резкому увеличению погрешностей с ростом мощности шума.

Заключение

В статье представлен алгоритм проективного совмещения телевизионных сигналов и описана процедура, направленная на повышение помехоустойчивости при оценке параметров совмещения.

Наиболее близкими по способу обработки к предложенному алгоритму являются решения, использующие дескрипторы.

Однако существенным достоинством является снижение чувствительности к масштабным искажениям.

Разработанный алгоритм, в частности, можно использовать в многомерных системах видеонаблюдения для автоматического расчета параметров совмещения. Проблема совмещения текстурных областей решается путем контроля коэффициента корреляции на этапе сопоставления особых точек.

Статья может быть полезна разработчикам систем технического зрения и разработчикам алгоритмов обработки телевизионных сигналов.

×

Об авторах

Альфия Асхатовна Диязитдинова

Поволжский государственный университет телекоммуникаций и информатики

Автор, ответственный за переписку.
Email: a.miftahova@psuti.ru
ORCID iD: 0000-0001-8940-4543

начальник научно- исследовательского отдела Поволжского государственного университета телекоммуникаций и информатики, г. Самара, Россия.

Область научных интересов: компьютерная обработка сигналов, совмещение телевизионных сигналов, оценка параметров телевизионных сигналов, распознавание объектов в системах технического зрения.

Россия, 443010, г. Самара, ул. Л. Толстого, 23

Список литературы

  1. Гошин Е.В., Котов А.П., Фурсов В.А. Двухэтапное формирование пространственного преобразования для совмещения изображений // Компьютерная оптика. 2014. Т. 38, № 4. С. 886–891. DOI: https://doi.org/10.18287/0134-2452-2014-38-4-886-891
  2. The contour analysis and image-superimposition problem in computer vision systems / A.I. Novikov [et al.] // Pattern Recognition and Image Analysis. 2015. Vol. 25, no. 1. P. 73–80. DOI: https://doi.org/10.1134/S1054661815010149
  3. Hast A., Nysjö J., Marchetti A. Optimal RANSAC – Towards a repeatable algorithm for finding the optimal set // Journal of WSCG. 2013. Vol. 21, no. 1. P. 21–30.
  4. Ефимов А.И., Новиков А.И. Алгоритм поэтапного уточнения проективного преобразования для совмещения изображений // Компьютерная оптика. 2016. Т. 40, № 2. С. 258–265. DOI: https://doi.org/10.18287/2412-6179-2016-40-2-258-265
  5. Nonrigid image registration using free-form deformations with a local rigidity constraint / D. Loeckx [et al.] // Medical Image Computing and Computer-Assisted Intervention – MICCAI 2004. Lecture Notes in Computer Science. 2004. Vol. 3216. P. 639-646. DOI: https://doi.org/10.1007/978-3-540-30135-6_78
  6. Ke Y., Sukthankar R. PCA-SIFT: A more distinctive representation for local image descriptors // Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 2004. Vol. 2. P. 506–513. DOI: https://doi.org/10.1109/CVPR.2004.1315206
  7. Цифровая обработка изображений в информационных системах / И.С. Грузман [и др.]. Новосибирск: Изд-во НГТУ, 2002. 351 с.
  8. Измерение характеристик и оценка возможностей видеокамер со сверхширокоугольной оптикой / О.Л. Куляс [и др.] // Физика волновых процессов и радиотехнические системы. 2020. Т. 23, № 1. С. 89–99. DOI: https://doi.org/10.18469/1810-3189.2020.23.1.89-99
  9. Harris С., Stephens M. A combined corner and edge detector // Proceedings of the Alvey Vision Conference. 1988. P. 147–151. DOI: https://doi.org/10.5244/C.2.23
  10. Мясников Е.В. Определение параметров геометрических трансформаций для совмещения портретных изображений // Компьютерная оптика. 2007. Т. 31, № 3. С. 77–82. URL: http://www.computeroptics.smr.ru/KO/Annot/KO31-3/14.html

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Изображение в декартовой (а) и логарифмически полярной системе координат (б)

Скачать (258KB)
3. Рис. 2. Вычисление коэффициента корреляции между фрагментами изображений: изображение первой камеры в окрестности особой точки в декартовой (а) и логарифмически полярной системе координат (б), изображение второй камеры в окрестности особой точки в декартовой (в) и логарифмически полярной системе координат (г)

Скачать (365KB)
4. Рис. 3. Особые точки в области изображения с текстурным сигналом

Скачать (173KB)
5. Рис. 4. Этапы обработки изображений

Скачать (153KB)
6. Рис. 5. Результат совмещения сигналов многокамерной системы наблюдения: а – изображение первой камеры; б – изображение второй камеры

7. Рис. 6. Результат неверного совмещения сигналов многокамерной системы наблюдения: а – сопоставление опорных точек; б – результат совмещения

8. Рис. 7. Результат верного совмещения сигналов многокамерной системы

Скачать (456KB)
9. Рис. 8. Результаты численного моделирования

Скачать (225KB)

© Диязитдинова А.А., 2021

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ФС 77 - 68199 от 27.12.2016.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах