Мы расширяем аудиторию ваших семинаров!
Главная » Новости » Новости "Моста Безопасности" » Трёхмерное зрение: модное поветрие или фантастические возможности? (часть 3)

Трёхмерное зрение: модное поветрие или фантастические возможности? (часть 3)

Трёхмерное зрение: модное поветрие или фантастические возможности? (часть 3)

13.12.2013

vocord.ru

Часть 3. Объёмное зрение: алгоритмы трёхмерной реконструкции сцены по нескольким 2D-снимкам (начало в Части 2)

Существуют различные алгоритмы нахождения сопряженных точек на стереопарах. Одним из наиболее эффективных считается алгоритм SIFT (Scale Invariant Feature Transform) – алгоритм поиска характерных точек на  двух или более изображениях, инвариантный к масштабу изображений и изменениям яркости. SIFT также достаточно устойчив к изменениям ракурса изображения. Этот алгоритм описан в литературе [1, 2, 3, 4].

Идея алгоритма SIFT заключается в нахождении особенных точек на каждом изображении, а последующем сравнении и парном отборе этих точек по некоторым характерным признакам. Для этого для каждого изображения вычисляются так называемые пирамиды сглаженных изображений на разных масштабах:

L(x, y, σ) = G(x, y, σ) * I(x, y)  

Здесь I(x, y) – исходное двумерное изображение, G(x, y, σ) – сглаживающий гауссиан,  L(x, y, σ)- результат свертки изображения с гауссианом.

В алгоритме вводится параметр степени размытия k.  Для каждого разрешения исходного изображения параметр k варьируется, и строятся пирамиды c различным сглаживанием (см. Рис.1). После этого вычисляется разность гауссианов двух соседних слоев, которая обозначается через D.

D(x, y, σ) = (G(x, y, k σ) - G(x, y, σ)) * I(x, y) = L(x, y, k σ) - L(x, y, σ)

Такая процедура повторяется для изображения исходного разрешения, уменьшенного вдвое, вчетверо и т.д. Обычно параметр k выбирается таким, чтобы в пределах одной октавы по разрешению получалось 4-5 слоев гауссианов.

 

Рис.1. Построение разности гауссианов в SIFT 

 После построения пирамиды гауссианов и их разностей определяются такие особенные точки, которые являются экстремумами как внутри каждого слоя, так и между слоями (см. Рис.2).

 

 

Рис.2. Поиск экстремума между слоями и внутри слоя. Экстремум помечен крестиком.

 Для каждой особенной точки экстремума, найденной выше, в зависимости от параметра σ строится окружность, содержащая соседние точки изображения, и изучаются градиенты яркости в данных точках. Эти градиенты усредняются. Относительно среднего градиента вычисляются отклонения градиентов в окружающих точках, которые сводятся к некоторой упрощенной модели описания, называемой дескриптором (см. Рис.3).

В результате, получается множество особенных точек на каждой паре изображений с набором своих дескрипторов. Эти точки сравниваются попарно на соседних изображениях, и если дескрипторы двух выбранных точек совпадают в переделах заданной точности, то две точки принимаются как сопряженные. Можно считать, что эти точки были получены как проекция одной и той же трехмерной точки на плоскости двух камер.

 

 

Рис.3. Описание точек экстремумов по направлению вектора градиента в соседних точках.

Различные эксперименты показывают, что SIFT хорошо находит сопряженные точки, дает малое количество ложных точек, однако покрытие изображение сопряженными точками не является плотным [1]. Обычно для изображений лица разрешением порядка 400 х 600 пикселов удается в лучшем случае найти порядка 100-150 сопряженных точек. На Рис.4 приведен результат расчета SIFT в зависимости от чувствительности (порога) алгоритма.  Такая особенность алгоритма объясняется структурой самого алгоритма – среди всего множества точек выбираются лишь наиболее характерные точки-экстремумы на разных масштабах, которыми не могут быть все точки изображения одновременно.

Подробнее > > >

Объёмное зрение, Scale Invariant Feature Transform, видеонаблюдение, Вокорд

« Предыдущая новость |Следующая новость »

 

Регистрация

Рассылка

Подпишитесь на электронную газету: она будет приносить новости на Ваш компьютер.
Охранные системы

Ближайшие выставки по безопасности

Календарь выставок
закрыть