научная статья по теме РАСПОЗНАВАНИЕ ПРОЕКТИВНО ПРЕОБРАЗОВАННЫХ ПЛОСКИХ ФИГУР. Ш.ОБРАБОТКА ОСЕСИММЕТРИЧНЫХ ОВАЛОВ МЕТОДАМИ АНАЛИЗА ПОЛЯР Биология

Текст научной статьи на тему «РАСПОЗНАВАНИЕ ПРОЕКТИВНО ПРЕОБРАЗОВАННЫХ ПЛОСКИХ ФИГУР. Ш.ОБРАБОТКА ОСЕСИММЕТРИЧНЫХ ОВАЛОВ МЕТОДАМИ АНАЛИЗА ПОЛЯР»

СЕНСОРНЫЕ СИСТЕМЫ, 2011, том 25, № 4, с. 275-296

ЗРИТЕЛЬНАЯ СИСТЕМА

УДК 004.932.2

РАСПОЗНАВАНИЕ ПРОЕКТИВНО ПРЕОБРАЗОВАННЫХ

ПЛОСКИХ ФИГУР. III. ОБРАБОТКА ОСЕСИММЕТРИЧНЫХ ОВАЛОВ МЕТОДАМИ АНАЛИЗА ПОЛЯР

© 2011 г. П. П. Николаев

Институт проблем передачи информации им. А.А. Харкевича РАН 127994, Москва, пер. Б. Каретный, 19 E-mail: nikol@iitp.ru

Поступила в редакцию 17.3.2011 г.

Рассмотрена задача проективно инвариантного распознавания овалов, обладающих после проективной их трансформации осью симметрии в неявной форме. Решать ее предложено в три этапа: на основе разработанных новых методов анализа сначала производится детекция образа оси, затем - особой ее точки, чем и создается возможность инвариантного описания овала на этапе его финального отображения в глобальном и локальном базисе. Основное внимание в работе уделено обсуждению альтернативных схем вычисления оси (локализации ее образа, дуально ей соответствующего полюса симметрии и инвариантных ее точек). Учет выявленных преимуществ и слабых сторон этих схем позволяет избирать оптимальную сообразно конкретным условиям задачи распознавания. Численные эксперименты с аналитически заданными овалами, имеющими неявную симметрию, показали перспективность разработанных процедур обработки для визуальных систем автоматического распознавания гладких выпуклых контуров (по центральной монокулярной проекции оптического сенсора), не обладающих, кроме свойств симметрии, никакими иными геометрическими особенностями.

Ключевые слова: овал, проективное преобразование, поляра, полюс, вурф, касательная, инвариантное отображение, гармоническое соответствие, точка перегиба.

ВВЕДЕНИЕ

Дисциплина Техническое зрение, активно наращивая потенциал своих практических возможностей, с ростом производительности вычислительных систем начала "вторгаться" в проблемные области, продуктивная разработка которых еще десятилетие назад считалась абсолютной прерогативой научного направления Искусственный интеллект, достижения в рамках которого были продуктом "высоких теорий". Это расширение круга задач коснулось обширнейшей проблематики автоматического визуального распознавания, в том числе и применительно к специфическим условиям статического монокулярного наблюдения, для которых наиболее универсальным подходом к процедуре опознания объекта полагают опору на инвариантные свойства его геометрии. И подходят для этой цели только проективные

и топологические инварианты, - ведь со сменой оптического ракурса регистрации объекта на сенсорной матрице системы могут измениться все его метрические параметры и аффинно инвариантные характеристики: расстояния между опорными точками, отношения длин прямолинейных отрезков границ, углы между ними, позиции центров масс контуров, форма криволинейных границ, свойства симметрии его фрагментов и т.п. В силу перечисленных обстоятельств разработка теоретических подходов, использующих "понятия и инструменты" проективной (вкупе с проективной дифференциальной) геометрии, призвана обеспечить востребованную (в разнообразии ее вариантов) автоматизацию процессов геометрического распознавания. Привлечение же громоздких вычислительных схем в работе с проективными инвариантами образа стало ныне доступным благодаря возросшей производительности вычис-

лительных систем. Как уже упоминалось в публикациях этого цикла работ (Николаев, 2011, а, б), основной геометрической характеристикой объекта, инвариантной к любым центрально проективным изменениям его сенсорного образа, является "двойное отношение прямолинейного ряда четырех точек" - вурф. Оценка его численного значения для каких-то линейных фрагментов объекта, а также использование проективно инвариантных "опорных элементов" (точек и прямых), исчерпывают минимально достаточный набор средств, с помощью которых, "согласно теории", можно строить процедуры инвариантного анализа плоских контуров, "оптически искажаемых" сенсором по законам центральной проекции. Основным предметом изложения, как и в предыдущих статьях цикла, здесь будут аспекты теории распознавания гладких выпуклых контуров класса овалов. Только овалы теперь рассматриваются уже не как составные (Николаев, 2011, а) и не в виде их композиции с неким (заданной позиции) дуальным элементом плоскости (Николаев, 2011, б), а как обладающие единственным общим для них свойством - наличием оси симметрии, которая под влиянием априори неизвестного проективного преобразования, совершенного над "исходной ортоформой" овала, фигурирует неявно, т.е. не удовлетворяет известным декартовым свойствам оси симметрии. Объект нашего рассмотрения не обязан удовлетворять условию равенства частей хорд (соединяющих пары симметричных точек овала), рассекаемых осью и ей перпендикулярных. Не обязательны для него и аффинные модификации свойств осевой симметрии. Стало быть, и признак параллельности тех же хорд, но уже не под прямым углом рассекаемых осью, при постоянстве отношения их длин, также не может быть гарантировано выполняемым для нашего объекта. Перечисленные свойства нельзя использовать в процедурах поиска положения неявной оси (станем далее называть искомую прямую образом оси, обозначая сокращенно - ОО) по причине их выполнения лишь в сугубо частных случаях реализации, т.е. в силу не универсальной их природы. При вычислении позиции ОО можно опираться исключительно на проективно инвариантные его (образа) свойства, базовый набор которых мы и сформулируем ниже. Свойство 1: все пары симметричных точек контура овала принадлежат прямым Li, пересекающимся в общей точке полюса симметрии PS (точке собственной либо в частном случае его ортоформы - несобственной, т.е. бесконечно удаленной). Свойство 2: две касательные к контуру овала в точках пересече-

ния с ним прямой ОО, также пересекаются в PS. Свойство 3: для любой прямой Li и принадлежащей этой прямой четверки точек, две из которых проективно симметричны, третья Pi образована пересечением данной Li с ОО, а четвертая есть PS, численное значение вурфа всегда равно единице, т.е. любая пара симметричных точек овала разделяется парой Pi, PS в гармоническом отношении (формула вычисления вурфа и определение гармонизма для четверки коллинеарных точек приведены в работах (Николаев, 2011 а, б)). Вполне понятная цель - решить задачу распознавания объекта с предельно возможным минимумом декларируемых его особенностей - обусловила список ограничений при постановке задачи в целом, - в нее не включены объекты, обладающие хотя бы одним инвариантным признаком из списка явных (к таковым относятся точки излома, пересечения, ветвления, перегиба и т.д., их список приведен в первой части работы (Николаев, 2011, а)). Завершая вводную часть, заметим, что стиль изложения данных, полученных по теме третьей части цикла, нами сохранен в согласии с манерой предшествующих частей. Иными словами, данный текст адресуется в том числе читателю, имеющему общебиологическое образование. С этой целью все авторские декларации даны в наглядно представимом виде, для обеспечения чего статья иллюстрирована данными численных экспериментов с овалами и для их анализа вводимыми вспомогательными кривыми (полярами) всех типов, теоретически рассматриваемых в этой части работы. Ограничения на допустимый объем текста не позволили включить в рамки данной статьи весь материал, полученный по теме осевой симметрии плоских фигур. Здесь не будут рассматриваться процедуры и методы проективно инвариантного распознавания осесимметричных овалов с использованием вспомогательных кривых внутреннего (по отношению к контуру овала) положения: аналогов схемы "триплет" (двупара-метрические вурф-отображения овала в композиции с внутренней фиксированной точкой") и нового структурного элемента - сопряженной пары А?-контуров (в данной части будет описан лишь способ вычисления этой вспомогательной конфигурации и приведены основные ее свойства), включаемых в процедуры детекции ОО для дальнейшего отображения овала в эталонный образ. Эти материалы, а также описание методов анализа овалов с неполной осевой симметрией, планируется изложить в следующей части данного цикла исследований.

1. ИСХОДНАЯ ПОСТАНОВКА ЗАДАЧИ РАСПОЗНАВАНИЯ И ЕЕ УТОЧНЕНИЕ

Рассмотрим подробнее постановку задачи инвариантного описания овала с учетом специфики, привносимой наличием у него неявного опорного элемента, каким является ОО. Напомним, что отображение распознаваемой плоской кривой на эталонный 4-вершинник требует однозначной детекции на ней упорядоченной четверки точек, при условии, что позицию каждой можно вычислить при любых проективных преобразованиях плоскости, которой эта кривая принадлежит. Безошибочная локализация ОО посредством вычисления координат точек пересечения ОО с контуром овала обеспечивает для искомого ансамбля только две инвариантные точки (назовем их опорными и обозначим А и В). Следовательно, первоначальную версию о двухэтапном процессе проективно инвариантного описания овала необходимо дополнить задачей этапа промежуточного, - требуется найти недостающую пару опорных точек, предварительно сформулировав и свойства, которым должны удовлетворять эти точки, и метод их поиска. Первое, что представляется подходящим вариантом идеи о дополнительной паре точек, - найти позицию максимальной хорды Ы (проходящей через полюс РБ, положение которого согласно свойству 2 должно быть уже известно, если нами правильно решена задача первого этапа о позиции ОО), оказывается соображением ложным, поскольку отношение, в котором Ы делит отрезок А-В на две неравные части (в одной из возможных ортоформ овала) является инвариантом аффинным, а не проективным, т.е. в роли признака, использовав который, удастся завершить формирование ансамбля из четырех инвариантных точек, никак не поможет разрешению стоящей проблемы. Требуется привлечение аппарата поляр, развитого нами в предшествующей части цикла (Николаев, 2011, б), и разъяснение функциональной роли этих вспомогательных кривых, само появление которых в ходе вычислительного процесса является следствием выбора некоторой точки овала, не принадлежащей контуру фигуры, в качестве "внутреннего полюса Р". Как

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком