научная статья по теме ИНТЕРПОЛЯЦИЯ ЛИНИЙ РАЗЛИЧНОЙ ОРИЕНТАЦИИ Биология

Текст научной статьи на тему «ИНТЕРПОЛЯЦИЯ ЛИНИЙ РАЗЛИЧНОЙ ОРИЕНТАЦИИ»

СЕНСОРНЫЕ СИСТЕМЫ, 2010, том 24, № 1, с. 3-9

ЗРИТЕЛЬНАЯ СИСТЕМА

УДК 612.821

ИНТЕРПОЛЯЦИЯ ЛИНИЙ РАЗЛИЧНОЙ ОРИЕНТАЦИИ

© 2010 г. В.М. Бондарко

Институт физиологии им. И.П. Павлова РАН 199034 Санкт-Петербург, наб. Макарова 6, E-mail: vmbond@gmail.com

Поступила в редакцию 20.02.2009 г.

В психофизических экспериментах исследовали зависимость процесса интерполяции от размера и ориентации изображений, а также расстояния между ними. В качестве изображений использовали два симметричных относительно вертикали отрезка прямых линий длиной 0.6, 1.2 и 1.8 угл.град. с ориентацией ±15, ±30, ±45 или ±60о. Расстояния между отрезками менялись в пределах от 0.5 до 4.5 угл.град. пропорционально их длине. Посередине между отрезками был изображен штрих, у которого менялась высота. Наблюдателя просили указать, где находится штрих: выше или ниже воображаемой кривой, соединяющей отрезки. По результатам экспериментов вычисляли местоположение штрихов, лежащих на таких кривых. Координаты штрихов зависели от расстояния между линиями и их ориентации, они менялись пропорционально размеру изображений. Затем были рассчитаны кривые, проходящие через концы отрезков линий и экспериментально полученные координаты штрихов. Наилучшее приближение к экспериментальным данным было получено в случае кривых —дуг окружностей, для которых линии являлись касательными. Обсуждаются возможные варианты интерполяции фрагментированных изображений.

Ключевые слова: интерполяция, фрагментированные изображения, гештальтпсихология.

ВВЕДЕНИЕ

Опознание фрагментированных объектов — неотъемлемая черта повседневной жизни. Редко можно наблюдать объект целиком. Чаще всего часть объекта скрыта, находится за другим изображением. Каким образом происходит процесс восстановления неполного изображения и его опознание — задача, изучением которой занимаются многие исследователи. Интуитивно понятно, что подобное восстановление может быть неоднозначным. В задаче интерполяции фрагмен-тированных контуров исследователи, как правило, предлагают руководствоваться следующими принципами гештальтпсихологии (Koffka, 1935): принципом хорошего продолжения (good continuation) и принципом близости (proximity). Моделирование этих представлений приводит к наложению некоторых условий на соединяющую фрагменты кривую. Во-первых, кривая должна быть гладкой (иметь производные в любой точке; геометрическая интерпретация производной — касательная), и ее производные на краях должны совпадать с производными на краях фрагментов изображения. Во-вторых, длина соединяющей кривой должна быть минимальной. С математической точки зрения таких условий недостаточ-

но для однозначного определения соединяющей кривой. Необходимо хотя бы указать класс кривых, среди которых ищется неизвестная.

Продемонстрируем выполнение этих принципов на примере. Возьмем два отрезка линий разной ориентации АВ и СБ и соединим их ближайшие концы прямой линией ВС (рис. 1). Осуществим следующее построение. Построим окружность произвольного диаметра, соприкасающуюся с отрезком СБ в точке С. Из центра Е этой окружности проведем линию, перпендикулярную ВС. Точку ее пересечения с окружностью обозначим через С. Через нее проведем линию, параллельную ВС. Ее пересечение с продолжением прямой АВ обозначим за Ь". Отложим от точки Ь" на прямой Ь"С' отрезок, равный ВЬ". Конец этого отрезка обозначим за В'. Теперь опустим перпендикуляры из точек В и В' к соответствующим прямым АВ и В'С'. Из точки пересечения этих перпендикуляров (Р) проведем окружность, соприкасающуюся с прямыми АВ и В'С'. Касательные к окружности в точках В и В' совпадают по направлению с АВ и В'С'. Таким образом, в результате построили искомую кривую линию ВВ'С'С, обладающую нужными свойствами. Эта кривая состоит из двух дуг окружностей и отрезка прямой линии. С одной стороны, она незначи-

А

F

Рис. 1. Построение интерполирующей кривой с минимальной длиной.

АВ и СБ - исходные отрезки прямых линий. ВВТ и С'СЕ - две окружности, для которых АВ и СБ являются касательными. ВВ'С С - построенная гладкая кривая, выделена жирной линией. В точках В и С направление касательных к этой кривой совпадает с ориентацией отрезков АВ и СБ.

(Kellman, Shipley, 1991)). В этом случае Жерби-но и Фантони (Gerbino, Fantony, 2006) получили довольно неожиданный результат: зависимость заполнения контура от исходного размера изображений, т.е. отсутствие инвариантности по отношению к размеру изображений. Они промоделировали полученные данные разработанной ими моделью поля (field model), в которой достигается определенный компромисс между принципами хорошего продолжения и минимальности длины интерполирующей линии и отсутствует инвариантность к размеру.

В настоящем исследовании сделана попытка экспериментально найти возможный тип кривых, производящих интерполяцию фрагментирован-ных изображений, и посмотреть, выполняется ли в данной задаче инвариантность к размеру. В качестве изображений были взяты два отрезка прямых линий. Сама задача соответствует случаю модального заполнения контура (Kellman, Shipley, 1991).

тельно отличается по длине от отрезка прямой ВС, с другой — имеет касательные в точках В и С, направление которых совпадает с направлением отрезков АВ и СБ, которые хотели соединить. Понятно, что при уменьшении радиуса окружностей эта кривая будет приближаться к прямой ВС. Но в то же время эта минимальная по длине линия (прямая ВС) не может быть достигнута из-за несовпадения у нее ориентации с ориентацией отрезков линий АВ и СВ. Какой радиус окружностей следует брать в расчет, не совсем понятно. Но кажется маловероятным, что кто-либо захочет объединить отрезки подобным образом. Возможно соединение отрезков АВ и СВ другим видом кривых, но как следует из данного примера, длина их не будет минимальной. Поэтому можно заключить, что два предложенных принципа гештальтпсихологии в этой задаче сталкиваются с противоречием. Принцип минимальности длины интерполирующей кривой, скорее всего, не обязательно должен выполняться. Исследователи по-разному пытались решить эту проблему с математической точки зрения. Некоторые варианты ее решения будут рассмотрены в разделе "Обсуждение результатов".

Экспериментально подобрать наилучшую интерполирующую кривую, естественную для зрительного восприятия, насколько известно, пробовали только при закрывании части объекта другим объектом (так называемое амодальное заполнение контура, определение понятий дано в обзоре

МЕТОДИКА

Стимулами служили симметрично расположенные относительно вертикали отрезки прямых линий. Они имели размер около 0.9, 1.8 и 2.7 см и ориентацию ±15, ±30, ±45 или ±60°. Расстояния между центрами отрезков линий менялись пропорционально их длине в пределах от 0.75 до 6.75 см (0.75, 1.5 и 2.25 см для линии длиной 0.9 см). На одинаковом расстоянии от концов линий был изображен хорошо видимый горизонтальный штрих, который располагался на разной высоте по вертикали. На рис. 2 показаны примеры использованных стимулов.

Изображения были синтезированы на компьютере 1ВМ-486 со стандартным цветным дисплеем СТХ. Характеристики дисплея: 17 дюймов по диагонали, шаг апертуры решетки 0.27 мм. Дисплей использовали при разрешении экрана 1024 х 768 пикселей и частоте смены кадров 100 гц. Яркость экрана была равна 40 кд/м2, стимулов -5 кд/м2 . Время предъявления изображений было равно 1 с. Стимулы предъявлялись бинокулярно с расстояния 86 см до экрана монитора. Длина линий при таком расстоянии составляла 0.6, 1.2 и 1.8 угл.град., расстояния между ними — 0.5-4.5 угл.град., длина штриха — 2.5 угл.мин, 1 пиксель соответствовал 1.2 угл.мин.

Наблюдатель смотрел на экран, на котором появлялись два отрезка линий и штрих. Он должен был указать, выше или ниже этот штрих находится по отношению к мысленно представленной им

Рис. 2. Примеры тестовых изображений.

Приведены два тестовых изображения, отличающиеся длиной линий и их ориентацией (±15 и ±30о). Между линиями на середине изображен штрих с меняющейся в ходе эксперимента высотой. Наблюдатель указывает, где расположен штрих: выше или ниже относительно интерполирующей кривой.

соединяющей две линии кривой. Для ответа наблюдатель нажимал на одну из двух клавиш-стрелок на клавиатуре "вверх", "вниз". Использовался метод вынужденного выбора (ответ "штрих находится на объединяющей линии" не был разрешен). Ритм предъявления изображений на экране задавал сам наблюдатель, но после последующего предъявления проходило не менее 500 мс.

Было проведено девять серий экспериментов, отличающихся размером изображений и расстоянием между ними. В каждой серии ориентация линий и высота штриха менялись случайным образом. В работе приведены суммарные данные по 10-14 экспериментам в каждой серии, которым соответствует 100-140 предъявлений стимулов с одинаковой ориентацией, размером, расстоянием между линиями и высотой штриха. Регистрировали ответы "выше-ниже".

В начале с каждым наблюдателем были проведены пробные эксперименты для задания первоначальных ординат штрихов так, чтобы для конкретных условий присутствовало примерно 50% ответов "ниже" и столько же ответов "выше". Шаг изменения высоты подбирали наименьшим для получения большей точности измерений. Он был равен 1-8 пикселям у разных наблюдателей в зависимости от размеров стимулов и расстояния между ними.

В экспериментах приняло участие трое наблюдателей с нормальным зрением.

РЕЗУЛЬТАТЫ

Для определения позиций штрихов, расположенных на интерполирующих кривых, для каждого наблюдателя были построены психометрические функции для ответов "выше" при каждой фиксированной длине линий, расстоянии между ними и ориентации. При помощи метода наименьших квадратов психометрические функции были приближены к функциям нормального распределения. Точность приближения оказалась высокой (95% и более) у всех наблюдателей.

Величины средних значений у нормальных распределений соответствуют тем высотам, при которых наблюдатели считают, что точки лежат на интерполирующих кривых. На рис. 3 показаны зависимости средних значений от длины линий для наименьших (а), средних (б) и даль-

Ш

а

I §

и

80-| 70605040302

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком