Иванов, Смирнов, Цуккерман - О движении глаз при восприятии стохастических изображений

  

Вся библиотека >>>

Оглавление книги >>>

 


Исследования зрительной деятельности человека


 

О движении глаз при восприятии стохастических изображений

 

И. К. Иванов, С. Д. Смирнов, И. И. Цуккерман

 

 

В естественных условиях восприятию формы объектов почти всегда, по-видимому, предшествует выделение участков, которые можно приближенно полагать статистически однородными (квазистационарными) по одному или нескольким параметрам-признакам.

Ведущим параметром для выделения объектов обычно служит цвет. Но и на одноцветном изображении хорошо различаются участки по тону, фактуре и т. д., причем зрение как бы усредняет значения параметров, используемых им как признаки (например, яркость, размер и форму деталей и т. п.), производя на каждом участке статистические оценки. Без этого «за деревьями леса не увидеть».

Статистические оценки могут служить для распознавания широких классов зрительных образов. Удавалось обучать ЭВМ или специализированные автоматы классифицировать по статистическим характеристикам типы почв, облачности, текстуры металлов и т. п. (Горьян, Цуккерман, 1966; Горьян и др., 1970; Бухаров и др., 1972).

Способность обнаружить статистически однородные участки объектов, различать изображение с разными статистическими свойствами присуща не только человеку и высшим животным, но даже и насекомым (Недочетова и др., 1967). Операции статистического анализа изображений осуществляются, по-видимому,, на сравнительно низких    уровнях    зрительной системы. Даже при тяжелых локальных поражениях зрительной коры и явно выраженной зрительной агнозии способность дифференцировать статистически различные тестовые изображения сохраняется относительно хорошо (Горьян и др., 1969). Сходные данные получены и в опытах на животных (Празд-никова, 1970).

 

Средние значения параметров (например, средняя яркость, среднеквадратичное значение уклонения от средней яркости и т. п.) оказываются нередко недостаточными для автоматической классификации реальных изображений. Более эффективными признаками для классификации текстур служат не средние величины (моменты), а распределения, заданные, например, в виде гистограммы (гистограммы распределения яркости элементов изображения, распределения контуров по направлениям и т. п.) (Горьян, Цуккерман, 1966). Что касается зрения, то здесь остается не выясненным до конца, какие распределения предпочтительнее выбирает зрительная система человека.

Участки реальных изображений описываются не одной характеристикой, а трудно определяемой совокупностью их. Начинать изучение с особенностей восприятия статистически однородных участков удобнее на более простых изображениях с помощью специально синтезированных «случайных» тестов. Параметры каждого участка, по которым производится обобщение и различение, здесь    задаются    заранее. 

 

Приняв гипотезу, что зрительная система оценивает статистические параметры для выделения объектов, надо было уточнить особенности этого процесса. Каковы, приблизительно размеры оперативных полей, по которым берутся выборки и производятся статистические оценки? Отслеживает ли глаз границы между участками с различной статистикой или фиксируется внутри участков? Зависит ли тактика обнаружения участков от статистики изображений? На эти вопросы и следовало ответить в первую очередь. В качестве тест-объектов использовались двухградационные (черно-белые) изображения типа текстур. Они состояли из «случайного» фона, на котором находился участок («фигура») со статистическими характеристиками, отличавшимися от статистических характеристик фона.

При этом были синтезированы две серии тестов, подробное описание которых приведено ниже. Принципиальное различие между ними заключается в том, что в тестах первой серии испытуемый должен был обнаружить местоположение прямолинейной границы между двумя участками, имеющими различные статистические характеристики, а в тестах второй серии испытуемый должен был опознать форму участка, имеющего статистические характеристики, отличные от характеристик окружающего фона. Таким образом, в экспериментах с тестами первой и второй серий мы имеем дело с разными уровнями зрительного восприятия — уровнем обнаружения статистических различий и более высоким уровнем опознания формы на оснозе обнаруженных различий статистических характеристик. Результаты экспериментов с различными сериями тест-объектов описаны отдельно

Тест-объекты, Задавая статистические характеристики фона и фигуры, мы ограничились двумя самыми простыми из них — так называемыми статистиками первого и второго порядка. Статистика первого порядка задавалась вероятностью (частотой) черных элементов Р(ч), т. е, отношением числа черных элементов к полному числу дискретных отсчетов яркости. Отсчеты были статистически независимыми. Статистика второго порядка задавалась как простая марковская цепь, а именно задавалась вероятность (частота) перепадов яркости, т. е. переходов от черного к белому и от белого к черному, которые принимались равными Рч{б) —-Рв (ч) = W. Вероятность перепада при этом вычисляется как Pn=W(2—W). Вероятность черного и вероятность белого на таких изображениях равны 0,5 каждая.

Фон всегда задавали статистикой первого порядка, причем во всех тестах для фона выбирали Рн — Р6 = 0,5. В тестах первого типа фигура отличалась от фона частотой черных элементов (AiP—0,5 — P4). В тестах второго типа частоты черных элементов для фигуры и фона были одинаковыми (AiP=0), а фигура выделялась из фона тем, что между ее элементами задавались статистические связи ДцР=0,5— Рп¥=®, тогда как фон был образован статистически независимыми отсчетами. Были синтезированы две серии тестов. В первой серии граница между фоном и фигурой всегда была прямолинейной, а внешний контур всего тест-объекта был круглым или прямоугольным  (рис. 3,а,б).

 

В тестах, имеющих круглую форму, угол наклона границы а равнялся 45°, 90°, 135° и 180°. В тестах, выполненных в виде прямоугольника, а придавались только два значения— 90 и 180°, но дополнительно менялась площадь фигуры, которая составляла 0,25; 0,5 и 0,75 площади всего тест-объекта.

Каждый из перечисленных тестов был выполнен в четырех вариантах, которые отличались друг от друга статистическими характеристиками фигуры. В двух случаях фигура задавалась статистикой первого порядка (Рч=0,3 и .Рч—0,4) и в двух — статистикой второго порядка (Рп~0,3 и Рп=0,4).

Тест-объекты второй серии имели 'прямоугольную внешнюю форму с фигурами, окруженными со всех сторон фоном. Для синтезирования фигур и фона в этих тестах использовалась только статистика первого порядка. Границы фигур в тест-объектах задавались прямоугольником или кругом. В различных тест-объектах менялись местоположение фигур, ориентация прямоугольника (горизонтальная, вертикальная и под углом 45°), размер фигур (400, 800 и 1600 элементов) и их статистика (Рч=0,3; Рч=0,4).

Для изготовления двухградационных тестовых случайных изображений может быть использована электронная вычислительная машина (ЭВМ) с выводом информации на электронно-лучевую трубку. Однако наиболее высококачественные (контрастные и однородные по всему полю) тесты получались с помощью специального устройства. Оно включало-в себя электроуправляемые пишущие машины типа ЭУМ-23, датчик случайных чисел и схему управления. Одна из пишущих машин служила для печати, вторая — для задания границы фигуры. Черные элементы теста впечатывались специальным бойком, установленным вместо одной из букв в регистре машинки. Размер бойка был выбран таким, чтобы получить белые и черные элементы одинаковой величины.

Для получения команд управления пишущей машинкой «Печать» и «Пропуск» использовалась случайная последовательность десятичных цифр, поступающая с датчика случайных чисел.

Для задания границ объекта использовался лист белой бумаги, имеющий размеры изготавливаемого теста, на который в требуемом месте наносился рисунок объекта. Вся площадь объекта заливалась тушью. Этот лист вставлялся во вторую пишущую машинку и перемещался синхронно с листом бумаги, на котором печатался тест. На второй машинке было установлено фотосчитывающее устройство, работающее в отраженном свете. Оно состояло из осветителя и фотодиода. При появлении участка объекта перед фотодиодом с него снимался сигнал, который управлял изменением параметра синтезируемого статистического изображения.

Обнаружение границ между текстурами

Методика

Описанные выше тест-объекты с прямолинейной границей между фигурой и фоном предъявлялись испытуемому на экране с помощью проектора. Угловой размер «круглых» тестов равнялся 9° (по диаметру); угловой размер «прямоугольных» тестов равнялся 9°Х13,5°. Размер одного элемента во всех случаях был равен 5 угл.мин.

Перед началом опыта испытуемого знакомили с несколькими образцами объектов и сообщали ему обо всех вариантах расположения границы между текстурами с различными статистиками. Таким образом, задача испытуемого сводилась к выбору внутри заранее известного «алфавита» изображений. В промежутках между отдельными пробами и перед началом первой пробы поле зрения испытуемого перекрывалось шторкой. Испытуемому давалась следующая инструкция: «После поднятия шторки переведите взгляд на объект и рассматривайте его до тех пор, пока не увидите границу между участками объекта, имеющими различную статистическую структуру. Затем немедленно переведите взгляд на правую верхнюю точку объекта, лишь после этого сообщите местоположение границы. Старайтесь работать быстро, но без ошибок». Ответ испытуемый давал путем нажатия кнопки. Каждое положение границы было закодировано последовательностью длинных и коротких сигналов. Все коды были тщательно выучены испытуемыми и отработаны в тренировочных опытах.

Эксперименты проводились в условиях бинокулярного зрения. Движения правого глаза регистрировались фотооптическим методом (Ярбус, 1965) на открытую неподвижную фотобумагу. Точность наложения траектории движений глаз на объект составляла 0,5°.

В опытах принимало участие трое испытуемых; с каждым из них было проведено по два опыта на каждое условие.

Результаты и их обсуждение

При обработке полученных записей определялось количество правильных ответов и число фиксаций за время решения задачи. Результаты, усредненные по всем испытуемым и по всем тестам, имеющим заданные статистические характеристики, представлены в табл. 1.

Для анализа пространственного расположения фиксаций взора на объектах со статистикой фигуры I порядка площадь тест-объектов была условно разделена на три зоны — зону границы (полоса шириной 1,5°, в центре которой расположена фактическая граница) и две зоны, расположенные по обе стороны от зоны границы. Оказалось, что примерно в одной трети всех поисков фиксации расположены по одну сторону от зоны границы, примерно в одной пятой случаев они расположены в зоне границы, в одной трети случаев они расположены по обе стороны от пограничной зоны, и лишь изредка встречаются поиски, когда фиксации покрывают почти весь объект.

Увеличение статистических различий фигуры и фона, т. е. возрастание АтР и ДцР облегчает задачу выделения границы.

На объектах с фигурами, заданными статистиками II порядка, расположение фиксаций в большинстве случаев носило характер более или менее однородного распределения. Классификация таких поисков на основе визуального анализа была затруднена. В этих случаях подсчитывали среднюю амплитуду скачков (расстояние между отдельными фиксациями— А), среднее расстояние фиксаций от границы — В; отношение числа фиксаций на меньшей части объекта (Ns=o,25) к числу фиксаций на большей части объекта (Ns=oi75) для тест-объектов с S фигуры=0,25 и 0,75 S объекта; показатель корреляции, отражающий тенденцию к пересечению линией взора границы между фигурой и фоном.                        

Оперативные поля зрения при работе с тест-объектами, на которых фигуры характеризуются статистикой II порядка, оценивались по средней амплитуде скачков. Они составляют 2,5° (по радиусу).

Когда фигура и фон характеризуются различными статистиками I порядка, они отличаются друг от друга средней яркостью. Операции усреднения яркости участков легко выполняются периферическими рецептивными полями. Это, возможно, и является основной причиной того, что оперативные поля для анализа статистик первого порядка имеют большую величину.

Анализируя пространственное положение фиксации взора на объектах, можно выделить следующие способы работы испытуемых при решении задачи на выделение границы между текстурами: способ одновременного сравнения — взгляд фиксируется или на границе между текстурами, или на одной из них, способ последовательного сравнения —испытуемый центрирует взгляд сначала на одной текстуре, а затем на другой.

В более или менее чистом виде эти способы выступают лишь при решении достаточно простых задач, когда фигура характеризуется статистикой I порядка. В сложных случаях имеют место комбинации обоих способов, которые не поддаются классификации на основе внешних признаков; они потребовали дополнительной количественной обработки, результаты которой обсуждаются ниже.

Анализ эмпирических коэффициентов корреляции, отражающих тенденцию к пересечению линией взора границы между текстурами, показывает, что в случае сложного и развернутого во времени поиска последующая фиксация чаще расположена с той же стороны, что и предыдущая (/Ci=+0,09 для Р„=0,3 и /Ci=+0,34 для Рп = 0,4 — средние данные). Тот факт, что при большей выраженности границы линия взора чаще пересекает ее (/Ci= +0,09 для Р„ = 0,3 против K"i= +0,34 для Рп = 0,4), свидетельствует о том что испытуемые предпочитают пользоваться способом последовательного сравнения и переходят к нему по мере появления гипотезы о местоположении границы.

При случайном распределении фиксаций по объекту следовало ожидать, что среднее отношение числа фиксаций на меньшей части объекта (5 = 0,25) к числу фиксаций на большей части объекта (5=0,75) будет пропорционально отношению площадей (0,33). Для объектов со слабо выраженной границей мы получили это отношение равным 0,23, а для объектов с более сильно выраженной границей — 0,55, т. е. чем сильнее выражена граница, тем в меньшей степени фиксации распределяются между частями объекта пропорционально их площади и тем более равномерно распределяются Они между частями объекта, расположенными по разные стороны от границы вопреки различию в их площадях.

Чем больше различия между статистическими характеристиками текстур, тем в среднем ближе к границе расположены фиксации    (5=1,4° для Рп=0,3 и 1,9° для Рп = 0,4).

Таким образом, анализ распределения фиксаций показывает, что чем меньше статистические различия между текстурами, тем ближе пространственное распределение фиксаций к однородному. Напротив, чем резче выражена граница, тем в большей степени параметры двигательного поведения глаза определяются ею (линия взора чаще, пересекает границу, соотношение количества фиксаций на фигуре и фоне определяется в основном не их площадью, а принадлежностью к разным текстурам и, наконец, фиксации ближе располагаются к границе).

Сопоставительный анализ поисков границы в различных условиях показывает, что при больших различиях между статистиками фигуры и фона преобладает «симультанный» принцип работы зрительной системы. Это значит, что видимая граница между текстурами непосредственно оценивается во время каждой фиксации. При слабо выраженных границах (т. е. в случае малых АР) преобладает последовательный или накопительный принцип работы зрительной системы. В этом случае оценка разности производится после длительного про-цесса суммации сравниваемых параметров по большой площади.

Поиск фигур на однородном фоне

Методика

Для проведения опытов по выделению фигур на однородном фоне использовалась вторая серия тест-объектов. 1 Тест-объекты проецировались на экран и имели угловые .\ размеры 11X18°; на один элемент приходилось 7 угл.мин. Размеры фигуры на фоне составляли 6,5°ХЗ,3°; 4,5°Х2,3°; 3,2°Х1.6°, что соответствовало 1600, 800 и 400 элементам. Перед началом опыта испытуемого знакомили с образцами фигур, затем ему давали инструкцию: «Ваша задача состоит в том, чтобы в предъявленных объектах найти (распознать) одну из показанных ранее фигур, указав ее местоположение. Старайтесь работать быстро, но без ошибок». В остальном методика опытов была аналогична методике 1-й серии. В опытах участвовало двое испытуемых.

Результаты  и  их   обсуждение

При обработке записей подсчитывались следующие показатели: общее количество фиксаций на объекте; количество фиксаций в области фигуры; амплитуда первого скачка в область фигуры; количество опытов, в которых после фиксации фигуры вновь наблюдались фиксации на фоне с последующим возвратом и область фигуры (в процентах к общему числу опытов). Соответствующие данные, усредненные по двум испытуемым, ирпнсдсны в табл. 3.

Из табл. ,4 индии, что как уменьшение статистических различии между фигурой и фоном, так и уменьшением площади фигуры усложняют задачу выделения фигуры, о чем говорит увеличите среднего числа фиксаций. При этом происходит как бы обмен статистических различий на размер (например, при А,/'=-^0,2 и 5=400 эл. N=10; при AiP=0,l и5=Ш00эл. N — U).

Иными слонами, для данного числа фиксаций, потребовавшихся для обнаружения AiPl/S=const. Это равенство напоминает известный закон Пипера   (Piper), да и по существу соответствует условиям обнаружения стимула, для которых выведен этот закон.

Увеличение абсолютного числа фиксаций на фоне (разность между общим числом фиксаций и числом фиксаций и области фигуры)   при уменьшении статистических различии фигуры и фона и площади фигуры также свидетельствует о наличии действительного поиска фигуры и косвенно о большей сложности решаемой задачи.

Плотность фиксаций на фигуре значительно выше плотности фиксаций на фоне (следует учесть, что площадь фигуры в несколько раз меньше площади фона, в то же время в среднем до 50% фиксаций приходится на фигуру). Указанная тенденция несколько усиливается при увеличении статистических различий фигуры и фона. Этот факт, а также факт увеличения числа поисков с возвратом глаза в область фигуры при уменьшении статистических различий между фигурой и фоном и уменьшении площади фигуры позволяют предположить, что поиск в сложных условиях носит характер выдвижения и проверки гипотез.

По величине первого скачка в область фигуры можно судить о величине оперативного поля, в пределах которого происходит обнаружение фигуры на фоне. В условиях описанных опытов она оставалась относительно постоянной, порядка 3,5° (по радиусу).

 

Заключение

Восприятию формы объектов обычно предшествует выделение статистически однородных участков. Для изучения процессов выделения, таких участков использовалась методика, основанная на регистрации глазных движений при рассматривании стохастических изображений. Тест-объектами служили искусственно синтезированные черно-белые изображения типа текстур. Они состояли из стохастического фона, на котором находился участок («фигура») со статистическими характеристиками, отличавшимися от фоновых. Использовались тест-объекты с прямолинейными границами между фигурой и фоном и тест-объекты с «фигурой», имеющей форму прямоугольника, круга и пр.

Обнаружено, что увеличение статистических различий фигуры и фона упрощает задачу обнаружения границы и опознания ее формы. При этом чем меньше статистические различия между текстурами, тем ближе пространственное распределение фиксаций к однородному. Напротив, чем резче выражена граница, тем в большей степени параметры двигательного поведения глаза определяются ею (линия взора чаще пересекает границу, соотношение количества фиксаций на фигуре и фоне определяется в основном не их площадью, а принадлежностью к разным текстурам и, наконец, фиксации ближе расположены к границе).

Тактика обнаружения участков зависела от статистических различий. В частности, при больших различиях между фигурой и фоном преобладал симультанный способ работы, а при малых различиях — сукцессивный или накопительный способ. При опознании формы разных участков происходил обмен статистических различий на площадь. Получены факты, позволяющие предположить, что поиск в сложных условиях носит характер выдвижения и проверки гипотез.

Радиус оперативных полей, по которым проводятся статистические оценки, имел в условиях описанных опытов порядок 2,5—3,5°.

 

 

ЛИТЕРАТУРА

 

1.             Б у х а р о в   А. К.,    Г о рьян   И.   С,   Хавкнн   Л.   М.,   Цуккерман И. И. Телевизионный автомат для распознавания структур. «Техника кино и телевидения», 1972, № 3.

2.             Г и дик о л А. А.   Кибернетика и кортикальная регуляция движений. София, ИНН,

3.             Го рьян II. С,   Цуккерман И. И.   Распознавание образов по их статистическим свойствам. «Техника кино и телевидения», 1966. № 1'.

4.             Г о р  и и 11. (;.,  Д у б о в А. С,  Ильи н Б. М.,  Ц у к к е р м а н И. И.

0(1 аитоматнческом распознавании форм облачности. «Метеорологии и гидрология», 1970, № 9.

5.             Г о р I. и и II. (',.,  М е е р с о н Я. А.,  Тонко и о г и й И. М.,  Ц у к к е р-

м и м 11. II. О распознавании случайных изображений при локальных поражениях коры головного мозга. «Невропатология и психиатрия:./, I'Ki'J, № 2.

6.             Недочетом:! Ю. Ф., С о л ощ енко Н. П., Францевич Л. И..

М п л п м о и II. И.  К различению насекомыми расчлененности кон-,     турни фигуры. В сб.: «Вопросы бионики». М,, «Наука», 1967.

 

Содержание >>>