bigpo.ru
добавить свой файл
1 2 3


4.3. Колебания глаза


Сходство функциональных назначений технического глаза обучае­мой системы управления и глаза животных, в том числе человека, побуждает к осмысленному переложению особенностей живого зрения, приспособленного к поиску, на техническое. Одной из таких особенностей являются колебания глаза. Различают несколько типов этих колебаний; наиболее ярко выражены скачки, благодаря которым глаз перескакивает с точки на точку сво­его внимания. Определён термин таких скачков — саккады. Скачки-саккады не носят регулярного характера и постороннему наблюдате­лю кажутся хаотичными. Есть дрейф — плавное смещение глаза в одном каком-либо направлении, и есть тремор — регулярные колебания глаза с определённой частотой и почти неизменной амплитудой. Колебания-тремор ещё называют микросаккадами, но по виду своему они нисколь­ко не похожи на саккады. Все эти колебания своих глаз человек, как правило, не замечает; они ему не мешают. Более того, как показали эксперименты, устранение этих колебаний создаёт человеку опреде­лённые неудобства. Следовательно, колебания не есть нежела­тельная неустойчивость приводов глаз, вытекающая из самой природы автоматического наведения, а являются положительным свойством /3.I3/. Сосредоточим свое внимание на треморе и попытаемся, исходя из теории обучаемых систем управления, обосновать целесообразность введения его в техническое зрение.

Уточним параметры тремора глаз человека. Амплитуда тремора сос­тавляет у разных людей от нескольких десятков угловых секунд до 1,2 угловой минуты; частота колеблется от 30 до 100 Гц /3.1/. По другим источникам /1.41/ колебания совершаются несколько раз в се­кунду на величину I...2 угловых минуты. Расхождения в параметрах у разных источников — несущественные. Что интересно, амплитуда тре­мора соизмерима с наименьшим расстоянием между двумя точками, которые способен различать человек; она равна приблизительно 0,5 угловых минуты. Приведём ещё такие данные из нейробиологии: одно волокно зрительного нерва охватывает примерно 125 рецепторов глаза; одна ганглиозная клетка сетчатки, объединяюшая несколько рецепторов, охватывает своим рецепторным полем примерно 3 угло­вых градуса всего поля зрения или около одного миллиметра на сет­чатке; рецептивные поля ганглиозных клеток накладываются друг на друга с некоторым смещением.

Нэйрофизиологи, говоря о треморе, обычно отмечают такие поло­жительные моменты его влияния: он, прежде всего, устраняет адап­тацию рецепторов, как нежелательное явление; без колебаний глаз неподвижные предметы в поле зрения через несколько секунд стано­вились бы невидимыми; во-вторых, было замечено, что тремор обостряет зрение; тонкие линии он делает более различимыми.

Объектом нашего внимания является технический глаз обучаемой системы управления, рецепторами которого являются обычные фоторе­зисторы, например из германия, из кремния или из соединений кад­мия с серой, селеном, теллуром /З.З/. Фоторезисторы имеют хорошую, близкую к линейной чувствительность, но страдают такими недостат­ками, как малое быстродействие и относительно большие габариты. Постоянная времени фоторезисторов , характеризующая их быст­родействие, колеблется в пределах 0,03...0,08 секунды, а габариты фоточувствительной площадки измеряются миллиметрами. В качестве рецепторов глаза могут быть использованы фотодиоды или лавинные фотодиоды, но у них имеются свои недостатки. У всех перечисленных технических фоторецепторов отсутствует адаптация, характерная для рецепторов живого глаза. Говоря техническим языком, адаптация есть регулирование по реально-дифференцирующему закону. Можно, разуме­ется, в каждый рецептор встроить электрическую схему с таким зако­ном регулирования, но в данном случае будем рассматривать простые фоторецепторы без подобных схем.

При использовании в качестве оптики технического глаза объек­тивов типа Гелиос с углом зрения 28 градусов и диаметром изобра­жения не более 50 мм можно расположить в этой зоне сетчатку с 2000 фоторезисторов, то есть до 50 штук по диаметру. Таким об­разом, один рецептор будет охватывать приблизительно 0,5 угловых градуса поля зрения или 1 мм сетчатки.

Охарактеризуем возбуждения рецепторов сетчатки. В силу нелинейностей фоторезисторных свойств рецепторов и оптических искажений поле возбуждений рецепторов будет, очевидно, отличаться от изображения на сетчатке, а это изображение — от видимой сцены. Но в данном случае эти отличия нас не интересуют, и поэтому обобщим и то, и другое, и третье одним понятием — образ. Элементами об­раза, как известно, являются пятна, границы или контуры пятен, линии, точки и полутоновые участки. Напомним, что пятно есть участок рецепторного поля с равными возбуждениями рецепторов, причём при смещении изображения на величину не более, чем на один рецептор, возбуждения сохраняются неизменными. Пятна могут быть светлыми, тёмными или серыми. Рецепторы света, возбуждающиеся на свету, будут иметь соответственно наибольшее, наименьшее или частичное возбуждение. Рецепторы же темноты, возбуждающиеся в темноте, наоборот, — соответственно наименьшее, наибольшее или частичное обратное возбуждение. Граница пятна или контур включа­ет только те рецепторы, возбуждение которых изменяется при сме­щении изображения по сетчатке на один рецептор. Линия есть тот же контур, но без пятна; при смещении изображения поперёк линии на один рецептор возбуждения всех рецепторов изменяются. Точка охватывает только один или несколько, но малое число рецепторов, и при смещении в любом направлении возбуждения их изменяются. Полутоновые участки характерны тем, что рецепторы их хотя и слабо, но изменяют своё возбуждение при любом смещении изображений.

Влияние колебаний глаза на зрительный образ. Прежде чем выдать рекомендации по введению колебаний технического глаза (тремора), посмотрим, как эти колебания отразятся на образе, то есть на изо­бражении на сетчатке. Из всех элементов образа важнейшими являются линии и точки; только у них при малых смещениях изображений по сет­чатке глаза происходят существенные изменения возбуждений рецепто­ров, и только эти изменения могут обеспечить требуемые изменения сигналов управления обучаемых систем. Рецепторы полутоновых участ­ков и, тем более, пятен в изменении сигналов управления участия практически не принимают. Тонкие линии, ширина которых соизмерима с размерами оптических окон рецепторов или даже меньше их, могут оказаться незамеченными глазом.

Введём колебания глаза. Амплитуда этих колебаний, скорее всего, должна быть соизмеримой с размерами рецепторов, а частота — с по­стоянной времени рецепторов , то есть со временем запаздыва­ния срабатывания фоторецепторов. Более точные параметры колебаний определим дальше. Колебания, о которых идёт речь, не должны распро­страняться на остов: если глаз закреплён на схвате робота, то при­воды колебаний должны смещать глаз относительно схвата; причём же­лательно заставлять колебаться глаз в двух направлениях в плоскос­ти, перпендикулярной оптической оси глаза.

Сосредоточим своё внимание на некоторой линии образа, изобразим её в виде полосы шириной а (рис. 3.21) и заставим колебаться в поперечном направлении по синусоидальному закону с амплитудой А и частотой :


.


Считаем, что линия (полоса) ярко выделяется на общем фоне и за­свечивает фоторецепторы сетчатки глаза. На самом деле линия может быть тёмной на светлом фоне, но, учитывая, что сетчатка включает кроме так называемых рецепторов света, ещё и рецепторы темноты, тём­ные линии можно приравнять к светлым, и также можно говорить о яркости тёмных линий.

Во время колебаний зона засветки оказывается шире полосы на ве­личину двух амплитуд. Однако вследствие колебаний рецепторы будут освещены не всегда, а только в момент выхода на них полосы. Те из них, которые освещены постоянно, или почти постоянно, будут возбуждены максимально, но а те, на которые свет падает кратковремен­но, окажутся возбуждёнными лишь частично. Определим степень зас­ветки рецепторов в зависимости от смещения их от центрального поло­жения. Обозначим через х — смещение края полосы в поперечном на­правлении и заменим в синусоидальном законе частоту  на период Т:


,


где — время начала засветки.





Рис.3.21. Зависимость засветки рецепторов от колебаний глаза


Полное время засветки за один период колебаний Т определится как


,


а с учётом синусоиды получим:


. (3.69)


На рис. 3.21 изображены: полоса шириной а, три синусоиды с амплитудами: ; ; , — и кривые зависимости продолжительности засветки рецепторов в течение одного периода Т от удалённости рецепторов х. Как видно из графика, рецепторы, расположенные на оси t, будут освещены полосой по­стоянно, если амплитуда колебаний полосы А окажется меньше поло­вины ширины а. При А=а те же рецепторы будут освещены только 2/3 времени периода Т, а при — ещё меньше: . Но при любой амплитуде колебаний полосы время освещения ею указан­ных рецепторов не будет меньше половины периода Т. Рецепторы, расположенные не по центру полосы, будут освещены меньше; чем даль­ше от центра, тем ещё меньше. Координата крайней освещённой точки определяется как , а общая ширина освещаемой зоны будет равна .

Теперь посмотрим, как будут возбуждаться рецепторы под воздей­ствием мелькающего света. Закон роста возбуждения (проводимости) фоторезистора в этом случае может быть представлен в виде экспо­ненты:


, (3.70)


где — наибольшее возбуждение фоторезистора при непрерывном освещении его полосой.

Примем за время отсчёта начало засветки фоторезистора; тогда в конце засветки возбуждение возрастёт до такой величины:


,


где — остаточное возбуждение от засветки в предыдущем периоде.

После засветки рецептор погружается в темноту, и возбуждение его начинает спадать по тому же закону экспоненты:


. (3.71)


В конце затемнения возбуждение фоторезисторов снизится согласно (3.71) до значения


.


В результате можно определить высшее возбуждение фоторезистора в конце засветки:


,


и его низшее возбуждение в конце затемнения:


.


На рис.3.22 представлена кривая изменения возбуждения фоторезистора во времени t при условии, что . Среднее возбуждение фоторезистора можно определить по кривой (рис.3.22) путем интегрирования выражений (3.70) и (3.71) и деления суммарной величины на период Т. Однако, учитывая то, что экспонента спадания возбуждения (3.71) по своим параметрам повторяет экспоненту роста (3.70), а также то, что начальные и конечные точки этих экспонент совпадают, на этом основании можно утверждать, что


. (3.72)





Рис. 3.22. График возбуждения фоторецептора
при мелькающем освещении


Если же учесть, что ионизация токопроводящего слоя обычных, упомянутых выше фоторезисторов порождается исключительно светом и не носит лавинный характер, как у лавинных фотодиодов, то до­пустимо считать, что среднее возбуждение каждого фоторе­зистора будет пропорционально засветке :


.


С учётом (3.69) последнее выражение примет вид


. (3.73)


И выражение (3.72), и выражение (3.73) в общем случае дают раз­мытое изображение линии на сетчатке глаза с увеличением её ширины. Хорошо ли это или плохо? То, что все видимые линии становятся тол­ще, — это ещё не значит, что они становятся более видимыми. Если уширение линии осуществить без полутонов, ступенчато, то такая линия становится пятном, и решающим фактором изменения сигнала управления становится лишь край этой уширенной линии. Другое дело — полутоновое, размытое к краям изображение линии на сетчатке гла­за: любое смещение изображения приводит к изменению возбуждений рецепторов, охваченных этой линией. И чем шире размыта линия, тем больше рецепторов фиксируют её. В этом смысле размывание линий действительно способствует обострению зрения (хотя понятие остроты зрения требует особого толкования).

Однако такой вывод справедлив лишь в отношении отдельной линии. При наличии нескольких рядом расположенных линий размывание их может привести к стиранию границ между ними, то есть к потере ост­роты зрения. Другими словами, отдельно расположенные линии при ко­лебаниях глаза будут фиксироваться большим количеством рецепторов и тем самым ярче выделяться, но плотно расположенные линии будут сливаться в общее пятно. Именно так видит человеческий глаз: до определённого момента он отчётливо различает тонкие линии и мелкие точки, а дальше — при сближении их — изображения линий и точек сливаются. Граница различимого-неразличимого человеческого глаза известна, и она удачно используется в телевизорах, где пятьсот строк сканирования при определённых размерах экрана обеспечивают восприятие изображения как непрерывного. С учётом указанных осо­бенностей человеческого глаза сформировалась также точечная поли­графия.

Острота зрения как следствие обучения. А теперь — об инженер­ном толковании остроты зрения (уточним: технического зрения) с по­зиции обучаемых систем. Очевидно, какой бы рельефной (контрастной) ни была видимая сцена, глаз не задержит своего внимания ни на чём в этой сцене, если он не обучен этому; и говорить в этом случае об остроте зрения бессмысленно. Вот если обучаемая система управле­ния со зрением обучена отыскивать вокруг себя заданные предметы, зрительно выделяющиеся на общем фоне, или любые изображения (для глаза предметы — тоже изображения), то тогда и возникает острота зрения.

Из чего она складывается?

Изменение любого образа В, как известно, порождает соответствующее изменение сигнала управления:


; .


Величина становится определённой только в том случае, когда она выделяется из общего «шума», то есть когда , где — уровень «шума» (или допустимое отклонение). Такой порог чувствительности и определяет остроту зрения. Он порождается соот­ветствующим изменением образа при соответствующем состоя­нии мозга:


; .


Обострить зрение, то есть усилить изменение образа до граничного значения , можно различными способами, напри­мер дополнительной подсветкой обозреваемой сцены, или наведением оптики на большую резкость, или увеличением напряжения питания технического глаза. Но можно обострить, оказывается, с помощью колебаний глаза.

Чтобы объяснить это, рассмотрим более подробно техническое зре­ние. В конечном счёте острота зрения проявляется не в простом из­менении сигнала управления на величину, больше чем (хотя в общем случае это справедливо), а в сосредоточении внимания на заданном объекте или, говоря иными словами, в надёжном поиске. Если глаз реагирует на изменение образа и с помощью технического мозга заставляет привод смещать схват в сторону выделенного пред­мета, то, следовательно, этот глаз в данном случае имеет необхо­димую остроту зрения. Её можно считать достаточной и в том случае, если схват притормаживает при выходе на посторонний, но схожий по виду предмет и притормаживает ровно на столько, на сколько необходимо для надёжного обозревания предмета. Значит, кроме зри­тельного выделения на общем фоне искомых и похожих на них пред­метов, должен сформироваться соответствующим образом в процессе обучения сам технический мозг, то есть образ С. А так как про­водимости технических синапсов, как известно, в процессе обучения изменяются под воздействием возбуждений соответствующих рецепто­ров, то, очевидно, наибольшие изменения претерпят только те си­напсы, рецепторы которых окажутся наиболее возбуждёнными. Это оз­начает, что при обучении в целевых ситуациях яркие пятна, линии и точки образов этих ситуаций оставят в мозгу наибольший след. Если говорить об отдельной линии образа целевой ситуации, то ей будет соответствовать некоторое проявление в мозгу, которое «ска­жет своё слово» в момент выхода в процессе работы на эту же целе­вую ситуацию. Так во время поиска заданного предмета при прибли­жении к нему линии (контуры) его изображения на сетчатке глаза постепенно будут надвигаться на проявления этих же линий в мозгу, и, как только они сольются, схват остановится — предмет найден.

Образно говоря, рельеф состояния мозга С напоминает рельефы образов ситуаций В обучаемой выборки, и в том числе — целевых с нулевыми сигналами управления, а посему в момент выхода глаза на любую целевую ситуацию, то есть в момент нахождения заданного предмета, оба стыкующихся рельефа (образа ситуации В и образа состояния мозга С) находят, как бы, наиболее плотное прилега­ние друг к другу с наименьшей потенциальной энергией, точнее го­воря — с нулевой, так что дальше глаз перемещаться уже не сможет: предмет найден. Продолжая это же образное сравнение, можно ска­зать, что в прочих нецелевых ситуациях указанные рельефы не име­ют плотного прилегания и скользят друг по другу, как скользит шарик по неровной поверхности в поисках лунки. В этом смысле В, С и Е отражают, образно говоря, штамп: В — пуансон, С — матрица, а Е — зазор между ними.

Возвращаясь к исследуемым линиям образов ситуаций, можно пред­ставить их в виде выступающих рёбер рельефа, а их проявления в мозгу — в виде желобов (соответственно: точка — бугорок, а прояв­ление точки в мозгу — лунка), и при сближении рёбер и желобов они стыкуются. Нельзя забывать при этом, что проявление зрительных элементов в мозгу никоим образом не является простым их отпечатком. При наложении в процессе обучения одних ситуаций на другие и при многократном повторе картина проводимостей синапсов в мозгу ока­жется очень сложной и далеко не однозначной по отношению к кон­кретному зрительному образу. Тем не менее след от отдельных си­туаций всё же в мозгу останется; точнее говоря, это — уже даже и не след, а некоторое искажённое проявление его.

Сравним в образном представлении линии без колебаний и с коле­баниями глаза. Без колебаний — линии будут выглядеть как узкие рёбра с отвесными краями, а их проявления в мозгу — как такой же ширины щели. Хотя очертания этих рёбер и этих щелей полностью сов­падают и они могут плотно прилегать друг к другу, но находить друг друга рёбра и щели будут с трудом: достаточно иметь самое малое смещение, и стыковка невозможна. Даже стремясь друг к другу, они легко будут проскакивать позицию совпадения. Отсюда следует, что схват с глазом обречён на неустойчивость, которая усугубляется инерцией головы робота и запаздыванием срабатывания фоторецепторов.

Другое дело — при треморе, то есть при колебаниях глаза относи­тельно схвата. Линию теперь можно представить уже в виде выступа­ющего широкого ребра с пологими сторонами, а проявление линии в мозгу — в виде такой же ширины жёлоба также с пологими краями. И нахождение, и стыковка этих рёбер и желобов могут осуществляться без каких-либо трудностей. Достаточно попасть пологой стороне ребра на край жёлоба, и начнётся естественное «скольжение» к полному совпадению, к стыковке данных ребра и жёлоба, то есть к выходу схвата с глазом на искомый предмет. Пологие профили рё­бер и желобов предотвращают неустойчивость приводов головы робо­та в нулевой позиции, снижая влияние инерции головы и апериоди­ческого запаздывания системы. Скольжение ребра по склону жёлоба можно назвать проявлением остроты зрения.

С другой стороны, пологие склоны рёбер и желобов таят в себе некоторую опасность «зависания» на них: чем положе склон, тем ме­нее проявляется стремление двигаться под действием его уклона. Так детские санки на слабом склоне горки могут не скользить вниз. Причиной «зависания», как обычно, может быть сухое трение приво­да и механизма, которое преодолевается только тогда, когда сигнал управления Е привода достигает своего порогового значения. Вы­ход из положения связан опять же с тремором: колебания глаза при­водят к пульсированию сигнала управления, и в позиции, близкой к целевой, такое пульсирующее подталкивание приведёт к дальней­шему скольжению по склону вплоть до почти нулевой отметки. Прав­да, в других позициях, далёких от целевых, пульсирование сигнала управления не позволяет стабилизироваться любому положению схвата робота, и схват с глазом смещается даже в том случае, когда нет для этого видимых причин. Это и есть тот дрейф, то есть бес­цельное плавное блуждание, который отмечен у человеческого глаза.

Выбор параметров колебаний глаза. Итак, колебания-тремор тех­нического глаза способствуют выделению искомых предметов, поиску их, быстрейшему выходу на них и стабилизации положения после на­хождения. Другими словами, колебания-тремор обостряют зрение или, проще, улучшают его. И такое улучшение наблюдается почти на всём пространстве зрительных возможностей за исключением только того, что очень мелкие детали зрительного поля, напротив, сливаются и глазом не выделяются. Но и это можно расценить как улучшение зрения: благодаря такой способности глаза можно, оказывается, линей­ные или точечные, то есть дискретные изображения, воспринимать непре­рывными, монолитными.

Если целесообразность введения в техническое зрение колебаний-тремора считать очевидной, то возникает вопрос выбора параметров этих колебаний: какими они должны быть? Практика, разумеется, даст свой ответ на поставленный вопрос, а пока приходится руководствова­ться логическими соображениями.

И одним из этих соображений может быть необходимость. Колебания глаза должны быть такими, чтобы различать вполне определённые по раз­мерам мелкие предметы или детали этих предметов. Допустим, робот предназначен для монтажа электрических плат. Самыми мелкими деталями плат являются отверстия в этих платах и ножки устанавливаемых в них микросхем. Значит, глаз должен их различать с расстояния, допустим, 0,5 метра. Достаточно пересчитать размеры указанных мелких деталей в масштаб сетчатки глаза, чтобы определить их угол зрения. Пусть их размер окажется равным полградусу угла зрения объектива; тогда ампли­туда колебаний глаза может составлять порядка 0,25...0,50 угловых градуса. Такой вывод следует из анализа кривых зависимости продолжи­тельности засветки от соотношения ширины линии и амплитуды колеба­ний (рис. 3.21). Что же касается выбора частоты колебаний, то, исхо­дя из тех же соображений необходимости, можно рекомендовать как мож­но большую частоту.

Другим соображением при выборе параметров колебаний-тремора может быть соотношение их с параметрами глаза, в частности с размерами и с постоянной времени рецепторов. Пусть амплитуда колебаний будет рав­на половине угла зрения одного рецептора, то есть 0,25 угловых гра­дуса. При равных размерах амплитуда и ширины полосы (А=а) полу­чается, что глаз окажется способным различать предметы с размерами, соответствующими приблизительно 0,75 угловых градуса. Более мелкие детали поля зрения будут сливаться. Частоту колебаний следует выби­рать с учётом того, что период колебаний Т должен быть больше по­стоянной времени рецептора, но обязательно меньше постоянной времени привода робота: . Если известные фоторезисторы имеют = 0,03...0,08 сек, то период можно принять равным Т = 0,05...0,10 сек при условии, что = 0,20 сек.

Ещё одним соображением при выборе параметров колебаний-тремора глаза может быть реальная возможность. Приведённые выше параметры фоторезисторов не очень удачные для технического зрения. Желательно было бы иметь такие фоторецепторы, размеры оптических окон которых не превышали бы сотых или даже тысячных долей миллиметра, а посто­янная времени — измерялась бы тысячными и менее долями секунды. Тог­да при обычной оптике типа объективов фотоаппаратов можно было бы довести число рецепторов в сетчатке глаза до десятков и сотен ты­сяч, а быстродействие робота, оснащённого техническим зрением, — до быстродействия широко известных робототехнических, станочных и иных приводов.

И, наконец, можно принять за эталон известные параметры колебаний человеческого глаза.



следующая страница >>