Загрузить архив: | |
Файл: 191-0018.zip (239kb [zip], Скачиваний: 131) скачать |
МИНИСТЕРСТВООБРАЗОВАНИЯ УКРАИНЫ
ДОНЕЦКИЙ ГОСУДАРСТВЕННЫЙИНСТИТУТ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
О С Н О В Ы П О С Т Р О Е Н И Я
С И С Т Е М Р А С П О З Н А В А Н И Я
О Б Р А З О В
Ч а с т ь1
(К у р с л е к ц и й)
Óòâåðæäåíî:
çàñåäåíèè êàôåäðû íà ðàñïîçíàâàíèÿ îáðàçîâ
Ïðîòîêîë ¹ 3 îò 23.11.97
1 9 9 7
Настоящее учебное пособие представляет собой первую часть курса лекций по "Основам построения систем распознавания образов", читаемых студентам специальности "Программное обеспечение вычислительной техники и автоматизированных систем управления" в VI - VII семестрах обучения в Донецком Государственном институтеискусственного интеллекта.
Причинами подготовки и выпуска специального курса лекций явились:
1.Отсутствие отработанного и доступного учебника инженерной направленности по созданию систем распознавания.
2.Дефицит книг соответствующей тематики для организации самостоятельной работы студентов.
3.Необходимость обобщения отдельных взглядов автора, достаточно продолжительное время специализировавшегося в области создания систем распознавания.
Одновременно с курсом лекций в настоящее учебное пособие помещены вопросы практических занятий по изучаемым темам и методические указания к лабораторным работам.
Составитель доц. Л.А. Белозерский
Ответственный за выпуск В.В. Гончаров
С О Д Е Р Ж А Н И Е
Т е м а1 Распознавание образов в жизни человека (Введение)...……
Ë Å Ê Ö È ß 1.1Ðàñïîçíàâàíèå â áèîëîãè÷åñêèõ è òåõíè÷åñêèõ ñèñòåìàõ.
1.1.1. Всеобъемлющий характер действия механизмовраспознавания ..............................................................................................
1.1.2. Краткая история вопроса появления технических систем автоматического распознавания и методов их создания............................................................................................………
Л Е К Ц И Я 1.2Терминология и отличительные особенности систем распознавания ...................................................................……….
1.2.1. Основные определения...........................................……………….
1.2.2. Системы распознавания................................................…………..
Т е м а 2Задачи, решаемые в процессе создания системраспознавания
Л Е К Ц И Я2.1. Проблематика задач создания систем распознаванияна описательном уровне ...............……………………
Л Е К Ц И Я2.2. Формулировка задач создания систем распознавания и методы их решения .........................…………………
Л Е К Ц И Я2.3. Формулировка задач создания систем распознавания и методы их решения (продолжение) ……………….
Т е м а 3Классификация систем распознавания
Л Е К Ц И Я 3.1 Принципы классификации и типы систем распознавания………………………………………………………….
Л Е К Ц И Я 3.2 Принципы классификации и типы системраспознавания(продолжение) ….....................……………………….
Ò å ì à 4 Îïòèìèçàöèÿ ýâðèñòè÷åñêèõ âûáîðîâ ïðè ñîçäàíèè ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ
Ë Å Ê Ö È ß 4.1Îïòèìèçàöèÿ àëôàâèòà êëàññîâ è ñëîâàðÿ ïðèçíàêîâ
4.1.1.Уточнение назначения и цели создания СР .......……………….
4.1.2. Взаимосвязь размерности алфавита классов и эффективностиСР ………………………………………………………………………
Ë Å Ê Ö È ß4.2 Îïòèìèçàöèÿ àëôàâèòà êëàññîâ è ñëîâàðÿ ïðèçíàêîâ(ïðîäîëæåíèå) ….……………..............................................
4.2.1.Взаимосвязь размерности вектора признаков и эффективности СР…………………………………………………………………………
4.2.2.Формализация задачи оптимального взаимосвязанного выбора
àëôàâèòà êëàññîâ è ñëîâàðÿ ïðèçíàêîâ………….…………………….
4.2.2.1. Ôîðìàëèçàöèÿ èñõîäíûõ äàííûõ .. . . ....... .....……… .
4.2.2.2.Âûèãðûø ðàñïîçíàâàíèÿè îïòèìèçàöèÿ àëôàâèòàêëàññîâ è ñëîâàðÿ ïðèçíàêîâ â óñëîâèÿõ îãðàíè÷åíèé……..
Те ма 5 Моделирование систем распознаванияобразов - методология их создания иоптимизации
Ë Å Ê Ö È ß 5.1 Ââåäåíèå â ìîäåëèðîâàíèå .....................................
5.1.1.История вопроса ......................................................……………..
5.1.2 Îñíîâíûå îïðåäåëåíèÿ ............................................……………
Ë Å Ê Ö È ß5.2 Ìîäåëèðîâàíèå ñëîæíûõ ñèñòåì è ïðèìåíåíèå ìîäåëåé
5.2.1. Принципы построения модели сложной системы ...………….
5.2.2. Моделирование сложных системи опытно-теоретический метод их испытаний ........................……………………………………
Ë Å Ê Ö È ß5.3Ìåòîä ñòàòèñòè÷åñêèõ èñïûòàíèé(ìåòîä Ìîíòå-Êàðëî)………………………………………………………………….
5.3.1.Основное определение .............................................…………….
5.3.2.Принципы получения случайных величин на ЭВМ …………
Ë Å Ê Ö È ß 5.4 Ìåòîä ñòàòèñòè÷åñêèõ èñïûòàíèé (ïðîäîëæåíèå)
5.4.1.Моделирование независимых случайных событий ……………
5.4.2.Способы получения случайных чисел с заданным законом распределения ..........................................................……………………
Ë Å Ê Ö È ß 5.5Ìîäåëü ñèñòåìû ðàñïîçíàâàíèÿ îáðàçîâ ................
5.5.1.Моделирование распознаваемого объекта ........…………………
Ë Å Ê Ö È ß 5.6.Ìîäåëü ñèñòåìû ðàñïîçíàâàíèÿ îáðàçîâ (ïðîäîëæåíèå)……………………………………………………………
5.6.1.Моделирование средств определения характеристик объектов распознавания.........................................................……………………....
5.6.2.Моделирование каналов связи...............................………………
Ë Å Ê Ö È ß5.7. Ìîäåëèðîâàíèå àëãîðèòìà ðàñïîçíàâàíèÿ .............
5.7.1.Модель алгоритма распознавания объектов (явлений, процессов) ....................................................................................................
5.7.2.Модуль оценки эффективности системы распознавания ……..
5.7.3.Модуль управления моделью системы распознавания…………
Ë Å Ê Ö È ß 5.8 Îïûòíî-òåîðåòè÷åñêèé ìåòîä â çàäà÷àõ ñîçäàíèÿ ñèñòåì ðàñïîçíàâàíèÿ .............................................……………………
5.8.1.Использование принципов опытно-теоретического метода при моделировании СР .........................................……………………………
5.8.2. Моделирование в задачах создания и оптимизации систем распознавания..................................................................…………………
ЛАБОРАТОРНЫЕ РАБОТЫ..................................................................
ВОПРОСЫ ПРАКТИЧЕСКИХ ЗАНЯТИЙ ...................................…...
ËÈÒÅÐÀÒÓÐÀ................................................….........................................
Т е м а 1
Распознавание в биологических и технических
системах
Л Е К Ц И Я 1.1
Распознавание образов в жизни человека
( Введение)
1.1.1. Всеобъемлющий характер действия механизмовраспознавания.
Распознавание образов (а часто говорят - объектов,сигналов, ситуаций,явлений или процессов) - самая распространенная задача, которую человеку приходится решать практически ежесекундно от первого до последнего дня своего существования. Для этого он использует огромные ресурсысвоего мозга,которые мы оцениваем таким показателем как число нейронов, равное 1010.
Можно даже не утруждая себя примерами (мы рассмотрим их ниже) заметить, что похожие действия наблюдаются в биологии, в живой природе, а иногда даже в неживой. Кроме того, распознавание постоянно встречается в технике. А если это так, то, очевидно, следует считать механизм распознавания всеобъемлющим.
С более общих позиций можно утверждать, и это вполне очевидно,что в повседневной деятельности человек постоянно сталкивается с задачами, связаннымиспринятием решений,обусловленных непрерывно меняющейся окружающей обстановкой.В этомпроцессе принимаютучастие:органы чувств, с помощью которых человек воспринимает информацию извне; центральная нервная система,осуществляющая отбор, переработку информации и принятие решений; двигательные органы, реализующие принятое решение. Но в основе решений этих задач лежит, в чем легко убедиться, распознавание образов.
В своейпрактике люди решают разнообразные задачипо классификации и распознаванию объектов, явлений и ситуаций (мгновенно узнают друг друга,с большой скоростью читают печатные и рукописные тексты, безошибочно водят автомобили в сложном потоке уличного движения,осуществляют отбраковку деталей на конвейере,разгадывают коды, древнюю египетскую клинопись и т.д.).
Рассмотрим некоторые примеры всепроникающего механизмараспознавания образов человеком в природе и обществе.
1.Вы легко узнаете издалека своего знакомого (но задайтесьвопросом: как?) Обратите внимание на слабую зависимость результатов распознавания от дальности,если конечно мы еще видим отдельные элементы и движения.
2.Предположим Вам нужен для изучения или повторения такой раздел математики, как интегральное исчисление. Ваши действия :
а) распознаете по корешкам обложек справочник на книжной полке;
(на фоне других книг - прочитывая, распознаваяназванияпри последовательном просмотре или по внешнему виду,хранимому Вами в памяти по предшествующему пользованию этим справочником)
б) листаете и распознаете страницу справочника с оглавлением; (по опыту знаете, что оглавление располагается в начале или в конце книги)
в) распознаете тексты заголовков оглавления; (читаете);
г) распознаете среди всех заголовков необходимый Вам (сравниваете прочитанный со смысловым содержаниеминтересующего Вас раздела)
д) распознаете соответствующую этому заголовку страницу; (зная, что в оглавлении против найденного раздела печатается интересующий номер страницы)
е) листаете справочник и распознаете по нумерации страниц необходимый номер;
(сравниваете запомненный номер с номерами открываемыхстраниц) и т.д., и т.п.
Обратите внимание, во-первых, на то, сколько знаний, хранящихся вВашей памяти используется. Во-вторых, здесь, как и в предыдущих примерах,можно задаться многочисленными вопросами по поводу того, как это Вы сами все осуществляете, и не найти ответа.
В рассмотренном примере мы уже должны были заметить, что помимо “чистого” распознавания в нем присутствуют нашидействия,нопри этомлюбому действию предшествует распознавание.А любое выполненное действие влечет за собой новый этап распознавательной деятельности.
3.Вот может быть более очевидный пример из военного дела.Обратите в нем внимание на сочетание распознавания и действий, являющихся управлением.
Представьте себя в роли летчика в кабине самолета-истребителя. Вы взлетаете, набираете высоту,готовитесь и начинаете выполнять боевую задачу. Прежде всего:
-обнаруживаете (то есть, распознаете) в зоне обзора цель-самолет противника;
-идете на сближение;
-на основе имеющихся знаний о своем самолете как оружии - распознаете момент, когда произвести пуск ракеты по обнаруженной цели;
-производите пуск;
или:
-распознаете, чтопротивникопередил Вас и произвел по вашему самолету пуск ракеты;
-распознаете среди большого набора тактических приемов ввашей памяти необходимый прием для управления самолетом в целях проведения противоракетного маневра;
-производите маневр.
-распознаете, чтоманевр удался (если не удался и есть возможность- повторяете) - и сами атакуете противника;
Затем:
-распознаете, что горючее на исходе или - задача выполнена - уходите на посадку;
-распознаете посадочную полосу - осуществляете посадку.
Вот далеко не полный и подробный перечень этапов распознаванияи действий.Но если сами действия понятны и очевидны, то предшествующее им распознавание требует осмысливаниясоответствующегомеханизма. И прежде всего,каждый этап описанных последовательности - это действия на основе знаний, хранящихся в памяти.
4.Рассмотрим пример из области экономики. Руководитель экономического региона по экономическим показателям хозяйственной деятельностиобнаруживает (распознает) ухудшение продовольственного обеспечения области, города и т.п.
Обратившись к другой группе экономических показателей, он распознает, что лежит в основе такого нежелательного явления (например, отсутствиегорючего для автотранспорта). В итоге принимается решение о дополнительных договорах на бензин или дизельное топливо споставщиками или, найдяновых поставщиков,организуетотправку железнодорожного состава цистерн или автозаправщиков для доставки и т.д.
5.Еще один военный пример из области обороны, где человек не выполняет ни распознающей функции,ни функции управления. СПРН (система предупреждения о ракетном нападении), находясь в режиме круглосуточного боевого дежурства автоматически обнаруживаетвнекоторый момент времени(то есть, распознает) КО (космический объект) и завязывает его траекторию.На этой основе автоматически определяется не являетсяли этотКО баллистической ракетой (распознается по попаданию пролонгированной во время полета КО точки его падения на обороняемую территорию, натерриториюстраны). Если указанное условие выполнилось СПРН дает сигнал тревоги на средства противодействия , например систему противоракетной обороны (ПРО). Система ПРО, в свою очередь, обязана автоматически по данным СПРН обнаружить (распознать ) интересующуюцель, распознать,например, что этосложнаябаллистическаяцель СБЦ (боевая часть БЧ +ложные цели ЛЦ), распознать БЧ среди ЛЦ, произвести пуск противоракеты и т.д., и т.п.
6.Теперь примеры из области биологии.
Семечко растения распознает достаточность температурыокружающей среды, достаточность влаги, питательных веществ - и включает механизм роста.
Росянка распознает насекомое,севшее на ее лепестки и резко закрывается как ловушка для последующего переваривания пищи.
Подсолнечник распознает,где расположено солнце,и поворачивает свое соцветие в его сторону.
Комар распознает человека и пьет его кровь.
Лягушка распознает и ловит комара.
Удав распознает и ловит лягушку.и т.д.
И здесь также мы задаемся уже знакомым нам вопросом: как?
7.Совсем ужеутрированный случай из техники:дверной замок распознает свой ключ и разрешает открыть помещение.
В последнем примере человек, как создатель, знает все.
Таким образом,приведенные примеры показывают, что распознавание в природе,обществе,в жизни человека,в технике - всеобъемлюще. Но при этом мы отмечаем,что ответов на поставленные вопросы, когда речь касается распознающейдеятельности человека в большинстве случаев мы не найдем. До настоящего времени полные представления оспособностях живыхорганизмов в распознавании многих явлений и объектов отсутствуют.В то же время,создавая технические системы,способные заменить его, человек высказывает гипотезы, продвигающие его к знанию распознающей деятельности в природе,что позволяет ему успешно решать стоящие задачи.Рассматриваемыйкурс “Основы построения систем распознавания образов” и должен научить пониманию того, что лежит в основе современныхгипотез распознавательной деятельности и как на этой основе упомянутые задачи решаются.
1.1.2. Краткая история вопроса появления технических систем автоматического распознавания и методов ихсоздания
Длительное времявопросыраспознавания рассматривались человеком лишь с позиций методов биологии и психологии. При этом целью изучения являлись восновномкачественные характеристики,непозволяющие вскрыть и точно описать соответствующий механизм.Еслии получались числовые характеристики, то они, как правило, были связаны с изучением рецепторов,таких как органы зрения, слуха, осязания. Что же касалось характеристик принятия решений, то до их математической оценки дело не доходило. И только кибернетика позволила ввести в изучение психологического процесса распознавания образов, лежащего в основе принятия любых решений,количественные методы,что открыло принципиальноновые возможности в исследовании и проектировании автоматических систем распознавания.Только кибернетика позволила ввести в область распознавания,как явления природы,математические представления. В этом можно увидеть в частности реализацию взглядов Галилея,которыйутверждал:
“Книга природы написана на языке математики. И тот, кто хочет прочесть ее, должен изучать этот язык”.
Исторически сложилось,что многие задачи такого класса, как распознаваниеметеоосадков;распознавание авиационной ситуации в районе аэропорта авиадиспетчером;распознавание полосыпосадкилетчиком в сложных условиях,человек,как правило, решает эффективно, то есть с необходимым качеством.Этим и объясняется исторически появившаяся необходимость использования человека в качестве элемента или звена сложных автоматических систем.
Примечательно то,что в процессе указанной деятельностичеловека число принимаемых решений по результатам распознавания ситуаций конечно, в то время как число состояний внешней среды,оцениваемых в процессесамого распознавания и приводящих к указанным решениям,может быть бесконечным.
Это можно видеть на примере машинистки,печатающей поддиктовку. Из бесчисленногомножествавариантов произношения одного и того же звука она выбирает только один,всегда ударяя по одной,определенной клавише пишущей машинки.В результате она безошибочно печатает слова, независимо от их искажения при устном произнесении.
К принятию такого конечного числа решений человек подготовлен всем своим жизненным опытом.Поэтому принятие идеологии автоматизации указанных процессов, замены человека как звена автоматических систем привело к тому, что человечество прежде всего научилось строить автоматы, способные реагировать намножествоизменений характеристиквнешней среды некоторым ограниченным числом рациональных решений (реакций) исполнительных органов этих автоматов.Это не значит,что были найдены механизмы, лежащие в основе человеческих и природных способностей распознавания,но главные особенности этих способностей, лежащие на поверхностипредставлений,созданные автоматы во многих случаях хорошо имитировали.
Например, автомат,управляющий технологическим процессом выпуска некоторой продукции,реагирует на случайные изменения качества ее путем регулирования количества той или иной компоненты исходного материала,режима работы и т.п.,но только придостиженииопределенного уровня этих изменений. То есть, реакция осуществляется не на любое изменение, а на множество их, совокупность.
В результате человечество пришло кситуации,когда распознающие устройства могут повышать, например, эффективность систем связи (распознавая сигналы в шумах),помогают устанавливать объективный диагноз заболеваний (распознавая всегда однозначно в отличии от человека симптомы-признаки заболеваний), дают возможность осуществлять автоматический контроль сложных технических систем и вовремя вмешиваться и проводить их ремонтно-восстановительные работы и т.д.
Создание устройств,которые выполняют функции распознаванияразличных объектов,во многих случаях открывает возможность замены человека как элемента сложной системы специализированным автоматом.Такая замена позволяетзначительно расширить возможности различных систем, выполняющих сложные информационно-логическиезадачи. Заметимздесь, что качество работ, выполняемых человеком на любом рабочем месте зависит от квалификации, опыта, добросовестности, состояния. В то же время автоматего заменяющийдействуетоднообразно и обеспечивает всегда одинаковое качество, если он исправен.
Но не только указанная замена и освобождение человека отвыполнения рутинных операций является причиной создания и поиска путей создания ряда систем распознавания. В некоторых случаях человек вообще не в состоянии решать эту задачу со скоростью, задаваемой обстоятельствами, не зависимо от качеств и психологического состояния принимающего решение (Например: противоракетный маневр самолета в сложных метеоусловиях; вывод из рабочего режима АЭС и т.п.). Автомат же с такими задачами может легко справляться.
Итак, основныецели замены человека в задачах распознавания сводятся к следующим:
1)Освобождение человека от однообразных рутинных операций для решения других более важных задач.
2)Повышение качества выполняемых работ.
3)Повышение скорости решения задач.
В течение достаточно продолжительного времени проблема распознавания привлекает внимание специалистов в области прикладной математики, а затем и информатики. Так можно, в частности, отметить работы Р.Фишера,выполненные в 20-х годах и приведшие к формированию дискриминантного анализа,как одного из разделов теории и практики распознавания.В 40-х годах А.Н.Колмогоровым и А.Я.Хинчиным поставлена задача оразделении смеси двух распределений.
Наиболее плодотворными явились 50-60-е годы ХХ века.В этовремя на основе массы работ появилась теория статистических решений.В результате этого появления найдены алгоритмы,обеспечивающиеотнесение нового объекта к одному из заданных классов,что явилось началом планомерного научного поиска и практических разработок. В рамках кибернетики начало формироваться новое научное направление, связанное с разработкой теоретических основ и практическойреализации устройств,а затем и систем,предназначенных для распознавания объектов,явлений, процессов.
Новая научнаядисциплина получиланазвание “Распознавание образов”.
Таким образом,базой для решения задач отнесения объектов к тому или иному классу послужили,как этоотмечается сегодня,результаты классической теории статистических решений. В ее рамках строились алгоритмы , обеспечивающие на основе экспериментальных измеренийпараметров (признаков), характеризующих этот объект, а также некоторых априорных данных, описывающих классы, определение конкретного класса, к которому может быть отнесен распознаваемый объект.
В последующем математический аппарат теориираспознаваниярасширился за счет применения:
-разделов прикладной математики;
-теории информации;
-методов алгебры логики;
-математического программирования и системотехники.
(Системотехника - научное направление, охватывающее проектирование, создание, испытания и эксплуатацию сложных систем).
К середине 70-х годов определился облик распознавания как самостоятельного научногонаправления,появилась возможность создания нормальной математической теории распознавания.В этом нам придется убедиться,а также приобрести необходимые навыки, прослушав курс “Основы построения систем распознавания образов”.
Первая отечественная работа в области распознавания образов - работа основоположникасовременной теории информации Харкевича Александра Александровича- “Опознавание образов” .”Радиотехника” т.14,15. 1959 г.
Наши отечественные ученые, внесшие существенный вклад в эту дисциплину:
В.М.Глушков, В.С.Михалевич, В.С.Пугачев, НП.Бусленко, Ю.И.Журавлев, Я.З.Цыпкин, А.Г.Ивахненко, М.А.Айзерман, Э.М.Браверман, М.М.Бонгард,В.Н.Вапник, Г.П.Тартаковский, В.Г.Репин, Л.А.Растригин, А.Л.Горелик и др.
Зарубежные ученые:
1-й Ф.Розенблатт - 1957г , Персепторон - простейшая модель мозга, решающая задачи распознавания.
Р.Гонсалес, У.Гренандер,Р.Дуда, Г.Себестиан,Дж.Ту, К.Фу, П.Харт.
Л Е К Ц И Я1.2
Терминология и отличительные особенности системраспознавания
1.2.1. Основные определения
В силу чисто исторических причин класс задач распознавания связан с понятием “образа”. В свое время не обратили внимания, что в заимствованном из англоязычных работ термине “pattern recognition” термин “pattern”,кроме значения “образ”,имеет еще значение “модель”, стиль”,“режим”, “закономерность”, “образ действия”. В современном распознаваниии особенно искусственном интеллекте его употребляют в самом широком смысле, имея в виду, что “образ” - этонекоторое структурированное приближенное (обратите внимание - “приближенное”!) описание(эскиз) изучаемогообъекта, явления или процесса.
То есть, частичная определенность описания является принципиальным свойством образа.
Основное назначение описаний (образов) - этоихиспользование в процессе установления соответствия объектов, то есть при доказательстве их идентичности, аналогичности, подобия, сходства ит.п., которое осуществляется путем сравнения (сопоставления). Дваобраза считаются подобными, если удается установить их соответствие. Можно,в частности, считать, что имеет место соответствие, если достигнута их идентичность.
Сопоставление образов представляет собой основную задачу распознавания и играет существенную роль в информатикевцелом. Этазадача возникает, в частности, в различных разделах искусственного интеллекта, например в понимании естественного языкакомпьютером, символьной обработке алгебраических выражений, экспертныхсистемах, преобразовании и синтезе программ ЭВМ.
Теперь отметим следующий важный момент,что вразличных задачах образупридается различный смысл.Это определяется часто тем,какие характеристики объекта входят в описание образа, какой аппарат используется для представления этих характеристик. Именно отсюда и можно понять, почему образ является приближенным описанием объекта. Чем большее число свойств и качеств объекта отражено на принятом языке в образе рассматриваемого объекта,тем полнее это описание, тем полнее этот образ характеризует описываемый объект. Однако в любом случае мы имеем дело с описанием,а не с самим объектом, который всегда богаче описания. Итак, любой образ представляется некоторым набором признаков. Поэтому вполне допустимо нарядус выражением“распознаваниеобразов” применятьвыражение “отождествление некоторых наборов описаний объектов”.
* * *
Достаточно наглядно и теоретически и практически понимается различие между объектом и образом, если рассмотреть различия между картиной (художественное полотно),являющейся плоским объектом, и таким ее изображением как фотографическое или компьютерное, введенное телекамерой или сканером.
Простота примера состоит в том, что как картина, так и ее изображение на пленке или в телевизионном кадре записи - двумерны.Вводя соответствующие системы координат, представим их так
f(a,b) - объект;
g(x,y) - изображение объекта.
Общепринято объект обозначать буквой f, аизображение -g.
Заметим сразу, что изображение может выступать как образ картины в том числе в автоматической системе распознавания, будучи введенным в компьютер для прямого сопоставления с другими изображениями. Но при этом обратим внимание и на то, что изображение здесь - это уже не сам объект.
Можно понять, что идеальная изображающая система - этотакая система, для которой в любой точке пространства выполняется равенство f = g. На практике почти не существует таких систем. Функциональныесвязи между f и g всегда подлежат экспериментальному определению.
Для понимания сути вопроса рассмотрим простейшую оптическую систему получения фотографий картины, нарисованнойнадвухмерном экране.Здесь мы имеем дело с объектом, лежащем в плоскости, и таким же плоским изображением.
В данном примере распределения f и g имеют одну и ту же размерность, поскольку они являются пространственным распределением интенсивности светаили его цвета в плоскости.
Фотография формируется квантамисвета, отраженногооткартины, прошедшего через линзовую систему фотоаппарата ипопавшегона фотопленку. Такое формирование изображения приводит кпотерикачества за счет искажений и несовершенства приемного устройства, и следовательно, в этом случае f и g не равны друг другу. И только еслиизвестен закон потери качества, то можно провести компенсациюискаженийпутем соответствующей обработки изображения.
Другим примером могут быть двухмерные изображенияg распределения f радиационного препарата в организме человека, полученныес помощью гамма-камеры, поворачивающейся последовательнона определенныеуглы относительно пациента. Здесь надо избавиться от иллюзии того,что полученные детали изображения соответствуют областяминтереса врача-диагноста. Дело в том, что рассмотренное визуализированное изображение - это не распределение активности поглощения в теле пациента,а распределение интенсивностей только в элементах изображения.
То есть, изображение gесть некотороепредставление(описание) объекта f, которое, хотя и располагается в том же месте, но может иметь отличия не только качественные, но и такие количественные как размеры. В данном случае приходится констатировать, что процессы в гамма-камере, с помощью которой производитсярегистрация исходных данных, на сегодняшний день не имеют математическогоописания, позволяющего связать объект с его изображением. Это еще раз заставляет подчеркнуть, что врач не видит измененийинтенсивности поглощения гамма-излучения в теле пациента, а только - распределение интенсивностей на изображении, полученном с помощью системы регистрации. А отсутствие математического описания связей изображения и процесса не позволяет строго трактовать результаты медицинского наблюдения. Остается надеяться только на опыт врача.
Разумно считать, что объект и его изображениефизически совпадают и связаны друг с другом соотношениями, характеризующими конкретный метод визуализации, хотя в ряде случаев могут иметь отличающиеся размеры.
Таким образом, в общем случае не существует идеального (1:1) соответствия между информацией, содержащейся в какой-либо точкес координатами (a, b), и информацией,соответствующейточке (x,y).В принципе информацию от каждой точки объекта можно “рассеять”по всем точкам изображения. Однако в любом полезном методевизуализации главный вклад в каждую точку (a, b)будет даватьотдельнаяконкретная точка (x, y). Другие, соседние точки будут вносить меньшее количество информации, причем уменьшение указанного вкладапроисходит достаточно резко по мере удаления от основной точки с координатами (x, y).Эти выводы известны как принцип близости, а распределениепо изображению некоторой точки из пространства объекта может зависеть как от значения поля в точке объекта, так и от поля в точках, расположенных около этой точки и удаленных на бесконечное расстояние от нее.
Какая же существует физическая связь между пространством объекта и пространством изображения?
В плоскость изображения попадает информация исходя изналичия информации в плоскости объекта, а также в зависимости от того, какой кодирующий носитель информации используется в данном методе визуализации (фотография формируется за счет переносафотонов,яркостная картина УЗИ - за счет рассеяния продольных ультразвуковых волн, степень поглощения радиационныхпрепаратов -путем счетаиспущенныхg-квантов, рентгенограмма - за счет линейного затухания рентгеновскихквантови т.п.).
Введем функцию h(x,y,a,b), котораяописываетпространственныесвязи для точечного процесса, то есть процесса, который отличен от нуля лишь в точке с координатами (a' ,b' ). Тогда зарегистрированноеизображениебудет иметь вид:
Здесь зависимость распределения изображения отамплитудысигнала точечного источника учтена введением в функцию h пятого аргумента.
Рассмотрим теперь сигнал от второго точечного объекта, расположенного там же, где и первый:
Согласно принципу суперпозиции излученные энергиисигналов суммируются:
Это - нелинейная суперпозиция в силу нелинейности слагаемых в правой части равенства.В итоге,каквидим, суммированиюизмеряемых распределенийвплоскости изображениянесоответствует сложение функций в плоскости объекта.
Если же системалинейна, то
а суперпозиция будет иметь следующий вид
То есть, в случае линейности системы сложение функцийв плоскости объекта приводит к суммированию распределений в плоскости изображения с точностью до единственной функции преобразования h.
Математически последнее является очень важным упрощением,так как линейность в рассматриваемых задачах предполагаетсявсегда впервом приближении, даже когда это, строго говоря, не соответствует действительности.
Теперь можно перейти к обобщенным соотношениям, связывающим пространства объекта и его изображения. Для нелинейной системы визуализации имеем:
а для линейной
Функция h, используемая для связи распределений f и g, называется функцией отклика точечного источника (ФОТИ).Зависимостьееот всех четырех пространственныхкоординатопределяет ФОТИкак пространственно-зависимую. Если же точечный процесс одинаков для всех точек плоскости объекта, то h - пространственно-инвариантна. При этомh зависит лишь от разности координат (x-a,y-b).Для пространственно-инвариантной системы
при этом для линейной пространственно-инвариантной системы
Последнее выражение известно как интеграл свертки,согласно которому распределение по изображению представляет собой свертку распределения по объекту с ФОТИ. Именно функция h описываетпроцесспереноса информации от объекта в пространство изображения ихарактеризуетвсе геометрические искажения, присущие процессу визуализации.
Окончательное упрощение обобщенныхсоотношений,описывающих процесс формирования изображений, получается в том случае, когда свойства системы в двух перпендикулярных направленияхнекоррелируют другс другом. Это означает, что двухмерную ФОТИможнопредставить ввиде произведения двух одномерных ФОТИ. Такдляпространственно-зависимой системы имеем
а для пространственно-инвариантной
Это свойство системы называется разделимостью.
В итоге для линейной, пространственно-инвариантной разделимой системы получаем
Учитывая рассмотренное, легко понять, что,наблюдаяизображение, мы не можем считать его точным представлением распределенияпо объекту. Это можно заметить путем внимательного рассмотренияизображения и сравнения его с объектом или явлением. Причина - несовершенства системы визуализации.
Именно поэтому в теорииобработки изображенийбольшоевнимание уделяется методамисключения соответствующихискажений,получившим название обращение свертки (Вытекает из рассмотрения хотябы последнего интеграла свертки!).
В соответствующих задачах интеграл свертки рассматриваетсяс учетом искажения изображенийшумами.Так длялинейныхсистем полное представление о задаче создает выражение
где n(x,y) - распределение шума в изображении.
***
Теперь сконцентрируем внимание на следующем важномтерминераспознавания образов - “класс”.Здесь, прежде всего, обратим внимание на то, что как человек, так и автомат принимаютрешениена основе отождествления совокупности конкретных значений характеристик объектов или явлений не просто друг с другом,а обычно с некоторымклассом, в который объединяются объекты или явления, имеющие общие свойства (например:характеристики выхода из строя агрегатов и систем той же АЭС - класс опасных отказов или класс отказов, требующих определенного технического вмешательства, но неопасных).
Таким образом, классы - это объединения объектов (явлений), отличающиеся общими свойствами, интересующими человека.
Всегда, имея в виду цель распознавания,в конечном итоге принятое решениеоб отнесении объекта к тому или иному классу определяет реакцию соответствующей системы на данную входную ситуацию однозначно.
Таким образом, в самых общих чертах распознавание можно определить как соотнесение объектов или явлений на основе анализа иххарактеристик, представляющих образы этих объектов, с одним из нескольких, заранее определенных классов.
И следует обратить внимание на то,что термин “распознавание”в равной мереотносится как к процессам восприятия и познания,свойственным человеку и живым организмам,так и к техническим попыткам человека реализовать“электронные”или “вычислительные” аналоги этих процессов, то есть к решению задач в рамках предмета распознавания как раздела информатики.
1.2.2. Системы распознавания
До этого мы говорили о проблеме распознавания в целом,о теории, о возможности замены человека автоматом. Теперь сосредоточим внимание на практическом применении соответствующих знаний.При этом обратим внимание и на то,что те практические реализации методов распознавания, о которых в этих случаях шла речь, носят название систем распознавания (СР).
Здесь необходимо подчеркнуть,что именно центральную задачу распознаванияобразовпредставляет построение на основе систематических теоретических и экспериментальныхисследований эффективныхвычислительныхсредств (объединяемых в понятии “системы распознавания”) для отнесения описаний с объектов,явлений,процессов к соответствующим классам.
Широкий круг задач,возлагаемых на такиесистемы, определяется приведенным нами определением самого понятия “распознавание” и включает выяснение по разнородной,часто неполной,нечеткой, искаженной и косвеннойинформации факта,обладают ли изучаемые объекты,явления, процессы, ситуации фиксированным конечным набором свойств, позволяющим отнести их к определенному классу. Сюда входят как непосредственно задачи распознавания и классификации,так и такие задачи,в результате решения которыхна основе распознавания требуется выяснить, в какой области из конечного числа областей будут находиться некоторые процессы через определенный промежуток времени.
Отсюда понятно, что к задачам распознавания должны относиться задачи технической и медицинской диагностики, геологического прогнозирования, прогнозирования свойств химическихсоединений,распознавания свойств динамическихи статических объектов в сложной фоновой обстановке и при наличии активных и пассивныхпомех,прогнозирования урожая, обнаружения лесных пожаров,управления производственными процессами.
Разработки систем распознавания, начатые с 50-х годов, исчисляются тысячами.Сегодняуже трудно назвать такую отрасль науки и сферы производства, где СР не используются или не будут. При этом применение методовраспознавания в ряде направлений науки и техники оказывает обратное влияние на эти направления, поистине революционизирующее влияние.
Рассмотрим некоторые применения.
1)Системы технической диагностики.
Их внедрение - важнейший фактор повышения эффективности использования машин и технологического оборудования, резкого сокращения расходов на эксплуатацию.
Исторически сложившаяся тенденция усложнения, а значит удорожания машин постоянно увеличивает затраты на эксплуатацию. Выход - переход к системам технической диагностики (распознавания состояния машин), например,безразборный поиск неисправностей.В результате вместо планово-предупредительного ремонта - ремонт по фактической необходимости.Например, в инструкции по эксплуатации автомобиля предусмотрены плановые технические обслуживания через 500 км, 1000 км, 2000 км и т.д. Если же его оснастить системами распознавания состояний,то от плановых ТО можно было бы отказаться заменив их обслуживанием отдельных узлов и систем по необходимости.
2)Медицинская диагностика.
Автоматизированные системы диагностики в медицине - путь увеличения
- широты и глубины охвата симптомов;
( рассчитывать только на память врача во всех ситуациях очень трудно. Лучше функцию памяти отдать компьютеру)
-оперативности;
(компьютер обеспечит почти мгновенный результат)
-достоверности.
(диагноз компьютера не зависит от внешних факторов, как это случается с человеком)
3)Сельское хозяйство.
Области применения здесь:
-распознавание размеров урожая по данным космических наблюдений;
-уменьшение ручного труда при сортировке плодов по форме, цвету и размерам и т.п.
4)Военное дело.
Сложные системы вооружения:
-автоматический функциональный контроль технического состояния систем и ввод резервирующих;
-роботы, обслуживающие фазированные антенные решетки радаров.
На основе рассмотренного можно уже ответитьнавопрос, чтоже представляет собой СР.
В первом приближении:
“СР - это автоматическое вычислительное устройство, предназначенное для распознавания образов (каких? можно уже не повторяться).
Заметим, что это очень поверхностное определение.Сегодняфизически СР это и вычислительная машина как один составляющий элемент СР;
-это и такие часто более дорогостоящие технические средства, как средства обнаружения распознаваемых объектов (например, патологических изменений того или иного органа человека);
-это и средства измерений параметров обнаруженных объектов (без них не получить признаков распознавания);
-это и математическое обеспечение,в составе которого: методы и алгоритмыобработки измерительной информации;методы и алгоритмы определения признаков распознавания;методы и алгоритмынепосредственно распознавания объектов,явлений , процессов ( построения решающих правил отнесения объектов к тому или иному классу); методы иалгоритмыв некотором смысле оптимального управления процессом распознавания; методы и алгоритмы оценки эффективности СР как на стадии проектирования, так и в процессе ее функционирования;
-наконец,для больших систем это иколлектив подготовленных специалистов обеспечивающих жизненный цикл существования системы.
Рассмотрим подробнее отдельные элементы.
а) Средства обнаружения распознаваемых объектов.
К ним в разных областях применения относятся:
в медицине:
-рентгеновские аппараты;
-аппараты УЗИ;
-ЯМР-томографы;
-энцефалографы;
-рентгеновские томографы;
-кардиографы и т.д.
в военном деле:
-радиолокаторы;
-оптические (лазерные) локаторы;
-лазерные дальномеры;
-приемники гамма-излучения;
-сонары - ультразвуковые локаторы.
Средства обнаружения представляют дорогостоящую часть СР. Но этим дорогостоящая часть СР не ограничивается.
б) Средства сопряжения.
Для сопряжениясредств обнаружения с ЭВМ необходимы специальные электронные устройства аппаратного интерфейса.Этисоставные части СРтакже достаточно дорогостоящи.
в)Средства измерений параметров распознаваемых объектов,явлений, процессов.
Средства измерений часто входятв составобнаружителей(РЛС - измерение дальностей, углов, Рс/Рш).
г) Методы и алгоритмы обработки измерительной информации
Часто для получения признаков распознавания или параметров , которые их обусловливают необходима специальная математическая обработка (пример,для РЛС - определение дальностей целей по временной задержке сигналов, угловыхкоординат по разности фаз,коэффициентов лобового сопротивления целей по координатам и их производным и т.п.).
Сам процесс назначения признаков - творческий процесс,говорят - эвристический, зависящий от человека.
д) Методы и алгоритмы принятия решения о принадлежностиобъектов распознавания.
е) Методы и алгоритмы оптимального управления распознаванием.
ж) Методы и алгоритмы оценки эффективности распознавания.
Как алгоритмы принятия решений,так и управление распознаванием, таки оценка эффективности определяются сложностью систем распознавания и представляют концентрированное применение комплекса математических операций соответствующего назначения.
з) Э В М
Наконец, ЭВМ.Это обязательный элемент современной СР. Вся обработка измерений с целью выделения признаков распознавания, вся математика классификации, управления и оценки эффективности выполняется ЭВМ.Само развитие теории и методов распознавания обязано появлению ЭВМ.
и) Коллектив подготовленных специалистов.
Такая составляющая на первый взгляд не имеет отношения к системе. Однако безколлективаподготовленных специалистов трудно обойтись в больших системах,решения которых чрезвычайно ответственны.Втаких системахоценка эффективности - это показатель,которым пользуются с моментасоздания СР и до конца ее существования.При этом пользуются этим показателем специалисты, а не система. А сама необходимость такого использования связана с тем,что в процессе работ появляетсявозможность повыситьэффективностьСР за счет получения новых данных и уточнения параметров системы в результате анализа специалистамиконкретного случая распознавания с последующим уточнением этими специалистами имеющихся параметров. То есть, система в течение своей жизни (говорят - “жизненного цикла”) изменяется (динамизм системы).
Таким образом, СР - сложная динамическая система, состоящая в общем случае из коллектива подготовленных специалистовисовокупности техническихсредствполучения и переработки информации, обеспечивающих на основе специально сконструированныхалгоритмов решениезадачиклассификации соответствующих объектов,явлений или процессов.
После того,как описан состав и функции элементов СР, для завершенияобщихпредставлений о проблеме распознавания можно провести и некоторые поверхностные сравнения технических СР итакой совершенной СР, как человек.
Так рецепторы человека,к которым мы относим зрительные,слуховые, осязательные, обонятельные и вкусовые рецепторы - это средства обнаружения, а иногда и измерения характеристик распознаваемыхобъектов, явлений, процессов. Тут аналогия полнейшая.
Далее на пути оперирования с информацией у техническихСРстоит устройство сопряжения с ЭВМ. Естественными аналогами его являются биологические средства связи человеческих рецепторов с мозгом,выполняющим роль ЭВМ.
Но это,пожалуй, - все, что мы сегодня знаем наверняка. И вопросов здесь больше, чем ответов:
-какие функциивыполняют рецепторы в части первичной обработки результатов обнаружения объектов, явлений;
-каковы характеристики линий передачиданных отрецепторовк мозгу как ЦВС;
-какие признаки выделяет система обработки;
-какиеалгоритмы использует мозг для решения задачи классификации, оптимального управления процессом распознавания;
-как человеку удается избавиться от специфичности, свойственной техническим СР и т.д.
В процессе нашего дальнейшего изучения предмета Вы сами поставите еще много нерешенных в этом плане вопросов. А их разрешение чрезвычайно важно для построения быстродействующих ивысокоэффективныхтехнических СР, помогающих человеку в его повседневной практике.
Достижение соответствующих целей - задачи XXI века.
Л Е К Ц И Я 2.1.
Проблематика задач создания систем распознаванияна описательном уровне
При изучении первойтемы мы уже создали представления о проблеме распознавания в целом. Казалось бы,можно было бы теперь сразу перейтик теоретическомуосмысливанию составляющих этой проблемы. Однако какие это составляющие, как они соотносятся друг с другом в общей постановке проблемы, этого пока не было возможности выделить.
Поэтому,прежде чем перейти к формальной постановке соответствующих задач, постараемся рассмотреть их и осмыслить на описательном уровне.
Итак, мы уже знаем, что распознавание образов в технике - необходимый элемент процесса механизации и автоматизации машин, устройств и систем для
-замены человека там, гдеиспользуетсятяжелый физический труд;
-реализации быстрых реакцийвуправлении там, где нет времени на раздумье;
-замены человека в так называемыхрутинных операциях, то есть,повторяющихсядействиях, не требующих умственных усилий.
Ужепротяжении 4-хдесятковлет этипотребности реализовывались в таких конкретных на приложениях, каксоздание специалзированныхроботов,техническая имедицинская диагностика, метеопрогноз,формализованнаяоценка общественных, экономических и социальныхявленийи процессов.Наэто, начинаяс 50-хгодов, были направлены усилия научной и инженерной мысли.
В результате сопоставления конкретных решенийиразработок оказалось, что несмотря на многообразие иособенностиприложений, задачи создания систем распознавания имели много общего,не зависящего от указанной специфики.
Вот почемудля выработкиметодических подходов теории распознавания имело смыслвыделять общие повторяющиеся приемы,а их число естественно должно быть ограниченным и легко объединяемым в задачи. Сами же этизадачидолжны были явиться ключевыми для создания любой системы распознавания. В результате оказалось, что найденный методический подход к построению систем распознавания образов инвариантен к предметной области.
Постараемся осмыслить эту инвариантность построения СР , рассмотревпростые реализации систем.
А. Распознавание стороной А самолетов стороны В(этот пример мы будем часто использовать в последующем, постепенно его усложняя).
Здесь фактически требуется создать автоматическую систему,обеспечивающую стороне А решение указанной задачи.
Понятно, что цель создания такой системы - оборона стороны А от возможного нападения, а следовательно - предотвращение возможного ущерба.
Первое, с чего естественно начать эту работу - провести изучение и анализ всей возможной информации об авиации стороны В и собрать необходимые данные.
Как эта информация может быть получена:
-изоткрытой печати (часто многие характеристики самолетовне скрываются);
-из разведданных;
-из экспериментальных наблюдений самолетов стороны В и измеренийих характеристик (например,с помощью РЛС);
-из экспериментальной обработки данных, полученных помакетам и моделям соответствующих самолетов стороны В
(наземные стенды или электродинамические расчеты); и т.д.
Какие это характеристики?Это - численность экипажей, высоты полета, крейсерские скорости, дальности полета, число двигателей и т.д.
Рассматриваемое изучение позволит обнаружить втомчисле и способы,которыеприменяет или предполагает применять сторона В для преодоления противовоздушной обороны (ПВО) стороны А и которые будут ухудшать возможностираспознавания.Например, США по программе Стелс разработали бомбардировщик-невидимку для радиолокационных средств - В1).
Таким образом мы должны получить все мыслимыеисуществующие характеристики самолетов (признаки).
Второй шаг, логично следующий из проведенного изучения - на основе знания тактико-технических характеристик средств противодействия стороне В, имеющихсяустороны А,и знаний авиации стороны В можно выделить ситуации применения ее, существенно отличающиесяпо возможному ущербу и по возможности его предотвращения.
Это фактически соответствует разделению самолетов стороны В на классы, для каждого из которых стороне А известно, что нужно предпринять.
В результате может оказаться, что классов 3 (А1- бомбардировщики, А2 - штурмовики ,А3 - истребители),а средств противодействия - 2 (S1 - ЗУР, S2 - истребители с их вооружением).
При этом наиболее эффективно их распределить следующим образом:
А1 - S1
А2 - S2
А3 - S1
то есть, классы А1 и А3 с точки зрения противодействия желательно объединить в один класс.
Если же средств противодействия - 3 (S1- ЗУР для больших высот, S2 - ЗУР маловысотные, S3 - истребители с ихвооружением), то классы можно не объединять, а использовать стратегию
А1 - S1
А2 - S2
А3 - S3
Третий шаг по созданию системы распознавания самолетов стороны В - выбор измерителей.
Для обозначенных классов авиации из анализа имеющихся устороны А средств наблюдения за самолетами (РЛС, ОЛС и т.п.) и полного перечня признаков соответствующих самолетов,полученных на первомнашемэтапе разработки (например,крейсерские скорости, высоты полета, длины фюзеляжей, размахи крыльев, число двигателей и т.п.) выделить такие,которые могут быть определены по данным имеющихся средств измерений.
Здесь возможны иразочарования:может неоказатьсятаких средств измерений.Тогдапринимается решение о их создании.
Итак, покаждому самолету мы имеем № характеристик - признаков. Но это еще ничего не дает нам для решения задачи. Мы не знаем,как разделить самолеты,пользуясь этими признаками по классам.
Для этого и нужен 4-й шаг -априорноеописание классов.То есть, необходимо наязыке выбранных признаков описать каждый класс самолетов или тактических способов их применения.
При этомв описании каждого класса должны содержаться сведения:
- о наличии или отсутствии признаков качественного характера (тип двигателя,наличие постановщика помех, тип помех и т.п.);
- о диапазонах или законахраспределения признаков, имеющих количественное выражение.
Следует заметить,чтовсе выбранные признаки должны получить соответствующее содержание (свое) для каждого класса.
На этом подготовительный этап работы заканчивается .
Теперь, если с помощью выбранных средств наблюденийза воздушными целями обнаружен неизвестный самолет и измерены (оценены) его признаки, то сопоставлениеполученныхапостериорных данных (по результатам проведенных опытных измерений) с априорными (доопытным описанием классов) позволяет произвести его распознавание (отнесение к соответствующему классу А1,А2 самолетов стороны В).
Здесь априорные данные - доопытное признаковое описание классов;
апостериорные данные - послеопытный набор признаков классифицируемого самолета.
Рассмотрим вторую возможную реализацию СР.
Б. Распознавание заболеваний сердца.Требуется построить такого рода автоматическую систему.
1-й шаг создания такой системы - изучение всей информации о заболеваниях сердца.
На первый взгляд эта задача кажется болеелегкой,чем распознавание самолетов,так как все сведения носят открытый характер. Однако обольщаться здесь не следует. В процессе пристального ее изучения может обнаружиться, что некоторые стороны изучения явления человечеству пока еще неизвестны.
В результатемы должны иметь здесь все возможные характеристики заболеваний (признаки):
-зубцы кардиограмм;
-поведение пульса;
-поведение артериального давления и т.п.
2-й шаг - изучение всего арсенала средств лечения заболеваний и разделения их по классам,длякоторых известно,что нужно конкретно предпринимать для лечения (По самолетам мы также добивались разделенияихпо классам).
В результате может оказаться, что:
-число средств лечения(S1, S2...) большечисла классовзаболеваний (А1, А2,....); тогда их просто комплексируют или принимают решение о дополнительном распознавании противопоказаний;
-некоторые классы требуют одинаковых средств лечения (например,хирургическое вмешательство); тогда классы объединяют.
3-й шаг - из анализа имеющегося арсенала средств медицинской диагностики (кардиограф,фонокардиограф,УЗИ, рентген, анализ крови и т.д., и т.п.) и признаков классов заболеваний выделяют те признаки, которые реально определить имеющимися средствами ( Здесь возможны и решения о создании новых специальных средств диагностики).
Заметим, чтоте же действия предпринимались и для измерения признаков самолетов стороны В.
4-й шаг - на языке отобранных признаков описывается аналогично самолетам каждый класс заболеваний сердца,то есть, составляется перечень значений признаков каждого класса.
При этом для каждого класса должны быть выделены сведения:
-о наличии или отсутствии признаков качественного характера;
-о диапазонах или законахраспределения признаков, имеющих количественное выражение.
Здесь также следует заметить, что все выбранные признаки должны получить соответствующее содержание (свое) для каждого класса.
Теперь, если с помощью выбранных средств диагностики состояний сердца оценены признаки, характеризующиеего деятельность, то сопоставление полученныхапостериорных данных(порезультатам опытных измерений) саприорными (доопытнымописаниемклассов) позволяет произвести распознавание конкретного класса заболеваний или отсутствие заболеваний вообще.
Эти два примера показали, чтоподходык построениюсистем распознавания практически ничем не отличаются, несмотря на специфику самих создаваемых систем.
В результате мы получили общие представления о последовательности решения и составляющих задачи создания системы распознавания.В результате отмечаем, что несмотря на различие предметных областей подходы к построению СР - одинаковы.Система распознаваний заболеваний сердца строилась также, как и система распознавания самолетов,но заменить ее она не позволяет. Точно также СР самолетов не может применяться для решения задач распознавания заболеваний сердца.
Системы распознавания объектов (явлений), создаваемые человеком всегда узко специализированы в отличии отего собственных природных возможностей.
Что же касается общего подхода к построению любой системы, то теперь,если унас имеется некоторая совокупность объектов или явлений, которые необходимо распознавать (классифицировать),на основе обобщениядействийпри создании СР в 2-х рассмотренных примерах мы знаем, что последовательность решения соответствующих задач следующая:
-в соответствии свыбранным принципом совокупность объектов или явленийподразделяетсяна ряд классов (говорят: назначается алфавит классов);
-разрабатываетсясовокупность признаков (говорят: словарь);
-на языке словаря признаковописывается каждый класс;
-выбираются и (или) создаются средства определения признаков;
-на вычислительныхсредствах реализуется алгоритм сопоставления апостериорныхиаприорных данных и принимается решение о результатах распознавания.
В то же время, несмотря на выполненное определение последовательности действий,проведенное рассмотрение непозволяет ответить на следующие вопросы:
-как лучше производить разбиение объектов(самолеты, заболевания и пр.) по классам;
-как накапливать и обрабатывать априорную информацию;
-из каких соображений выбирать признаки;
-как описывать классы на языке признаков;
-на основе каких методов сравнивать априорную и апостериорную информацию;
-когда и как появляется всясистема распознавания.
Все эти вопросы являются предметом рассмотрениявпределах читаемого курса. Мы будем их детализировать все более глубоко по мере освоения предмета.
На последний вопрос следует дать предварительный ответ до того,как мыпроведемупомянутое углубленное изучение.Система должна появляться с самого начала изучения вопроса.Этот вариант ее должен представлять собой модель-прообраз будущей системы распознавания. Сейчас мы должны понять только одно - без такой модели создание СР чаще всего невозможно вообще. Без нее мы не сможем выбрать ни набор классов, ни перечень признаков, ни средства измерений их, ни решающие правила,обеспечивающие в комплексе, во взаимосвязи требуемоекачестворешений опринадлежности.Это обусловлено тем,что полная информация для создания СР на момент начала ее создания всегда отсутствует и без экспериментальной отработки всего процесса принятия решений не всегда ясно, какая информация может вообще потребоваться. Поэтому модель должна позволить методомпоследовательныхприближений внутренней структуры системы к требуемой достигнуть желаемого результата. В то же время вопросы моделирования СР не могут быть рассмотрены на нынешнем уровне полученных знаний. Поэтому моделирование СР - предмет дальнейшего изучения курса "Основ построения систем распознавания образов"
Итак, главные выводы:
1. Задачи, решаемые в процессе создания систем распознавания, инвариантны относительно предметной области, имеют много общего, основываются на едином методологическом подходе.
2. Каждая система распознавания индивидуальна и предназначается только для одного вполне конкретного вида объектов или явлений.
Если найдена сфера применения распознавания, то соответствующая система должна разрабатыватьсязановос учетом новыхспецифических свойствобъектов (явлений), определяющих как системуизмерений характеристик, так и словарь признаков, алфавит классов и алгоритм принятия решений.
3. СР должнасоздаваться методом последовательных приближений внутренней структуры на ее математической модели по мере накопления необходимой информации.
Теперь, после того как мы на качественномуровне рассмотрели проблематику распознавания, можно провести дополнительную детализацию и определить последовательность задач создания соответствующих систем.
Л Е К Ц И Я 2.2
Формулировка задач создания систем
распознавания и методы их решения
ЗАДАЧА № 1
Определение полного перечня признаков(параметров), характеризующих объекты или явления,длякоторых данная система разрабатывается.
В решении этой задачи - главное найти все признаки, характеризующие существо распознаваемых объектов (явлений).Любые ограничения, любая неполнота, как мы в последующем убедимся, приводят кошибкам илиполнойневозможности правильнойклассификации объектов (явлений).
Можем себе представить такую неполнотувуже рассмотренной нами задаче распознаваниясамолетовкак использованиеодного признака - потолок высоты полета самолетов.Врезультате - бомбардировщики не удастся отличать от истребителей ( присоздании бомбардировщиков стремятся к обеспечениюмаксимальновозможной высоты полета, а при создании истребителей добиваются,чтобы они могли уничтожать бомбардировщики).
Реально даже целая группа признаков может оказаться неэффективной.
Поэтому для решения 1-ой задачи создания СР необходимо найти все возможные признаки, описывающие объекты распознавания, с тем, чтобы при оценке эффективности решений системы не возвращатьсяк этой задаче, обнаружив ограниченность выбранных признаков на последующих этапах разработки.
Ночтобы назначатьпризнаки распознавания, необходимо, во-первых, понять, что не существует способов их автоматической генерации. На сегодня это под силутолько человеку.Поэтому говорят, что выборпризнаков - эвристическаяоперация.Во-вторых, выбор признаков можно осуществлять, имея представление об их общих свойствах. С этих позиций достаточно принять, чтопризнаки могут подразделяться на:
-детерминированные;
-вероятностные;
-логические;
-структурные.
А.Детерминированныепризнаки -это такиехарактеристики объектов или явлений, которые имеют конкретныеи постоянные числовые значения.
Примерами детерминированных признаков могут быть,например, ТТХ бомбардировщиков и истребителей США (таблицы № 1, 2).
Числовые значения признаков покаждому изсамолетовможно интерпретировать как координаты точек, представляющих каждый самолет в 11-мерном пространстве признаков.
Необходимо иметь в виду, что в задачах распознавания с детерминированными признаками ошибки измерения этих признаков не играют никакой роли,если, например, точность измерений такого признака, как размах крыльев самолета значительно выше(например,1 мм), чем различиеэтого признакау разных классов самолетов (например, 10 м).
Представить такую систему, где используются детерминированные признаки не так трудно:
-распознавание принадлежности самолета,данныекоторого получены разведкой или из открытой печати и не привязаны к классам (бомбардировщик- А1, истребитель-А2 и т.п.);
-распознавание на конвейере деталей по отличию геометрических характеристик, если ошибки измерений существенно меньше разметов этих деталей.
Распознавание осуществляется путемсравнения полученных размеровсимеющимися в базе данных характеристиками деталей.
Б. Вероятностные признаки - это характеристикиобъекта (явления), носящие случайный характер.
С такими признаками в основном и имеют дело в природеи технике.
Отличаются эти признаки тем, что в силу случайности соответствующей величины признак одного класса может принимать значения из области значений других классов,каждый из которых подлежит распознаванию в системе.
Таблица № 1
Характеристики |
Т и п ы с а м о л е т о в |
|||
В-1А |
В-52 |
В-57А |
FB-111 |
|
Экипаж (чел.) |
4 |
6 |
2 |
2 |
Vmax (кмч) при H=15 км |
2330 |
1020 |
935 |
2330 |
Vmin (кмч) при H=0.3 км |
1200 |
500 |
500 |
1350 |
Потолок (м) |
15240 |
15000 |
13750 |
20000 |
Бомб.нагрузка (т) |
22 |
34 |
14 |
16 |
Макс.взлетная масса (т) |
180 |
221 |
25 |
45 |
Размах крыльев (м) |
42 |
56 |
19 |
21 |
Длина самолета (м) |
44 |
48 |
20 |
22 |
Кол-во двигателей |
4 |
8 |
2 |
2 |
Тяга двигателей (т) |
13.6 |
7.7 |
3.3 |
9.2 |
Дальность полета (км |
11000 |
20000 |
4380 |
6600 |
Таблица ¹ 2
Характериcòèêè |
Т и п ы с а м о л е т о в |
||||
F - 4 E Фантом |
F - 105 E Тандер-чиф |
F - 15 Игл |
F - 100 D Супер-сейбр |
Хантер |
|
Экипаж (чел.) |
2 |
2 |
1 |
1 |
1 |
Vmax (кмч) приH=15 км |
2330 |
2230 |
2655 |
1400 |
1000 |
Vmin (кмч) при H =0.3 (км) |
1470 |
1400 |
1470 |
1220 |
1150 |
Потолок (м) |
19000 |
15000 |
21000 |
15000 |
17000 |
Бомб.нагр. (т) |
7.2 |
6.4 |
- |
3.4 |
0.9 |
Макс.взлетн. масса (т) |
26 |
24 |
25 |
18 |
11 |
Размах крыльев (м) |
12 |
11 |
14 |
11 |
10 |
Длина самолета(м) |
18 |
21 |
19 |
12 |
13 |
Кол-во двигателей |
2 |
1 |
2 |
1 |
1 |
Тяга двигателей (т) |
5.4 |
12 |
10.9 |
5.3 |
4.5 |
Дальность полета (км) |
885 |
760 |
1100 |
860 |
560 |
Если признакне может принять значенийв области соответствующих значений для других классов,то, следовательно, имеем дело не с вероятностным, а с тем же детерминированным признаком. Это как раз подчеркивает,почему вероятностные системы являются системами более общего порядка.
Для того,чтобыможно было в условиях случайности говорить о возможности распознавания, следует потребовать, чтобы вероятности наблюдениязначений признака всвоем классе были как можно больше, чем в чужих. В противном случае данный признак не позволит построить СР, использующую описание классов на его основе. Эффективность его недостаточна для достоверного решения и необходимо искать другие признаки, имеющие большую разделительную способность.
Вспомним из теории вероятностей, чемхарактеризуется случайная величина - законом распределения вероятностей.То есть, точно так же законом распределения долженхарактеризоваться каждый вероятностный признак.
Вспомним и то, что в качестве законов распределения вероятностей в теории вероятностей выступают интегральная функция F(x) - интегральный закон илиплотность распределениявероятностей (ПРВ) - дифференциальный закон f(x). При этом связь между ними:
Вспомним, что самый распространенный в природе закон распределения - нормальный или Гауссов - имеет ПРВ
Если предположить, что какой-либо вероятностный признак (например, размах крыльев, измеренный каким-либосредством измерений с ошибками) распределен по нормальному закону, то для3-х условных классов, отличающихся размахами крыльев,распределения этого параметра будут выглядеть, как показано на рис.2.1.
Из рис. 2.1видно,что если для неизвестного самолета мы с помощью упомянутого средства измеренийопределилиразмах крыльев Lкр с естественной случайной ошибкой ,то с определенной вероятностью это измерение может быть отнесено ккаждомуизклассов. Однако, легко заметить, что если это значение лежит ближе к одному из центров рассеяния (например, Mx1), то вероятность отнесения его к соответствующему распределению, а значит и классу, максимальная.
f(Lкр)
Mx1 Mx2 Mx3 Lкр
Рис.2.1
Примеры вероятностных признаков распознавания:
-среднее значение мощности сигнала радиолокатора, отраженного от самолета (причина - изрезанность круговой диаграммы рассеяния сигнала радиолокатора самолетом и электронные и атмосферные шумы в том же радиолокационном диапазоне);
-размерлиста растения (причины - отличия в питании, освещенности, влаги и т.п.);
-размер патологического изменения какого-либо органа человека (причины - различные стадии заболевания при его обнаружении,различные ракурсы и сечения наблюдений образования и т.п.) и т.д.
В. Логические признакираспознавания -это характеристики объекта или явления, представленныеввиде элементарных высказыванийобистинности (“да”,"нет” или “истина”, “ложь”).
Эти признаки, как мы понимаем, не имеют количественного выражения, то есть являются качественными суждениями оналичии, либо об отсутствии некоторых свойств или составляющих уобъектов или явлений.
Примеры логических признаков:
-наличие ТРД на самолете ;
-боль в горле пациента ;
-кашель ;
-насморк ;
-растворимость реактива и т.д.
Здесь покаждомупризнаку можно сказать только то,что он есть, либо его нет.
К логическим можно отнести также такие признаки, у которых не важна величина, а лишь факт попадания или непопадания ее в заданный интервал. (например, крейсерская скорость самолетабольше или меньше2000 км/ч).
Г. Структурные признаки - непроизводные (то есть,элементарные, не производимые из других элементарных признаков) элементы (символы),примитивы изображения объекта распознавания.
Появление структурных признаков обязано возникновению проблемы распознавания изображений с ее специфическими особенностямии трудностями.
Примеры структурных признаков:
а)дляизображения прямоугольника:
- горизонтальный отрезок прямой;
- вертикальный отрезок прямой.
б) для любого изображения на экране дисплея:
-пиксел.
Забегая далеко вперед визложенииматериала, следует отметить, что традиционно дляописанияизображений использовались разложения его в ряды по ортогональным функциям (ряды Фурье, полиномы Эрмита, Лежандра, Чебышева, разложения Карунена-Лоэваи др.).
Структурное описание в отличии от разложений:
-понятнее (физичнее) для человека, решающего задачу распознавания объекта;
-приемлемо идля компьютернойреализациипри распознавании;
-свободно от трудоемкостивычисленийи потерь информации, свойственных разложениям.
Оказывается, что оперируя ограниченным числом атомарных (непроизводных) элементов (примитивов),можно получить описание разнообразных объектов.То есть,для отличающихсяобъектов можно иметь набор одинаковых непроизводных элементов. Но для того, чтобы описание можно было бы выполнить, наряду с определениемнепроизводных элементов должны вводиться правила комбинирования, определяющие способы построения объекта из упомянутых непроизводных элементов.В результате два одинаковых непроизводных элемента различных объектов могут быть соединены друг с другом по разным правилам. Это и будет их отличать.
В целом для описания какого-либо объектанепроизводные элементы объединяются в цепочки (предложения) по своему, характерному толькодля этого объекта, набору правил.
В результате связей из непроизводных элементов(структурных признаков)образуется объект,аналогично тому,как предложения языка строятся путем соединения слов, в свою очередь состоящих из букв.Вэтом структурные методы проявляют аналогию ссинтаксисоместественного языка. Отсюдаструктурные признаки носят еще название лингвистических или синтаксических.
( Пример- код Фримена).
***
Таким образом, мы рассмотрели очень подробно 1-ую задачу создания систем распознавания - определение полного перечня признаков (параметров), характеризующих объекты или явления,для которых данная система разрабатывается. Главные выводы:
1) Выбор, назначение признаков распознавания - эвристическая операция,зависящая от творчества,изобретательности разработчика.
2) Состав признаков , выбираемых на этом этапе, долженбыть как можно более разносторонним и полным, независимым от того,можно или нельзяэтипризнаки получить.
3) Выбор признаковдолженосуществляться в группах детерминированных,вероятностных,логических и структурных.
Л Е К Ц И Я 2.3
Формулировка задач создания систем
распознавания и методы их решения
( продолжение)
ЗАДАЧА № 2
Первоначальная классификация объектов(явлений), подлежащих распознаванию,составление априорного алфавита классов.
Нам уже знакома на описательном уровне эта задача: необходимо выбрать (назначить) классы объектов (явлений) распознавания. Решение ее осуществляется наиболее часто эвристически,как и выбор признаков распознавания, а логика ее решения следующая:
1-е - определяется, какие решения могут приниматься по результатам распознавания либо человеком, либо автоматической системой управления объектом (цель распознавания).
2-е - на основе определеннойвышецели формулируются требования к системе распознавания,позволяющие выбрать принцип классификации.
3-е - составляется априорныйалфавитклассов объектов (явлений).
Предположим порезультатам некоторого метода медицинской диагностики состояния печени человека необходимо приниматьрешения о методе лечения (см.1-й пункт в рассмотренной последовательности решения задачи априорной классификации - цель).Насколькосерьезно принятие такого решения,учитывая возможность хирургического вмешательства, я надеюсь, понятно.
Тогда, очевидно, что требованием к системе (см.2-й пункт последовательности) - надежное (с высокой вероятностью) диагностирование каждого заболевания печени.
Следовательно, в априорный алфавит классов (см.3-й пункт рассмотренной последовательности) необходимо включить все возможные заболевания печени,а их - 11. То есть,классов распознаваемых заболеваний печени, диагностируемых некоторой гипотетической системой распознавания должно быть 11. Для более четкого понимания назовем эти классы:
1.Острый гепатит.
2.Хронический гепатит.
3.Жировая инфильтрация.
4.Цирроз.
5.Киста простая.
6.Киста паразитарная.
7.Абсцесс.
8.Опухоль.
9.Метастазы.
10.Гематома.
11.Конкременты.
Заметим, что, кроме ситуации, предложенной рассмотренной задачи,возможны и другие,когдаколичество классов, по которым надежно распознаются некоторые объекты (явления), заранее неизвестно и должно определяться самойсистемой распознавания.Эта задача называется задачей кластеризации, в которой можно отказаться уже от эвристического подхода. Однако решениездесь достигается при выборе некоторых общих правил кластеризации, которые задает разработчик системы.
ЗАДАЧА № 3
Разработка априорного словаря признаков распознавания.
Решая задачу №1, мы должны были найти все возможные признаки распознавания заданных объектов или явлений. Точно также при решении задачи ¹2 определился состав классов.
Теперь, располагая соответствующим перечнем и априорным алфавитом классов, необходимо провести анализвозможностей измерения признаков или расчета их по данным измерений, выбрать теиз них, которые обеспечиваются измерениями, а также в случае необходимости разработать предложения и создать новые средства измерений для обеспечения требуемой эффективности распознавания.
Таким образом, главное содержание рассматриваемой задачи построения СР -создание словаря, обеспечиваемого реально возможными измерениями.
Однако, хороший или плохойнаборпризнаков распознавания, получился в результате указанных действий разработчика СР, можно понять, выполнив испытания системы распознаваниявцелом и оценив эффективность распознавания. Но системы распознавания на указанном этапе разработки еще не существует. В то же время, как мы заметили, появилась необходимость оценки эффективности.И рассматривая очередные задачи создания СР, мы обнаружим, что рассматриваемаязадача остается актуальной на протяжении всех последующихэтаповсоздания системы распознавания (описание классов, выбор алгоритма распознавания). Только методомпоследовательныхприближений удается добитьсявыбора словаря признаков, обеспечивающего желаемое качество решений.
Выходом из создавшегося положения является возможность создания на данном этапе математической модели системы. Математические модели СР и используются для реализации указанных последовательных приближений, о чем упоминалось на описательном уровне при рассмотрении задач построения систем распознавания.
ЗАДАЧА № 4
Описание классов априорного алфавита на языке априорного словаря признаков.
Априорное описание классов - наиболее трудоемкая из задачв процессе создания системы распознавания, требующая глубокого изучения свойств объектов распознавания,а также и наиболеетворческая задача.
В рамках этой задачи необходимо каждому классупоставить в соответствие числовые параметры детерминированных и вероятностных признаков, значения логических признаковипредложения, составленные из структурных признаков-примитивов.
Значения этих параметров описаний можно получить изсовокупности следующих работ и действий:
-специальнопоставленные экспериментальные работы или --экспериментальные наблюдения;
-результаты обработки экспериментальных данных;
-математические расчеты;
-результаты математического моделирования;
-извлечения из литературных источников.
Что же такое описание класса на языке признаков?Рассмотрим это отдельно для детерминированных, вероятностных,логических и структурных признаков.
Если признаки распознаваемых объектов - детерминированные, то описанием класса может быть точка в №-мерном пространстве детерминированных признаков из априорногословаря, суммарасстояний которой от точек, представляющихобъектыданного класса, минимальна.
Легко себе представить такой эталон, вернувшись к рассмотренным нами таблицам ТТХ самолетов.Здесь мы имеем дело с 11-мерным пространством признаков.Каждая координата - это однакакая-нибудь характеристика, например “экипаж”. Если рассматривать только одну координату “экипаж”,то точкой эталона для истребителей будет - 1,для бомбардировщиков - 4.Это точки, суммы расстояний которых от всех истребителей и всех бомбардировщиков, представляющих эти два класса, минимальны.
Точно также это можно сделать по всем 11 координатам (т.е.“потолок”, “размах крыльев”, ”бомбовая нагрузка “ и т.д.), в результате чего будем уже иметь дело с точками эталонов в 11-мерном пространстве.
Если признакираспознавания-логические,то для описания каждого класса необходимо прежде всего иметь полный набор элементарных логических высказываний A,B,C, входящих в состав априорного словаря.Но это только признаки.Для описания классовэтого недостаточно. Еще необходимо установить соответствие между набором значений приведенных признаков A,B,C и классами W1, W2,...Wm.
Так для простоты понимания и без притязаний на медицинскую достоверность возьмем такой пример:необходимо распознавать два заболевания - обычная простуда и ангина (W1,W2), а в качестве логических признаков выберем
А - повышенная температура (А=0 - нет, А=1 - да);
В - насморк (В=0 - нет, В=1 - да);
С - нарывы в горле (С=0 - нет, С=1 - да).
Тогда так называемоебулевосоотношение междуклассомW1 (обычное простудное заболевание) и значениями признаками (аэти значения - бинарные) выглядит так
Здесь умножение, каквызнаете, соответствуетлогическому “И”, а сложение - “ИЛИ”.
Точно также для второго класса заболеваний получим следующее описание
Подробнее здесь мы эти вопросы не рассматриваем, так как логическим системам в дальнейшем курсе уделим достаточное внимание.
Если распределение объектов распознавания, представляемых числовыми значениями их признаков пообластям соответствующего пространства вероятностное, то для описанияклассов необходимо определить характеристики этих распределений. А из теории вероятности известно, что это
-функции ПРВ fi (x1,x2,....,xn),гдеx1.....xn - вероятностные признаки, I- номер класса;
-P(Wi) - априорная вероятность того, что объект, случайно выбранный из общей совокупности, окажется принадлежащим к классу Wi.
Как получить ПРВ классов системы распознавания? В распоряжении разработчика СР - три способа:
-экспериментальное определение по статистическим данным;
-теоретический вывод;
-моделирование.
То жекасается априорной вероятности класса P(Wi).
Если признаки распознавания - структурные, тоописанием каж-дого класса должен быть набор предложений (цепочек из непроизводных элементов с правилами соединения). Каждое из предложений класса - характеристика структурных особенностей объектов этого класса. Пример - код Фримена.
ЗАДАЧА № 5
Выбор алгоритма классификации, обеспечивающего отнесение распознаваемого объекта или явленияк соответствующему классу.
Непосредственное решение задачи распознаваниянаоснове использования словаря признаков и алфавита классов объектов или явлений фактически заключается вразбиении пространствазначений признаков распознавания на областиD1,D2,...,Dn, соответствующие классам W1,W2,...,Wn (вспоминаем определение “образа”).
Указанное разбиение должно быть выполнено таким образом, чтобы обеспечивались минимальные значения ошибок отнесения классифицируемых объектов или явлений к “чужим” классам.
Результатом такой операции является отнесение объекта, имеющего набор признаков X1,X2,....,Xn (точка вn-мерном пространстве), к классу Wi, если указанная точка лежитвсоответствующей классу области признаков - Di.
Разбиение пространства признаков можно представлять как построение разделяющих функций fi(x1,x2,....,xn) между множествами (областями) признаков Di, принадлежащим разным классам.
Упомянутые функции должны обладать следующим свойством:
-если объект,имеющийвектор признаков фактически относитсяк классутозначение разделяющей функции
должно быть большим, чем значение еедля класса (здесь индекс q - означает номер класса, к которому принадлежит вектор признаков).
Отсюда легко определить выражение решающей границы между областями Di, соответствующим классам Wi:
Для двух распознаваемых классов разбиениедвумерного пространства выглядит так (рис 2.2). Физически распознавание основываетсянасравнении значений той или иной меры близости распознаваемого объекта с каждым классом. При этомеслизначение выбранной меры близости (сходства) L данного объекта w с каким-либо классом Wg достигает экстремума относительно значений ее по другим классам,то есть
то принимается решение о принадлежности этого объекта классу Wg,то есть wg.
Надеюсь понятно, что если мера близости неимеет экстремума, то мы находимся на границе, где не можем отдатьпредпочтение ни одному из классов.
X1 oo o o
xx x o o o
x o o F2(X1,X2) > F1(X1,X2)
x x x o o o o
x o o o oo
x x x xx o o o o o
F1(X1,X2)>F2(X1,X2) x o
xx x x x x x o o
x x x x x x
x x x x x
X2
Рис.2.2
В алгоритмахраспознавания,использующих детерминированныепризнаки в качестве меры близости, используется среднеквадратическое расстояние между данным объектом w и совокупностью объектов(w1,w2,....,wn), представляющих (описывающих) каждыйкласс.Такдля сравнения с классом Wg это выглядит так
где kg - количество объектов, представляющих Wg-й класс.
При этом в качестве методов измерений расстояния между объектамиd(w,wg) могут использоваться любые методы (творческийпроцессздесь не ограничивается).
Так, если сравнивать непосредственно координаты(признаки), то
где N -размерность признакового пространства.
Если сравнивать угловые отклонения, то рассматривая вектора, составляющими которых являются признаки распознаваемого объекта w и класса wg, будем иметь:
где ||Xw||и||Xwg|| - нормы соответствующих векторов.
Валгоритме распознавания,использующемдетерминированные признаки можно учитывать и их веса Vj (устанавливать степень доверия или важности).Тогдарассмотренное среднеквадратическое расстояние принимает следующий вид:
В алгоритмах распознавания, использующих вероятностные признаки, в качестве меры близости используется риск, связанный с решением о принадлежности объекта к классу Wi,гдеi -номеркласса. (i=1,2,..,m.).
Описания классов, как мы недавно рассмотрели
В рассматриваемом случае к исходным данным для расчетамеры близости относится платежная матрица вида:
Здесь на главной диагонали - потери при правильных решениях.Обычно принимают Сii=0 или Cii<0.
По обеим сторонам от главной диагонали - потери приошибочных решениях.В каждой системе эти потери свои, свойственные только ей. Однако назначение их - творчество разработчика системы распознавания.
Если вектор признаков распознаваемого объектаw - риск, связанный с принятием решения о принадлежности этого объекта к классу Wg, когда на самом деле он может принадлежать классам W1,W2,...,Wm, наиболеецелесообразно определять как среднее значение потерь
С1g, C2g,...,Cmg,
то есть, потерь, стоящих в g-ом столбце платежной матрицы.
Тогда этот средний риск можно записать как определение МОЖ
Здесь P(Wi/Xw) -апостериорная вероятность того, что wi.
Для исходных данных, а именноописанийклассов эта вероятность легко может быть определена в соответствии с теоремой гипотез или по формуле Байеса
Вероятности и плотности,входящие в формулу - ни что иное как характеристики описания классов в вероятностной системе.
Для алгоритмов, основанных на логических признаках, понятие “мера близости” не имеет смысла. Вспомним упрощенный пример,рассмотренныйнами для логических признаков заболеваний (простой простуды и ангины).
Имея значения признаков А,B,C, достаточно подставить их в булевы соотношения между классами и признаками,чтобысразу получить результат как истинность или ложность булевой функции описания того или иного класса.
Действительно, пусть признаки приняли следующие значения:
-Ïîâûøåííàÿ òåìïåðàòóðà: A=1
-Насморк: B=0
-Нарывы в горле: C=1
Тогда подстановка их в булевы соотношения даст следующий результат:
То есть, истинным является второе соотношение, соответствующее распознаванию ангины как диагностируемого класса издвух заболеваний.
Для алгоритмов, основанных на структурных(лингвистических) признаках, понятие “меры близости” более специфично.
С учетом того, что каждый класс описывается совокупностью предложений, характеризующих структурные особенностиобъектовсоответствующих классов, распознаваниенеизвестного объектаосуществляется идентификацией предложения, описывающего этот объект, содним из предложений в составе описания какого-либо класса.
При этом идентификация может подразумевать наибольшеесходство предложения, описывающего распознаваемый объект с предложениями из наборов описания каждого класса.
Рассмотрев задачу №5 ,мы фактически завершили рассмотрение круга задач создания СР. В то же время уже отмечалось, что создание СР осуществляется последовательными приближениями по мере получениядополнительной информации.В этом ряду последовательных приближений главную роль играют признаки распознавания. От эффективности их набора зависит, эффективность системы в целом. В процессе совершенствования системы указанный набор пополняется, неэффективные признаки исключаются. Поэтому одной из задач создания СР должна быть и задача перехода от априорного словаряпризнаков к рабочему. То же касается и априорного алфавита классов.
ЗАДАЧА № 6
Определение рабочего алфавита классов и рабочего словаря признаков системы распознавания.
Настоящая задача на уровне разработки, прошедшей этапы решения задач 1 -5, по крайней мере уже может бытьпоставлена, так как в результате выполнения предшествующих задач созданасистема распознавания первого приближения (априорный алфавит классови априорный словарь признаков, выбран алгоритм распознавания).
Суть стоящей задачи - разработкатакого (рабочего) алфавитаклассови такого (рабочего) словаря признаков, которые обеспечилибымаксимальное значение показателя эффективности распознавания. То есть, из априорного словарямы должны выбрать признаки, позволяющие при всех имеющихся ограничениях на их получение (измерение)доставить максимум вероятности правильной классификации объектов (явлений) и (или) минимальные вероятности ошибочных классификаций создаваемой системой. Такой выбор не может не предполагать оценку указанных показателей до того, как создана система.
Указанное существо задачи заставляет снова обратить внимание на возможность получения оценки эффективности системы распознавания путем ее моделирования. Об этом мы говорили при создании априорного словаря признаков. К этому мы вернемся при специальном рассмотрении вопросов моделирования систем распознавания.
Что же касается приемов, обеспечивающих отбор в процессе оптимизации систем распознавания, то они являются также предметом отдельного рассмотрения.
Л Е К Ц И Я3.1
Принципы классификации и типы систем распознавания
Ïðè ðàññìîòðåíèè çàäà÷, ðåøàåìûõ â ïðîöåññå ñîçäàíèÿ ñèñòåì ðàñïîçíàâàíèÿ (òåìà 2) , ìû ãîâîðèëè î ïðèçíàêàõ îáúåêòîâ (ÿâëåíèé),î ñïîñîáàõ èõ ïîëó÷åíèÿ â ïðîöåññå ðàáîòû ÑÐ,îá èñïîëüçîâàíèè àïðèîðíîé èíôîðìàöèè, íå çàòðàãèâàÿâîïðîñîâ âçàèìîñâÿçåé â ñèñòåìå.Èíîãäà òîëüêî óïîìèíàëè îá ýòîì .
 òî æå âðåìÿ, ÷òîáû ëåã÷å, ñîçíàòåëüíåå ðåøàòü çàäà÷ó âûáîðà ïðèçíàêîâ (à ýòî, êàê ìû ïîìíèì, - ïðîöåññ ýâðèñòè÷åñêèé), à òàêæå äëÿ ïëàíèðîâàíèÿèñïîëüçîâàíèÿ êàê àïðèîðíîé èíôîðìàöèè (îïèñàíèå êëàññîâ), òàê è àïîñòåðèîðíûõ äàííûõ (èçìåðåíèÿ ïî äàííîìó íåèçâåñòíîìó ïîäëåæàùåìó êëàññèôèêàöèèîáúåêòó) ýòè âçàèìîñâÿçè íåîáõîäèìî õîðîøî ïðåäñòàâëÿòü.
Однако, как оказывается, упоминаемые взаимосвязи могутпринимать различные формы,иметь свои особенности. Простое перечисление здесь не подходит. Поэтому представляется необходимым классифицировать сначала сами системыраспознавания.Это позволит понять взаимосвязи в них и решать те задачи, о которых мы сейчас говорили.
Начнем с уточнения того,что такое классификация. Классификация - это распределение предметов,явлений по классам, отделам,разрядам в зависимости от их общих свойств.
В основе классификации лежат определенные принципы.
Для классификации СР будем использовать следующие принципы:
1.Однородность информации для описанияраспознаваемых объектов или явлений.
2.Способ получения апостериорной информации.
3.Количество первоначальной априорной информации.
4.Характер информации о признаках распознавания.
А. Рассмотрим 1-й принцип.
(Однородностьинформации)
Здесь пододнородностью следует понимать - различную или единую физическую природу информации (признаков).
Поэтому принципу СР делятся на:
-простые;
-сложные.
Простые СРхарактеризуются единой физической природой признаков. Например:
1) только масса - для систем распознавания жетонов, монет в автоматах таких, как междугородный телефон, турникет метро;
2) геометрические размеры - для таких СР, как всякого рода замки.
Ясно, что для простых систем распознавания не обязательно иметь компьютер. Достаточноих реализовать в виде механических или электромеханических устройств.Хотя компьютерные реализации впринципе не противопоказаны,если наряду с этой в системе решаютсяи другие более достойные задачи.
Сложные СР характеризуются физической неоднородностью признаков.
В рассмотренном нами в теме№ 2 перечне признаков самолетов такая неоднородность просматривается невооруженным глазом. Там имели:
-и численность экипажей;
-и высоты полета;
-и взлетный вес;
-и геометрические размеры и т.д.
Точно также в медицинской практике для диагностикиможет оказаться необходимым привлекать:
-и температуру;
-и данные анализа крови;
-и данные кровяного давления;
-и кардиограммы и т.п.
Конечно, простота всегда предпочтительнее.Хорошоиметь всего 1-2 признака и при этом желательно однородных, чтобы решать задачу компьютерного распознавания, например,заболеваний печени.Но не всегда, как и в этом случае, так получается. Сравните распознавания ключа замком и распознавание преступника по словесному портрету (набору признаков).
Б. Второй принцип классификации СР.
(Способ получения апостериорной информации).
По этому принципу сложные системы ( а мы уже знаем, что они собой представляют) распознавания делятся на:
-одноуровневые;
-многоуровневые.
На рис. 1 изображена одноуровневая система распознавания.
Здесь:
И1, И2,.....,Иn - разнородные по физической природе измерители.
АО - априорное описание классов распознаваемых объектов;
АК - алгоритм классификации;
САУ- система автоматического управления (алгоритм)распознаванием.
Многоуровневые сложныесистемы распознавания отличаются от одноуровневых тем, что не все признаки от разнородных физических измерителей используются непосредственно для решения задачи распознавания.
Здесь наосновеобъединения признаков нескольких измерителей и соответствующей обработки могут быть получены вторичные признаки, которыемогут как использоваться в АК,так и сами в свою очередь служить основой для объединения.То есть,получаем 2-й, 3-йидр. уровни признаков,определяющие многоуровневость СР. Причем подсистемы, которые осуществляют объединение признаков, в свою очередь могут представлять собой также устройства распознавания (локальные СР).
Схема здесьв целом подобна предыдущей (для одноуровневой системы), а отличается лишь усложнением связей от признаков к АК.(Рис.2)
W
È 1 È2 ............................. Èn
X11 X12 .... X1k X21 X22 .... X2p Xn1 Xn2 ....Xnr
A K
Ñ ÀÓ
Ðåøåíèå î ïðèíàäëåæíîñòè
AO
Ðèñ. 1
W
È 1 È2 ......................... Èn
X11 X12 .... X1k X21 X22 ....X2p Xn1 Xn2 .Xnr
A B C
D
À Ê
ÑÀ Ó
À Î Ðåøåíèå î ïðèíàäëåæíîñòè
Ðèñ. 2
Таким образом:
в одноуровневых СР информацияопризнаках распознаваемого объекта (апостериорная информация)формируетсянепосредственно на основе обработки прямых измерений;
в многоуровневых СР информация о признаках формируется на основе косвенныхизмеренийкак результат функционирования вспомогательных распознающих устройств (пример: измерение дальности радиолокатором по времени задержки излученного импульса).
В. Третий принцип классификации.
(Количество первоначальной априорной информации).
Здесь вопрос касается того, достаточно или недостаточно априорной информации для определения априорного алфавита классов, построения априорного словаря признаков и описания каждого класса на языке этих признаков в результате непосредственной обработки исходных данных.
Соответственно этому СР делятся на:
-системы без обучения;
-обучающиеся (ОСР) и самообучающиеся системы (ССР).
Сразу заметим,что многоуровневые сложные СР однозначно нельзя разделить на указанные классы,так как каждая из локальных СР, входящих в их состав, сама может представлять как систему без обучения, так и систему обучающуюся или самообучающуюся.
Системы без обучения.
Для построения таких систем необходимо располагать полной первоначальной априорной информацией. Предыдущие, рассмотренные нами схемы СР фактически изображали такие системы.
Обучающиеся системы.
Итак, судяпо предыдущему рассмотрению,для обучающихся систем мы должны иметь дело с ситуацией,когда априорной информации не хватает для описания распознаваемых классов на языке признаков . (Возможны случаи,когда информации хватает,однакоделать упомянутое описание нецелесообразно или трудно).
Исходная информациядляобучающихся СР (ОСР) представляется в виде набора объектовw1, w2,....,wl ,распределенных по m классам:
(w1,w2,...,wr) W1
(wr+1,wr+2,...,wq) W2
..................
(wg+1,wg+2,...,wl) Wm
Цель обучения и ее достижение заключаются для ОСР в определении разделяющих функций
Fi(X1,X2,.....,Xn),
где i = 1,2,....,m (номер класса).
Определение этойфункцииосуществляетсяпутем многократного предъявления системе указанных объектов (из набора w1,w2,....,wl)с указанием, какому классу они принадлежат.
То есть, на стадии формирования ОСР работают с “учителем”, осуществляющим указание о принадлежности предъявленного для обучения объекта. И прежде, чем система будет применяться, должен пройти этап обучения.
О разделяющихфункцияхмы уже вели речь,когда рассматривали задачи построения систем распознавания.Теперь мы вернулись к этому понятию, определив СР, в которых указанные функции применяются.
Мы и еще раз вернемся к этому понятию, когда будем рассматривать математическую сторону вопроса определения разделяющей функции.
Теперь же мы уже в состоянии изобразить ОСР (Рис. 3).
Y - учитель;
ОО - обучающие объекты;
АРФ - алгоритм построения разделяющих функций;
ТС - под общим названием “Технические средства”
объединены измерители признаков распознавания;
АО - априорное описание классов распознаваемых об’ектов;
АК - алгоритм классификации;
САУ - система автоматического управления (алгоритм) распознавания;
w - неизвестные, распознаваемые объекты.
Ïóíêòèðíûå ëèíèè íà ðèñóíêå ñîîòâåòñòâóþò âçàèìîñâÿçÿì â ïðîöåññå îáó÷åíèÿ.
W
Ò Ñ ÎÁÎ Ó
À Ð Ô
ÀÎ
Ñ À Ó
ÀÊ
Ðåøåíèå î ïðèíàäëåæíîñòè
Ðèñ.3
Л Е К Ц И Я3.2
Принципы классификации и типы систем распознавания
(Продолжение)
Самообучающиеся системы.
В отличии от систем без обучения и систем, обучающихся с учителем, для самообучающихся систем характерна недостаточность информации для формирования не только описаний классов, но даже алфавита классов. То есть, определен только словарь признаков распознавания. Однако для организации процесса обучения задается все-таки некоторый набор правил, в соответствии с которым система сама вырабатывает классификацию.
Для ССР также, как для ОСР существует период обучения, характерно наличие периода самообучения, когда ей предъявляются объекты обучающей последовательности. Только при этом не указывается принадлежность их к каким-либо классам.
Соответствующая функциональная схема ССР приведена на рис.4.
Здесь дополнительно к обозначениям рис.2,3 имеем:
ОС - объекты самообучения;
ПК - правила классификации;
АФК - алгоритм формирования классов.
Примером самообучающейся системы может быть система разделения на классы промышленных предприятийдля сравнительного анализа эффективности их функционирования. При этом в качестве правил классификации могут быть указания либо о равенстве объемов выпускаемой продукции, либо о равенстве численности рабочих и т.п.).
В другой широко применяемой терминологии ССР - это система автоматического кластерного анализа или таксономии (taxis - порядок, nomos - закон).
Завершая рассмотрение классификации СР по количеству первоначальной априорной информации, заметим,что СР,в которых недостаточно информации для назначения словаря признаков, не существует. Без этого не создается никакая система.
W
Ò Ñ ÎÁÑ
ÀÔ Ê Ï Ê
ÀÎ
Ñ À Ó
ÀÊ
Ðåøåíèå î ïðèíàäëÅÆíÎñòè
Ðèñ.4
Г.Четвертый принцип классификации.
(Характер информации о признаках распознавания).
С характеристикой информации о признаках распознавания мы уже имели дело при изучении задач создания СР. В соответствии с ее отличительными особенностями СР подразделяются на
-детерминированные;
-вероятностные;
-логические;
-структурные (лингвистические);
-комбинированные.
Подытоживая пройденное, отметим характерные особенности этих систем, а именно:метод решения задачи распознавания и метод априорного описания классов.
Детерминированные системы.
а) Метод решения задачи распознавания:использование геометрических мер близости;
б) Метод априорного описания классов:координаты векторов-эталоновпокаждому из классов или координатывсех объектов,принадлежащих классам (наборы эталонов по каждому классу).
Вероятностные системы.
а) Метод решения задачи распознавания:вероятностный,основанный на вероятностной мере близости (средний риск);
б) Метод априорного описания классов:вероятностные зависимости между признаками и классами.
Логические системы.
а) Метод решения задачи распознавания:логический, основанный на дискретном анализе и исчислении высказываний;
б) Метод априорного описания классов:логические связи, выражаемые через систему булевых уравнений, где признаки - переменные, классы - неизвестные величины.
Структурные (лингвистические) системы.
а) Метод решения задачи распознавания:грамматический разбор предложения, описывающего объект на языке непроизводных структурных элементов с целью определения его правильности.
б) Метод априорного описания классов:подмножества предложений, описывающих объекты каждого класса.
Комбинированные системы.
а) Метод решения задачи распознавания:специальные методы вычисления оценок;
б) Метод априорного описания классов:табличный, предполагающий использование таблиц, содержащих классифицированные объекты и их признаки (детерминированные, вероятностные, логические).
Комбинированные системы требуют отдельного рассмотрения для понимания принципов их построения, что мы и сделаем в нашем курсе после определенной подготовки.
В целом рассмотренная классификация СР может быть представлена следующей схемой (рис.5)
Послепроведенной классификации возвратимся для дополнительного рассмотрения функциональных схем СР.И обратим внимание именно на термин "достаточное" или "недостаточное" количество информации. С этой меркой мы походили к разделению СР на два большие класса: СР без обучения, обучающиеся и самообучающиеся СР. То есть, для СР без обучения имели дело с полной информацией, а для ОСР - с неполной (нет описания классов на языкепризнаков),адля ССР - еще с большей неполнотой (отсутствует даже алфавит классов).
Однако заметим, что само понятие “неполнота информации” - качественное, относительное. Для СР без обучения при прочих равных условиях этой информации просто больше. Это означает, что результативность СР при имеющемся объеме априорной информации значительно выше, чем имеем в той ситуации, которая требует создания ОСР. О результативности СР, для которой невозможно априорно назначит алфавит классов говорить вообще нельзя. Что же касается примененного здесь выражения "результативность значительно выше", то из последующего изучения курса будет понятно, что этому казалось бы опять-таки качественному утверждению соответствуют вполне конкретные количественные показатели.
ÑÐ
Ïðîñòûå Ñëîæíûå
Áåç îáó÷åíèÿ Ñ îáó÷åíèåì Ñ ñàìîîáó÷åíèåì
Äåòåðìèíè
ðîâàííûå Âåðîÿòíîñòíûå Ëîãè÷åñêèå Ñòðóêòóðíûå
Êîìáèíèðîâàííûå
Ðèñ.5
Таким образом, отсюда следует, что информацией никогда пренебрегать не стоит. Поэтому при построении как ОСР, ССР и простоСР необходимовсегда использовать принцип обратной связи для расширения объема информации.То есть,результаты решения задачи распознавания неизвестныхобъектов после апостериорного подтверждения правильности их классификации необходимо использовать для уточнения описания классов в простых СР без обучения и для дополнительного обучения в ОСР и ССР.
Для решения таких задач приведенные схемы СР должны быть дополнены соответствующими функциональными связями дообучения.
***
Классификация СР была бы неполной, если бы мы не коснулись экспертных систем,стоящих несколько в стороне от приведенной методологии построения изучаемых нами классических СР.
Как выужезнаете, этисистемыосновываются наметодах искусственного интеллекта.
Классические решения задач распознавания основываются на моделировании математико-алгоритмических функций (уравнения, системы уравнений) детерминированных или стохастических систем с точным определением области применения, значений параметров, диапазоновсигналов, интервалов времени,частотных диапазонов и т.п. Эти задачи опираются на надежные,точно научно обоснованные знания. В них реализуются новые иоригинальные достижения высококвалифицированных специалистов, имеющих в то же время узкую специализацию.Однако такиеспециалисты достаточно редки. Это и побуждает создавать экспертные системы, основанные на представлении неалгоритмического,логического, декларативного характера, нечеткого и слабо формализованного знания в виде множества фактов и правил, причинно-следственных связей.
Указанные знанияпри этом могут быть как заслуживающими доверия и опробированными многочисленными независимымиприменениями,таки сомнительными.
Экспертные системы распознавания - это специализированные автоматыобработки знанийдляинтерактивного и кооперативного решения проблем распознавания на естественном профессиональном языке соспособностями приобретения,хранения и представления знаний в форме алгоритмических программ с одной стороны и неалгоритмическихфактов и правил, с другой стороны.
Изучение экспертных систем - это отдельный предмет с его методами и подходами.
Îïòèìèçàöèÿ ýâðèñòè÷åñêèõ âûáîðîâ ïðè ñîçäàíèè ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ
Л е к ц и я4.1
Оптимизация алфавита классов и словаря признаков
4.1.1. Уточнение назначенияи цели создания СР
Как нами уже установлено,процесс распознавания включает такую последовательность операций:
- прием на входе СР образа распознаваемого объекта;
-cопоставление апостериорной информации поступившегообъекта симеющимсяв СРаприорнымописанием классов всех объектов, подлежащих распознаванию(объектов,на которыерассчитанасистема);
- принятиерешения оботнесении объекта,образ которого был принят, к одному из классов.
Правило,согласно которомуобъекту,образ которого принят, ставится в соответствие наименование класса, называется решающим правилом.
В литературе широко распространено мнение,что суть проблемы распознаванияисостоит в определении такого решающего правила.То есть,центральной задачей часто считается нахождениев признаковом пространстве такихграниц,которые некоторым оптимальным образом (например,по критерию минимума ошибок распознавания) разделяютэто пространство на области, соответствующие классам.
При этом нами четко установлено,что в зависимостиот объемааприорнойинформации возможнодваподхода к определению решающих правил (границ между классами в признаковом пространстве):
1. Непосредственное предварительное определение придостаточном количестве априорной информации (СР без обучения).
2.Постепенное уточнениев ходе работы СР по назначению при наборе достаточного количества информации (обучающиеся СР).
Каждый их подходов основан на том,что априорный словарь признаков и алфавит классов известны. При отсутствии априорного алфавитаклассов применяется подход, реализуемый в самообучающейся СР. Однако приэтом заранее должны быть известны словарь признаков и ,кроме
того,набор некоторых правил назначения классов в процессе самообучения. Решающие правила здесь определяются как итог нахождения алфавита классов.
Исторически сложилось, что первые теоретические и прикладные работы в области распознавания основывались на полной определенностиалфавита классови словаре признаков. При этом проблема распознавания сводиласьобычно к проблеме оптимального в некотором смысле определения решающих правил , решающих границ между классами.
Широкая практикасозданияСР в последующие годы (особенно в военных приложениях) и дальнейшее развитие теории распознавания убедительно показали, что приведенное отношение устарело. При построении реальных СР даже при известных признаках и классах приходитсярешать сложную и дорогостоящую задачу разработки, ввода и использования специальных измерительных средств и комплексов таких средств с ЭВМ.Эти средства и комплексы оказываются главным элементом в получении признаков распознавания.
При этомреализациярешающего правила - это алгоритмическая задача, решение которой отодвигается на второй план сложностью и ценой задачи создания измерительных средств.
Кроме того,для логических и структурных СР о поиске решающих правил вообще не может быть и речи.Они известны. В логических СР -это правила определения неизвестных в булевых уравнениях, в структурных - правила определения правильности конструкции предложения.Этот факт поэтому и является дополнительным доказательством первостепенной важности задачи определения признаков и классов.
В результате представляется возможным сформулировать назначение любой СР.
Назначение СР- получение информации, необходимой для принятия решения о принадлежности неизвестных объектов (явлений)ктому или иному классу.
Такое определениенаиболееплодотворно для сложных систем.
Оно заставляет сосредоточить усилия в создании СР на главномнаправлении.
(Примером главенства информации могут служить медицинские СР, геологические, метеорологические, криминалистические, системы контроля космического пространства страны).
Но и принятие решений о принадлежности -несамоцель. Поэтому второй момент, на который нам необходимо обратить внимание до перехода к теоретическим описаниям рассматриваемых в этой теме задач,- это необходимость понимания того, что любая СР является частью какой-либо системы управления(автоматической илиавтоматизированной).
Отсюда легко формируется цель создания СР.
Цель создания СР - обеспечение высокой эффективности принимаемых решений в управлении.
Приведенные определения позволяют более критично отнестись к тому факту,что информация,которая лежит в основе принятия решений и обеспечивает достижение цели распознавания, основывается на эвристическом методе ее получения.
Из рассмотрения содержания задач построения СР следует, что словарь признаков распознавания и алфавит классов формируются человеком на основе его знаний, опыта, интуиции. В то же время ответственность за решения может быть очень велика.
Поэтому очень важно найти объективные методы оценки такого рода человеческой деятельности.
На это мы и направим последующий анализ.
4.1.2. Взаимосвязь размерности алфавита классов и эффективности СР
Мы пока еще не затрагивали вопросов такой взаимосвязи,хотякак алфавит классов, так и словарь признаков определили и имеем представление о их выборе. Однако, обсуждение вопросов составления словаря признакови выбора алфавита классов никак не затрагивало их взаимосвязи. В то же время мы понимаем,что наличие связейдвух явлений, объектов,процессов вообще достаточно часто позволяет выяснить некоторые ограничения составляющих.Попытаемся их поискать для таких объектов, как словарь признаков и алфавит классов.
Оказывается, что отмеченные особенности и приведенные определенияназначения и цели создания СР уже определяют взаимосвязи между классами и принимаемыми решениями.
Рассмотрим, какие же это взаимосвязи, в чем их существо. Очевидно, главное, что накладывает на них отпечаток - это необходимость достижения высокой эффективности решений.
Отсюда можно утверждать,что в управлении высокая эффективность решений достигается:
1)Увеличением числа классов в принятом алфавите, то есть, повышением степени детализации распознаваемых объектов (явлений) по назначению и характеру.При этом чем детальнее классификация, тем легче предпринять адекватное управление. ( Вполнепонятно,что распознать просто отказ двигателя автомобиля менее привлекательно,чем указать на выход из строя клапана или масляного насоса).
2)Повышением точности определения признаков распознавания, а значит снижением возможности ошибочных решений, часто опасных для управления (снижение ошибок классификации).
Так, если ошибки измерения координат падающегоКОбольшие, то можно как ошибочно самоуспокоиться, предполагая точку падания за пределами интересующей нас зоны ответственности, так и ошибочно объявить тревогу и даже вызвать панику.
В то же время увеличение числа классов в любой задаче, как можно понять только из соображенийздравого смысла
( в дальнейшем мы это опишем более строгоматематически) не всегдапросто, а иногда оказывается и невозможно.
Но существует одна ситуация, когда это увеличение всего на один класс бесспорно важно. Так для того, чтобы результаты распознавания были более приемлемы для последующегоуправления,приходится дополнительнокимеющимся m классам вводить (m+1)-ый, когда отказываются от распознавания, а значит и от управления.Отказ от управления лучше, чем управление при ошибочности распознанной ситуации (если этовозможнопо назначению системы).
Теперь постараемся понять имеющиеся связи, рассматривая отношениямеждучислом классов и ошибками распознавания. Для удобства рассматриваем одномерный случай (вместо вектора признаков без ущерба для задачи, но для ясности физических представлений, имеем один признак.
Пусть заданы три класса объектов W1, W2, W3
- распределениями вероятностей f(x/W1), f(x/W2 ), f(x/W3 ),где x - вероятностный признак распознавания ;
- априорными вероятностями P(W1), P(W2), P(W3);
- матрицей потерь при решениях
Теперь поймем,что если априорная вероятность отнесения объекта к i-му классу,в то время как он принадлежит к j-му классу (то есть, априорная вероятность ошибки) равна
P(Wi /Wj ),
то среднеезначение платы за ошибочную классификацию всех m объектов в системе распознавания определяется как условное МОЖ потерь (зависимость от Wj
В целомсредниепотери классификации (то есть, потери по всем классам) определяются как среднее
Остается определить вероятность P(Wi /Wj ),так как априорное описание классов напрямую не дает ее значений.
Изобразим ситуацию классификации в рассматриваемом нами примере в виде функций ПРВ параметра распознавания для трех классов (Рис 4.1.1)
f(x/Wi)
f(x/W1) f(x/W2) f(x/W3)
a b X
Рис. 4.1.1
Если теперь определитьобласти возможного разброса параметра распознавания каждого класса как Gi ,толегко определитьзаписанную нами вероятность ошибки так
Обозначим указанные области Giна рисунке. Здесь эти области в силу одномерности случая должны представлять собой отрезки. Поэтому достаточно указать границы
а - граница между 1-ым и 2-ым классами;
b - граница между 2-ым и 3-им классами
Соответственно отрезки:
1-го класса]-¥ +a];
2-го класса ]+a +b];
3-го класса]+b+ ¥[.
Теперь можно записать в соответствии с приведенной формулой условные риски ошибочных решений
Отсюда среднийриск ошибочных решений в системе распознавания (то есть, риск ошибочной классификации всех классов):
Для простоты рассмотрения принимаемСii = 0, Cij =C, Pi = Pи, пользуясь рисунком, получим
Здесь обозначен средний риск индексом "1", так как теперь рассмотрим вторую ситуацию, для которой постараемся уменьшить число классов, объединяя первый и второй классы в один - четвертый.
Определим по правилам теории вероятностей ПРВ четвертого класса по ПРВ первого и второго классов
До этого мы упрощали представление вероятностей и плат за ошибки для трех классов. Добавим к этому и четвертый класс
C44=0;C14 =C41 = C.
На рисунке ПРВ классов изобразимПРВ четвертого класса (пунктир).
Теперь можно записать,как и в первом случае (три класса), условные риски ошибочных решений для оставшихся 3-го и 4-го классов
(Условные риски R1и R2здесь отсутствуют, так какпроизошло объединение 1-го и 2-го классов в 4-ый. Кроме того, матрица плат за ошибки с учетом четвертого класса приняла сначала следующий вид
а затем из нее за счет того же объединения исключили столбцы и строки, имевшиеиндексы "1" и "2". В результате получили:
Средний риск для случая двух оставшихсяклассов W3 и W4 обозначим индексом "2" и также, как для первого случая, после простых преобразований получим
.
Теперь, если подставим сюда вместо ПРВ f(x/W4) его выражение, определенное уже нами, то получим
Наконец мы можем сравнить средний риск R1 и R2
__ __
R1 > R2
Вывод:
При заданном признаковом пространстве и прочих равныхусловиях уменьшение числа классов приводит к меньшению ошибок распознавания.
Следствие:
При увеличении числа классов для уменьшения среднего риска (через уменьшение вероятности ошибочных решений) необходимовключатьв состав словаря признаков такие, которые имеют меньший разброс.
Действительно, для рассмотренного намиодномерногослучая по приведенномурисунку можно проследить, что вероятности ошибочных решений снижаются,если распределения имеют меньший разброс. То есть, при этом опять-таки уменьшается риск ошибочных решений в системе и тем самым достигается большая эффективность, но теперь ужебезуменьшения числа классов.
Л е к ц и я4.2
Оптимизация алфавита классов и словаря признаков
(продолжение)
4.2.1. Взаимосвязь размерности вектора признаков и эффективности СР
Из предположений,возникающих в связи сприведеннымследствием изучения вопроса уменьшения числа классов, можно заключить, что увеличение числа признаков должно приводить к повышению эффективностиСР, таккак рано или поздно в составе вектора может появиться такой признак, разброс которого минимален. Это качественное утверждение является достаточноважным в построении систем распознавания и поэтому требует строгого доказательства.
Итак, докажем, что с увеличением числа признаков вероятность правильного распознавания неизвестных объектов также увеличивается.
Рассмотрим такое доказательство,допуская,что
- для каждого k-го признака распознаваниясуществуетнекоторая вероятностьтакого события Ak, когда решение опринадлежностиобъектов кWi классу принимается однозначно.
-признаки распознавания независимы между собой.
Независимость признаков означаети независимостьсобытийAk (событий принятия однозначных решений о принадлежности).
Обратимся ктеории вероятностей.Вероятностьнаступления двух совместных или несовместных событий A1 и A2
P (A1 + A2 ) = P (A1 ) + P (A2 ) - P (A1 A2 )
Отсюда для трех событий получим
P (A1 + A2 + A3 ) = P [A1+ (A2 + A3 )] = P (A1 ) + P (A2 + A3 ) - P [A1 (A2 + A3 )] = P (A1 ) + P (A2 ) + P (A3 ) - P (A2A3 ) - P (A1A2 + A1A3 ) =
=P (A1 ) + P (A2 ) + P (A3 ) - P (A2 A3 ) -[ P(A1A2 ) + P (A1A3 ) -P (A1A2A3 )]
или
Точно также для четырех событий
Теперь образуемразность между вероятностями суммы 4-х и 3-х событий, состоящих в рассматриваемом нами случае в принятии однозначного решения опринадлежностипо4-м и 3-м признакам распознавания соответственно:
=
(Наиболее просто эту разность получить,не доводя уменьшаемое доконечного вида
Теперь по индукции можно записать:
Из приведенноговыражения следует,что если не достигнута предельная вероятность правильного распознавания, то есть:
то при любом nимеем
Это является доказательством возрастания вероятности при увеличении числа признаков.
Таким образом, последовательность
при является монотонно возрастающей,а значит и сходящейся, так как предел возрастания -“1”.
Для сходящейся последовательности
а значит
что и требовалось доказать.
Следствие:
Снижение эффективностираспознавания засчетувеличения числа классов может быть скомпенсировано увеличением размерности вектора признаков.
Заметим, что мы вели доказательство для независимых признаков.В случае зависимых признаков (коррелированных) надежда на повышение эффективности основывается на наличии связей, приводящих к лучшей разделимости классов (Это можно показать на примере двумерного пространства признаков, которому соответствуют неперекрывающиеся эллипсы рассеяния).
4.2.2. Формализация задачи оптимального взаимосвязанного выбора алфавита классов и словаря признаков
Решая задачу повышения эффективности СРза счет увеличения размерностивектора признаков,мы не обращаливнимания на то,что указанное увеличение - это часто возрастание числа технических средств измерений,каждое из которыхобеспечивает определениеодного или группы признаков.Значит при этом растут расходы на построение СР. Аресурсы часто ограничены.
Поэтому в условиях ограниченных ресурсов на создание СР только некоторый компромисс между размерами алфавита классов и объемом рабочего словаря признаков обеспечивает решение задачи оптимальным образом. Для обеспеченияэтого компромисса требуетсяпредварительная формализация задачи.Начнем с общей формулировки задачи.
4.2.2.1.Формализация исходных данных
Пусть задано множество объектов или явлений
W ={w1 , w2 ,....,wl };
(например, W=самолеты, а w1 -пассажирский самолетТу-154 , w2- военно-транспортный самолет АН-12, w3 - истребитель МИГ-29 и т.д.).
Введем множествоиз r возможных вариантов разбиения этих объектов W на классы (варианты алфавита классов)
A ={A1, A2, ..., Ar}
(например, A1 - 2 класса - пассажирские, военные (m1 =2); A2-5 классов - истребители, бомбардировщики, штурмовики, пассажирские,военно- транспортные (m2 =5) )
Таким образом, с учетом возможного отказа от решений вкаждомварианте множество объектов W подразделяется на свое число классов:
в варианте A1 - на (m1 +1) классов;
в варианте A2 - на (m2 +1) классов;
...........................................................
в варианте Ar - на (mr +1) классов.
Иными словами здесь мы располагаем r алфавитами классов.
В соответствии с вариантом алфавита классов (As) исходные объекты (явления) разбиваются на ms "решающих" классов
W = {W(1/As ), W(2/As ), W(3/As ),....... , W(ms /As )},
где естественно "1", "2",..... - номера классов; As- вариант алфавита классов, где s=1,2,....,r.
Например:
W(1/As ) = {W1 ,W2 ,..Wk }; W(2/As ) = { Wk+1 ,Wk+2 ,..,Wl }
и т.д.
Таким образом, мы располагаем подмножествами классифицированных объектов.
Если при этом располагаем априорным словарем признаков
_
X = { x1 , x2 , ..., xn },
и притом размеры указанных подмножеств классифицированных объектов таковы, что соответствующие выборки признаков представительны (в каждомкласседостаточное встатистическом смысле число объектов),то тогда тем или иным способом может быть проведено описание каждогоиз классов на языке этого словаря.
В детерминированномслучае это достаточно просто.Каждый класс имеет свои эталоны со своими характеристиками как наборами параметров,представляющих собой признаки распознавания:
Xik [W(j/As )],
__
гдеi = 1,n - число признаков распознавания;
__
j = 1,m - число классов;
___
k = 1,Nэj- число эталонов в j-том классе.
При статистическом подходе (вероятностные признаки ивероятностная СР)описание это:
- априорные вероятности классов P[W(i/As )];
_
- функции условных ПРВ f{X/[W(i/As )]};
Если же объем выборокобъектовпо подмножествамнедостаточен для непосредственного описания классов, то эти описания, как мы знаем, могут быть получены с помощью процедуры обучения.
Наличие описаний классов уже позволяет определять решающие правила (решающие границы),использование которых обеспечивает минимизацию ошибок при распознавании неизвестных объектов.
Если бы не было ограничений на величину ресурсов, ассигнуемых на построение СР, а именно на создание измерительных средств, предназначенных для определения признаков, то можнобыло бы считать,что как алфавитклассов, так и словарь признаков определены и можно приступать к построению системы.
Реально при создании сложных систем не бывает без указанных ограничений. При этом,когда речь идет об ограничениях,это не обязательно финансовыеограничения. Достаточночасто в качестве таковых могут выступать ограничения на быстродействие, память и т.п.
4.2.2.2.Выигрыш распознавания и оптимизация алфавита классов и словаря признаков в условиях ограничений
В условияхограниченийна создание или использование средств измерений (а равно - средств получения признаков распознавания) оказывается естественной невозможность использования всех признаков. Поэтому для формирования рабочего словаря признаков вводится вектор, совпадающий по мощности с вектором признаковX:
_
V ={v1 ,v2 ,...,vn },
компоненты которого vj равны 1, если данный признак априорного словаря используется в рабочем и 0 в противном случае.Этот вектор носит название вектора отбора.
Располагая стоимостями измерения каждого j-го признака Сj , имеем общие затраты на реализацию априорного словаря признаков
Сапр =
Для рабочего словаря будем иметь
Сраб =
При наличии конкретнойвеличиныассигнованных ресурсов (C0 ) на создание СР ограничения,о которых идет речь,формализуются ввиде следующего неравенства
С0 >=
Если в конечном итоге интересоваться вектором отбора, то возникает следующая экстремальная задача:
в пределах выделенных ассигнований на создание СР (C0) еобходимо найти такое пространство признаков, при котором обеспечиваетсямаксимальное значение некоторого критерия эффективности СР.
Здесь речь идет не только о словаре признаков, но и об алфавите, учитывая выясненную связь между ними.Действительно, если мы будем уменьшать число признаков, то придется уменьшить и число классов.
Обращая внимание на тот факт, что без критерия эффективности такая задача не решается, введем его.
В соответствующей литературе приводится несколько требований, которыми следует руководствоваться при выборе показателя эффективности:
1) показательэффективности должен характеризовать систему как единое целое.
2) показатель эффективности должен обеспечивать возможность получения количественной оценки с требуемой достоверностью.
3) область изменения показателя эффективности должна иметь четко очерченные границы.
На поверхности понимания стоящейперед намизадачив качествеединого показателядлявсей системылежит вероятность правильногораспознавания.
Однако, такой выбор несколько расходится с пониманием цели создания СР - выработкой управляющих решений.Поэтому и критерийдолжен характеризовать выигрыш, достигаемый от принятия решения как ответных действий на распознавание.
Составляющими такоговыигрыша от применения СР являются частные выигрыши от отнесения неизвестного объекта к тому илииному классу.
Обозначим такуюсоставляющуюв i-омклассе s-ого варианта алфавита классов так:
Gs [W(i/As )].
Что же такое "выигрыш"? Что можно выиграть в управляющем решении?
Рассмотрим в общем виде два примера:
1) В экономикепорезультатам распознавания ситуации может быть принято такое решение,которое обеспечит максимальную прибыль. А может быть и такое решение, которое даст меньшую прибыль или вообще никакой, не говоря уже о возможных убытках.Поэтому понятно,что здесь величина выигрыша зависит от того,насколько не только правильно, но и детально распознана ситуация. Если класс, к которому она отнесена достаточно широк, то трудно ожидать большого выигрыша. Если же детализация оченьподробная,что соответствует большему числу распознаваемых классов, то можно ожидать большую отдачу от принятого решения.
2) В военном деле мы можем иметь дело с отнесениемкклассу опасных не только боевых частей (БЧ) ракет,но и ложных целей (ЛЦ), их имитирующих. При этом вынуждены будем обстрелять (а это и естьрешение по результатам распознавания) и БЧ и каждую ЛЦ. В этом случае мы имеем проигрыш,измеряемый ценой ПР и затратами наих пуски. Если же мы все-таки часть ЛЦ распознаем и отнесем к соответствующему классу,то сэкономим часть противоракет ПР.Если же все ЛЦ отделим от БЧ баллистических ракет (БР), то выигрыш будет максимальным.
Таким образом, в каждом конкретном случае выигрыш специфичен. Но чем он больше, тем лучше.
При таких качественных рассуждениях,хотя и правильных, назначение и подсчет выигрышей не поддается точным выводам и оценкам. Эта задача всегда индивидуальная, носит эвристический характер итребует творчества конструктора при максимальном учете факторов, влияющих на результат.Так или иначе выигрыш для каждого класса, обеспечивающий соответствующее решение, должен быть назначен.
Принимая во внимание зависимость выигрыша от ряда случайных факторов распознавания,в качестве оценки эффективности необходимо использовать единый показатель, получаемый как математическое ожидание составляющих:
где -i -му классу (то есть, после измерения вектора признаков и их отбора).
Теперь сформулированная нами задача может быть формализована следующим образом:
при C0 >=
Здесь A0 ,v0- искомое решение, обеспечивающее выбор варианта разбиения на классы (алфавит классов) и определения рабочего словаря признаков.
Таким образом, общая постановка проблемы создания СР объектов или явлений заключается в определении оптимального алфавита классов и рабочего словаря признаков при наилучшем решающем правиле в условиях ограничений на построение системы измерений признаков распознавания.
Тем а 5
Моделирование систем распознавания образов - методология их создания и
оптимизации
Л Е К Ц И Я 5.1
Введение в моделирование
5.1.1. История вопроса
История моделированияначинается фактически с истории математики,а также с появления графического и пластического искусств, известныхнам по памятникам ранних цивилизаций.Так элементы математического моделирования существовали уже в период зарождения математики.Однимиз первых примеров четко сформулированной математической модели является теорема Пифагора (VI век до нашей эры).
Рассмотрим компьютерную реализацию теоремы Пифагора в ее наиболее простой интерпретации
Известно, чтоэта проверенная жизнью зависимость может использоваться в расчетах как строительных конструкций, так и в машиностроении, так и в определении кратчайшего пути по карте и на местности и т.п.
Если теперь на входе компьютерной программы задавать переменные X и Y как катеты треугольника, например, реальной строительной конструкции, имея желание получить интересующий разработчика размер гипотенузы этой конструкции то в результате расчета будем иметь значения Z, найденные фактически в результате моделирования указанной природной зависимости.
Теорема Пифагора возглавляет длинный список классических примеров математических моделей, среди которых
-законы движения Ньютона (XVII в);
-полиномы Эйлера (XVIII в);
-волновые уравнения Максвелла (XIX в);
-теория относительности Эйнштейна (XX в).
Характеризуя существо математического моделирования, следует определить математическую модель как абстрактное математическоепредставлениеотображаемого объекта, явления, процесса.
Графические ипластическиеискусства вотличиеот математики возглавили ряд методов, получивших название аналогового моделирования.
Аналоговые модели следует определить как отображение предметов, процессов, явлений посредством аналогичного представления.
Классическими примерамианалоговых моделей могут служить глобус, рельефные карты,модели солнечной системы в виде телнапроволочных орбитах,модели молекулярныхсоединений в виде атомных структур,а также аэродинамические трубы, аналоговые модели систем автоматического регулирования, представляемые элементарными звеньями (интегрирующее, инерционное и т.д.)и т.п.
С появлением вычислительных машин стало очевидно, чтоматематические и аналоговые модели могут быть запрограммированы, например, для их исследований. Это явилось знаменательным в истории развития моделирования. С этого момента моделирование получило мощное средство,оказавшее существенное влияние на его совершенствование, развитие, усложнение и охват различных сторон деятельности человека.
Значимость происшедшегоскачка достаточно убедительно характеризует такой пример первых проб компьютерной реализации моделей. В начале 50-хгодовв университете Дж. Гопкинса в США был построен имитатор воздушного боя, состоявший из механических элементов. Каждый вариант боя проигрывался на нем вручную несколькими участниками и длился 3 часа.
Оказалось, чторезультаты при этом обусловливались рядом случайных факторов, а не искусством игроков.
Несколько позже рассмотренная аналоговая модель была формализована в математическую и запрограммирована на ЭВМ ЮНИВАК 1103А. Витоге время реализацииодного вариантамоделированияуменьшилось почти в 10000 раз. Эффект, достигнутый при переходе к ЭВМ, был феноменальным.
Использование ЭВМ сделало возможным создание таких моделей, которые не могли быть реализованы на базе аналоговой техники или с помощью ручного счета. При этом стала очевидной и возможность решения огромного числа вариантов поставленной задачи.
После второймировой войны моделирование с использованием вычислительной техники применялось главным образом для решения военныхзадач:
-в военных играх;
-в исследованиях боевых операций;
-в испытаниях и исследованиях сложных системвооружения.
В тоже время постепенно моделирование находило все большее применение во всех невоенных областях человеческой деятельности:
-в физических и технических науках;
-в коммерческой деятельности;
-в медицине;
-в юриспруденции;
-в библиотечном деле;
-в социальных науках.
Было показано практически,что моделирование с помощью вычислительной техники применимо к любому предмету и явлению,которые могут быть описаны количественно и представлены в виде математических соотношений.
Комплексы разнообразной аппаратуры,связанные в единую целесообразно функционирующую систему посредством управляющей ЭВМ или действий обслуживающего персонала,можно встретить сегодня как на металлургических и химических предприятиях,так и в медицинских учреждениях или в исследовательских лабораториях.
Усложнение аппаратурывлечет за собой усложнение ее проектирования и производства.Нужно отметить, что организация деятельности многочисленных участников процесса разработки, упорядочение использования технологического и испытательного оборудования и т.д.превратилисьв ХХ веке в тяжелые системотехнические проблемы.
В настоящее время непрерывно растет число вновь создаваемых сложных систем.Это вызывается как потребностями, возникающими вследствие значительных трудностей осуществления процесса управления разросшейся экономикой, увеличением масштабов предприятий крупного производства, а также достижениями в области автоматизации и вычислительной техники.
Наиболее характерныеособенностисложных систем - это наличие большого количества разнородных элементов,объединенных в систему для достижения единой цели, сложные взаимно переплетающиеся связи, развитая система математического обеспечения, предназначенная для обработки огромных информационных потоков.
Сложные системы характеризуются множеством состояний. Каждоеиз них определяетсяконкретным наборомвходныхпараметров. Изменение входного состояния или значений параметров,характеризующих поведение отдельных элементов системы, приводит к изменению выходных параметров системы и ее состояний.
Множество параметров,характеризующих каждый из элементов и систему в целом, а также наличие сложных функциональных зависимостей между ними, затрудняет формализацию с целью описания поведения таких систем. На практике редко удается получить полное математическое описание поведение сложной системы в общем виде.
Уникальность и дороговизна сложных систем практическиисключает традиционные эмпирические методы их проектирования путем “доводки” аппаратуры на серии опытных образцов. В ряде случаев сложную систему вообще неуспевают испытать в течение всего периода эксплуатации.При этом проверка в аварийных ситуациях,как правило, оказывается вообще невозможна (АЭС в аварийных ситуациях).
Если вкачествевыхода изсоздавшегося положения использовать расчеты систем с привлечением ЭВМ, тоздесь,во-первых, приходится сталкиваться не только с неоднозначностью состояний систем,но и с их сложностью и нелинейностью.До уровня инженерныхрасчетов доводится обычно только анализ линейных стационарных или нелинейных безынерционных систем. Приходится идти на их упрощения. Обычно использование аналитическихметодов расчета выходных показателей системы позволяет понять ее закономерности разработчику. Однако для сложных систем возможностианалитических методов крайне ограничены сложностью математического описания узлов и блоков,а также достоверностью априорного определения факторов, которые наиболее существенно влияют на динамику исследуемой системы.
Во-вторых, частные данные (то есть, для отдельных состояний),получаемые в процессе длинных математических выкладок и вычислений, не имеют, к тому же, наглядной физической интерпретации. Это затрудняет:
-выявление первопричин окончательного поведения системы -может потребоваться проведение повторных аналитических выводов и расчетов;только полный объем вычислений по системе в целом характеризует ее исследуемый вариант);
-убеждение заказчика, не являющегося специалистом в области математических методов анализа, в эффективности предлагаемой системы.
Таким образом,при исследовании сложных систем как часто невозможен натурный эксперимент, так и крайне ограничены возможности аналитических и численных расчетов.
Выходом из создавшегося положения явилась организация натурных экспериментов составных частей создаваемой системы в тесной связи с экспериментами на ЭВМ с запрограммированной структурой исследуемой системы, называемой моделью.
Сочетание неполногонатурного эксперимента с экспериментом на указанной модели получило название опытно-теоретического метода испытаний сложных систем.
В основе этого метода - создание на ЭВМ модели системы, позволяющей не только получить выходные показатели,но и исследовать взаимные связи процессов, элементов и поведение сложной системы в различных условиях эксплуатации при изменяемых значениях параметров и переменных.
5.1.2. Основные определения
Термин “моделирование”имеет в литературе много различных толкований. Наиболее приемлемым на взгляд многих авторов является такое определение:
моделирование естьметод изучения системы путем ее замены более удобной дляэкспериментальныхисследований системой, называемой моделью и сохраняющей наиболее существенные черты оригинала.
И как дополнение можно использовать следующее определение:
моделирование есть общий метод изучения объекта путемисследования замещающей егомоделис переносом получаемой информации на изучаемый объект.
Отправной точкой при построении модели технической системы следует считать описание.
Описание - совокупность сведений об исследуемой системе и условиях, при которых необходимо провести исследования.
Описание представляется в виде:
-схем;
-текстов;
-формул;
-таблиц экспериментальных данных;
-характеристик внешних воздействий и окружающей систему внешней среды.
Описание задаетпредполагаемыйалгоритм работы системы и может формально рассматриваться как некоторая функция внешних воздействий.
В качестве примера можно без достаточной детализации рассмотреть описание модели системы распознавания речи.
Здесь, во-первых,исходя из того,что описание - это сведения о системе и условиях ее применения, нужно более точно определить систему распознавания речи, Например:
“Система распознавания речевых команд управления подъемом стекол автомобиля в процессе его эксплуатации”.
Для такой системы описание модели должно включать:
-схему речевого аппарата человека и теоретические положения речеобразования;
-описание условий речевого управления (шумы двигателя, шумы окружающей среды и т.д.);
-характеристики микрофона, как датчика сигналов, воспринимающегокоманду (зависимостьвыходных сигналов от звукового давления во всем диапазоне частот, например, в виде таблиц);
-характеристики сигналов управления (мощность, направленность, удаленность от микрофона);
-характеристики канала приема электрических сигналов на входе преобразователя “аналог-цифра” компьютера (чувствительность, дискретность, точность и т.п.);
-математические зависимости, применяемые для обработки принятого сигналас целью получения признаков распознавания и классификации;
-способпреобразования результатов распознавания в команды управления;
-характеристики канала передачи команд управления;
-требования к величинам сигналов управления двигателями подъема стекол.и т.д. и т.п. )
Модель воспроизводит описание системы с большими или меньшими упрощениями, зависящими от намерений исследователя,возможностей вычислительных средств, имеющихся в его распоряжении и времени, отпускаемого на проведение испытаний.
При этом должен достигаться разумный компромиссмеждуточностью воспроизведения моделью характеристик системы и сложностью необходимых для этого мер и средств.
Другими словами (основываясь на рассмотрении описания системы как функции внешних воздействий) ,при моделировании производится аппроксимация функции-описания более простой и удобной для машинного представления функцией-моделью.
Аналогия междупостроением модели и аппроксимацией позволяет использовать для наглядности представлений аппроксимацию функции w(x) на некотором отрезке [a,b] линейной комбинацией
Здесь - модель функции-описания w(x) характеризуется
n параметрами (числовыми коэффициентами ai );
ji(x) - некоторые возможные простые функции, заданные на том же отрезке [a,b].
Теперь, исходяиз характеристикимодели(см. выше положение о том, что модель воспроизводит систему с упрощениями),варьируя параметрами ai, необходимо получить наилучшее или удовлетворяющее исследователя (в некотором смысле) приближение функции-модели к функции-описанию.
Обычно для оценки точности описанияимодели пользуютсяболее удобной для вычисления мерой
где Qw -скалярный показатель, который намереваются получитьпри исследованиисистемы (например,производительность, надежность, пропускная способность); Qm - скалярный показатель,соответствующий Qw, но полученный при анализе модели m.
При этом описание w(x) и модель m(x) отождествлены с векторами w и m некоторого многомерного пространства.
Если при этом описание полностью характеризует систему и еесостояния и существует некоторое взаимно-однозначное преобразование
и
то модель и система (в крайнем случае ее описание) изоморфны.
При выполнении только второго соотношения, то есть при отсутствии обратного преобразования, имеем дело с гомоморфностью.
Л Е К Ц И Я 5.2
Моделирование сложных систем и применение моделей
5.2.1. Принципы построения модели сложной системы
а) Принцип декомпозиции
Прежде всего исходим из того очевидногоположения,что сложные системыможно разбить на подсистемы и элементы с иерархической структурой связей.Тогда каждая подсистема, решая конкретную задачу, обеспечивает тем самым достижение общей цели.
С этих позиций,к особенностям сложной системыследует отнести такие:
1)Сложную систему можно расчленить на конечное число подсистем, а каждую подсистему,в свою очередь,- на конечное числоболее простых субподсистем до тех пор,пока не получим элементы системы (под элементами системы следует понимать объекты, которые в условиях данной задачи не подлежат расчленению на части).
2)Элементы сложной системы функционируют во взаимодействии друг с другом.
3)Свойства сложной системы определяются не только свойствами отдельных элементов, но и характером взаимодействия между ними.
На практике стремятся расчленить сложную систему натакуюсовокупность подсистем,которая наилучшимобразомотражала бы работу и функциональное взаимодействиеееэлементов. В этом случае и строгое физико-математическое описание становится более доступным.
Использование принципа декомпозиции систем на подсистемы, подсистем на элементы позволяет создать модель сложной системы путемразработки для простых физически элементов их математическое описание и соответствующий алгоритм.
Практическая реализация этого принципа предполагает,что специалисты, изучающие процессы в каждом конкретном элементе,способнына основе экспериментальныхи теоретических исследований разработать модели всех элементов и достичь при этом точности,котораянеобходима для оценки характеристик работоспособности каждого из этих элементов в условиях штатной эксплуатации.
Например, выделивв качестве отдельного элемента системы двигатель постоянного тока,даем возможность специалистуформировать его описание. Так из теории систем автоматического регулирования для такого двигателя описанием является система дифференциальных уравнений
или после упрощения и преобразований
где
Таким образом субблоки,блоки, элементы сложной системы или удается описать математически с достаточной степенью точности длярасчета ихтекущих состояний,или в результате специальных экспериментальных исследований получить совокупность числовых данных дляописания указанныхсостояний.Эти числовые данные могут быть как непосредственно использованы при компьютерной реализации соответствующих блоков в виде таблиц,описывающих реакцию этих блоков на входные воздействия, так и в виде заменяющих упомянутые таблицы аппроксимирующих их зависимостей.И в том и в другом случаях программирование не вызывает трудностей.
Так или иначе декомпозиция системы,о которойидет речь,дает возможностьспециалистам создатьпрограммнореализуемые алгоритмы функционирования блоков, субблоков, элементов.
Отсюда совокупностьмоделирующих алгоритмов блоков,субблоков, элементов, разработанных указанным способом, с учетом ихвзаимодействия определяют алгоритм модели всей системы в целом.
Примерами декомпозиции при создании модели системыраспознавания заболеванийвнутренних органов человека могут быть варианты разбиения ее на элементы и блоки компьютернойсистемы, построеннойнаоснове ультразвуковой медицинской диагностики. Структурная схема одного такого варианта при достаточно поверхностной декомпозиции представлена на рис. 5.2.1.
Модель ультразву-
кового локатора,
являющегосяос- ультразвуковом новным элементом
диапазоне волн аппарата УЗИ
Модель алгоритма
обработки изображе-
ний внутреннего ор-
гана
Модель алгоритма
анализа и принятия
решения
Рис 5.2.1. Структурная схема варианта декомпозиции системы распознавания
Более детальная декомпозиция позволяет представленные блоки расчленить на субблоки и элементы.Так , например, могут быть детализированы первые два из блоков рассмотренной схемы (Рис.5.2.2).
Точно также могут быть подвергнуты декомпозиции и другиемодули структурной схемы, приведенной на рис.5.2.1. В результате появляется возможность для узкихспециалистов на основе физико-математического описания разработать алгоритмы их и затем комплексировать в общий алгоритм модели системы.
а) Принцип допустимых упрощений
В большинстве случаев, однако, общий алгоритм модели, полученный в результате декомпозиции системы,разработки специалистамиалгоритмов элементов и их связей и последующего объединения,является
Модуль описания Модуль описания
геометрической возможных поло-
формы внутрен- жений потологи-
него органа ческих образо-
ваний в органе
Модуль описания Модуль описания
положений функцио- геометрических
нальных элементов характеристик
внутреннего органа потологических
образований
Модуль выбора
условий наблюде-
ния внутреннего
органа (сечение)
Модуль описания
звукодинамичес-
ких свойств се-
чения органа
Ìîäóëü îïèñàíèÿ Ìîäóëü îïèñàíèÿ Ìîäóëü îïèñàíèÿ
çâóêîäèíàìè÷åñ- çâóêîäèíàìè÷åñ- çâóêîäèíàìè÷åñ-
êèõ ñâîéñòâ ïà-êèõ ñâîéñòâ êàæ- êèõ ñâîéñòâ ïà-
òîëîãè÷åñêèõ äîãî èç ôóíêöèî- ðåíõèìû âíóòðåí-
îáðàçîâàíèé íàëüíûõ ýëåìåíòîâ íåãî îðãàíà
Модуль формирования ультазвуково-
го изображения сечения органа
на модель алгоритма обработкиизображений
Рис.5.2.2. Структурная схема декомпозиции модели отражающих свойств иультразвукового локатора
только исходным и его еще нельзя положить в основу создания рабочей модели системы.Это определяется его громоздкостью,а также плохой согласованность с вычислительными ресурсами и с требованиями кмодели системы.
Такие возможные недостатки исходного алгоритма модели вытекают из различия целей моделирования отдельных элементов и сложной системы вцелом.
Причина различия целей состоит в том, что специалисты, разрабатывающие алгоритмы элементов,стремятся к тому, чтобы отразить характеристики этих элементов с максимальной точностью. В результате алгоритмы моделей элементов могут оказаться достаточно сложными, а в итоге
-непомерно возрастает время счета одной реализации функционирования системы в целом;
-уменьшаетсяобщее число модельных экспериментов (реализаций) при общем ограничении времени на испытание сложной системы.
И это при том, что всегда существуют более простые реализации элементов по сравнению с предложенными “сходу”.К тому же с точки зрения влияния на конечную точность моделированиясистемывклады отдельных элементов могут оказаться несущественными,а значит сами описания алгоритмов их функционирования могут допускать упрощения.
Поэтому модель системы в целом должна строиться на основе компромисса между ожидаемой точностью оценок конечногопоказателяи сложностью самой модели.
Отсюда путь к созданию рабочей модели системы - поиск компромиссных решений. В основе его лежит анализ допустимых упрощений как исходных алгоритмов моделей элементов, так и алгоритмов их взаимодействия.
При создании рабочей модели системы (разработке алгоритма модели) методики анализа возможных упрощений бывают самыми разными, но смысловое содержание их состоит в том,чтобы обеспечить системные расчеты в отведенное время и достичь при этом заданной точности конечногопоказателя (например,эффективности для систем распознавания). Естественно, что указанный анализ, направленный на исключение, замену отдельных блоков и субблоков или их корректировку должен предполагать:
-более углубленное аналитическое изучениеи представление работы физического аналога;
-экспериментальные исследования физического аналога.
Решения по упрощению многообразны. Все они специфичны и не поддаются обобщению. При этом наиболее конкретная рекомендация по замене может быть дана лишь в отношении блоков,осуществляющих воздействие на исследуемую часть системы.Только в этой ситуации блоки можно однозначно заменить упрощенным эквивалентом, не зависящим от указанной исследуемой части системы. Само собой разумеется,что если при заменах и корректировках не нарушается функциональное взаимодействие блоков и субблоков,то схема сопряжения их в общей модели остается без изменений.
При заменах блоков упрощенным эквивалентом отказываются от точного описания
-либо на основе отдельных исследований на самостоятельной модели (говорят: ”частной” модели) воздействий, данного блока на систему и выбора в качестве замены нового блока формирующегореализациинаихудшего воздействия;
-либо при достаточно большом числе факторов, определяющихвоздействие,выбором в качестве замены нового блока, формирующего случайное воздействие с заданными характеристиками.
Если, например, в состав некоторой сложной системы входит автоматический электронный измеритель некоторой величины,используемой блоками этой системы, то приходится иметь дело с неизбежными ошибками измерений. Причины ошибок здесь - наличие электронных шумов, вызываемых:
-неравномерной эмиссией электронов (так называемый “дробовой шум) в электровакуумных приборах;
-неравномерностью процессов генерации и рекомбинации носителей тока в полупроводниковых приборах.
При построении модели указанного измерителя возможны:
1)Строгоефизико-математическоеописание указанных неравномерностей движения носителей тока и их влияния на измеряемую величину ("модель с точностью до носителя").
2)Экспериментальная оценка максимальной ошибки измерения интересующегопараметра и замены точного блока всего лишь имитатором постоянной величины максимально возможной ошибки, добавляемой к измерениям.
3)Экспериментальные статистические исследования ошибок измерителя, получение закона распределения вероятностей ошибок и замена точного блока на блок генерации случайных ошибок с заданным законом распределения, добавляемых к “чистым” измерениям.
В техническихприложениях моделирования ни "точность до носителя", ни имитация максимальных ошибок не являются удовлетворительным решением. Третий подход к решению задачи встречается наиболее часто. Это связано, особенно в электронике, с наличием большогочисласлучайных воздействий.Это и каналы связи со случайными шумами. Это и ошибки измерений, носящие случайный характер.Это и точности изготовления деталей и т.д. и т.п.
Отсюда следует,что при соответствующихзаменах блоковкаждый эксперимент на системной модели должен носить случайный характер.
5.2.2. Моделирование сложных системи опытно-теоретический метод их испытаний
Рассмотрение историивопроса появления и развития моделирования показало, чтоцель создания любой модели - испытания некоторой системы.При этом сегодня речь идет о компьютерной реализации и испытаниях модели системы в условиях,которые или невозможно, или достаточно дорого создать для проведения натурных испытаний реальнойсистемы, или это сопряжено с большими временными затратами.
В то жевремяиз проведенногорассмотрения отличий модели от представляемого ею объекта (процесса, явления) следует, что полностью положиться на результаты моделирования, выступающего в качестве единственного источника получения характеристик указанного объекта (процесса, явления) не представляется возможным.
Отсюда логически вытекает необходимость сочетания моделирования и натурных испытаний для совместного получения показателей соответствующей системы. Соответствующий метод и получил название опытно-теоретического.
Здесь необходимо заметить:когда речь идет о натурных испытаниях системы, подразумевают натурные испытания ее элементов или сокращенного, упрощенного варианта.В противном случае пришлось бы создать систему в целом,не зная заранее,как она будет выполнять те или иные задачи.А если при этом система окажется неспособной выполнить свое назначение изатраты нецелесообразными?Но система создана?!В связи с этим и цель опытно-теоретического метода - избежать нецелесообразных затрат, используя сочетание экспериментальных данных в ограниченном объеме и моделирования - во всей области факторного пространства функционированиясистемы.
Суть опытно-теоретическогометода, обязательнопредполагающего создание модели системы, сводится к выполнению следующих положений:
1)Получениедля одних и тех же условий достаточного количества реализаций показателей функционирования системы или ее отдельных блоков в натурных испытаниях и на модели.
2)Проведениепараметрической доработки модели на основе сравнения результатов натурных экспериментов и моделирования,если структура модели удовлетворительна.
3)Проведение структурной перестройки модели, дополнительный учет отдельных факторов,дополнение связей при наличииостаточной разности междувыходными характеристиками после попытки параметрической доработки.
4)Проверка статистической совместимости модели и системы в ряде целенаправленно выбранных точек факторного пространства.
5)На основе выполненной калибровки модели (пункты 1-4) распространение результатов испытаний системы с помощью моделирования на всю область факторного пространства.
Таким образом достигается сначала изоморфность модели и системы, а затем оценка этой системы на модели во всех возможных условиях функционирования.
Упомянутый при этом отказ от создания системы в целом,замена ее испытаний на испытания отдельных узлов, модулей,составляющих и т.п. отражается на построении модели системы. Дело в том, что некоторые результаты испытаний могут позволить,например,отдельные составляющие системы не моделировать, описывая соответствующие физические процессы, не искать для них точных математическихописанийдля реализации,а воспользоваться полученными экспериментальными данными. Так, можно не моделировать уходы параметров отдельных электронных иэлектромеханических устройств, приводящие к их отказам, если в результате испытаний получены характеристики надежности этих устройств (вероятностьбезотказной работы в течение рабочего цикла, наработка на отказ, время безотказной работы). То есть, натурные испытания могут явиться основанием для упрощения модели при сохранении ее изоморфности системе.
Рассмотренный путь упрощения - неединственный.Во-первых, уже упомянутыйнами компромиссный характер создания модели системы (между точностью и возможностью реализации) дает вотдельныхслучаях такие основания.Тогда,как уже упоминалось можно отказаться от некоторых деталей моделирования.Во-вторых, задачи, ставящиеся перед моделью могут быть различными: оценка функционирования системы, оценка взаимодействия системы с другими сложнымисистемами, оценкахарактеристик системы во всем диапазоне условий функционирования и т.д. Это приводит к тому, что при испытаниях сложных систем имеют дело не с одной единственной моделью.Так по своему назначению модели делятся на частные и системные.
Частные модели- это модели отдельных частей системы (подсистем, узлов, агрегатов), позволяющие при высокой точности моделирования этих частей получитьисходные данные для использования в системной модели.В результате системная модель небудетперегружена соответствующими частными задачами, то есть, упроститсяи сможет стать реализуемой в приемлемое время (например, в реальное время),с приемлемым быстродействием и в допустимом объеме.
Системные модели включают в свой составэлементы,отражающие в той или иной степени работу всех частей системы или напрямую используют отдельные части системы.Они позволяют получить показатели качества всей системыв целом.А так как таких показателей может быть несколько, то и системных моделей может быть несколько. При таком разделениифункций исчезает сложность разрабатываемых моделей. Этим, в частности, объясняется деление системных моделей нафункциональныеи комплексные. Иесли функциональные модели предназначаются для испытаний функционирования сложной системы в различных ситуациях,то комплексные обеспечивают:
-отработку и отладку программного обеспечения сложной системы;
-оценку характеристик отдельных средств и получение исходных данных для полной оценки системы.
Л Е К Ц И Я5.3
Метод статистических испытаний
(метод Монте-Карло)
5.3.1.Основное определение
Из рассмотренияпринципов построения моделей сложных систем следует, что при упрощениях модели и замене блоков, описывающих, как правило,воздействия на систему и ее части, эксперимент на системной модели сложной системы достаточно часто приобретает случайный характер.Случаен всилу этого и выходной эффект системы от запуска модели к запуску.Для проведения моделирования в таких условиях наиболееприемлемымявляется метод моделирования,основанный на статистических испытаниях, так называемый метод Монте-Карло.
Приемлемость указанного метода обусловливается тем, что
1)расчет оценок выходных параметров осуществляется с использованием достаточно простых алгоритмов обработки.
2)просто и точно определяется необходимый объем моделирования из условия достижения заданной точности оценок выходных показателей.
3)методика организации экспериментов на модели достаточно проста и хорошо программно реализуема.
В этом легко убедиться на простых примерах. А пока рассмотрим определение.
Метод статистических испытаний (метод Монте-Карло) состоит в решении различных задач вычислительной математики путем построения для каждой задачи случайного процесса с параметрами, равными искомым величинам этой задачи..
Рассмотрим простейшие примеры.
А. Пусть необходимо определить вероятность Pч того, что суммарное число попаданийпри стрельбев“десятку” мишени при 10 выстрелах - четно.
Известно, чтоесли вероятностьпопадания в “десятку” при одном выстреле равна p , то искомая вероятность согласно биномиальному закону распределения вероятностей вычисляется так:
Здесь -число сочетаний из 10 по 2k.
Если предварительно подсчитать всечисласочетаний при k=0…5 или использовать готовую таблицу сочетаний, то вычисления Pч по указанной формуле потребуют 26 операций.
Вместо такогорасчета можно было бы экспериментально выполнить N серий стрельб по 10 выстрелов и определить из их числа количествосерий nч , в которых число попаданий в “десятку” - четное. Тогда при достаточно большом N имеем
Однако при таком подходе для получения достоверными в оценке Pч двух знаков после запятой потребуетсяоколо 10 000 серий по 10 выстрелов.
Оказывается, что ЭВМ позволяет выполнить решение указанной задачи третьим способом.
Как известно многие языки программирования имеют в составе стандартных функций датчик случайных чисел, позволяющий формировать случайную последовательность равномерно распределенных чисел на интервале [0,1].
Поэтому вместовыстрела по мишени достаточно выбрать из датчика указанное число со значением x и проверить выполнение неравенства x
Если оно выполнено, то это соответствует попаданию в “десятку” с вероятностью p. Покажем это.
Действительно вероятность попадания случайной величины в интервал [0;p] равна
где w(x) - плотность распределения вероятности
В нашем случае имеем дело с равномерным распределение на единичном интервале, то есть w(x) = 1. Поэтом P0;р= p.
Выбираем теперь серии из 10 чисел x. Если при этом число “попаданий” (выполнения неравенства x
При N таким образом имитированных серий получим также,как и в прямом эксперименте со стрельбами
Однако в отличии от этого прямогоэкспериментарезультат будет получен здесь на современной ЭВМ не более чем за 10 с.
Таким образом задача в рассмотренном случае была решена (согласно определению метода Монте-Карло) путем построения случайной последовательности с параметром,равным искомой величине Pч. Этапоследовательность была построена следующим образом:
-формирование на первом этапе равномерно распределенной последовательности на интервале [0,1] ;
-формирование на втором этапе новой случайной последовательности (N серий) группировкой полученных на первом этапе значений в серии по 10;
-формирование на третьем этапе искомой случайной последовательностипутемвыборки из последовательности серий второго этапа размера N таких,в которых неравенство x
Количество серий третьего этапа формирования и определяет частость
которая при N®¥стремится к искомой величинеPч .
Б.Еще один пример, но из области непосредственного применения метода Монте-Карло к вычислению интегралов.
Пусть необходимо вычислить
При этом будем считать, что0<=x<=1 и 0<= g(x) <=1 , то есть вся функция лежит в единичном квадрате.
Такое ограничение не влияет на общность задачи, так как любой интеграл заменой переменныхи изменением масштаба может быть приведен к рассматриваемому.
Y
1
y = g(x)
x
1
Рис.5.3.1.
Будем рассматривать две области на плоскости (x,y)
W - область, заданная неравенствами
0<= x <=1
0<= y <=1
w - область, ограниченная кривой y = g(x) иординатами x=0 и x = 1.
Площадь областиW равна единице S1=1, а площадь областиwS2 = I.
Зададим в области W равномерное распределение случайных точек. Это означает, что вероятность попадания точки с координатамиxi,yi в область W равна1,а в некоторую часть этой области - пропорциональна площади этой области независимо от ее расположения внутри W.
Плотность заданного распределения вероятностей f(x,y) = 1
Ïîýòîìó âåðîÿòíîñòü ïîïàäàíèÿ òî÷êè â îáëàñòü wðàâíà
Таким образом,I = S2.
Если теперьмы располагаемвозможностьюимитировать случайные точки с координатами xi, yi в соответствии с заданной плотностью, то после Nиспытаний, подсчитав число тех из них (m), которые попали в область w, получим частость
Вспоминаем, что частота при N®¥ стремится к истинному значению, а в качестве приближенного значения интеграла следует использоватьуказанную частоту.
Подводя итог рассмотренному примеру с точки зрения введенного определения метода Монте-Карло, отметим, что
-решаемая задача относится к области вычислительной математики;
-для решения задачи формировалась случайная последовательность чисел как выборка значений изпоследовательностис равномерной плотностью распределения вероятностей, попадающих в областьw;
-искомаявеличина определялась как отнесение числа попаданий в область w к общему числу экспериментов.
Рассмотренных примеров уже вполне достаточно для того,чтобы пояснить данное в начале определение метода статистических испытаний.В то же время следует иметь в виду , что существует большое многообразие задач,для которых метод Монте-Карло является плодотворным, позволяя достигать инженерногорезультата там,где аналитические методы либо сложны,либо не дают ответа. В этом аспекте необходимо отметить такие области применения, как
-многомерные интегралы;
-теория обнаружения сигналов;
-обращение матриц и решение систем линейных алгебраических уравнений;
-некоторые краевые задачи;
-нахождение собственных значений исобственныхфункций и др.
5.3.2.Принципы получения случайных величин на ЭВМ
Датой рождения метода Монте-Карло принято считать 1949 г ,когда в американском журнале ассоциации статистиков появилась статьяМетрополиса иУлама“ МетодМонте-Карло”.Создателями метода считают Дж.Неймана и С.Улама. В Советском Союзе первые статьи о методе относятся к 1955-1956 годам.
Теоретические основы метода Монте-Карло известны уже давно. Более того, некоторыезадачи статистики решались с использованием случайных выборок, то есть,фактически этим методом.Но таккак моделировать случайные величины вручную - очень трудоемкая работа, широкое применение метода началось с появления вычислительных машин.
Само название“Монте-Карло” происходит от названия города в княжестве Монако,знаменитого своими игорными домами.Все дело здесьв том, что одним из простейших механических устройств для получения случайных величин является рулетка.Простейшая схемаее -вращающийся диск с цифрами,резко останавливающийся для определения цифры, на которую указывает неподвижная стрелка.
Пуская иостанавливая рулеткуиобъединяя получаемые в каждом пуске цифры в группы заданного размера (например, пять), можно составить таблицуслучайных цифр (в случае примера группирования - пятизначную). Таблица эта носит название таблицы случайных чисел, хотя правильнее было бы назвать ее таблицей случайных цифр.Самая большая такая таблица (RAND Corporation, 1955 г) содержит 1 000 000 цифр.
Составление таблиц случайных чисел - не такая простая задача. Если мы хотим иметь хорошую таблицу,то придется при разработке ее тщательно проверять,таккак любоефизическое устройство вырабатывает случайные числа отличающимися по распределению от равномерного.
Ну, а используются такие таблицы либо для ручного счета,что сегодня - редкость,либо при машинном применении приходится поступаться тем,чтопри вводесоответствующий файл потребует большой памяти в ущерб решаемым при этом задачам.
Для устраненияэтого недостатка казалось бы легче подключить рулетку к ЭВМ.Однако ясно, что быстродействие такого комплекса генерации случайных чисел будет исключительно низким. Поэтому в качестве генераторов случайных величин чаще используются шумы в электронныхлампах. Например, здесь может быть предложен следующий алгоритм. Если за некоторый фиксированный промежуток времени Dt уровень шума превысил заданный порог четное число раз, то в разряд некоторого числа записывается единица, если нечетное - ноль.
Так как количество такого рода генераторов выбираютравнымколичеству разрядов упомянутого числа в ЭВМ, то во все эти разряды будут записаны нули и единицы. Каждый такт такой логической проверки всех генераторов дает одно полноразрядное число,равномерно распределенное в интервале [0,1].
Недостатки этого метода генерации:
1)Возможны неисправности электронных генераторов шума, приводящие к пропаданию равновероятности нулей и единиц,что требует постоянных проверок и ремонта.
2)Невозможно повторение случайной последовательности чисел, полученной в одном эксперименте, для проверки работыпрограммы ЭВМ.
Поэтому такого рода датчики применяются в специализированных ЭВМ для решения задач методом Монте-Карло.
Для универсальныхЭВМ такие датчики - слишком дорогостоящее оборудование,так как в таких ЭВМ прибегают к расчетам сиспользованием случайных чисел достаточно редко.Но чтобы не исключить полностью такую возможность здесь лучше использовать так называемыепсевдослучайные числа.
Генерация псевдослучайных чисел осуществляет сама машина всоответствии со специальными стандартными функциями, предусматриваемыми в ее математическом обеспечении.
Можно вообще не интересоваться, как эти числа получаются. Указанные стандартные функции неоднократно проверяются разработчиками и качество их гарантируется.Однако самапостановка вопроса“получение псевдослучайных чисел” на ЭВМ вызывает недоумение. Ведь все, что делает машина,должно быть заранее запрограммировано.Поэтому хотелось бы понимать,откуда появляется случайность. Кроме того, без понимания особенностей псевдослучайных последовательностей, хотя бы поверхностного, трудно говорить иногда о их разумном использовании.
Что же такое псевдослучайные числа?
Числа, получаемые по какой-либо формуле и имитирующие значения случайной величины, называются псевдослучайными.
Под словом “имитирующие” подразумевается,что эти числа удовлетворяют ряду требований так, как если бы они были значениями случайной величины.
Первый алгоритм для получения псевдослучайных чисел был предложен Дж.фон Нейманом в 1951 г.Он получил название метода середины квадратов..Существо его заключается в следующем.
Пусть задано произвольное 4-значное целое число n1= 9876.
Возведем его в квадрат и получим 8-значное число n12=97535376.
Выберем 4 средние цифры из этого числа и обозначим n2= 5353.
Затем снова возведем его в квадрат n22 =28654609и выберем4 средние цифры. В результате получим n3=6546.
Продолжая указанные рекуррентные действия будем иметь
n4 = 8501; n5 = 2670; n6 = 1289 и т.д.
В качестве псевдослучайных значений предлагалось использовать
gк = 10-4 *nк ,
то есть:
0.9876; 0.5353; 0.6546; 0.8501; 0.2670; 0.1289 и т.д.
Таков самый простой алгоритм, обладающий отдельными недостатками, на которых не будем задерживать внимание. Главное то, что они заставили в последующем обратиться к более сложным алгоритмам. Но схема получения псевдослучайных чисел осталась фактически неизменной:очередное значение получается из предыдущего или предыдущих.
Рассмотрение теории вопроса и других алгоритмов не входит в планы нашего курса, но нам необходимо знать один важный вывод изсоответствующих разделов, имеющий практическое значение:
рекуррентно получаемые псевдослучайные последовательности обладают периодом, величина которого зависит главным образом от разрядности представления чисел в машине.
С точки зрения теории вероятностей - это плохо. Однако там, где длины генерируемых последовательностей удовлетворяют потребителя, появляется такое достоинство как возможность отработки программного обеспечения сложных систем при одних и тех же последовательностях.
Ну, а рекуррентность получения псевдослучайныхпоследовательностей и определенный период позволяют повторять генерацию последовательности любое число раз,что невозможно для физических датчиков случайных чисел и что так важно для отладки специфических программ.
В целом достоинства методов получения псевдослучайных чисел заключаются в следующем:
1) на получение каждого числа затрачивается всего несколько простых операций, в результате чего скорость генерирования случайных чисел имеет тот же порядок, что и скорость работы ЭВМ.
2) программы получения псевдослучайных чисел чрезвычайно компактны в силу простоты рекуррентных соотношений.
3) любое псевдослучайное число может быть легко воспроизведено.
4) последовательностьпсевдослучайныхчисел достаточно один раз аттестовать, а затем постоянно использовать в сходных задачах без опасения изменения характеристик.
Л Е К Ц И Я 5.4
Метод статистических испытаний
(продолжение)
5.4.1. Моделирование независимых случайных событий
Возможность генерации псевдослучайных чисел, равномерно распределенных на интервале [0,1], открывает широкие возможности для статистического моделирования вообще во всех его приложениях.
Наиболее важным в задачах статистических испытаний представляется моделирование независимыхслучайных событий.Здесьсущество задачи состоит в том,что необходимо воспроизвести случайное событие А, наступающее с вероятностью p.
Если для этоговоспользоватьсяквазиравномернойпоследовательностью, то интересующая вероятность в общем виде может рассматриваться как результат интегрированиясоответствующей плотностираспределения вероятностей
гдеz - некоторый пока неопределенный предел;fрр(x)- плотность вероятностей равномерно распределенных чисел.
Но для равномерного распределения на интервале [a,b] имеем
Для чисел равномерных на интервале [0,1] будем иметь
fрр(x)= 1 и соответственно
Отсюда очевидноz = p.
Тогда понятно, что реализация события А с вероятностью p осуществляется тогда,когда равномернораспределенныечисла на интервале [0,1] попадают в его часть [0,p].
Следовательно, процедура моделирования появления случайного события А должна состоять в генерации случайных чисел R4i0 и сравнении их с величиной p : Ri <= p
Выполнение неравенства соответствует наступлению события А.
Рассмотренные соображенияраспространяются на моделированиеполной группы событий. A1,A2,…,Am , наступающих с вероятностями p1,p2,…,pm, для которых естественно определено:
p1 + p2 +…+ pm = 1.
Здесь, используя ту же квазиравномерную последовательность, можем записать условия наступления любого события As из представленной группы:
Тогда действительно:
что и требовалось доказать.
Процедура моделирования появления событий As (s=1,m) состоит в рассмотренном случае в генерации последовательности Ri и проверки попадания ее в интервалы
Исходом испытания при этом будет появление того события As, номеру которого соответствует выполненное неравенство, а значит интервал.
5.4.2. Способы получения случайных чисел с заданным законом распределением
Основным соотношением,связывающим случайные числаSi,имеющие заданный закон распределения f(x), и числа Ri, равномерно распределенные на интервале [0,1], является:
Доказательство справедливости этого соотношения следует из того факта, что
где F(x) - интегральная функция распределения вероятностей,являющаяся однозначной функцией своего аргумента.
При этом F(x) изменяется от 0 до 1 при изменении x от -¥ до+¥.
Таким образом, дляаргумента, лежащего в интервале -¥ Возвращаясь
к исходному выражению заметим,
чтодля
получения числа, принадлежащего совокупности {Si}, имеющей
плотность распределения f(x), необходимо приведенное уравнение разрешить
относительно Si . Пусть, например, требуется получить
случайные числа с экспоненциальным законом распределения В силу
приведенного соотношения преобразования имеем Интегрируя, получим Отсюда Понятно, что генерация
равномернойпоследовательностизначений в интервале [0,1] и подстановка их в
полученное выражение обеспечивает генерацию случайнойпоследовательностис
экспоненциальным законом распределения вероятностей. При попыткепреобразования равномерного распределения в
заданное может оказаться, что разрешить уравнение относительно Si,как это
проделано в примере, весьма трудно. Это случается, например,когда интеграл от f(x) не выражается
черезэлементарные функции или когда
плотность f(x) задана только графически. В такой ситуации для преобразования
используется метод Неймана. Условия
для его реализации: случайная
величина x может быть определена на интервале [a,b]; плотность
распределения вероятностей f(x) на интервале [a,b] ограничена f(x) <= Mo. Разыгрывание (генерация) значений
x,распределенных с плотностью
вероятностей f(x), осуществляется следующим образом: 1)Генерируем два
случайных значения R1 и R2 величины равномерно
распределенной на интервале [0,1] и получаем случайную точку на графике f(x) с
координатами x’ = a + R1*(b - a) y’ = R2* Mo Mo
y’ Г
a x’ b x
Рис.5.4.1.
2)Если полученная точка лежит под кривой y=f(x), то полагаем, чтопервоезначение случайнойвеличины,соответствующей плотности распределения вероятностейf(x) равно
x1 = a + R1*(b - a) = x’
Если же полученная точка лежит над кривой y =f(x),то пара случайных чисел R1 и R2 отбрасывается, выбирается новая R3 и R4 и операции пп.1,2 повторяются.
Случайные числаxi, полученныетаким образом,имеют плотность распределения вероятностей f(x).
Получение случайныхвеличин, плотностьвероятностейкоторых - нормальный закон, имеет свои особенности.
Основное уравнениепреобразованияв этом случае имеет следующий вид:
В явномвиде ононеразрешимо.Поэтому приходится использовать другой путь.Так согласно центральной предельной теореме теории вероятностейизвестно,что нормальныйзакон распределения возникает во всех ситуациях, когда случайная величина может быть представлена в видесуммыдостаточно большого числа независимых (или слабо зависимых) элементарных слагаемых, каждое из которых в отдельности мало влияет на сумму.Это дает возможность приближенно моделировать нормальную плотность распределения вероятностей суммированием чисел, равномерно распределенных на интервале [0,1]:
a =g1+ g2+ .....+gn
Эта сумма асимптотически нормальна с МО и с СКО
Но для равномерной плотности распределения
,
Значит
,
Тогда, если i-ое значение нормальной случайной величиныa соответствует i-муэксперименту суммирования n равномерно распределенных чисел, то
ai =gi1+ gi2+ .....+gin
Значит, получение нормально распределенной последовательности {Si} с математическим ожиданием mз и СКО - sз осуществимопутем нормирования иперемасштабирования последовательности {ai},то есть, приведения ее к заданным числовым характеристикам:
Л Е К Ц И Я 5.5
Модель системы распознавания образов
Теперь после изложения общих представлений о моделировании вообще можно перейти к построению моделей конкретных систем - системраспознавания образов. Поэтому начнем с того, что определим в первом приближении цель моделирования систем распознавания.
Цель компьютерного моделирования систем распознавания - их исследовательские испытания для оценки эффективности распознавания в приемлемые срокииво всем факторном пространстве представления объектов (явлений, процессов) и возможностей измерителей их характеристик.
Можно было бы предположить, что такое определение касается только сложных СР, в составкоторыхвходят многочисленныеиразнородные средстваизмерений или на информационной основе которых строятся сами системы распознавания. Для таких систем не вызывает сомнения необходимостьприменения опытно-теоретического метода испытаний. Поэтому для них и должна идти речь о сроках ифакторном пространствеприменения СР.То есть, к компьютерному моделированию прибегают чаще всего постольку,поскольку не могут в приемлемое время провести натурные испытанияСРво всем факторном пространстве поведения объектов (явлений, процессов) и измерителей их характеристик.
И далее,казалось бы, что системы распознавания, для которых натурныеиспытаниядостаточно дешевы,а способы моделирования входных воздействий достаточно сложны и неясны,не следует вообще и моделировать. Кажется, что все можно получить в эксперименте.
Если задатьсяцелью, томожно найти настолько простые системы.
Однако в большинстве случаев кажущаяся простота идешевизнанатурных экспериментов(испытаний) при неопределенности методов построения моделей входных воздействий скрывает от испытателяхарактеристикифакторного пространства состояния и поведения объектов распознавания. При этом не удается определить фактическую эффективность, а оцененное значение ее только успокаивает (“ведь оценка получена!”),так как, к сожалению, характеризует только какую-то неопределенную часть факторного пространства,о которой могут быть лишь качественные суждения, а чаще всего и ошибочные.
Поэтому независимо ни от чего попытка разработки изоморфной моделиуже ведет к получению дополнительной информации для создания более эффективных систем или для четкого определения области применения созданной системы распознавания.
Отказ отэтого подходаприводит к тому,что легко реализуемые экспериментальные применения системы часто не позволяют объяснить причины неожиданно появляющихся отрицательных результатов. И только более полный анализ поведения объектов (явлений,процессов)распознавания, измерителейих характеристик и сопутствующих искажений (что входит в задачи создания соответствующих моделей) выводит из тупиковойситуации, если, конечно, она расценена как тупиковая.
Решение задач построения компьютерных моделей систем распознавания образов основывается на
-пониманиипринциповклассификации и структуры систем распознавания;
-способов описания классов на языке словаря признаков;
-подходов к формализации показателей эффективности распознавания.
Начиная с декомпозиции, как одного из важнейших принципов построения моделей, можно заметить,что блочный состав моделей систем распознавания грубо уже определяют их схемы, рассмотренные при изучении принципов классификации.Поэтому модель СР первого приближения должна включать следующие основные элементы:
-распознаваемый объект (явление, процесс);
-технические средства (средства измерений);
-многоуровневая(в общем случае) система обработки измерений;
-алгоритм классификации.
Ну, а так как моделирование систем распознавания,какэто было сформулировано выше, преследует целью проведение испытаний и получение оценки выполнения ими задач - эффективности -,то последним венчающим модель элементом в перечисленный состав должен быть включен блок оценки этого показателя (эффективности).
Рассмотрим болееподробно всеперечисленныеэлементы модели, стремясь к их детализации и определению принципов компьютернойреализации во взаимодействии друг с другом.
5.5.1. Моделирование распознаваемого объекта
Сложность модели распознаваемого объекта (явления,процесса) определяетсяполностью степенью физико-химической сложности его самого, условий его наблюдения и степенью доступности необходимых измерений.
Исходя изопределения назначения системы распознавания ,- получение информации,необходимой для принятия решения о принадлежности неизвестного объекта (явления, процесса) к тому или иному классу ,- ничего другого не остается,как получить по возможностивсю информацию, имеющую отношение к его распознаванию. Незнание или плохое знание описания объекта во всем диапазоне интересующих сторон, свойств, характеристик, факторов поведения не дает оснований надеяться на эффективность получаемых решений.
Заметим, чтосоответствующая задача (получение всей информации) не противоречит самой первой задаче, с которой начинается создание СР, - определение полного перечня признаков распознавания.
Говоря слова “модель объекта” (а равно “модель явления”,“модель процесса”) условимся, что при этом будем иметь в виду “модель объектов распознавания”,которые могут относиться к различным классам.Но так какв системев каждом акте ее применения всегда имеют дело с одним неизвестным объектом,подлежащим распознаванию,а также имея в виду, что принципы моделирования всех объектов данной СР одинаковы (различны лишь характеристики),чаще всего используется термин “модельобъекта распознавания”.
Исходя изэтого определим модель объекта как цифровой имитатор совокупности его свойств, характеристик и состояний. Заметим, что,на первый взгляд, число моделируемых (имитируемых) свойств, характеристики состояний объекта равно размерности словаря признаков распознавания.Так действительно,если в СРиспользуется один простой признак распознавания, то и моделью соответствующего объекта должно имитироваться поведение этой одной характеристики,одного свойства,одного состояния объекта.Точно также, если СР использует несколько простых признаков,то имитатор объекта долженобеспечивать получение такого же количества характеристик (свойств, состояний) каждого моделируемого объекта. Однако если признак распознавания один, но комбинированный, то цифровой имитатор соответствующего объектадолжен выдаватьсистеме столько и таких его характеристик (свойств,состояний),сколько и каких используется для расчета этого комбинированного признака во многоуровневой системе.То есть, размерность вектора имитируемых свойств может быть больше или равна размерности вектора признаков распознавания.
Примеры.
1)Пусть в СР в качестве признака распознавания используется один - масса объекта.Значит моделью каждого из объектов, подлежащих распознаванию,будет в простейшем случае запись в банке данных каждогоиз них всего одного соответствующего числа в принятой размерности (тонна, килограмм, грамм и т.п.).
2)Пусть в качестве признаков распознавания в СР используются геометрические размеры объекта. Тогда модель каждого объекта, подлежащего распознаванию, будет представлять в простейшем случае три числа в соответствующем банке данных - длина, ширина, высота (м, дм, см, мм).
3)Пусть в СР метеоосадков в качестве признака дождей (а дожди бывают разными хотя бы по интенсивности) используется количествоводы, попадающейна определеннуюповерхность земли.Тогда моделью любого класса дождей может быть всего одно число - количество ммосадковв час (месяц, год).
4)Пусть в СР распознаются звуки по высоте их тона.Тогда моделью каждого звука будет число, характеризующее частоту основного тона его и имеющее размерность - Гц.
5)Пусть в СР распознаются звуки по ряду признаков:
-высота основного тона;
-наличие низкочастотной модуляции основного тона;
-изменение интенсивности.
Тогда модель такого в данном случае сложного явления должнасодержать по каждому классу, подлежащему распознаванию, по крайней мере, такие параметры как частота основного тона;
-частота модуляции;
-изменение амплитуды основного тона во времени (вид модуляции).
Чем сложнее свойства объекта,отражаемые в составе вектора признаков распознавания,тем сложнее модель этого объекта.Так, если для распознаваниятребуется знаниегеометрических характеристик объекта более полно, чем для определения длины, ширины и высоты, то такой объектдолженуже представляться чертежами его в трех проекциях.Соответствующая модель - внешние контуры указанных проекций, представляемые
-либо в виде набора дискретных точек координат;
-либов виде набора параметров сплайнов,аппроксимирующих указанные контуры;
-либо в виде радиально-круговых разверток указанных контуров, то есть , величин радиус-векторов, имеющих начало в некотором центре чертежа проекции и конец на границе контура.
Так илииначе мы имеем и здесь и в рассмотренных простейших случаях наборы числовых характеристикраспознаваемыхобъектов, которые для каждого из объектов и представляются как его модель.
Утверждая, чточем большеразмерностьвектора признаков,тем сложнее модель объекта,мы как бы все и усложняем сами вполнесознательно. Действительно формирование словаря признаков,а значит размерности соответствующего вектора,- эвристическая операция.Причем эта задача обычно нацелена на то, чтобы как можно всестороннее охарактеризовать выбранным словарем объект распознавания. Ведь от количестваи качествапризнаков распознавания зависит эффективность классификации.Поэтому получающееся отсюда усложнение модели следует считатьестественным состоянием при стремлении к созданию высокоэффективной системы.
Для четкости последующего изложения вопросовпостроениямоделей СР назовембанк данныхсчисловыми характеристиками распознаваемых объектов, соответствующими признакам распознавания,модулем статических характеристик объектов в составе модели объекта.
Этим модель не исчерпывается.
Следующий важныйшаг анализасоставамодели объекта (явления, процесса) основывается на представлении о том, как объекты распознаванияпоявляются навходесистемы распознавания.Достаточно трудно представить себе системы,на вход которых объекты попадают встрогой очередности. Обычно имеем дело с некоторым вероятностным распределением, то есть, каждый объект или группа достаточно близких объектов, образующих класс, предъявляются СР с конкретной априорной вероятностью.
Изоморфно этому одним из составляющих модельСРмодулей должен быть элемент, осуществляющий вероятностный выбор предъявляемого объекта в каждом запуске программы модели распознавания. Таким образом каждыймодельныйэксперимент по распознаванию при наличии такого модуля должен начинаться со статистической задачи выбора объекта определенного класса, подлежащего в этом эксперименте распознаванию.
Логико-математические принципы построения модуля выбора объекта - это принципы генерации случайных событий методом статистических испытаний (Монте-Карло). При этом, если каждый класс, для которого определенааприорная вероятность,представляется одним объектом,то имеем дело с одним датчиком случайных событий (появлений объектовнавходе СР). Если же каждый класс содержит несколько однотипных объектов,то соответственно модуль должен иметь и второй датчикслучайныхсобытий, заключающихсяв появлении на входе системы одного конкретного объекта из набора их (полной группы событий), входящих в имитируемый класс.
В итогедля наиболее общего случая функциональная схема рассмотренной части модели объекта имеет следующее строение (Рис.5.5.1).
Рассмотренная часть модели распознаваемого объекта является достаточной,если мы имеем дело с объектами,явлениями или процессами в статике или если располагаем наблюдениями их для измерения характеристик в фиксированные моменты времени.
Однако чаще всего реальные СР имеют дело с объектами,характеризующимися некоторой кинематикой.
Например, нами рассматривалась такие характеристики звука как высота и громкость, соответствующие признаки которых - частота и амплитуда.В представленном на схеме модуле статических характеристик указанные параметры были бы записаны в виде двух чисел по каждому классу.
Но звук одного тона - это периодический во времени процесс, кинематическая характеристика которого
где A - амплитуда;f - частота.
Здесь получить интересующие признаки (частоту и амплитуду) по одному мгновенному значению не представляется возможным.Они могут быть определены только путем наблюдений и обработки процесса X(t).Аесли это так, то в соответствующую модель необходимо ввести модуль, который обеспечивает получение X(t), а значит
-счет времени от некоторого момента начала наблюдений или обработки t0;
-расчет кинематики X(t) по приведенной выше зависимости, в
Модуль выбора класса
в соответствии с ап-
риорными вероятнос-
тями появления P(Wi)
№ класса
Модуль выбора объек-
та заданного класса
из соответствующего
набора
№ класса ( i )
№ объекта
М о д у л ь с т а т и ч е ск и х х а р - к о б ъ е к о в
Статические Статические
õàðàêòåðèñòèêè õàðàêòåðèñòèêè... õàðàêòåðèñòèêè
объектов 1-го объектов 2-го объектов m-го
класса класса класса
Статические характеристики объекта i-го класса
Рис.5.5.1
Функциональная схема чсти модели объекта
которую и входят статические характеристики - амплитуда и частота.
Здесь счетчик времени - независимая от физического содержания задачи функция
где Dt- принятаяв модели дискретность представления исходныхсигналов;
k -число тактов моделирования кинематики.
Сам же расчет кинематики определяется объектом и его свойствами.
Рассмотрим еще один пример.
Пусть объект распознавания описанплоскимизображением, контур которого в модуле статических характеристик представлен в виде таблицы расстояний от центра тяжести этогоизображенияс помощьюрадиально-круговой развертки:
или при выбранной дискретности разверткиDj развертки
Если реально объектраспознавания являетсявращающимсявокруг центра масс с угловой скоростью jv, а система распознавания должна получать соответствующие признаки путем обработки измеренныхрадиальных размеров объекта,то модель объекта должна содержать модуль кинематики. При этом определение исходного радиального размера объекта во времени должно осуществляться путем,по крайней мере, линейного интерполирования значений таблицы статических характеристик. С учетом дискретной во времени имитации радиального размера будем иметь:
Если вместостатического описания радиально-круговой разверткой тот же плоский объект описан координатами точек контура в прямоугольной системе x,y. Тогда кинематика его при вращении относительно центра масс:
где Xio,Yio - координаты i-ой точки статического описания объекта;
Xi(t),Yi(t)- координаты i-ой точки в процессе вращения объекта.
Применив указанное преобразование ко всем точкам описанияобъекта, получимего положение в каждый интересующий момент времени в виде соответствующих положений всех описывающих точек.
Точно также, как и в предыдущем случае, при дискретном счете времени от некоторого момента t0 будем иметь:
Если же при вращении центр нашей фигуры будет совершать некоторое поступательное движение, то для координат точек ее контура будут:
Осуществляя указанные расчеты постатическойтаблице координат точек контура,будемполучать впоследовательные моменты времени с дискретностью Dt полное представление о движении рассматриваемого объекта. Это и являетсяпрактическим решением задачи его моделирования при геометрическом описании.
Рассмотрение приведенныхпримеров показывает,что более сложные физические описания статики распознаваемых объектов (явлений, процессов) приведут к более сложным выражениям для определения их кинематики.
На этом рассмотрение основ построения модели распознаваемого объекта может бытьзакончено.Типичная функциональная схема его может быть представлена теперь следующим образом (Рис.5.5.2.).
В заключение отметим, что счетчик времени, введенный необходимостью моделирования кинематики объекта, задает темп работы
Модуль выбора классав соответствии с апри-
орными вероятностями появления P(Wi)
№ класса
Модуль выбора объекта заданного класса
из соответствующего набора
№ класса (i)
№ объекта
М о д у л ь с т а т и ч е с к и х х- к о б ъ е к о в
Статические характеристики
объекта i-го класса
М о д у л ь к и н е м а т и ч е с к и х х а р - к
Субмодуль Субмодуль Субмодуль
счетчика вре- счетчика вре- счетчика време-
мени функцио- мени функцио- ни функцио-
нирования ¹1 нирования ¹2 нирования ¹m
Субмодуль рас- Субмодуль рас- Cубмодуль рас-
чета кинемати- чета кинемати- чета кинемати-
ческих харак- ческих харак- ческих харак-
теристик объ- теристикобъ- теристик объ-
екта 1-го кл. екта2-го кл. ектаm-го кл.
Кинематические характеристики объекта
Рис. 5.5.2.
Функциональная схема модели объекта
всей модели системы распознавания. Через время Dt на выходе модели объекта появляются новые данные о нем. При этом отсчет времени начинается с момента запуска модели.Сам же счет при синхронизации от ЭВМобеспечивает работу модели,как говорят, “в реальном времени”. Если же такая синхронизация отсутствует, то очередной такт моделирования объекта начинается послевыполнениявсех программ модели до конца.В этом случае масштаб времени может быть замедленным относительно реального илиускоренным. Все зависит от объема вычислительныхоперацийвсей модели СР.
Л Е К Ц И Я5.6.
Ìîäåëü ñèñòåìû ðàñïîçíàâàíèÿ îáðàçîâ
(продолжение)
5.6.1. Ìîäåëèðîâàíèå ñðåäñòâ îïðåäåëåíèÿõàðàêòåðèñòèê îáúåêòîâ ðàñïîçíàâàíèÿ
Модель измерителей,обеспечивающих определение характеристик для решения задачи распознавания,является логическим продолжением модели объекта , а значит очередным элементом, в составе общей модели системы.Как следует из предыдущих разделов курса сами измерители являются наиболее сложной и, как следствие, дорогостоящей частью системы. Отсюда вполне понятно,что эта сложность отражается и на рассматриваемой модели.Чаще всего причина сложности модели заключается в том,что в составе систем распознаванияиспользуются дистанционныеизмерители, реализующиедостаточно сложные по техническому осуществлению физические принципы с вытекающимиотсюда последствиямиихматематического описания. Кроме того, работа измерителей сопровождается ошибками измерений и отказами,что в свою очередь обусловливаетусложнение физико-математического описания и алгоритм.
Для того,чтобы выделить принципы построения моделей средств определения характеристик объектов распознавания, прежде всего обратимся к примерам.
Начнем стакого простогослучай как распознавание звуков по их высоте. Тогда на выходе модели объекта, а значит на входе модели измерителей, мы имеем дело с дискретным процессом
Естественно потребовать от измерителя определение частоты как параметра распознавания.Тогдазадачами такого измерителя,состоящего очевидно из микрофона и усилителя должны быть:
-прием и усиление этого звукового сигнала;
-определение периода принятого гармонического сигнала и по нему частоты.
Последняя задачаможет выглядеть как рекуррентное сопоставление каждого принятого дискретного значения с предыдущим и обнаружение номера дискрета,когда достигается максимум сигнала.На некотором временном интервале в результате такой обработки будет полученоs такихзначений:kmax1 ,kmax2 ,....., kmaxs. Тогда интересующая частота тона определится как
Но оказывается,чтопри моделировании этим нельзя ограничиться,так как реальный сигналискажаетсяшумами измерительноготрактаиошибками измерителя амплитуды . При этом
где h(kDt) - нормальный случайный процесс с нулевым математическим ожиданием и дисперсией Dx. При этом дисперсия является паспортной характеристикой применяемого измерителя частоты тона звукового сигнала.
Случайная аддитивная составляющая сигнала, входящая в это выражение и обусловливает ошибки определения номеров тактов достижениямаксимумов сигналом,азначит и ошибку определения частоты.Определитьвеличину, вернее параметры,этой ошибки можно,проведя теоретическийвывод зависимости
пользуясь рассмотренной связью между частотой и максимумами сигнала.Этого же можно достичь и численно,пользуясьметодом статистическихиспытаний (Монте-Карло).Для реализации его придется очевидно генерацию нормальной случайной последовательности h(kDt)с Mx = 0 и дисперсией Dx. Добавляя соответствующее значение последовательности к периодической части сигнала и определяя по приведенному алгоритму значенияfi, после набора достаточного статистического материала (q реализаций)получим
;
Точно так может быть определена и плотность распределения вероятностей интересующих нас ошибок измерений.
Заметим, что с точки зрения построения всей модели измерителя получение параметровошибок измерения частоты (Mf,sf 2 ) или плотности распределения вероятностей в рамках модели самого измерителя не является необходимым.Рассмотренную операцию можно провести отдельно. Выполняется это,как мы упомянули и показали, либо аналитически, либо с использованиемметода Монте-Карло.Причем компьютерные реализации и того и другого подходов представляют собой частныемодели ошибок.А результатыих работыдаютвозможность включить в модель измерителя частоты упрощенный субблок ошибок. Последний будет представлять собой всего лишь датчик случайных чисел , построенный на основе реализации плотности распределения вероятностей ошибок определениячастотыили нормальной аппроксимации плотности с числовыми характеристиками, определенными на упомянутых частных моделях .
В качествевторого примера, помогающегонам выяснить принципы построения моделираспознавания,рассмотрим измеритель радиального размера такого объекта как вращающийся вокруг своего центра тяжести прямоугольник.
Для простоты и наглядности будем считать,что точка,из которойведутся наблюдения этого прямоугольника и измеряется его текущий радиальный размер лежит в начале координат (0,0). При этом радиальным размером объекта считается величина
где Rimax(kDt), Rimin(kDt) - расстояния до наиболее удаленнойи ближайшей к точке стояния измерителя точек контура прямоугольника (пересечения с радиус-вектором наблюдения).
Из простых алгебраических соображений, решая уравнения по определению точек пересечения прямых,отрезки которых образуют стороны прямоугольника,с прямой радиус-вектора из начала координат, для каждого положения прямоугольника будем иметь соответствующие значения.Акак изменяются во времени координаты точек контура прямоугольника в модели объекта, а значит и уравнения отрезков сторон его, мы уже рассмотрели.Понятно, что изложенные принципы позволяют записать строго все математические выражения,составляющиесущество такого измерителя и легко программно реализовать при построении модели.
По аналогии с предыдущим примером можно считать,что паспортной характеристикой измерителя радиального размера должна быть либоплотность распределениявероятностейошибок определения ri или числовые характеристики нормального закона, имеющего место как правило при измерениях.И так же, как и в предыдущем примере, модель измерителя радиального размера должна включать модуль датчика случайных чисел,генерирующего аддитивную добавку к ri - dri в соответствии с указанными данными. Тоесть,измеренное в каждом такте работы программы моделизначение радиального размера должно иметь случайную добавку
Следует еще раз подчеркнуть, что плотность распределения этой добавки, как случайной величины, должна соответствовать заданной в паспорте для данного измерителя или полученной для него экспериментально в процессе его испытаний.
Таким образом,уже два рассмотренных примера однозначнодемонстрируют,что составными частями модели измерителей характеристик объектов распознавания должны быть:
-модули каждого из средств,отличающихся по физическимпринципам,алгоритмы измеренийкоторых имеют свое специфическое математическое описание;
-модули датчиков случайных чисел, реализующие случайные добавки к измерениям каждогосредствав соответствии с заданными плотностями распределения вероятностей ошибок.
В то же время эти примеры, позволившие сформировать первые представления омодели средств измерений,не достаточно подчеркнули факт того, что измерители чаще всего определяют интересующие характеристики объекта на некотором временном интервале наблюдения, то есть по совокупности сигналов, а не в точке.
Уже впервом примереизмерителячастот гармонических сигналов нельзя было обойтись без накопления информации: частотаопределялась по результатам наблюдения нескольких периодов сигнала X(t).
Точно также во втором примере (вращающийся прямоугольник)скорее всего длярешенияраспознавательных задач мгновенными замерами радиальных размеров ограничиться нельзя. Требованияклассификациимогут заставить насздесь либоопять-таки измерять период вращения,либо пользоваться в этих целях такими характеристикамикакматематическое ожидание и среднеквадратический разброс радиального размера объекта:
Таким образом, рассмотренные примеры реализации измерителей параметров объекта, а значит и признаков их распознавания, заставляют считать обязательным наличие в составе модели измерителя модулянакопления информации об объекте на некотором интервале времени. Длительностьего будет естественно определятьсянеобходимой точностьюполучаемыхоценок, а также зависит от
-типаизмерителя, его возможностей обнаружения и устойчивого измерения соответствующего параметра;
-допустимого временного баланса на решение задачи распознавания.
Так радиолокаторначнет измерения радиолокационных характеристик воздушного или космического объекта только после того,как этот объект приблизиться настолько,что соответствующий отраженный сигнал превысит уровень собственных шумов приемного устройства этого радиолокатора.
Датчик температуры начнет ее измерения после достижения ею порога чувствительности его.
Рассмотрев указанные примеры, мы все-таки не охватили другие важные стороны измерителей,на которые должно быть обращено внимание при построении модели. К ним относиться надежность.
Если измерительвышел изстроя или его отказ привел к снижению точности определения параметра распознавания,то ясно, что это приведет к падению эффективности классификации объектов. Следовательно, при моделировании такие ситуации должны бытьпредусмотрены,а выполнить это достаточно просто, если мы располагаем, например, вероятностью безотказной работы соответствующего средства как паспортнойхарактеристикой.В соответствии с рассмотренным нами методом моделирования случайных событий (метод Монте-Карло) достаточно организовать датчиктаких случайныхсобытийкак отказ и при выполнении условий выхода из строя запрещать модели измерителя выдавать на выход данные по распознаваемому объекту.Если же отказ приводит только к снижению точности, то в задачи такого модуля должно входить соответствующее изменение характеристик измеренных параметров по сравнению с паспортными.
Проведенное рассмотрениетипового состава модели измерителя даетоснования считать, что реальные объекты, явления, процессы, подлежащиераспознаванию, а соответственно и измерители их характеристик,могутобладать широким спектром особенностей. Именно они отражаются на принципахпостроения модели измерителя. Поэтому реально рассматриваемыемодели могут быть и значительно проще исущественно сложнее.Однакоизложенные принципы дают основы методологии,базирующейся на тщательном анализе объектов, явлений, процессов и задач измерения их характеристик, а поэтому позволяют надеяться на учет указанной простоты или сложности при реализации и обеспечении изоморфного представления моделей измерителей.
5.6.2. Моделирование каналов связи
Немаловажную роль в определении характеристик распознаваемых объектов играют каналы связи. И говоря о том, что главная цель СР - получение информациидлярешения задач распознавания,указанные каналы можно считать конструктивно присущими таким системам.
В качестве каналов связи могут рассматриваться:
-каналы передачи и приема энергии измерителями, осуществляющими дистанционное измерение характеристик объектов;
-каналы передачиинформацииизмерителя наустройства, осуществляющие ее обработку и использование.
Так, еслиречь идетобизмерителях радиолокационного типа,то здесь каналом названного первого типа является земнаяатмосфера.Она обладает частотно-избирательнымисвойствами, пропуская почти без потерь одни волны и задерживая другие.Ослабление и поглощение при этом носит экспоненциальныйхарактери зависитотпротяженности трассы распространения сигналов от радиолокатора до наблюдаемого объекта. Поэтому придостаточно коротких трассах этим ослаблением можно пренебречь. В противном случае любые ослабления сигналов ведут как к снижению дальности наблюденияинтересующего объекта,так и к ухудшению точности сопутствующих измерений.
Ионосфера Земли является анизотропной средой,обладающей различными значениями показателя преломления для различных длин волн. В итоге - изменение поляризации, а значит ослабление принимаемого сигнала.
Слоистость атмосферы - причина систематическихошибокизмеренияугловых координат, дальности и скорости объекта.
Местные неоднородности атмосферы, обусловленные вихревыми процессами в воздухе, - причина случайных ошибок измерений.
Для ультразвукового локатора, используемого в медицинской аппаратуре УЗИ, слоистость и местные неоднородности тканей человека, частотная зависимость их коэффициента пропускания приводят:
-к затуханию сигнала;
-к поглощению сигнала;
-к рассеянию сигналов;
-к интерференции ультразвуковых колебаний.
Если первые три вызывают неоднородное ослабление отраженного сигнала, несущего информацию о состоянии внутреннего органа человека,то последнее приводят кпоявлениюспекл - шума, затрудняющегонаблюдения распознаваемых объектов и являющегося результатом дифракции отраженных от различных неоднородностей сигналов.
Характерно то,что в большинстве случаев исследованию рассматриваемых каналов связи посвящены многочисленные теоретические и экспериментальные работы. При этом достаточно часто указанные воздействия на распространениесигналов измерителей хорошо описываются математически. Для них существуют или теоретические зависимости или в худшем случае эмпирические соотношения,хорошо себя зарекомендовавшие. В каждом конкретном случае канала связи и измерителя эти зависимости исоотношения наполняются своим специфическим содержанием.
Главный вывод из этого рассмотрения - возможность учета искажений информационных сигналов в разрабатываемой моделисистемыраспознавания.
Второй из упомянутых типов каналов передачи информацииизмерителей -это в большинстве случаев каналы ее ввода в ЭВМ.Здесь главным является, если не учитывать дальность передачи и соответствующееослабление сигналов,преобразование измеренного значения , представленного в виде тока или напряжения в цифровую форму.
Такое преобразование может осуществляться как стандартными средствами ЭВМ, так и в самом измерителе параметров объектов распознавания.
Речь же оважности выяснения существа указанного преобразования идет потому, что дискретизация всегда вносит ошибки в передаваемый параметр и должна учитываться при моделировании.
Здесь математическое описание достаточно строго и исходит ихтого, чтоплотностьраспределения вероятностей ошибок дискретизации - равномерная с нулевым математическим ожиданием и дисперсией
где D - цена младшего разряда преобразования.
Таким образом,рассмотрение показало, что каналы связи, осуществляющие передачу информации зависят главным образом от типаизмерителя. Поэтомуихвключение в модель измерителя в качестве специальных модулей не должно вызывать сомнений.
В итоге типовая функциональная схема модели измерителя может быть представлена следующим образом (Рис.5.6.1).
Динамические характеристики объекта
Модель 1-го измери- Модель 2-го измери-
теля теля
Модуль имитации Модуль имитации
отказов измери- отказов измери- ....
теля теля
Модуль имитации Модуль имитации
начала и продол- начала и продол-
жительности из- жительности из- ....
мерений мерений
Модуль оценки Модуль оценки ....
параметров параметров
Модуль имитации Модуль имитации
аппаратурных аппаратурных ....
ошибок ошибок
Модуль имитации Модуль имитации
ошибок канала ошибок канала ....
связи связи
Модуль имитации Модуль имитации
преобразования преобразования ....
параметра в циф- параметра в циф-
ровой код ровой код
Рис.5.6.1. Модель средств измерения характеристик
Л Е К Ц И Я 5.7.
Моделирование алгоритма распознавания
5.7.1. Модель алгоритма распознавания
объектов (явлений, процессов)
О модели алгоритма распознавания следует вести речьвследующих случаях:
1)При программной реализации соответствующего алгоритма нена рабочей ЭВМ,а на ЭВМ, предназначенной только для предварительной его отработки.
2)При отличиях языка программирования модели от языка программирования рабочего алгоритма.
3)Приотработке впроцессе моделирования принципов построения алгоритма и, в частности, алфавита классов и словаря признаков, а также решающего правила.
4)Приразличных сочетанияхситуаций,представленных в пп. 1-3 настоящего перечня.
Если алгоритм системы распознавания реализуется на “своей” ЭВМв эксплуатационном представлении, то он уже в силу полной изоморфности и аналогичности не представляет собой модель, а является реальнойсоставной частью системы или ее модели (если идет речь о модели системы).В этом случае функциональная схема алгоритма ничемне отличаетсяот схем, приведенных при изучении вопросов их классификации.
Реализация алгоритма распознавания на “своей” ЭВМ совместно с моделью объекта распознаванияи средств измерения характеристик представляет собой комбинированную модель СР (реальный программнореализованный алгоритм СР и модели входных воздействий), предназначаемую для оценок:
-правильности функционирования алгоритма СР;
-эффективности системы распознавания,имеющей выбранную структуру и реализацию.
Первая из рассмотренных ситуаций применения моделированиясистемраспознавания может иметь достаточно широкий спектр задач в процессе создания алгоритма и его отработки,если отсутствуют экономически допустимаявозможность его реализации на рабочей ЭВМ или ЭВМ подобного типа.
Точно также существуют условия для возникновения второй ситуации.
Например, желание приспособить готовую программно реализованную СР для другой системы на ЭВМ,где в соответствии симеющимися требованиями программирование ведется на другом языке или на автокоде, заставляет рассматривать существующую реализацию как модель.
Третья ситуация применения моделей систем распознавания представляется наиболее соответствующей конструирования систем распознавания.В том случае, когда целью моделирования алгоритма являетсявыбор признаков распознавания и алфавита классов, состав модели оказывается наиболее полным по сравнению сдругими и поэтому представляющим наибольший интерес.
Главное что отличает такую модель - это наличие модуляописанияклассов на языке признаков.Забегая вперед,можно заметить, что подобный модуль может быть и принадлежностью рабочего алгоритма СР. Наиболее это очевидно для обучающихся систем распознавания.
Алгоритм функционированиямодуля описания классов на языке признаков в максимальной степени интересен для вероятностныхсистем распознавания. Другие системы имеют более простую и очевидную реализацию.
На начальнойстадии модельнойотработки вероятностной СР имеем дело с m классами и N признаками распознавания .В дальнейшем ихчисло может быть изменено. Для этого и проводится моделирование.
Òîãäà, êàê èçâåñòíî, îïèñàíèå êàæäîãî èç êëàññîâ ïðåäñòàâëÿåòñÿ òàê:
_
Класс 1: f(X/W1) и P(W1)
_
Класс 2: f(X/W2) и P(W2)
_
Класс 3: f(X/W3) и P(W3)
..............................
_
Класс m : f(X/Wm) иP(Wm)
При независимости всех N признаков обычно имеем:
_ _ _ _
f(X/W1)= f(X1/W1)*f(X2/W1)*....*f(XN/W1)
_ _ _ _
f(X/W2)= f(X1/W2)*f(X2/W2)*....*f(XN/W2)
.......................................
_ _ _ _
f(X/Wm)= f(X1/Wm)*f(X2/Wm)*....*f(XN/Wm)
Как видим,исходными данными для описания классовNпризнаками являются вэтом случае частные описания каждого из классов по каждому признаку
f(Xj/Wi), где j = 1,N
Отсюда понятно, что если j-ый признак распознавания имитируется в модели объекта ( а у нас такая имитации будет предусмотрена), топри достаточном количествезапусковмодели (числеиспытаний) получим в каждом заранее известном классе ряд измерений
{Xjk}k = 1, Nисп
Отсюда статистической обработкой может быть получена сначала гистограмма плотности распределения вероятностей
f(Xj/Wi)
Затем аппроксимация этой плотноститеоретическимнепрерывным распределением (например нормальным) дает требуемоечастноеописание i-го класса по данному j-му признаку. Точно также получаются частные описания всех классов по каждому из признаков.Они и обеспечивают при указанной независимости признаков начальное описание всех классов.
Таким образом,отсюда понятно,что в составемодуляописания классов модели СР должен находиться субмодуль восстановления плотностей распределения вероятностей признаков в каждом из назначенных классов, реализующий рассмотренный алгоритм.
Обратим теперь внимание на то,что число классов и число признаков в соответствии с имеющимися представлениями о создании СР в исходном состоянии должно быть максимально возможным.Число классов -так как всегдаесть стремление к максимальной детализации решений.Число признаков - так как их максимумусоответствуетмаксимум вероятности правильной классификации.
В соответствии с этим модель СР может быть использована для оценки результативности увеличения числа признаков,введения новых. Здесь без дополнения ее путем доработок не обойтись. Ну,а все последующие шаги оптимизации СР,обеспечивающей максимум вероятности правильной классификации, связываются, во-первых, с выбором такого числа признаков, которое удовлетворяло бы имеющимся ограничениямнасоздание средств измерений и обработки информации.Таким образом,здесь уже имеем делос противоположной тенденцией - ограничением числа признаков (исключением менее эффективных), но при стремлении сохранить достигнутую эффективность на полном их наборе.
Следовательно, во-вторых,в задачиоптимизациидолжны входить действия по компенсация потерь от уменьшения числа признаков,которые сопровождаются,как мы уже доказали, только уменьшением числа классов в исходном алфавите.
В результатесокращения числа признаков сокращенное описание будет иметь вид:
где k - число исключенных признаков распознавания из i-го класса
i = 1,(m-l)
l - число исключенных классов.
Причем здесь предполагается,что после отбора всостав вектора признаков тех,которые удовлетворяют предъявленным ограничениям, производится повторное описание классов .
Когда же есть необходимость уменьшить число классов, то исключаемые из алфавита классы вынужденно объединяются стемиоставшимися в его составе, для которых такое объединение не принесет увеличения числа ошибочных решений в системе.Тогда при объединении, например, двух классов (p-го и q-го) и тот и другой исчезают из алфавита и появляется один новый (m+1)-ый с описанием:
и
Естественно, что тогда (после исключения) последней алгоритмической функцией в модуле описания классов должна быть функция их перенумерации в новом составе.
Таким образом, последовательность алгоритмических действий модуля описания классов включает:
1)Расчет одномерных плотностей распределения вероятностей каждого из признаков по классам по репрезентативной выборке реализаций измеренных значений (при моделировании объектов и измерителей).
2)Исключение из описаний одномерных плотностей распределения при сокращении размерности вектора признаков.
3)Перекомпоновка плотностей описания классов и априорных вероятностей при сокращении числа классов.
4)Перенумерации классов после объединения отдельных.
Учитывая тот факт,что при имеющихсяограничениях насоздание средств измерений и (или) средств обработки приходится варьировать наборами признаков,рассмотренный модуль описания классов должен повторять функции 2-го пункта при каждом новом наборе.
Наличие рассмотренного модуля в составе модели СР предъявляет определенные требования к его окружению.Во-первых, для каждого нового описания классов необходимо в качестве входной информации модуля иметь используемый в данной серии испытаний вектор отбора признаков. При решении задачи объединения классов в качестве входной информациимодуля необходимо иметь решение в виде номеров классов, назначенных к объединению. В соответствии с этим модуль обеспечивает:
-повторное описание классов при каждом новом векторе отбора;
-описание объединенных классов после испытаний системы распознавания для одного состава алфавита (перекомпоновка векторов-признаков при их независимости).
Если перваяиз приведенных задач решается автоматически исключением признаков,то вторая не может быть решена без оценки эффективности СР в данной серии испытаний. То есть, решается после проведения испытаний с данным вариантом алфавита во всем диапазоне допустимых векторов отбора признаков распознавания.
5.7.2.Модуль оценки эффективностисистемы распознавания
Оценка эффективностиСР, как это следует из самого понятия “эффективность”, представляется необходимым элементом модели СР вцелом, позволяющим ответить на вопрос,каково качество или созданной системы или системы после ее очередных доработок (изменений алфавита классов и словаря признаков распознавания), осуществляемых в процессе оптимизации.
В том случае,когда решение системы зависит от многихфакторов, имеющих случайный характер,показателями, характеризующими оптимальность, являются вероятности правильных и ошибочных решений. Отсюда целесообразным для конструкциимодели оценки эффективности должен быть субмодуль оценки вероятностей решений системы.
К основным даннымдля формализациитакого субмодуля относятся исходы модельных испытаний. Они представляют собой решения о принадлежности при известной принадлежности классифицируемого объекта в каждом испытании.
Поэтому работа алгоритма субмодуля в рассматриваемой части заключается в фиксации решений и истиной принадлежности объекта в некоторой матрице решений:
где nij/Vk - число отнесений объекта j-го класса (известного при организации моделирования) к классу i.
Число таких матриц после испытаний СР для каждого вектораотбора Vk равно числу таких векторов, удовлетворяющих ограничениям средств на создание или использование систем измерений признаков распознавания.Еслиже имеем дело с оценкой конкретной структуры системы распознавания, то естественно будем иметь всего одну матрицу для заданного конкретного набора признаков распознавания.
В любом случае эти матрицы легко преобразуются в матрицывероятностей соответствующих решений (точнее, частот,сходящихся к вероятности с заданной точностью при специально выбранном количестве модельных испытаний).Тогда для алфавита классов Ar имеем:
Эта простота конечной оценки показателей функционирования системы как раз и является характерной особенностью метода статистических испытаний (метода Монте-Карло).
Отсюда может быть получена вероятность правильных системных решений в целом (то есть, отнесений ко всем классам алфавита):
На этомпри оценке эффективности СР с конкретной детерминированной структурой моделирование завершаетсяи рассмотреннымсубмодулем ограничивается структура модуля оценки эффективности.
Если же существует необходимость оптимизации,то возникает необходимость дополнения модели оценки эффективности субмодулем выбора оптимального набора признаков распознавания.. Его алгоритм очевиден:
_
То есть, g-ый вектор отбора (Vg) обеспечивает максимальную вероятность правильных системных решений в алфавите Ar.
Теперь матрица вероятностей соответсвует любым системным решениям для найденного оптимального набора признаков распознавания.В результате появляется возможность определить в данном алфавите класс g, объекты которого классифицируются в максимальной степени ошибочно.
Соответствующую вероятность находим какмаксимальную вероятность ошибки:
откуда номер упомянутого класса:
Если теперь задаться порогом вероятности P(g)зад,топоявляется возможность приP(g/Ar) > P(g)зад принять решение о необходимости исключения из алфавита Ar класса с номером g , эффективность отнесения к которому ниже требуемой(заданной).
Отсюда все операции, связанные с определение такого класса (номера его через вероятность ошибочного отнесения),могут быть объединены в отдельномсубмодулем- поиска класса, снижающего эффективность распознавания.
Наконец, та же матрица
позволяет выделить такой класс,отнесение к которому объектов найденного низкоэффективного класса наиболее целесообразно для повышения эффективности системных решений. Номер такого класса соответствует максимальной вероятности отнесения кнему указанногонизкоэффективного класса. То есть:
Эти операции можно поручить отдельному субмодулю, выходом которого должны быть номера классов g и h , которые следует объединить в алфавите Ar, чтобы повысить эффективность СР в целом. Он может быть назван субмодулем определения номеров объединяемых классов.
 ðàññìàòðèâàåìîì ñîñòàâå (Ðèñ.5.7.1.) ìîäóëü îöåíêè ýôôåêòèâíîñòè óäîâëåòâîðÿåò ïîòðåáíîñòÿì êàê îöåíêè êà÷åñòâà ÑÐ, òàê è ïîòðåáíîñòÿì óïðàâëåíèÿ îïòèìèçàöèåé ÑÐ â óñëîâèÿõ îãðàíè÷åíèé ñðåäñòâ íà ñîçäàíèå èçìåðèòåëåé.
Ñàìè ôóíêöèè óïðàâëåíèÿìîäåëüþÑÐ íåîáõîäèìî îáúåäèíèòü â îòäåëüíîì ìîäóëå.
№ распознанного класса
Субмодуль оценки № имитируемого
результата распо- класса
знавания (от модели объекта)
r i,j
Субмодуль расчета _
от модуля матрицы решений Vk
управления (от модуля управления)
|| nij/Vk||
Субмодуль расчета
и хранения матриц
на модуль вероятностей ре-
управления шений
|| Pij(Ar/Vk)||
Субмодуль опреде-
ления оптимально-
на модуль го набора призна-
управленияков в алфавите Ar
gAr
Субмодуль поиска
неэффективно рас-
на модуль познаваемого
управления класса
è ìîäóëü P(g/Ar) è g/Ar
îïèñàíèÿ
êëàññîâ Ñóáìîäóëü ðåøåíèÿ Ñóáìîäóëü îïðåäå-
об исключенииg-го ления расширяемо-
класса го класса (h)
Рис.5.7.1. Модуль оценки эффективности
5.7.3. Модуль управления моделью системы распознавания
Из рассмотрения общих принципов моделированиясложныхсистем, атакже состава и особенностей построения модели СР следует, что в общихчертах динамика моделирования системы распознавания представляет собой
-многократно повторяющийся ( с каждым пуском программы модели) процесс выбора распознаваемого объекта;
-многократноповторяющийся процесс имитации работы измерителей параметров по каждому моделируемому объекту иштатной обработкиполученнойинформации сцелью получения признаков распознавания;
-многократно повторяющийся ( для каждого выбранного объекта распознавания) процесс штатного принятия решения о принадлежности предъявленного объекта;
-статистическую обработку принятых решений в каждом из пусков программы модели как источник определения показателя качества СР в целом.
Первая из приведенных функций,задающая весь процесс функционированияпрограммы модели в каждом пуске, реализуется в виде:
-первоначальногопуска программы модели испытателем с исходными требованиями,введенными им предварительно;
-автоматического повторения заданногочислациклов пуска программы для реализации повторений процесса распознавания в соответствии с методологией статистических испытаний;
-своевременной выдачи необходимых исходных данных для ввода в отдельные субмодули модели для организации их работы по заранее введенным и хранимым данным или по результатам выполненной работы другими субмодулями.
Все остальные функции, характеризующие динамику модели СР в целом, должнывыполняться автоматически в рассмотренной последовательности.То есть, первая функция объединяет фактически все задачиуправления моделью.Выполнение ее логично возложить на отдельный модуль -модуль управления..
Общее рассмотрениереализации модуля управления позволяет обратить внимание на задачу связи испытателя с моделью системы.Приэтомрассматривая алгоритмическое содержание уже описанных модулей,входящих в состав модели,можно заключить,что модуль управлениядолжениметь интерфейс, позволяющий вводить для организации моделирования такие исходные данные, как
-количествостатистичесих испытаний(пусков)на модели системы;
-исходный априорный алфавит классов;
-априорные вероятности предполагаемых классов;
-допустимое значение вероятности ошибочной классификации.
Кроме того, тот же интерфейс должен обеспечить представление испытателю по его требованию индикации:
-реализаций измеренных характеристик (признаков) моделируемых объектов;
-поэтапных значений (для каждого алфавита классов и набора признаковраспознавания)показателя эффективности системы;
-состава алфавита классов и параметров их описания;
-текущего состояния отбора признаков в рабочий словарь.
Теперь можно детализовать отдельные детали управления. Так модульуправления должен обеспечивать
-автоматическое повторение решений полногообъемазадач испытанийна модели со сменой вектора отбора признаков распознавания (если заданы ограничения на средствасоздания и использования средств измерений);
-автоматическийпереход к анализу эффективности всех вариантов рабочего словаря после завершения испытаний со всеми возможными векторами отбора;
-автоматическийпереход к выполнению корректировки алфавита классов после выполненного анализа ошибок классификациии;
-автоматическоеповторение циклов полного объема испытаний после корректировки алфавита классов.
А отсюда логически вытекает, что задание (генерация) векторов отбора, удовлетворяющихзаданным ограничениям,вполне соответствуетфункциям управления.То есть,эта задача должна решаться модулем управления,который обязан иметь соответствующие исходные данные по ограничениям выделенныхсредстви затратам на создание или применение отдельных измерителей.
Перечисленные функции должны быть алгоритмически дополненыфункцией обучения системы на информации об объектах, имитируемой соответствующим модулем модели. Работа в указанном режиме может осуществляться как при первом пуске модели для первоначального описания классов, так и при любой смене алфавита классов и словаря признаков.
Обобщенная структурная схема модуляуправленияприведена на рис 5.7.2,а общая структурная схема модели СР без детализации рассмотренных модулей и субмодулей - на рис.5.7.3.
От модуля
обработки Субмодуль вывода Субмодуль ввода P(Wi)
характеристик исходных данных Ar
измерений объекта распозна- и управления ото- P(g)з
вания бражением
От модуля Субмодуль отобра- Субмодуль генера- _
жения процесса ции допустимых Vk
оценки эф- моделирования векторов отбора
фективно-
сти и др.
Субмодуль управ-
ления описанием На
классов модуль
описания
классов
Субмодуль управ-
ления циклом ис-
пытаний системы На
модуль
имитации объектов
Субмодуль управ-
ления оценкой эф-
фективности
На модуль
оценки
эффективности
Рис. 5.7.2. Обобщенная структурная схема модуля управления моделью
информация, управление P(g)з
Модуль управления
моделью Ar
Ar
Vk
Модуль имитации
объектов распоз-
навания
Модуль измерите-
лей характеристик
объектов
Модуль отбора
признаков распоз-
навания
Ar
Модуль описания Модуль принятия
классов решений о при-
надлежности
h g
Модуль оценки
эффективности
Рис.5.7.3.Общая структурная схема модели СР
Л Е К Ц И Я5.8
Опытно-теоретический метод в задачах создания систем распознавания
5.8.1. Использование принципов опытно-
теоретического метода при моделировании СР
Назначение опытно-теоретическогометода - испытания сложных систем во всем факторном пространстве их функционирования.
Системы распознаванияобразов являютсяобычно составной частью сложных технических систем.Поэтому испытаниясамихсложных систем обеспечивают, как правило, и испытания СР.
Главное, чтообъединяет информационносистемыраспознавания и сложные системы,в состав которых они входят, это - объекты распознавания и средства измерений характеристик этих объектов. Причина такого пересечения систем очевидна и состоит в том, что сложные системы обеспечивают принятие решений по определенным объектам (процессам, явлениям), а распознавание этих же объектов (явлений, процессов) всегда направлено на получение дополнительной информации для принятияуказанных решений.
Отсюда казалось, что занимаясь системами распознавания, можно было бы не интересоваться опытно-теоретическим методом,отдатьегона откуп специалистам-испытателям сложных систем. При этом, если не учитывать неотъемлемое использование в составе СР средств измерений(а они нужны сложнойсистеме и без задач распознавания),то сама СР не выглядит как сложная.
Однако часто СР разрабатываются либо после создания систем принятия решений, являющихся сложными,либо самостоятельно врасчетена перспективное использование в какой-либо предметной области.То есть, в этих случаях разработчики СР встречаются с тем, что или не располагают изоморфнымимоделями объектов распознавания и средств измерений (они не были нужны разработчикам сложныхсистем) илипростолишены этих данных, так как предметная область применения СР еще не определилась. Поэтому и в первом и во втором (после определения предметной области) случаях становится важным для всесторонних оценок характеристик этих систем взгляд с позиций опытно-теоретического метода наупомянутое пересечение систем - объекты распознавания и средства измерения их параметров.Это обращение к опытно- теоретическому методузаставляет разработчиков СР самостоятельно идти по пути создания изоморфных моделей объектов и измерителей.В результате объединение модели СР с упомянутыми моделями уже представляется как сложная система со всеми вытекающими последствиями по ее испытаниям.
Дополнительно к изложенному можно заметить,что в соответствии с приведенными в нашем курсе определением главной задачейСРявляется получение информации об объекте распознавания.А это как раз и оправдывает объединение программно реализованного алгоритма распознавания с моделями объекта и измерителей при испытаниях системы распознавания.
Само моделирование объектов(явлений, процессов)распознавания почти всегдапредставляет собой достаточно объемную и сложную задачу.Примером может служить хотя бы разработка модели системы распознавания речевых сообщений.Объектраспознавания здесь - это в конечном итоге состояния речевого аппарата человека при производстве колебаний звукового диапазона.Сложностьэтого аппарата,его динамики не позволяет надеяться на легкое создание безупречной модели.При этом опытно-теоретический методиспытаний остается единственным в достижении высокой достоверности результатов отработки соответствующей СРнамодели. А без всестороннихиспытанийво всем факторном пространстве применения подобных систем,особенно для принятия решений высокой ответственности, не представляется возможным обойтись.Поэтому здесь создание изоморфных реальному речевому аппарату синтезаторов речи - этоодновременно и путь создания эффективных СР.
Можно найти достаточное число примеров из других областей науки итехники, которые подтвердят,что устраняться от использования принципов опытно-теоретического метода при создании СР не только нецелесообразно, но и ошибочно.
Отсюда арсеналом средств разработчикаСРпри созданиимоделей объектов иизмерителей должны быть следующие принципы опытно-теоретического метода:
1).Построение общей топологии модели СР, включая источники информации, и проведении ее декомпозиции.
2).Распределение задач между моделями и определение состава частных моделей.
3).Выбор и обоснование способов приближения моделей к реальным моделируемым объектам и измерителям их характеристик.
4).Выбор условийпроведения и планирование натурных испытаний информационных средств СР.
5).Обоснование объема экспериментов и проведение натурных испытаний информационныхсредств СР для оценки степени близости моделей и реальных объектов и измерителей.
6).Проведение параметрической и структурной доработок модели информационных средств СР на основе сравнения в одинаковых условиях результатов реальных испытаний и моделирования.
7).Проверка статистической совместимости моделей и соответствующих информационных средствввыбранных точкахфакторного пространства состояний объектов распознавания и измерителей их характеристик.
8).Проведение испытаний СР на моделях,определение характеристик качества программнореализованных алгоритмов,функционального взаимодействияэлементовсистемы и ее эффективности во всей области факторного пространства.
В целом опытно-теоретический метод подходк испытаниямсложныхсистем и его принципы основываются на целом ряде теоретических положений,решений и выводов,которые могут быть рассмотрены только вотдельномкурсе. Нашазадача - показать логическую приемлемость этого подхода к моделированию СР и адресовать будущего разработчика ктакимматериалам, излагающим соответствующие методы, как
1. Н.П.Бусленко. Теория больших систем. М.,”Наука”, 1969.
2. А.С.Шаракшанэ, И.Г.Железнов и др.
Сложные системы. М.,”Высшая школа”, 1977.
3. Г.И.Бутко,Ю.П.Порывкин и др.
Оценка характеристик систем управления летательными аппаратами. М.,”Машиностроение”, 1984.
5.8.2. Моделирование в задачах создания
и оптимизации систем распознавания
После того,как рассмотрены основные принципы построения моделей сложных систем и их испытаний с использованием моделирования, не сложно понять,на каком этапе создания СР может и должна появляться соответствующая модель.
Если обратиться к задачам создания СР,то первая из них -выбор признаков распознаваниязаданных объектов (явлений,процессов).То есть, в самом начале разработки СР в распоряженииразработчиканаходится конкретная, вполне определенная предметная область с ее объектами (явлениями, процессами).
Не вызывает сомнений то, что на рассматриваемом этапе уже возможно создание модели объектов (явлений, процессов), подлежащих распознаванию. В тожевремя соответствующая разработка оказывается в целом ряде случаев достаточно объемной, так как в самом начале работ в априорный словарьпризнаков включаются все возможные параметры,характеризующие объект (явление,процесс). А в результате последующего моделирования отдельныехарактеристики могут оказаться невостребованными в связи с тем, что не найдется соответствующего измерителя ихили его создание окажется экономически невозможным.
Поэтому хотя то всестороннее изучениесвойствобъекта, которое будет вуказанном случае проведено,и полезно для представлений возможного развития СР, разработка модели более целесообразной оказывается после анализа и выбора допустимого набора измерительных средств.
Так или иначе построение в выбранном признаковом пространстве модели, изоморфной реальному объекту,представляется достаточно мощным процессом для поиска наиболееэффективныхпризнаков распознавания.Указанный процессобязывает к глубокому анализу существа распознаваемого объекта.
В результатесоздания модели объекта появляется возможность очередного шага в построении модели СР в целом - возможность созданияи подключения модели средств измерений.
Далее после решения задачи выбора априорного алфавита классов(а это уже следующая задача создания СР) созданный комплекс из двух моделей (объекта и измерителей) позволяет методом статистических испытаний получить описание этих классов.То есть, статистически разыгрывая начальные условия состояния и движения объекта и измерителей егохарактеристик,получаем статистические данные (плотности распределения вероятностей) по каждому из признаков при их независимости в назначенных классах или совместные описания в более сложных случаях.
Если создается обучающаяся система,топосле выбораначальных приближений разделяющих функций классов (а это уже очередной этап создания СР) использование созданных моделей(объекта иизмерителей) обеспечит тем же методом статистических испытаний уточнение параметров указанных разделяющих функций. При этом появляется возможность проверки приемлемости для создаваемой системы различных решающих функций.
Для случая “полной” априорной информации (системабезобучения) задача выбора правила классификации также легко решается методом статистических испытаний.Здесь реализуется возможность проверки различных статистических критериев.
Как для обучающейся системы,так и для системы без обучения этап исследования решающих правил уже предполагает, что в состав модели входит модуль оценки эффективности.Без него предусматриваемое сравнение в приведенных случаях невозможно.
Таким образом,на всех этапах (при решении всех задач)создания СР любыхтипов моделированиеоказывается инструментом,избавляющим разработчика от сбора большого объема экспериментальныхданных.При этом, конечно,всегда предполагается,что применяемые модели прошли калибровку в рамках опытно-теоретического метода и являются изоморфными реальным аналогам.
В итоге рассмотрения роли и места моделирования в задачахсоздания систем распознавания образов остается вспомнить, что одно из важнейших направлений разработки - оптимизация эвристических выбороваприорного словаря признаков и априорногоалфавитаклассов. Однаков том, что моделирование может обеспечить выбор наиболее эффективных рабочего словаря и рабочего алфавита,уже пришлось убедиться при разработке структурной схемы полной модели СР.
В заключение необходимо обратить внимание на то, что общая структурная схема модели системы распознавания, рассматриваемая для вероятностного описания классов, остается справедливой для детерминированных и логических систем.Конечновнутренняя структура отдельных модулей должна быть подвергнута корректировке.Так в детерминированном случае ошибки измерений становятся несущественными и соответствующий субмодуль можно было бы исключить из модуля измерителя характеристик объекта распознавания. Точнотакжеупрощается модуль описания классов за счет использования набора детерминированных эталонов. Упрощается и модуль классификации.Нов целом вся структура модели остается приспособленной для испытаний детерминированных систем.
Аналогично свои особенности имеет реализация модели логической СР:
-результатыобработки информацииизмерителейпосле бинарного квантования должны преобразовываться в логические признаки;
-случайность результатов измерений за счет сопутствующих ошибок трансформируется вреально имеющую место случайность получения того или иного логического признака;
-описание классов выглядит в виде системы булевых функций классов с импликантами в виде произведений логических признаков;
-модульклассификации должен приобрести возможность решения булевых уравнений.
В то же время модуль оценки эффективности в основной своей частидолжен мало отличаться от модуля вероятностной системы,так какив этом случае оценки основываются на методе Монте-Карло.
Таким образом,разработанная общаяструктурная схема модели СР должна играть роль типовой, содержание модулей которой корректируется в зависимости от назначения системы и характеристик признаков распознавания.
Ë À Á Î Ð À Ò Î Ð Í Û Å Ð À Á Î Ò Û
Ï Î Ê Ó Ð Ñ Ó
"Îñíîâû ïîñòðîåíèÿ ñèñòåì
ðàñïîçíàâàíèÿ îáðàçîâ"
Лабораторная работа №1 по курсу “Основы построения систем распознавания образов”
Èññëåäîâàíèå ãåîìåòðè÷åñêèõ ìåð áëèçîñòè ðàñïîçíàâàåìûõ îáúåêòîâ è êëàññîâ
Целью лабораторнойработы является практическое освоение методов компьютерной реализации геометрических мер близости,применяемых для принятия решений в детерминированных системах распознавания.
1. Разработка алгоритма принятия решения в детерминированной системе распознавания на основе использования известных геометрических мер близости.
2. Программная реализация разработанного алгоритма.
3. Ввод заданных описаний 3-х классов на языке 11-и предложенных признаков распознавания (таблицы 1-3 - варианты заданий).
4. Отладка программы.
5. Выполнениеконтрольныхраспознаваний неизвестных объектов по векторам их признаков (таблица 4).
6. Сравнение принятых решений об отнесении неизвестных объектов к заданным классам по различным мерам близости.
1. Число классов распознавания - 5-10.
2. Размерность вектора признаков - до 20.
3. Число эталонов описания классов - 5-10.
4. Язык программирования - Паскаль, Си.
5. Программно должно быть предусмотрено использование для принятия решения всех введенных эталонов описания классов и их усредненных описаний.
6.Лабораторная работа должнабыть оформленав соответствии сустановленным порядком.
1. В качестве геометрических мер близости придетерминированном описании распознаваемыхобъектов и классовиспользовать
а)Эвклидово расстояние междуобъектами,описанными наязыке
признаков
б) Угловоерасстояние между векторами признаков распознаваемого объекта и эталона
в) Сумму модулей разности координат (признаков) объекта и эталона.
2. Решение о принадлежности объекта, представленного вектором Xw, к одному из классов принимается согласно правилам принятия решений в детерминированных системах.
Ïðèìå÷àíèå: Îïèñàíèå êëàññîâ k ýòàëîíàìè ìîæåò áûòü ïðåîáðàçîâàíî ê îïèñàíèþ îäíèìýòàëîíîì.Ýòî îñóùåñòâëÿåòñÿ îñðåäíåíèåì ýòàëîíîâïîïðèçíàêàì.
1é êëàññ ÒÀÁËÈÖÀ 1
ЭТАЛОНЫ |
|||||
№ признака |
1 |
2 |
3 |
4 |
5 |
1 |
0.95 |
0.80 |
0.90 |
0.70 |
1.00 |
2 |
0.54 |
0.68 |
0.47 |
0.75 |
0.80 |
3 |
0.80 |
0.40 |
0.90 |
0.30 |
0.50 |
4 |
0.65 |
0.90 |
0.80 |
0.60 |
0.70 |
5 |
0.81 |
0.51 |
0.91 |
0.71 |
1.00 |
6 |
0.42 |
0.56 |
0.14 |
0.70 |
1.00 |
7 |
1.00 |
0.56 |
0.78 |
0.67 |
0.34 |
8 |
0.60 |
0.81 |
1.00 |
0.74 |
0.88 |
9 |
0.64 |
0.51 |
0.77 |
0.25 |
1.00 |
10 |
0.50 |
0.63 |
1.00 |
0.24 |
0.76 |
11 |
0.51 |
1.00 |
0.25 |
0.77 |
0.64 |
2é êëàññ ÒÀÁËÈÖÀ 2
ЭТАЛОНЫ |
|||||
№ признака |
1 |
2 |
3 |
4 |
5 |
1 |
0.21 |
0.25 |
0.17 |
0.23 |
0.30 |
2 |
0.24 |
0.28 |
0.20 |
0.26 |
0.30 |
3 |
0.80 |
0.70 |
0.74 |
0.76 |
0.78 |
4 |
0.40 |
0.30 |
0.10 |
0.20 |
0.25 |
5 |
0.42 |
0.39 |
0.50 |
0.36 |
0.30 |
6 |
0.16 |
0.15 |
0.16 |
0.17 |
0.16 |
7 |
0.35 |
0.29 |
0.33 |
0.31 |
0.25 |
8 |
0.26 |
0.38 |
0.50 |
0.34 |
0.42 |
9 |
0.19 |
0.17 |
0.21 |
0.13 |
0.25 |
10 |
0.40 |
0.48 |
0.70 |
0.24 |
0.56 |
11 |
0.02 |
0.04 |
0.01 |
0.03 |
0.03 |
3é êëàññ ÒÀÁËÈÖÀ 3
ЭТАЛОНЫ |
|||||
№ признака |
1 |
2 |
3 |
4 |
5 |
1 |
0.21 |
0.25 |
0.17 |
0.23 |
0.30 |
2 |
0.60 |
0.80 |
0.40 |
0.70 |
1.00 |
3 |
1.00 |
0.80 |
0.84 |
0.86 |
0.88 |
4 |
1.00 |
0.90 |
0.70 |
0.80 |
0.85 |
5 |
0.15 |
0.12 |
0.21 |
0.09 |
0.03 |
6 |
0.08 |
0.06 |
0.10 |
0.14 |
0.09 |
7 |
0.25 |
0.20 |
0.22 |
0.21 |
0.18 |
8 |
0.25 |
0.34 |
0.44 |
0.31 |
0.37 |
9 |
0.19 |
0.17 |
0.21 |
0.13 |
0.25 |
10 |
0.49 |
0.57 |
0.83 |
0.33 |
0.65 |
11 |
0.04 |
0.06 |
0.03 |
0.05 |
0.05 |
4é êëàññ ÒÀÁËÈÖÀ 4
ЭТАЛОНЫ |
||||||
№ признака |
1 |
2 |
3 |
4 |
5 |
6 |
1 |
0.85 |
0.75 |
0.19 |
0.27 |
0.19 |
0.27 |
2 |
0.40 |
0.61 |
0.22 |
0.30 |
0.50 |
0.90 |
3 |
0.60 |
0.70 |
0.72 |
0.80 |
0.82 |
1.00 |
4 |
0.85 |
0.75 |
0.15 |
0.35 |
0.75 |
0.95 |
5 |
0.61 |
0.41 |
0.33 |
0.45 |
0.06 |
0.18 |
6 |
0.28 |
0.84 |
0.15 |
0.17 |
0.07 |
0.11 |
7 |
0.45 |
0.89 |
0.27 |
0.35 |
0.19 |
0.23 |
8 |
0.67 |
0.95 |
0.30 |
0.46 |
0.28 |
0.40 |
9 |
0.38 |
0.90 |
0.15 |
0.23 |
0.15 |
0.23 |
10 |
0.37 |
0.89 |
0.32 |
0.64 |
0.41 |
0.73 |
11 |
0.38 |
0.90 |
0.02 |
0.04 |
0.04 |
0.06 |
Ë È Ò Å Ð À Ò Ó Ð À
[1] Êîíñïåêò ëåêöèé ïî êóðñó "Îñíîâû ïîñòðîåíèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ".
Ëàáîðàòîðíàÿ ðàáîòà ¹2 ïî êóðñó “Îñíîâû ïîñòðîåíèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ”
Èññëåäîâàíèå âåðîÿòíîñòíîé ìåðû áëèçîñòè ðàñïîçíàâàåìûõ îáúåêòîâ è êëàññîâ
I. Öåëü ðàáîòû
Öåëüþ ëàáîðàòîðíîéðàáîòû ÿâëÿåòñÿ ïðàêòè÷åñêîå îñâîåíèå ìåòîäîâ êîìïüþòåðíîé ðåàëèçàöèè âåðîÿòíîñòíîé ìåðû áëèçîñòè, ïðèìåíÿåìîé äëÿ ïðèíÿòèÿ ðåøåíèé â âåðîÿòíîñòíûõ ñèñòåìàõ ðàñïîçíàâàíèÿ.
II. Çàäà÷è ëàáîðàòîðíîé ðàáîòû
1. Ðàçðàáîòêà àëãîðèòìà ïðèíÿòèÿ ðåøåíèÿ â âåðîÿòíîñòíîé ñèñòåìå ðàñïîçíàâàíèÿ íà îñíîâå èñïîëüçîâàíèÿ èçâåñòíîé âåðîÿòíîñòíîé ìåðû áëèçîñòè - ñðåäíåãî ðèñêà.
2. Ïðîãðàììíàÿ ðåàëèçàöèÿ ðàçðàáîòàííîãî àëãîðèòìà.
3. Ââîä çàäàííûõ îïèñàíèé êëàññîâ íà ÿçûêå ïðåäëîæåííûõ ïðèçíàêîâ ðàñïîçíàâàíèÿ.
4. Îòëàäêà ïðîãðàììû.
5. Âûïîëíåíèå êîíòðîëüíûõðàñïîçíàâàíèé íåèçâåñòíûõ îáúåêòîâ ïî âåêòîðàì ïðèçíàêîâ, çàäàííûõ ïðåïîäàâàòåëåì.
6. Ïðîâåäåíèå èññëåäîâàíèé âëèÿíèÿ íà ðåøåíèå î ïðèíàäëåæíîñòè
- àïðèîðíûõ âåðîÿòíîñòåé êëàññîâ;
- ïëàò, íàçíà÷àåìûõ çà îøèáî÷íûå ðåøåíèÿ.
III. Òðåáîâàíèÿ ê âûïîëíåíèþ çàäà÷.
1. ×èñëî êëàññîâ ðàñïîçíàâàåìûõ îáúåêòîâ - 3.
2. Êîëè÷åñòâî ïðèçíàêîâ ðàñïîçíàâàíèÿ - 1.
3. ßçûê ïðîãðàììèðîâàíèÿ - Ïàñêàëü, Ñè.
4. Ëàáîðàòîðíàÿ ðàáîòà äîëæíà áûòü îôîðìëåíà â ñîîòâåòñòâèè ñ óñòàíîâëåííûì ïîðÿäêîì.
5. Èññëåäîâàíèÿ âûïîëíèòü â äâà ýòàïà:
Ýòàï 1 - îöåíêà âëèÿíèÿ àïðèîðíûõ âåðîÿòíîñòåé êëàññîâíà ïðèíèìàåìûå ðåøåíèÿ î ïðèíàäëåæíîñòè;
Ýòàï 2 - îöåíêà âëèÿíèÿ ïëàò çà îøèáî÷íûå ðåøåíèÿ î ïðèíàäëåæíîñòèíà ýòè ðåøåíèÿ.
IV. Èñõîäíûå äàííûå äëÿ èññëåäîâàíèé
1. Óñëîâíûå àïðèîðíûå ïëîòíîñòè ðàñïðåäåëåíèÿ âåðîÿòíîñòåé, èñïîëüçóåìûåäëÿ îïèñàíèÿ êëàññîâ - íîðìàëüíûå ñ ìàòåìàòè÷åñêèìè îæèäàíèÿìè mi è ñðåäíåêâàäðàòè÷åñêèìè ðàçáðîñàìè -si (Òàáëèöà 1).
2. Èçìåðåííûå çíà÷åíèÿ ïðèçíàêîâ ïî ðàñïîçíàâàåìûì îáúåêòàì
- (Òàáëèöà 1)
3. Àïðèîðíûå âåðîÿòíîñòè êëàññîâ è ìàòðèöà ïëàò çà îøèáêè äëÿ ïåðâîãî èññëåäîâàíèÿ:
P(W1) |
P(W2) |
P(W3) |
|
1-é íàáîð |
0.1 |
0.8 |
0.1 |
2-é íàáîð |
0.2 |
0.6 |
0.2 |
3-é íàáîð |
0.3 |
0.4 |
0.3 |
4-é íàáîð |
0.4 |
0.2 |
0.4 |
5-é íàáîð |
0.4 |
0.1 |
0.5 |
4. Àïðèîðíûå âåðîÿòíîñòè êëàññîâ è ìàòðèöû ïëàò çà îøèáêè äëÿ âòîðîãî èññëåäîâàíèÿ:
P(W1)= 0.33, P(W2)= 0.33, P(W3)= 0.33.
5. Âàðèàíòû çàäàíèé
Òàáëèöà 1
Âàðèàíò |
Mi |
si |
||||||
Êëàññ 1 |
Êëàññ 2 |
Êëàññ 3 |
Êëàññ 1 |
Êëàññ 2 |
Êëàññ 3 |
|||
1 |
17 |
19 |
23 |
3 |
1.5 |
4 |
20 |
|
2 |
27 |
29 |
33 |
2.9 |
1.6 |
3.8 |
30 |
|
3 |
37 |
39 |
43 |
3.2 |
1.4 |
4.1 |
40 |
|
4 |
32 |
34 |
38 |
3 |
1.5 |
4 |
35 |
|
5 |
28 |
39 |
34 |
2.9 |
1.6 |
3.8 |
31 |
|
6 |
47 |
49 |
53 |
3.2 |
1.4 |
4.1 |
50 |
|
7 |
42 |
44 |
48 |
3 |
1.5 |
4 |
45 |
|
8 |
39 |
41 |
45 |
2.9 |
1.6 |
3.8 |
42 |
|
9 |
36 |
38 |
42 |
3.2 |
1.4 |
4.1 |
39 |
|
10 |
46 |
48 |
52 |
3 |
1.5 |
4 |
49 |
|
11 |
22 |
24 |
28 |
2.9 |
1.6 |
3.8 |
25 |
|
12 |
51 |
53 |
57 |
3.2 |
1.4 |
4.1 |
54 |
|
13 |
24 |
26 |
30 |
3 |
1.5 |
4 |
27 |
|
14 |
15 |
17 |
21 |
2.9 |
1.6 |
3.8 |
18 |
|
15 |
25 |
27 |
31 |
3.2 |
1.4 |
4.1 |
28 |
|
Ë È Ò Å Ð À Ò Ó Ð À
[1 ] Êîíñïåêò ëåêöèé ïî êóðñó "Îñíîâû ïîñòðîåíèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ".
Ëàáîðàòîðíàÿ ðàáîòà ¹ 3-1 ïî êóðñó "Îñíîâû ïîñòðîåíèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ"
Îöåíêà ýôôåêòèâíîñòè âåðîÿòíîñòíîé ñèñòåìû ðàñïîçíàâàíèÿ
I. Öåëü ðàáîòû
Öåëüþ ëàáîðàòîðíîé ðàáîòû ÿâëÿåòñÿ ïðàêòè÷åñêîå îñâîåíèå ìåòîäîâ êîìïüþòåðíîé ðåàëèçàöèè àëãîðèòìîâîöåíêè ýôôåêòèâíîñòè ÑÐ. Ëàáîðàòîðíàÿ ðàáîòà âûïîëíÿåòñÿ â ïðîöåññå ðåøåíèÿ êîíêðåòíîé çàäà÷è.
II.Çàäà÷è ëàáîðàòîðíîé ðàáîòû
2.1. Ðàçðàáîòàòü àëãîðèòì ðåøåíèÿ çàäà÷è ñëåäóþùåãî ñîäåðæàíèÿ:
â ïðîöåññå äåìîíòàæà ïðèâîäîâ íåêîòîðûõ óñòðîéñòâ, ïðîâîäèìîãî â öåëÿõ èõ ðåìîíòíî-âîññòàíîâèòåëüíûõ ðàáîò, àâòîìàòè÷åñêè êëàññèôèöèðóþòñÿè êîìïëåêòóþòñÿìóôòû âðàùàþùèõñÿ ñî÷ëåíåíèé ïî èõ âíóòðåííåìó äèàìåòðó. Ïðèíÿòûé òåõíîëîãè÷åñêèéïðîöåññ äåìîíòàæà îáóñëîâëèâàåò ñëó÷àéíûé õàðàêòåðäåìîíòàæà ìóôòû êàæäîãî òèïîðàçìåðà è ïåðåäà÷ó åå íà êëàññèôèêàöèþ è êîìïëåêòîâàíèå.
Ñðåäíåêâàäðàòè÷åñêàÿ îøèáêà èçìåðåíèé âíóòðåííåãî äèàìåòðà ìóôòû ñïåöèàëüíîé ýëåêòðîìåõàíè÷åñêîé ñèñòåìîé ñîñòàâëÿåò 3 ìì.
Âñåãî â äåìîíòèðóåìûõ èçäåëèÿõ èñïîëüçóåòñÿ 5 òèïîðàçìåðîâ ìóôò, âíóòðåííèå äèàìåòðû êîòîðûõ è êîëè÷åñòâî ïðèâåäåíû â òàáëèöå
Êîë-âî ìóôò |
Äèàìåòðû ìóôò ïî âàðèàíòàì |
|||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
||
100 |
3 |
7 |
18 |
35 |
4 |
17 |
8 |
11 |
5 |
20 |
6 |
10 |
19 |
|
100 |
6 |
10 |
21 |
38 |
7 |
20 |
11 |
14 |
8 |
23 |
9 |
13 |
22 |
|
100 |
9 |
13 |
24 |
41 |
10 |
23 |
14 |
17 |
11 |
26 |
12 |
16 |
25 |
|
100 |
12 |
16 |
27 |
44 |
13 |
26 |
17 |
20 |
14 |
29 |
15 |
19 |
28 |
|
100 |
15 |
19 |
30 |
47 |
16 |
29 |
20 |
23 |
17 |
32 |
18 |
22 |
31 |
2.2. ðåçóëüòàòå ðàçðàáîòêè:
2.2.1. Îïèñàòü êëàññû ñèñòåìû ðàñïîçíàâàíèÿ, ó÷èòûâàÿ ÷òî îøèáêè èçìåðåíèéâ òåõíè÷åñêèõ óñòðîéñòâàõ ïðèâîäÿò,êàê ïðàâèëî,ê íîðìàëüíîìó çàêîíó ðàñïðåäåëåíèÿ âåðîÿòíîñòåé îöåíèâàåìîãî ïàðàìåòðà.
2.2.2. Ðàññ÷èòàòü âåðîÿòíîñòè îøèáîê ëîæíîé êëàññèôèêàöèè ìóôò ïðåäëàãàåìîé ñèñòåìîé.
2.2.3. Îïðåäåëèòü àïðèîðíûé ðèñê ðàñïîçíàâàíèÿ â ñèñòåìå ïðè ðàâíûõ ïëàòàõ çà îøèáêè.(Ãðàíèöû ìåæäó i-ûì è i+1-ûì êëàññàìè óñòàíàâëèâàþòñÿ ïî ðàâåíñòâó ïëîòíîñòåé ðàñïðåäåëåíèÿ âåðîÿòíîñòåé ñîñåäíèõ êëàññîâ, òî åñòü:
mi + mi+1
ài,i+1 = ¾¾¾¾
2
ãäå mi è mi+1 - ìàòåìàòè÷åñêèå îæèäàíèÿîïèñàíèé ñîñåäíèõ êëàññîâ.)
2.3. Âûïîëíèòü ïðîãðàììíóþ ðåàëèçàöèþ ðàçðàáîòàííîãî àëãîðèòìà.
2.4. Îòëàäèòü ïðîãðàììó.
2.5. Âûïîëíèòü ðàñ÷åòû.
2.6. Ïðîâåñòè àíàëèç è îôîðìëåíèå ðåçóëüòàòîâ.
III. Ìåòîäè÷åñêèå óêàçàíèÿ ê âûïîëíåíèþ çàäàíèÿ.
3.1. Ïðîãðàììà ðàñ÷åòà è àíàëèçà ýôôåêòèâíîñòè ìîæåò áûòü âûïîëíåíà íà ëþáîì ÿçûêå âûñîêîãî óðîâíÿ.
3.2. Çàâèñèìîñòè âåðîÿòíîñòåé îøèáîê êëàññèôèêàöèè è ñðåäíåãî ðèñêà îò ÑÊÎ èçìåðåíèé îôîðìèòü ãðàôè÷åñêè.
3.3. Äëÿ èñïîëüçîâàíèÿïðè ðåøåíèè èíòåãðàëà Ëàïëàñà íåîáõîäèìî ðàçðàáîòàòü ïðîãðàììíóþ ôóíêöèþ íà îñíîâå åãî ðàçëîæåíèÿ â ðÿä.
3.4.Ïðè èíòåãðèðîâàíèè íîðìàëüíîé ïëîòíîñòè ðàñïðåäåëåíèÿ âåðîÿòíîñòåé èñïîëüçîâàòü ñëåäóþùåå çíà÷åíèå èíòåãðàëà Ëàïëàñà
Ë È Ò Å Ð À Ò Ó Ð À
[1] Êîíñïåêò ëåêöèé ïî êóðñó "Îñíîâû ïîñòðîåíèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ".
Ëàáîðàòîðíàÿ ðàáîòà ¹ 3-2 ïî êóðñó "Îñíîâû ïîñòðîåíèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ"
Èññëåäîâàíèå âëèÿíèÿ îøèáîê ðàñïîçíàâàíèÿ íà ýôôåêòèâíîñòü âåðîÿòíîñòíîé ñèñòåìû
I. Öåëü ðàáîòû
Öåëüþ ëàáîðàòîðíîé ðàáîòû ÿâëÿåòñÿ ïðàêòè÷åñêîå îñâîåíèå ìåòîäîâ êîìïüþòåðíîé ðåàëèçàöèèàëãîðèòìîâîöåíêè ýôôåêòèâíîñòè ÑÐ. Íàñòîÿùàÿ ëàáîðàòîðíàÿ ðàáîòà îñíîâûâàåòñÿ íà âûïîëíåííîé ëàáîðàòîðíîé ðàáîòå N 3-1 è ÿâëÿåòñÿ åå ïðîäîëæåíèåì.
II. Çàäà÷è ëàáîðàòîðíîé ðàáîòû
2.1.  êà÷åñòâå àëãîðèòìà äëÿ âûïîëíåíèÿ íàñòîÿùåé ðàáîòû èñïîëüçîâàòü àëãîðèòì, ðàçðàáîòàííûé â ëàáîðàòîðíîé ðàáîòå ¹ 3-1.
2.2. Èñõîäíûå äàííûå äëÿ ðàñ÷åòîâ îñòàâèòü òåìè æå, ÷òî áûëè âûáðàíû ïî ïðåäëîæåííîìó âàðèàíòó â ëàáîðàòîðíîé ðàáîòå ¹ 3-1.
2.3. Òðåáóåòñÿ:
2.3.1. Ñðåäè îøèáîê êëàññèôèêàöèè ìóôò (ñì. ëàáîðàòîðíóþ ðàáîòó № 3-1)íàéòèòàêóþ, êîòîðàÿèìååò ìàêñèìàëüíóþ âåðîÿòíîñòü
2.3.2. Èñïîëüçóÿ ñîçäàííóþ â ëàáîðàòîðíîé ðàáîòå ¹ 3-1 ïðîãðàììó, ðàññ÷èòàòüçàâèñèìîñòü ìàêñèìàëüíîé ïî âåðîÿòíîñòè îøèáêè êëàññèôèêàöèè P(Wk/Wd) îò âåëè÷èíû ÑÊÎ îøèáêè èçìåðåíèé äèàìåòðà ïðè äèñêðåòíîì ïîâûøåíèè òî÷íîñòè èçìåðèòåëÿ äèàìåòðà s= 3 ìì, 2.5 ìì, 2 ìì, 1.5 ìì, 1 ìì è 0.5 ìì:
P(Wk/Wd)= F1(s).
2.3.3. Äëÿ òåõ æå çíà÷åíèé îøèáêè èçìåðåíèé (ï.2) ðàññ÷èòàòüçàâèñèìîñòü ñðåäíåãî ðèñêà ðàñïîçíàâàíèÿ:
_
R = F2(s).
2.3.4. Ïî ðåçóëüòàòàì îïðåäåëåíèÿ â ï 2. çàâèñèìîñòè P(Wk/Wd)=F1(s) ïðåäúÿâèòü òðåáîâàíèå ê òî÷íîñòè ñèñòåìû èçìåðåíèé âíóòðåííåãî äèàìåòðà ìóôò (ÑÊÎ) äëÿ âûïîëíåíèÿ òðåáîâàíèÿ òåõíè÷åñêîãî çàäàíèÿ íà ñèñòåìó ðàñïîçíàâàíèÿ - íå áîëåå äâóõ îøèáî÷íûõ êëàññèôèêàöèé íà 500 ìóôò .
2.4. Âûïîëíèòü ðàñ÷åòû.
2.5. Ïðîâåñòè àíàëèç è îôîðìèòü ðåçóëüòàòû.
III. Ìåòîäè÷åñêèå óêàçàíèÿ ê âûïîëíåíèþ çàäàíèÿ.
3.1. Çàâèñèìîñòè âåðîÿòíîñòåé îøèáîê êëàññèôèêàöèè è ñðåäíåãî ðèñêà îò ÑÊÎ èçìåðåíèé îôîðìèòü ãðàôè÷åñêè.
3.2. Ïðè âûïîëíåíèè ï. 2.3.4 âîñïîëüçîâàòüñÿ ëèíåéíîé èíòåðïîëÿöèåé .
Ë È Ò Å Ð À Ò Ó Ð À
[1] Êîíñïåêò ëåêöèé ïî êóðñó "Îñíîâû ïîñòðîåíèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ".
Ëàáîðàòîðíàÿ ðàáîòà ¹ 3-3 ïî êóðñó "Îñíîâû ïîñòðîåíèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ"
Îöåíêà âëèÿíèÿ ÷èñëà êëàññîâ íà ýôôåêòèâíîñòü âåðîÿòíîñòíîé ñèñòåìû ðàñïîçíàâàíèÿ
I. Öåëü ðàáîòû
Öåëüþ ëàáîðàòîðíîé ðàáîòû ÿâëÿåòñÿ ïðàêòè÷åñêîå îñâîåíèå ìåòîäîâîöåíêè ýôôåêòèâíîñòè ÑÐ. Íàñòîÿùàÿ ëàáîðàòîðíàÿ ðàáîòà âûïîëíÿåòñÿ êàê ïðîäîëæåíèå ëàáîðàòîðíûõ ðàáîò ¹¹ 3-1, 3-2.
II.Çàäà÷è ëàáîðàòîðíîé ðàáîòû
2.1. Íà îñíîâå ðàçðàáîòàííîé ïðîãðàììû è ðåçóëüòàòîâ ðàñ÷åòîâ ïî ëàáîðàòîðíûì ðàáîòàì ¹¹ 3-1, 3-2 ïîâòîðèòü âûïîëíåíèå èõ òðåáîâàíèé, ïðåäâàðèòåëüíî èñêëþ÷èâ èç ñîñòàâà êëàññèôèöèðóåìûõ ìóôò 100 øòóê ñëåäóþùèõ äèàìåòðîâ ïî âàðèàíòàì:
Äèàìåòðû èñêëþ÷àåìûõ ìóôò â ìì ïî âàðèàíòàì
Âàðèàíò |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
Äèàìåòð |
9 |
13 |
24 |
41 |
10 |
23 |
14 |
17 |
11 |
26 |
12 |
16 |
25 |
2.2. Ñðàâíèòü çàâèñèìîñòü àïðèîðíîãî ðèñêà îò òî÷íîñòåé èçìåðåíèÿ ïðèçíàêà ðàñïîçíàâàíèÿ ñ çàâèñèìîñòüþ, ïîëó÷åííîéâ ïåðâîì èññëåäîâàíèè (ëàáîðàòîðíàÿ ðàáîòà ¹3-2).
2.3. Ñðàâíèòü çàâèñèìîñòü ìàêñèìàëüíîé îøèáêè ðàñïîçíàâàíèÿ êëàññîâ îò òî÷íîñòåé èçìåðåíèÿ ïðèçíàêà ðàñïîçíàâàíèÿ ñ çàâèñèìîñòüþ, ïîëó÷åííîé â ïåðâîì èññëåäîâàíèè, è ïîÿñíèòü ðåçóëüòàò.
Ë È Ò Å Ð À Ò Ó Ð À
[1] Êîíñïåêò ïî êóðñó "Îñíîâû ïîñòðîåíèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ".
Â Î Ï Ð Î Ñ Û
ÏÐÀÊÒÈ×ÅÑÊÈÕ ÇÀÍßÒÈÉ ÏÎ ÊÓÐÑÓ
"Îñíîâû ïîñòðîåíèÿ
ñèñòåì ðàñïîçíàâàíèÿ
îáðàçîâ"
Ç À Í ß Ò È Å¹ 1
Îñîáåííîñòè çàäà÷ ïîñòðîåíèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ
1.Îñíîâíûå îïðåäåëåíèÿ òåîðèè (îáúåêò, îáðàç, ðàñïîçíàâàíèå, ñèñòåìà ðàñïîçíàâàíèÿ).
2.Èíâàðèàíòíîñòü çàäà÷ ïîñòðîåíèÿ ÑÐ îòíîñèòåëüíî ïðèìåíåíèé è óçêàÿ ñïåöèôè÷íîñòü òåõíè÷åñêèõ ÑÐ.
3.Ñîäåðæàíèå è îñîáåííîñòèI ýòàïà ñîçäàíèÿ ÑÐ. Îïðåäåëåíèå ïîëíîãî ïåðå÷íÿ ïðèçíàêîâ ðàñïîçíàâàíèÿ.
4.Ñîäåðæàíèå è îñîáåííîñòè II ýòàïà ñîçäàíèÿ ÑÐ. Ðàçðàáîòêà àïðèîðíîãî àëôàâèòà êëàññîâ.
5.Ñîäåðæàíèå è îñîáåííîñòè III è IV ýòàïîâ ñîçäàíèÿ ÑÐ. Ðàçðàáîòêà àïðèîðíîãî ñëîâàðÿ ïðèçíàêîâ è îïèñàíèå êëàññîâ.
6.Ñîäåðæàíèå è îñîáåííîñòèV ýòàïà ñîçäàíèÿ ÑÐ. Ðàçáèåíèå àïðèîðíîãî ïðîñòðàíñòâà ïðèçíàêîâ íà îáëàñòè, ñîîòâåòñòâóþùèå àëôàâèòó êëàññîâ. Âûáîð àëãîðèòìà êëàññèôèêàöèè.
7.Ñîäåðæàíèå è îñîáåííîñòèVI ýòàïà ñîçäàíèÿ ÑÐ. Îïðåäåëåíèå ðàáî÷åãî àëôàâèòà êëàññîâ è ðàáî÷åãî ñëîâàðÿ ïðèçíàêîâ.
Ç À Í ß Ò È Å№ 2
Êëàññèôèêàöèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ
1.Êëàññèôèêàöèÿ ñèñòåì ðàñïîçíàâàíèÿ (ïðîñòûå è ñëîæíûå).
2.Êëàññèôèêàöèÿ ñèñòåì ðàñïîçíàâàíèÿ (ñèñòåìû áåç îáó÷åíèÿ, îáó÷àþùèåñÿ è ñàìîîáó÷àþùèåñÿ).
3.Êëàññèôèêàöèÿ ñèñòåì ðàñïîçíàâàíèÿ (îáùèå ïðåäñòàâëåíèÿ î ëîãè÷åñêèõ è ñòðóêòóðíûõ ñèñòåìàõ).
4.Êëàññèôèêàöèÿ ñèñòåì ðàñïîçíàâàíèÿ (äåòåðìèíèðîâàííûå è âåðîÿòíîñòíûå ñèñòåìû).
Ç À Í ß Ò È Å¹ 3
Îñíîâíûå îñîáåííîñòè äåòåðìèíèðîâàííûõ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ
1.Îïèñàíèå êëàññîâ íà ÿçûêå äåòåðìèíèðîâàííûõ ïðèçíàêîâ.
2.Ìåðû áëèçîñòè, èñïîëüçóåìûå äëÿ îöåíêè ïðèíàäëåæíîñòè îáðàçîâ â äåòåðìèíèðîâàííûõ ñèñòåìàõ ðàñïîçíàâàíèÿ.
3.Ðåøàþùåå ïðàâèëî äëÿ êëàññèôèêàöèè îáúåêòîâ, îïèñàííûõ íà ÿçûêå äåòåðìèíèðîâàííûõ ïðèçíàêîâ.
Ç À Í ß Ò È Å¹ 4
Îñíîâíûå îñîáåííîñòè âåðîÿòíîñòíûõ ñèñòåì
ðàñïîçíàâàíèÿ îáðàçîâ
1.Îïèñàíèå êëàññîâ íà ÿçûêå âåðîÿòíîñòíûõ ïðèçíàêîâ ðàñïîçíàâàíèÿ.
2.Ïîðÿäîê íàçíà÷åíèÿ ïëàò çà îøèáî÷íûå ðåøåíèÿ.
3.Ìåðû áëèçîñòè, èñïîëüçóåìûå äëÿ îöåíêè ïðèíàäëåæíîñòè îáðàçîâ â âåðîÿòíîñòíûõ ñèñòåìàõ.
4.Îïðåäåëåíèå àïîñòåðèîðíûõ âåðîÿòíîñòåé êëàññîâ.
5.Ðåøàþùåå ïðàâèëî äëÿ êëàññèôèêàöèè îáúåêòîâ, îïèñàííûõ íà ÿçûêå âåðîÿòíîñòíûõ ïðèçíàêîâ ðàñïîçíàâàíèÿ. Àïîñòåðèîðíûé ðèñê.
Ç À Í ß Ò È Å№ 5
Îñîáåííîñòè ýâðèñòè÷åñêèõ âûáîðîâ ïðèçíàêîâ è êëàññîâ
1.Àïðèîðíàÿ îöåíêà ýôôåêòèâíîñòè âåðîÿòíîñòíîé ñèñòåìû ðàñïîçíàâàíèÿ. Àïðèîðíûé ðèñê.
2.Îïðåäåëåíèå âåðîÿòíîñòè îøèáêè ïðè îöåíêå ñðåäíåãî àïðèîðíîãî ðèñêà. Îñîáåííîñòè îïðåäåëåíèÿ îøèáîê ïðè îïèñàíèè êëàññîâ íîðìàëüíîé ïëîòíîñòüþ ðàñïðåäåëåíèÿ âåðîÿòíîñòåé.
3.Äîêàçàòåëüñòâî âëèÿíèÿ ÷èñëà ïðèçíàêîâ íà ýôôåêòèâíîñòü ðàñïîçíàâàíèÿ.
4.Äîêàçàòåëüñòâî âëèÿíèÿ ÷èñëà êëàññîâ íà ýôôåêòèâíîñòü ðàñïîçíàâàíèÿ.
Ç À Í ß Ò È Å¹ 6
Îñíîâû ìàòåìàòè÷åñêîãî ìîäåëèðîâàíèÿ ñëîæíûõ
òåõíè÷åñêèõ ñèñòåì
1.Îñíîâíûå îïðåäåëåíèÿ òåîðèè ìîäåëèðîâàíèÿ ñèñòåì (ìîäåëü, ìîäåëèðîâàíèå, îïèñàíèå ñèñòåìû, èçîìîðôíîñòü ìîäåëè è ñèñòåìû).
2.Õàðàêòåðíûå îñîáåííîñòè ñëîæíûõ ñèñòåì. Ïðèíöèïû ïîñòðîåíèÿ ìîäåëåé ñëîæíîé ñèñòåìû (äåêîìïîçèöèè, äîïóñòèìûõ óïðîùåíèé).
3.Íàçíà÷åíèå è ñóùíîñòü îïûòíî-òåîðåòè÷åñêîãî ìåòîäà èñïûòàíèé ñëîæíûõ ñèñòåì.
4.Íàçíà÷åíèå ÷àñòíûõ è ñèñòåìíûõ ìîäåëåé â èñïûòàíèÿõ ñëîæíûõ ñèñòåì.
Ç À Í ß Ò È Å№ 7
Ìåòîä ñòàòèñòè÷åñêèõ èñïûòàíèé (Ìîíòå-Êàðëî)
1.Ñóùíîñòü ìåòîäà ñòàòèñòè÷åñêèõ èñïûòàíèé è åãî äîñòîèíñòâà.
2.Ïîíÿòèå ïñåâäîñëó÷àéíîãî ÷èñëà. Îñîáåííîñòè êâàçèñëó÷àéíûõ âåëè÷èí, ïîëó÷àåìûõ íà ÝÂÌ.
3.Ïðèíöèïû ñòàòèñòè÷åñêîãî ìîäåëèðîâàíèÿ íåçàâèñèìûõ ñëó÷àéíûõ ñîáûòèé.
4.Ñïîñîáû ïîëó÷åíèÿ íà ÝÂÌ ñëó÷àéíûõ ÷èñåë ñ çàäàííûì çàêîíîì ðàñïðåäåëåíèÿ.
Ç À Í ß Ò È Å¹ 8
Ìàòåìàòè÷åñêîå ìîäåëèðîâàíèå ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ
1.Öåëü êîìïüþòåðíîãî ìîäåëèðîâàíèÿ ÑÐ.
2.Îñîáåííîñòè ìîäåëèðîâàíèÿ ðàñïîçíàâàåìîãî îáúåêòà.
3.Ìîäåëèðîâàíèå ñðåäñòâ îïðåäåëåíèÿ õàðàêòåðèñòèê ðàñïîçíàâàåìûõ îáúåêòîâ.
4.Ìîäåëèðîâàíèå êàíàëîâ ñâÿçè è ïåðåäà÷è èíôîðìàöèè.
5.Îöåíêà ýôôåêòèâíîñòè ðàñïîçíàâàíèÿ ïðè ìîäåëèðîâàíèè ÑÐ.
6.Çàäà÷è óïðàâëåíèÿ ïðè ìîäåëèðîâàíèè.
7.Îñîáåííîñòè ïðèìåíåíèÿ îïûòíî-òåîðåòè÷åñêîãî ìåòîäà èñïûòàíèé ñëîæíûõ ñèñòåì ê ìîäåëèðîâàíèþ ÑÐ.
8.Èñïîëüçîâàíèå ìîäåëèðîâàíèÿ ÑÐ íà ýòàïàõèõ ñîçäàíèÿ è îïòèìèçàöèè.
Ë È Ò Å Ð À Ò Ó Ð À
[1] Êîíñïåêò ëåêöèé ïî êóðñó "Îñíîâû ïîñòðîåíèÿ ñèñòåì ðàñïîçíàâàíèÿ îáðàçîâ".
[2] Ãîðåëèê À.Ë. Ìåòîäû ðàñïîçíàâàíèÿ.Ì., "Âûñøàÿ øêîëà", 1986 ã.
[3] Аðêàäüåâ À.Ã., Áðàâåðìàí Ý.Ì. "Îáó÷åíèå ìàøèíû ðàñïîçíàâàíèþ îáðàçîâ"Ì., "Íàóêà", 1964 ã.
[4]Ëåâèí Á.Ð."Òåîðåòè÷åñêèå îñíîâû ñòàòèñòè÷åñêîé ðàäèîòåõíèêè"
Ì. , "Ñîâ.ðàäèî", 1968 ã.
[5] Âåíòöåëü Å.Ñ . "Òåîðèÿ âåðîÿòíîñòåé" М."Ôèçìàòãèç", 1969 ã.
[6]Ìàðòèí Ô. "Ìîäåëèðîâàíèå íà âû÷èñëèòåëüíûõ ìàøèíàõ"Ì., "Ñîâ.ðàäèî", 1972 ã.
[7]Ïîëëÿê Þ.Ñ. "Âåðîÿòíîñòíîå ìîäåëèðîâàíèå"Ì., "Ñîâ.ðàäèî", 1971 ã.
[8] Áóñëåíêî Í.Ï., Ãîëåíêî Ä.È., Ñîáîëü È.Ì. è äð "Ìåòîä ñòàòèñòè÷åñêèõ èñïûòàíèé. (Ìåòîä Ìîíòå- Êàðëî)" Ì., ÃÈÔÌË, 1962 ã.
[9] Âàñèëüåâ Â.È. "Ðàñïîçíàþùèå ñèñòåìû. Ñïðàâî÷íèê" Êèåâ, Íàóêîâà äóìêà, 1983 ã.
[10] Áàðàáàø Þ.Ë., Çèíîâüåâ Á.Â. è äð. "Âîïðîñû ñòàòèñòè÷åñêîé òåîðèè ðàñïîçíàâàíèÿ" Ì., Ñîâ. ðàäèî, 1967 ã.
[11]"Ôèçèêà âèçóàëèçàöèè èçîáðàæåíèé â ìåäèöèíå" ò.2., Ì., Ìèð, 1991 ã.