Представление знаний

Загрузить архив:
Файл: ref-30947.zip (272kb [zip], Скачиваний: 55) скачать

Московский авиационный институт (государственный технический университет)

Факультет прикладной физики и математики

Кафедра вычислительной математики и программирования

Реферат на тему «Представление знаний»

Преподаватель: Д. В. Сошников Студент: Ю. М. Сергукова Группа: 08-406

Москва, 2010

Содержание

1 Введение 2 2 Представление знаний. Теоретическая часть 3 Данные,информацияизнания ........................ 3 Классификациязнаний ............................ 4 ОсобенностипредставлениязнанийвнутриИС .............. 4 Моделипредставлениязнаний ........................ 6 Продукционнаямодель ........................ 7 Логическаямодель .......................... 7 Сетеваямодель ............................. 8 Формальныеграмматики ....................... 8 Фреймовыемодели .......................... 8 Комбинаторныемодели ........................ 9 Ленемы ................................. 9 Алгебраическиемодели ........................ 10 Нейронныесети,генетическиеалгоритмы ............. 10 3 Заключение 12

1. Введение

В повседневной жизни, порой не замечая этого, человек постоянно обрабатывает ин-формацию: получает ее, запоминает, вспоминает, делает выводы, анализирует, вно-сит поправки в свои суждения, строит на основе полученных знаний и предположе-ний свое поведение. Поэтому логично предположить, что, задавшись целью создать искусственный интеллект равный по мощности (или даже превосходящий) челове-ческому, захочется наделить этот новый разум аналогичными способностями (как минимум) к восприятию окружающей среды, речи, анализу ситуации, построению выводов, предположений, обладанию «характером», памятью. Некоторые из этих пунктов весьма и весьма спорны, однако, все во многом зависит от того, какими именно чертами мы хотим наделить искусственный интеллект. Так, например, ими-тация характера и настроения совсем не обязательна и может даже мешать дости-жению поставленных целей и объективной оценке, в то время как для прохождения теста Тьюринга она может быть необходима.

Но среди перечисленных «способностей» есть несколько, которые качественно от-личали бы искусственный разум от простого суперкомпьютера. Они касаются по-лучения и обработки информации, умения пользоваться полученными знаниями и применять их.

Таким образом мы подходим к одной из основных проблем — как «научить» машину хранить и обрабатывать знания, не пользуясь помощью человека в их подготовке, а получая их на основе собственной деятельности. Эта проблема решается 6 различ-ными направлениями в теории искусственного интеллекта:

1) Представление знаний.

2) Манипулирование знаниями.

3) Общение.

4) Восприятие.

5) Обучение.

6) Поведение.

Рассмотрим первую из них, а именно — представление знаний.

2. Представление знаний. Теоретическая часть

2.1. Данные, информация и знания

Прежде, чем рассуждать о представлении знаний в доступном и «понятном» машине виде, требуется определиться с терминологией. Это в достаточной степени проблема-тично, так как такие термины, как «информация», «данные» и «знания» не имеют четкого определения, а то множество определений, что были созданы человечеством, иногда не просто частично пересекаются, а даже противоречат одно другому. Пере-числим некоторые из них, которые более точно описывают нашу предметную об-

ласть.
Данные — факты и идеи, представленные в некотором, четко формализован-

ном виде, в котором их можно использовать для передачи в инфор-

мационном процессе;

— сведения, представленные в определенной знаковой системе и

на определенном материальном носителе для обеспечения возмож-

ностей хранения, передачи, приема и обработки.
Информация — данные, определенным образом организованные, имеющие для

своего получателя смысл, значение и ценность, необходимые ему для

принятия решений, а также реализации других функций;

— это данные, сопровождающиеся смысловой нагрузкой, помещен-

ные в некоторый контекст; данные, как-либо оцениваемые получа-

телем информации. При этом то, что для одних является данными,

для других может оказаться информацией.
Знания — проверенная информация и/или та информация, которой дове-ряют, результаты принятия решений, поведения, обобщенные в виде

теорем и законов, совокупности взглядов;

— зафиксированная и проверенная практикой информация, которая

может многократно использоваться людьми для решения тех или

иных задач.

Таким образом, мы получаем следующие закономерности:

имеют смысл

проверенная

При этом на данной диаграмме при движении слева направо уменьшается формали-зованность представления. И стоящая перед нами задача — представление знаний, самой неформальной сущности.

2.2. Классификация знаний

Можно найти и другие критерии для классификации знаний, но уже этого достаточ-но, чтобы показать разнородность человеческих знаний. Так, эмпирическое знание может быть одновременно и процедурным и личностным.

Логично предположить, что для описания той или иной категории лучше подходят определенные средства, в то время как другие значительно понижают эффектив-ность хранения и/или использования. Остановимся на общих моментах, абстрагиро-вавшись от вида категории знаний.

2.3. Особенности представления знаний внутри ИС

Представление знаний в памяти ЭВМ или на внешних носителях должно иметь осо-бенности, отличающие знания от данных, например, такие как:

  • внутренняя интерпретируемость;
  • структурированность;
  • связность;
  • семантическая метрика;
  • активность;

конвертируемость.

Сперва следует отдельно указать, что обрабатываемой единицей для знаний является факт, а не запись данных. Факт — это некоторая запись, наделенная семантикой.

Теперь рассмотрим каждый вышеобозначенный пункт в отдельности. Внутренняя интерпретируемость. Каждая информационная единица должна иметь уникальное имя, по которому ИС находит ее, а также отвечает на запросы, в кото-рых это имя упомянуто. Роль «имени» может выполнять набор аттрибутов. Смысл такого расширения данных — идентифицировать данные и их назначение должна уметь не только посторонняя программа, которая обладает информацией о том, как правильно расшифровать эти данные, но и сама система.

Структурированность. Информационные единицы должны обладать гибкой струк-турой. Для них может выполняться рекурсия—вложимость одних информационных единиц в другие. Иначе говоря, должна существовать возможность произвольно-го установления между отдельными информационными единицами отношений типа «часть—целое», «род—вид» или «элемент—класс».

Связность. Между информационными единицами должна быть предусмотрена воз-можность установления связей различного типа. Семантика отношений может носить декларативный или процедурный характер. Например, две и более информацион-ные единицы могут быть связаны отношением «одновременно», две информационные единицы — отношением «причина—следствие» или «быть рядом».

Семантическая метрика. На множестве информационных единиц в некоторых слу-чаях полезно задавать отношение, характеризующее их ситуационную близость, т.е. силу ассоциативной связи. Отношение релевантности при работе с информационны-ми единицами позволяет находить знания, близкие к уже найденным, но не имеющие с ними прямой связи. Этот пункт считается критичным для моделирования челове-ческих воспоминаний, построения ассоциаций, моделирования процесса генерации идей.

Активность. Данные обычно пассивны и используются командами в случае необхо-димости. Для ИС выполнение программ должно наоборот инициироваться текущим состоянием системы.

Конвертируемость. Содержание знаний не должно зависить от его записи. Поэтому форма представления, уровень детализации и степень неопределенности информации о предметной области может трансформироваться в процессе перехода к очередному этапу решения интеллектуальной задачи. Это свойство, в отличие от предыдущих, отражает динамичность знаний и связано с обучением системы.

2.4. Модели представления знаний

Среди множества разработанных моделей представления знаний можно выделить два основных подхода: эмпирический и теоретический.

Эмпирический подход основывается на исследовании сознания человека, изучении

принципов организации памяти и моделировании механизмов решения задач. Другой подход — теоретический, можно также назвать теоретически обоснованным. Он «гарантирует» правильность решений. В рамках этого подхода до настоящего времени удавалось решать только сравнительно простые задачи из узкой предметной

области. Кроме моделей, разработанных в рамках каждого из этих подходов, отдельно вы-деляют (относя к обоим подходом сразу) бионическое направление, представленное генетическими алгоритмами и нейронными сетями.

В каждом подходе мы увидим свое отношение и к тому, что является знанием, и к тому, как его представлять. Если в теоретических моделях знания строго формали-зованы, то эмпирические призваны дать некоторую свободу. Однако, ценой за эту свободу будет потенциальная невыводимость некоторых решений и невозможность найти ответ на поставленный вопрос, когда теоретические модели это гарантируют.

Рассмотрим каждую из моделей.

2.4.1. Продукционная модель

Это одна из самых распространенных моделей представления знаний. В ее осно-ве лежит набор правил вида «если условие, то действие», описывающих знания. Оперируя этими правилами можно построить прямой или обратный вывод. Прямой вывод — это поиск действия по заданному условию, обратный — поиск возможных условий, которые могли бы привести к указанному действию.

Продукционная модель понятна и с ее помощью можно легко записать поведение или даже построение выводов, однако при достаточном количестве правил возникает противоречивость некоторых из них, которая приводит модель в негодность. Также к ее недостаткам можно отнести неясность взаимных отношений правил и сложность оценки базы знаний.

2.4.2. Логическая модель

Вся информация в логической модели рассматривается как совокупность фактов и связывающих их утверждений, которые представляются как формулы в некоторой логике. Знания при этом представляются набором подобных утверждений, а постро-ение выводов и получение новых знаний сводится к реализации процедуры логиче-ского вывода. Этот процесс может быть строго формализован, так как в его основе лежит классический аппарат математической логики.

Сложности могут возникнуть при описании неоднородных миров (объекты относятся к разным категориям и их связывают различные отношения). Для преодоления этой и других сложностей в конкретных предметных областях используют расширенные модели, использующие нечеткую логику, оперирующие эмпирическими кванторами.

Такие расширенные модели объединяют возможности логического и лингвистиче-ского подходов, в результате чего называются логико-лингвистическими моделями данной предметной области.

2.4.3. Сетевая модель

Сетевая модель (или семантическая сеть) в инженерии знаний представляется на-правленным графом, узлы которого соответствуют понятиям и объектам, а дуги — отношениям между ними. В сетевой модели основными отношениями являются is-a и part-of, с помощью которых можно описать большой объем знаний.

Семантическая сеть позволяет снизить объем хранимых данных, обеспечивает реали-зацию ассоциативных связей. Проблема гибкости модели и существования бесконеч-ного множества возможных связей решается добавлением новых типов отношений. В проектах, посвященных моделированию человеческой памяти, также было предло-жено при использовании расширяемой подобным образом семантической сети также строить модель, хранящую все типы соединений и отношения подобия и взаимоза-меняемости между ними.

2.4.4. Формальные грамматики

Форальная грамматика (теория) состоит из алфавита (словаря), множества синтак-сических правил, которые позволяют определить истинность или ложность выраже-ний, построенных в данном языке, базовой системы подобных выражений, которые всегда истинны и называются аксиомами, множества правил вывода, позволяющих преобразовывать одно выражение в другое.

В основе этой модели лежит исчисление высказываний, которое можно считать клас-сическим примером аксиоматических систем. Эта система хорошо исследована и име-ет разработанную модель логического вывода. Эти свойства переносятся и на модель, ее использующую.

Главным недостатком является отсутствие гибкости системы. В случае модифика-ции или расширения модели может потребоваться перестроить всю систему, что для практических систем неприемлемо. Как следствие, формальные грамматики исполь-зуются в тех предметных областях, которые хорошо локализуются и мало зависят от внешних факторов.

2.4.5. Фреймовые модели

Фреймовая модель основана на концепции Марвина Мински — профессора Массачу-сетского технологического института, основателя лаборатории искусственного интел-лекта, автора ряда фундаментальных работ. Фреймовая модель представляет собой систематизированную психологическую модель памяти человека и его сознания. В отличие от других моделей в ней фиксируется жесткая структура информационных единиц, которая называется протофреймом (конкретным фреймом).

Сам фрейм представляет собой структуру данных для представления некоторого объекта. Информация, относящаяся к фрейму, содержится в составляющих его сло-тах. Значением слота может быть практически что угодно: числа или математиче-ские соотношения, тексты на естественном языке или программы, правила вывода (в случае терминального слота), либо ссылки на другие фреймы. Это позволяет ре-ализовать систему отношений между фреймами и даже рекурсию.

Каждый фрейм состоит из произвольного числа слотов, причем несколько из них обычно определяются самой системой для выполнения специфических функций, а остальные определяются пользователем.

Иерархия фреймов может описывать либо объект (тогда фреймы — составные ча-сти объекта, а слоты описывают его свойства), либо ситуацию или процесс (тогда фреймы — факты или этапы, а в слотах содержатся еще и вызываемые процедуры).

2.4.6. Комбинаторные модели

Комбинаторные модели основаны на рассмотрении дискретных объектов, конечных множеств и заданном на них отношении порядка. В рамках комбинаторики также рассматриваются все возможные изменения, перестановки и сочетания, в рамках заданных множеств.

Комбинаторные модели используются в задачах топологии (например, поиск пути), задачах прогнозирования поведения автоматов, при изучении деревьев решений, ча-стично упорядоченных множеств.

Основная проблема указана еще в определении этой модели: она оперирует толь-ко дискретными объектами и конечными множествами, связанными однородными отношениями.

2.4.7. Ленемы

Ленемы представляют собой смешанный тип модели, являющийся как бы «развити- ем» других моделей (фреймы, семантические сети и т.д.). Ленема предназначена для структурного комплексного описания понятий предмет-

ной области. По изобразительным возможностям ленемы более совершенны, чем та-кие традиционные модели представления знаний, как семантическая сеть, фрейм, система продукций. Однако, для некоторых понятий модель представления знаний на основе ленем может быть неудобной и даже неприемлемой. Например, это та-кие понятия, в описании которых очень большую роль играет внутренняя динамика. Модель, созданная на базе ленем, позволяет объединить на пользовательском уровне три существующие в настоящее время парадигмы представления знаний:

1) логическую (продукционная и логическая модели);

2) структурную (семантические сети и фреймы);

3) процедурную.

Для некоторых ситуаций это очень удобно, так как при реализации сложных моде-лей, включающих знания различных типов, возникает необходимость совмещения в одном языке представления знаний различных концепций.

2.4.8. Алгебраические модели

Алгебраическая модель подразумевает представление знаний в виде некоторых ал-гебраических примитивов, над которыми определено множество действий (некоторые из которых можно задать таблично). Для набора знаний представленного в таком виде действуют правила алгебраических множеств, такие как аксиоматизация, опре-деление подсистем и отношений эквивалентности. Также возможно построение цепей множеств (множества, для которых определен порядок отношения «быть подсисте-мой»).

Изначально предполагалось использовать подобную модель в качестве формализо-ванной системы построения аналогий (за счет определения эквивалентности). Одна-ко, на эту формальную модель очень сложно отобразить весь набор знаний, поэтому от этой идеи отказались.

2.4.9. Нейронные сети, генетические алгоритмы

Эти модели нельзя строго отнести к эмпирическому или теоретическому подходам. Их относят, как было сказано ранее, к бионическому направлению. Оно основывается на предположении о том, что если в искусственной системе воспроизвести структуры и процессы человеческого мозга, то и результаты решения задач такой системой будут подобны результатам, получаемым человеком.

Так, в нейронных сетях моделируются персептроны и их поведение, призванные ско-пировать дейтельность мозга, а генетические алгоритмы несут в себе принципы есте-ственного отбора и эволюции (за счет внесения изменений через мутации и смешение наследственностей).

Особенностью моделей этого типа является широкое использование эвристик, что в каждом случае требует доказательства правильности получаемых решений.

3. Заключение

Мы рассмотрели основные подходы к построению моделей представления знаний. У каждой из них есть свои достоинства и свои недостатки, которые делают каждую из них наиболее эффективной в конкретной области и при определенных условиях.

Однако, после рассмотрения этих моделей становится очевидно, что создание интел-лекта, подобного человеческому в плане самостоятельных обработки информации и использования знаний, пока невозможно. По крайней мере, не в чистых моделях. Логично предположитель, что требуется совместить некоторые из этих моделей для получения основных качеств, свойственных человеческому разуму.

Но даже в случае создания подобного интеллекта останется еще несколько качеств, которые практически невозможно запрограммировать (о чем неоднократно говорят, например, создатели и исследователи экспертных систем) — такие как неординар-ность мышления и способность к творчеству, умение строить предположения и до-гадки, создавать теории и идеи. И, как ни странно, именно эти качества в свое время подтолкнули человечество к идее создания искусственного интеллекта.

Список литературы

[1] http://ru.wikipedia.org/

[2] http://aiportal.ru/

[3] http://makhfi.com/

[4] http://uni-dubna.ru/~mazny/students/upr_zn/

[5] http://hr-portal.ru/