Примечание | от автора: Работа признана лучшей докторской диссертацией по медицинским наукам 1996 г. |
Загрузить архив: | |
Файл: ref-31768.zip (2426kb [zip], Скачиваний: 48) скачать |
Россиев Дмитрий Анатольевич
По мотивам диссертации на соискание ученой степени доктора медицинских наук Красноярск – 1995-2000
Оглавление
ВВЕДЕНИЕ.............................................................................................................................................................................................. 3 НЕЙРОСЕТЕВЫЕ КОМПЬЮТЕРНЫЕ ЭКСПЕРТНЫЕ СИСТЕМЫ В МЕДИЦИНЕ (ОБЗОР ЛИТЕРАТУРЫ) ...................................................................................................................................................................................... 8 ТЕОРЕТИЧЕСКИЕ И МЕТОДОЛОГИЧЕСКИЕ ОСНОВЫ СОЗДАНИЯ МЕДИЦИНСКИХ НЕЙРОСЕТЕВЫХ ЭКСПЕРТНЫХ СИСТЕМ .............................................................................................................................. 15 ЗАДАЧИ, РЕШАЕМЫЕ НЕЙРОННЫМИ СЕТЯМИ............................................................................................................................... 15 АРХИТЕКТУРА НЕЙРОННОЙ СЕТИ ................................................................................................................................................. 16 ФУНКЦИОНИРОВАНИЕ НЕЙРОНА .................................................................................................................................................. 17 ФУНКЦИОНИРОВАНИЕ НЕЙРОСЕТИ............................................................................................................................................... 18 ОБЩАЯ СХЕМА ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ .............................................................................................................................. 19 ОБУЧЕНИЕ НЕЙРОСЕТЕЙ-КЛАССИФИКАТОРОВ ............................................................................................................................. 19 ОБУЧЕНИЕ НЕЙРОСЕТЕЙ-ПРЕДИКТОРОВ ....................................................................................................................................... 22 МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ ОБУЧЕНИЯ НЕЙРОСЕТЕЙ ........................................................................................................... 23 ТЕСТИРОВАНИЕ ПРИМЕРОВ........................................................................................................................................................... 24 ОБЩИЕ АСПЕКТЫ СОЗДАНИЯ МЕДИЦИНСКИХ НЕЙРОСЕТЕВЫХ ЭКСПЕРТНЫХ СИСТЕМ............................................................. 25 ПОСТАНОВКА ЗАДАЧИ................................................................................................................................................................. 27 ПРЕДСТАВЛЕНИЕ ОБУЧАЮЩИХ ДАННЫХ ................................................................................................................................... 28 ИНИЦИАЛИЗАЦИЯ НЕЙРОННОЙ СЕТИ ......................................................................................................................................... 29 СТРАТЕГИЯ И ТАКТИКА ОБУЧЕНИЯ НЕЙРОННЫХ СЕТЕЙ............................................................................................................. 35 ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ НЕЙРОСЕТЕЙ И АВТОМАТИЗИРОВАННЫЕ СТРАТЕГИЯ И ТАКТИКА ОБУЧЕНИЯ.................. 38 ОСНОВНЫЕ ПОЛОЖЕНИЯ ТЕОРИИ И МЕТОДОЛОГИИ СОЗДАНИЯ НЕЙРОСЕТЕВЫХ МЕДИЦИНСКИХ ЭКСПЕРТНЫХ СИСТЕМ ....... 41 ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ СОЗДАНИЯ НЕЙРОСЕТЕВЫХ ЭКСПЕРТНЫХ СИСТЕМ ................................................................................................................................................................................................ 41 ПРОГНОЗИРОВАНИЕ ОСЛОЖНЕНИЙ ИНФАРКТА МИОКАРДА................................................................. 42 ПОСТАНОВКА ЗАДАЧИ................................................................................................................................................................. 44 ОБУЧАЮЩАЯ ВЫБОРКА И ВХОДНЫЕ ПАРАМЕТРЫ ...................................................................................................................... 45 ПРОГНОЗИРОВАНИЕ ФАКТА И ВРЕМЕНИ ВОЗНИКНОВЕНИЯ ФИБРИЛЛЯЦИИ ПРЕДСЕРДИЙ.......................................................... 47 ПРОГНОЗИРОВАНИЕ ВОЗНИКНОВЕНИЯ ПЕРИКАРДИТА................................................................................................................ 52 ПРОГНОЗИРОВАНИЕ ФАКТА И ВРЕМЕНИ ВОЗНИКНОВЕНИЯ ТРОМБОЭМБОЛИЧЕСКИХ ОСЛОЖНЕНИЙ ........................................ 53 ПРОГНОЗИРОВАНИЕ ФАКТА И ВРЕМЕНИ ВОЗНИКНОВЕНИЯ ИЛИ УСУГУБЛЕНИЯ СЕРДЕЧНОЙ НЕДОСТАТОЧНОСТИ.................... 55 ИЗУЧЕНИЕ ВЛИЯНИЯ ИССЛЕДУЕМЫХ ПАРАМЕТРОВ НА ПРОГНОЗ ОСЛОЖНЕНИЙ ИНФАРКТА МИОКАРДА ................................. 56 РАННЯЯ ДИАГНОСТИКА И ДИФФЕРЕНЦИАЛЬНАЯ ДИАГНОСТИКА ЗЛОКАЧЕСТВЕННЫХ ОПУХОЛЕЙ СОСУДИСТОЙ ОБОЛОЧКИ ГЛАЗА..................................................................................................................... 60 МЕТОДЫ ДИАГНОСТИКИ УВЕАЛЬНЫХ МЕЛАНОМ......................................................................................................................... 60 МЕТОД ИССЛЕДОВАНИЯ ПИГМЕНТА РЕСНИЦ ДЛЯ ДИАГНОСТИКИ УВЕАЛЬНЫХ МЕЛАНОМ......................................................... 61 ФОРМАЛЬНЫЙ СПОСОБ ИНТЕРПРЕТАЦИИ ДАННЫХ МЕТОДА ....................................................................................................... 62 ПОСТАНОВКА ЗАДАЧИ .................................................................................................................................................................. 62 ВХОДНЫЕ ПАРАМЕТРЫ И ОБУЧАЮЩАЯ ВЫБОРКА........................................................................................................................ 63 ОЦЕНКА ЭФФЕКТИВНОСТИ МЕТОДОВ ДИАГНОСТИКИ МЕЛАНОМЫ ХОРИОИДЕИ......................................................................... 65 ОЦЕНКА ЭФФЕКТИВНОСТИ МЕТОДА ДИАГНОСТИКИ МЕЛАНОМ СОСУДИСТОГО ТРАКТА ГЛАЗА С ПОМОЩЬЮ ИЗУЧЕНИЯ ПИГМЕНТА РЕСНИЦ............................................................................................................................................................................... 66 КОМПЛЕКС НЕЙРОННЫХ СЕТЕЙ.................................................................................................................................................... 67 МОДЕЛИРОВАНИЕ ЛЕЧЕНИЯ И ПРОГНОЗИРОВАНИЕ ЕГО НЕПОСРЕДСТВЕННЫХ РЕЗУЛЬТАТОВ У БОЛЬНЫХ ОБЛИТЕРИРУЮЩИМ ТРОМБАНГИИТОМ ..................................................................... 70 ХАРАКТЕРИСТИКА ОБСЛЕДОВАННЫХ БОЛЬНЫХ......................................................................................................................... 71 ОБУЧАЮЩИЕ ПАРАМЕТРЫ И ОТВЕТЫ ......................................................................................................................................... 73 ПОСТАНОВКА ЗАДАЧИ................................................................................................................................................................. 75 СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ В ИССЛЕДУЕМЫХ ПОДГРУППАХ................................................................................. 79 СОЗДАНИЕ И ОБУЧЕНИЕ НЕЙРОННЫХ СЕТЕЙ .............................................................................................................................. 80 АНАЛИЗ ЗНАЧИМОСТИ ОБУЧАЮЩИХ ПАРАМЕТРОВ.................................................................................................................... 80 МИНИМИЗАЦИЯ НАБОРА ВХОДНЫХ ПАРАМЕТРОВ...................................................................................................................... 81 ТЕСТИРОВАНИЕ ЭКСПЕРТНОЙ СИСТЕМЫ .................................................................................................................................... 83 НЕЙРОСЕТЕВАЯ ЭКСПЕРТНАЯ СИСТЕМА ДИФФЕРЕНЦИАЛЬНОЙ ДИАГНОСТИКИ "ОСТРОГО ЖИВОТА".............................................................................................................................................................................................. 84 ХАРАКТЕРИСТИКА ИССЛЕДОВАННЫХ КЛИНИЧЕСКИХ ПРИМЕРОВ ............................................................................................ 85VII.2. ПОСТАНОВКА ЗАДАЧИ................................................................................................................................................................ 90
VII.3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ..................................................................................................................................................... 91
VII.4. МИНИМИЗАЦИЯ ОБУЧАЮЩИХ ПАРАМЕТРОВ ............................................................................................................................ 93
ГЛАВА VIII. НЕЙРОСЕТИ ДЛЯ ИЗУЧЕНИЯ ИММУНОРЕАКТИВНОСТИ........................................................................ 95
VIII.1. ПОСТАНОВКА ЗАДАЧИ И РЕЗУЛЬТАТЫ ОБУЧЕНИЯ НЕЙРОСЕТЕЙ.............................................................................................. 95
VIII.2. ПРИМЕНЕНИЕ ОБУЧЕННЫХ НЕЙРОСЕТЕЙ ДЛЯ ИЗУЧЕНИЯ ИММУНОРЕАКТИВНОСТИ ПРИ ЯЗВЕННОЙ БОЛЕЗНИ ЖЕЛУДКА И ДВЕНАДЦАТИПЕРСТНОЙ КИШКИ .......................................................................................................................................................... 98
ЗАКЛЮЧЕНИЕ .................................................................................................................................................................................. 103
ЛИТЕРАТУРА..................................................................................................................................................................................... 105
Повышение эффективности работы лечебно-профилактических учреждений, особенно в условиях меди-цинского страхования, во многом связано с преобразованием всех аспектов деятельности и оформлением их в виде четкой и высокопроизводительной системы технологий.
В понятие технологии мы включаем 5 требований -элементов, которые должны быть проработаны для оптимизации, например, лечебной или диагностической процедуры.
В последнее время очень сильно возрастает значение информационного обеспечения. Оно становится критическим фактором развития технологий практически во всех областях знания. Это связано со следующими основными особенностями современного производства: максимальное разделение труда, особенно в сложных наукоемких производствах; постоянно увеличивающиеся объемы информации, требующие быстрой обработки; повышающиеся требования к качеству продукции и услуг; внедрение технических средств. Поэтому разработка и внедрение высокопроизводительных информационных систем является на сегодняшний день одной из самых актуальных задач.
Массовый выпуск персональных компьютеров, снижение их стоимости и доступность самого разнообраз-ного программного обеспечения позволили повысить качество технологий во многих областях медицины. Анализ особенностей применения персональных ЭВМ в медицинских учреждениях показывает, что наибольшее исполь-зование компьютеров идет в следующих направлениях: обработка текстовой документации, хранение и обработ-ка баз данных, статистика и финансовые расчеты. Отдельный парк персональных ЭВМ используется совместно с различными диагностическими и лечебными приборами, которые оперируют с данными сложного характера.
В подавляющем большинстве этих областей использования ЭВМ применяют стандартное программное обеспечение -текстовые редакторы, системы управления базами данных, статистические пакеты и прочее. Одна-ко, общеизвестно, что некоторые из важнейших участков лечебно-диагностических технологий практически не используют ЭВМ. Прежде всего это диагностика, назначение лечебных мероприятий, прогнозирование течения заболеваний и их исходов. Причины слабого применения компьютеров в этих областях носят чрезвычайно слож-ный характер и постоянно дискутируются многими исследователями. Рассмотрим основные из них.
Таким образом, указанные причины определяют крайне слабое использование существующих медицин-ских систем принятия решений и огромные трудности в разработке новых.
Исходя из вышесказанного, все задачи, решение которых актуально в медицинских технологиях, можно подразделить на две большие категории.
Поэтому можно выделить два способа решения задачи -логический и интуитивный. Логический метод оперирует набором формальных правил [109], интуитивный -накопленным опытом. При решении задачи первым способом она обычно разбивается на подзадачи, каждая из которых, в свою очередь, разбивается на несколько элементарных функций с известным алгоритмом вычислений. Зная алгоритм каждой элементарной функции, можно решать сложнейшие задачи, соединяя элементарные функции в нужной последовательности. Традицион-ное программирование как раз и обеспечивает такую возможность. При попытке применить такой метод к реше-нию интуитивных задач программист может столкнуться с невозможностью выделить алгоритм элементарной функции или вообще разбить задачу на такие функции.
Современный компьютер, обрабатывая информацию с большой скоростью, делает это на основе алгорит-мов, написанных программистом. Естественно, что с усложнением задач резко возрастает время, затрачиваемое на написание алгоритмов их решения. Поэтому трудности разработки экспертных систем определяется уже не техническими, а человеческими факторами.
Растущие объемы информации, появление новейших диагностических и лечебных технологий требуют принципиально иных подходов к обработке и интерпретации медицинских данных, возможности накопления, хранения и использования опыта квалифицированных специалистов. Аналогично, для научных исследований в медицине уже совершенно недостаточно использовать стандартные наборы статистических методов для обработ-ки материала. Требуются универсальные инструменты с возможностью гибкой постановки задач, применимые ко всем областям биологии и медицины, обладающие большой информационной емкостью и помехоустойчивостью, не нуждающиеся в длительном времени для разработки. Всем вышеперечисленным требованиям могут отвечать системы, способные самонастраиваться на решение задач. Созданные только один раз исходно одинаковыми, они должны обучаться решать совершенно различные задачи.
Отсюда вытекает еще один важный вывод. Возможности настройки нового класса экспертных систем должны распространяться вплоть до индивидуального пользователя, например до конкретного врача, имеющего возможность обучать экспертную систему на своем собственном опыте и тех данных, которые доступны этому врачу. Это означает, что необходимо коренное изменение технологии производства таких систем. Существую-щие традиционные системы принятия решений, основанные на четких правилах вывода, создаются, как правило, группой специалистов, в числе которых -математики, программисты и предметные специалисты, ставящие зада-чи. Возможности настройки таких систем на конечного потребителя почти всегда сведены к минимуму, и он, приобретая такую систему, часто сталкивается с ее неприменимостью к конкретным условиям его работы (например, другой спектр лабораторных анализов или методов обследования, принятых в данной клинике). Вы-ход -дать специалисту возможность самому конструировать экспертную систему исходя из конкретных условий, собственного опыта и опыта коллег. Такое конструирование должно производиться без знания предметным спе-циалистом математического аппарата, требуя только обычных навыков работы на персональном компьютере. Кроме того, в этой ситуации снимается психологическая проблема доверия к заключениям экспертной системы, которая работает , опираясь на опыт и знания того специалиста, который ее сконструировал, его коллег, которым он доверяет, и реальные данные, которые он сам получил в результате наблюдений.
Мы сформулировали основные требования, которым должны удовлетворять самообучающиеся медицин-ские экспертные системы принятия решений, диагностики, назначения лечебно-профилактических мероприятий и прогнозирования.
Анализ существующих методов обработки информации и метаалгоритмов решения задач показал, что вышеперечисленным требованиям достаточно хорошо удовлетворяют нейроинформационные технологии, бази-рующиеся на искусственных нейронных сетях. В основе функционирования нейронных сетей лежат алгоритмы, моделирующие распространение сигналов по нейронам и синапсам нервной системы. Существует достаточно большой набор архитектур и метаалгоритмов функционирования нейронных сетей, при этом задачи, решаемые современной нейроинформатикой, в большинстве случаев требуют подгонки архитектуры и алгоритмов обучения нейросетей под определенный класс задач или даже конкретную задачу. Поэтому, разработка универсальной тех-нологии создания медицинских экспертных систем, включающей оптимизацию архитектур и метаалгоритмов функционирования нейронных сетей, теоретические и методологические основы функционирования нейросетей при работе с медико-биологической информацией, является актуальной задачей.
Цель исследования.
Разработка теории и методологии создания медицинских самообучающихся нейросетевых экспертных систем принятия решений, диагностики и прогнозирования для практического здравоохранения, медико-биологических научных исследований; создание и внедрение в практику приложений.
Задачи исследования.
Структура (архитектура) искусственных нейронных сетей, состоящих из большого числа простых элемен-тов (нейронов -чувствительных и моторных) и межнейронных связей (синапсов), похожа (конечно, в очень упрощенном виде) на структуру нервной системы. При функционировании искусственной нейронной сети также моделируются базовые процессы, происходящие в нервной системе -поступление информации из внешнего мира в нейросеть, обмен нейронов сигналами через синапсы, вывод информации из нейросети во внешний мир.
Задачи медицинской диагностики и прогнозирования не имеют четких (явных) алгоритмов решения. В условия таких задач входит большое число сложно комбинирующихся факторов. Способ решения этих задач человеком лишь в малой степени основан на четких правилах. В основном используется опыт (явная или неявная память о предыдущих ситуациях), подразумевающий правильное решение не только в случае повторения ситуа-ции, но и при возникновении совершенно новой, не встречавшейся ранее ситуации.
Таким образом, нейронные сети, работая по неявным алгоритмам и решая задачи, не имеющие явного решения, достаточно хорошо моделируют (конечно, только внешне) способ принятия решений человеком. Одна-ко принципиальные различия работы нейронной сети и глубинного функционирования сознания и подсознания никак не отражается на конечном результате, поэтому при разработке нейроинформационных технологий не ста-вятся задачи достижения как можно большего структурного и функционального сходства искусственных объек-тов и реального мозга. Разработка архитектуры и алгоритмов нейронных сетей не базируется на моделировании структуры и физиологии головного мозга, а исходит из целей функционирования создаваемой системы. Появле-ние некоторого сходства является, по-видимому, проявлением некоторых общих закономерностей, а никак не результатом сознательного действия. Поэтому, разработка теории и методологии создания нейросетевых экс-пертных систем в медицине и биологии является движением в сторону создания искусственного интеллекта, ба-зирующегося не на принципах копирования структуры (как показали многочисленные попытки, этот путь никуда не привел), а на концепции постановки и достижения целей.
Нейросеть имеет определенное сходство с биологическими объектами еще и потому, что обладает “пове-дением”, не поддающимся абсолютно точному прогнозированию. Этот факт связан с тем, что нейросеть, имею-щая даже всего несколько нейронов, может иметь многие миллиарды различных состояний, причем каждое со-стояние приведет к уникальному ответу нейросети после подачи ей информации из внешнего мира. Поэтому изу-чение закономерностей функционирования нейросетей при их работе с медико-биологической информацией также является актуальной задачей, так как может открыть совершенно новые области их применения.
Нейросети могут служить в качестве математического инструмента для научных исследований при поис-ке взаимосвязей и закономерностей в больших информационных структурах, изучения взаимного влияния раз-личных факторов и моделирования сложных динамических процессов. Поэтому разработка методов нейросетево-го моделирования и анализа информации также является актуальной задачей.
Практическое применение нейросетей позволяет поставить создание медицинских экспертных систем на качественно иную основу.
10.Обученная нейросистема может использоваться как инструмент для моделирования и изучения объектов, с которыми она связана.
11.Применение нейросетевых систем позволит значительно ускорить работу специалистов, освободив большое количество времени, повысить качество профилактических, лечебных и диагностических технологий.
12.Гибко настраиваемые на конкретное лечебное учреждение нейросетевые экспертные системы прогнозирова-ния позволят оптимизировать планирование лечебных и профилактических мероприятий как конкретным больным (профилактика осложнений), так и по лечебному учреждению в целом, что приведет к повышению качества медицинских услуг и снижению затрат.
13.Применение нейросетевых экспертных систем для прогнозирования медико-социальных и демографических показателей позволит повысить качество технологий в организации медицинской помощи населению и плани-ровании здоровья.
14.Возможность нейронных сетей анализировать информацию (в частности, определять важность и информатив-ность медико-биологических данных) позволит оптимизировать различные диагностические технологии (от-каз во многих случаях от дорогостоящего и ненужного обследования), а также технологии разработки медико-экономических стандартов.
В результате проведенных исследований разработаны теоретические и методологические основы созда-ния нейросетевых медицинских экспертных систем. Их ядром являются полносвязные сигмоидные нейронные сети, обучающиеся по усовершенствованному метаалгоритму двойственного функционирования, позволившему увеличить скорость обучения в 1000-10000 раз.
Изучение работы практических врачей с персональными компьютерами, отработка интерфейсов про-граммного обеспечения привели к созданию базового инструментария, предназначенного для конструирования нейросетевых программ пользователями-медиками. Разработанный автором программный комплекс AcceStat2000 “NeuroMaster” может применяться не только для создания профессиональных экспертных систем, но и для проведения исследований медико-биологических данных с помощью нейросетей (проверка гипотез, поиск гипо-тез, моделирование, оптимизация).
С помощью пакета комплекс AcceStat-2000 “NeuroMaster” разработаны и апробированы на практике нейросетевые экспертные системы прогнозирования осложнений инфаркта миокарда, назначения лечения и про-гнозирования его непосредственных исходов у больных облитерирующим тромбангиитом, ранней диагностики меланом хориоидеи, дифференциальной диагностики “острого живота” и др.
Положения, выносимые на защиту.
Работа выполнена в Красноярской Медицинской Академии на кафедре медицинского страхования, ме-неджмента и маркетинга.
По теме диссертации опубликовано 70 работ в центральной, местной и зарубежной печати. Список работ приводится в Приложении 3.
Автор благодарит профессора М.И.Гульмана, профессора В.И.Лазаренко, профессора А .А.Модестова, профессора В.В.Фефелову, профессора В.А.Шульмана за поддержку и помощь в организации исследований.
Особую благодарность автор выражает научному консультанту, профессору А.Н.Горбаню.
Глава I. Нейросетевые компьютерные экспертные системы в медицине (об-зор литературы)
Разработка математических методов решения медико-биологических задач ведется уже не одну сотню лет. Учеными предложено огромное количество способов проверки гипотез и продукции выводов. В истории разработки этих методов прослеживаются два периода наибольшего интереса теоретиков и практиков. Первый период наблюдался в 60-е годы, когда были разработаны методы анализа, получившие некоторое распростране-ние и вызвавшие волну публикаций. Среди них -анализ Вальда [19], применяющийся до сих пор, матричные алгоритмы, основанные на анализе присутствия или отсутствия признаков [18], методы правдоподобия (анализ частот встречаемости признаков при двух или более заболеваниях [241]), алгоритмы, основанные на логике фазо-вого интервала (состояние выражается в виде совокупности точек в пространстве признаков [17,18]), вероятност-ные методы [308]. Довольно широкую популярность приобрели алгоритмы, основанные на поиске клинического прецедента [4]. Общим признаком, объединяющим все эти и другие традиционные методы, несмотря на их раз-нообразие, является наличие явных алгоритмов принятия решений [28]. “Диагностический алгоритм включает в себя совокупность правил, определяющих порядок переработки медицинской информации с целью постановки диагноза” [64]. Несмотря на то, что наиболее популярные методы до сих пор активно используются в теоретиче-ской биологии и медицине [53,55], в практической медицине они не нашли широкого применения. Это связано, во-первых, с тем, что методы, ориентированные на обработку групповых данных, слабо применимы к отдельным объектам, а во-вторых, с особенностями самой медико-биологической информации [125]. Решения в медицин-ских и биологических задачах зависят от огромного количества неодинаковых по значимости факторов [70,91]. Поэтому, даже если удается выстроить правила вывода, связывающие условия задачи с решением, метод, как правило, хорошо работает только на той группе объектов, на которой производились исследования. Естественно, создать универсальный алгоритм невозможно, и при использовании метода для другой подобной группы объек-тов его приходится полностью переконструировать практически заново.
Многолетние исследования, проводимые с самыми различными явными алгоритмами, показали, что ме-дицинские задачи, имеющие неявный характер, решаются явными методами с точностью и удобством, совер-шенно недостаточными для широкого практического использования в конкретных задачах диагностики, прогно-зирования и принятия решений [65].
Поэтому в настоящее время наблюдается второй всплеск интереса к диагностическим системам. Он направлен на принципиально новое поколение решающих алгоритмов, являющихся неявными и обладающих способностью к самонастройке [270], которая может осуществляться на минимальном количестве данных [202]. Основной группой таких алгоритмов, развиваемой сейчас наиболее интенсивно, являются нейросетевые методы [120,295].
Поиски и изучение неявных алгоритмов, позволяющих автоматически накапливать и затем использовать опыт при обучении [178], продолжаются уже более 100 лет [54]. Однако первые серьезные попытки создания нейронных сетей были сделаны в 40-50-х годах, когда У.Маккалох и У.Питтс выдвинули основные положения теории работы головного мозга. Естественно, что с появлением дешевых ЭВМ произошел резкий скачок в этой области [34], которая в начале 80-х годов сформировалась в целую науку -нейроинформатику [305].
Неявные задачи медицины и биологии явились идеальным полем для применения нейросетевых техноло-гий, и именно в этой области наблюдается наиболее яркий практический успех нейроинформационных методов [129,201,221].
Перейдем теперь к рассмотрению нейросетевых приложений для биологии и медицины, созданных раз-личными авторами. Общая черта, объединяющая приводимые ниже примеры -отсутствие единой универсальной технологии создания таких приложений. В публикуемых разработках используются самые разнообразные архи-тектуры [103,135,211] и алгоритмы функционирования нейронных сетей. Это приводит к тому, что для почти для каждой задачи разрабатывается своя собственная архитектура, и часто -уникальный алгоритм или уникальная модификация уже существующего. С точки зрения практического применения такие экспертные системы почти не отличаются от традиционных программ принятия решений; предложены даже методы преобразования тради-ционных экспертных систем в нейросетевые [231]. Их разработка требует участия специалистов по нейроинфор-матике, а возможности конструирования пользователем практически отсутствуют. Это делает такие системы чрезвычайно дорогими и не очень удобными для практического применения, поэтому в публикациях авторы в основном сравнивают качество работы нейросетевых алгоритмов и традиционных систем, работающих по прави-лам вывода.
Наибольший интерес для практического здравоохранения представляют системы для диагностики и диф-ференциальной диагностики заболеваний [117]. При этом для принятия решений могут использоваться самые разнообразные данные -анамнез, клинический осмотр (создаются экспертные системы диагностики, ограничи-вающиеся только этим набором [288]), результаты лабораторных тестов и сложных функциональных методов. Список областей медицины, в которых начали применяться новые технологии, чрезвычайно обширен и продол-жает расти.
В области пульмонологии начаты исследования по применению нейронных сетей для дифференциальной диагностики интерстициальных заболеваний легких [111,161]. Конструируемая система обучается различать 9 диагнозов по 20 параметрам клинического состояния и данным рентгенографии.
Появились работы с применением нейротехнологий для диагностики астмы [261], острой тромбоэмболии легких [271,309], рака легких [149].
Несколько работ посвящено решению задачи определения оптимальных параметров искусственного ды-хания [114,277,301]. Нейронные сети обучаются поддерживать оптимальный режим вентиляции легких и рабо-тают более гибко, чем системы, основанные на жестком алгоритме.
Одним из наиболее интенсивно развиваемых направлений является применение нейросетей в кардиоло-гии.
В Италии разработана чрезвычайно интересная экспертная система для диагностики и лечения артериаль-ной гипертонии [143,276]. Система включает в себя три нейросетевых модуля, причем ответы одних являются входными данными для других. В начале исследования больному проводят измерение систолического и диасто-лического давления каждые полчаса в течение суток. Данные за каждый час усредняются. Таким образом, обра-зуется массив из 48 величин артериального давления (по 24 для систолического и диастолического). После этого первый модуль, состоящий из двух трехслойных нейросетей (в каждой из которых 2 входных, 4 "скрытых" и 24 выходных нейрона), на основании данных о поле и возрасте больного рассчитывает аналогичные "должные" ве-личины и сравнивают их с реальными. Параллельно второй модуль (двухслойная нейросеть с 17 входными и 4 выходными нейронами) на основании клинических данных (симптоматика, анамнез) рассчитывает возможные сочетания гипотензивных лекарственных средств, которые могут быть использованы для лечения данного боль-ного. Данные, снятые с выходов обоих модулей, вместе с клиническими данными подаются на вход последнего, третьего модуля (6-слойная нейросеть). Этот модуль оперирует 4 группами гипотензивных препаратов (диурети-ки, бетаадреноблокаторы, ингибиторы ангиотензина, блокаторы кальциевых каналов). Цель -назначить суточный (почасовой) график приема больным лекарств каждой (если требуется) из 4 групп. Поэтому этот модуль имеет 96 выходных нейронов (4 препарата х 24 часа). С каждого выходного нейрона снимается доза, соответствующая одному препарату, назначаемому на данный час суток. Естественно, что в реальной ситуации большинство вы-ходных данных равны нулю. Таким образом, создается оптимальная для пациента схема лечения гипертонии. Нужно отметить, что система учитывает некоторые особенности приема препаратов больными, например, за-труднение приема препаратов ночью (назначает ночной прием только в крайних случаях), запрет на назначение мочегонных лекарств на ночь. Отличительной чертой системы является возможность пользователя (врача) пере-давать нейронной сети свой опыт. Для этого создателями программы предусмотрен специальный блок, который выводит на экран компьютера суточные кривые артериального давления и предлагает врачу ввести в компьютер суточную схему приема гипотензивных препаратов в необходимых, по его мнению, дозах. Введенный пример помещается в базу данных. В любое время можно инициировать доучивание нейронных сетей с новыми приме-рами.
В работе [133] описывается нейронная сеть для диагностики коронарного атеросклероза на ранних стади-ях. Диагноз выставляется на основании таких параметров, как пол, возраст, вес, рост, курительные привычки; данных семейного анамнеза, наличия у обследуемого диабета, показателей систолического и диастолического артериального давления, уровня холестерина и липопротеидов различных классов в крови.
Большое внимание уделяется применению нейросетей для диагностики атеросклероза [180].
Нейросети могут проводить диагностику и определение стадии атеросклероза по рентгенологическим данным [179] и по акустическим сигналам [105].
В одной из работ приводится метод выявления атеросклеротических бляшек в артериях [188]. Для этого применяется нейросеть, интерпретирующая флюоресцентные спектры, получаемые при исследовании тканей с помощью лазера.
Аналогичным образом проводится диагностика заболеваний периферических сосудов [107], например, определение форм артериита [115]. Описывается нейросетевая диагностика заболеваний мышц по мышечной биопсии [183],
Нейронные сети применены для оценки снабжения тканей кислородом [119] и мозгового кровотока [146,325,326], вентиляции и перфузии легких [291], капиллярного давления легких [219], диагностики микроэм-болий мозга по данным транскраниальной допплерографии [296].
Проводится комплекс исследований по использованию нейросетей для диагностики инфаркта миокарда [123,125,126]. Автор приводит данные по чувствительности (77,7%) и специфичности (97,2%) нейросетевого те-ста. В работе [124], кроме того, с помощью нейронной сети устанавливали диагностическую значимость клини-ческих параметров при диагностике инфаркта миокарда.
Нейросетевой анализ акустических сигналов позволяет проводить диагностику клапанных шумов сердца [197], и оценивать систолическую и диастолическую фазы сердечного сокращения с постановкой предваритель-ного диагноза [121].
Нейросети используются терапевтами для диагностики заболеваний п ечени по лабораторным данным исследования функций печени [268]; дифференциальной диагностики заболеваний печени [247,336] и желчного пузыря по УЗИ [286], диагностики панкреатита [226], изучения характера камней в почках [320].
Имеются немногочисленные работы по применению нейротехнологий в невропатологии и нейрохирур-гии, например, для диагностики нарушений слуха [250], изучения болезни Паркинсона [137], определения лока-лизации патологических очагов в мозге [102,150].
Нейропрограммы могут с успехом работать с медицинскими данными, относящимися к субъективным категориям, например, в психиатрии [258]. Оценка субъективных данных дает возможность распознавания пси-хических симптомов [132] и диагностики и изучения некоторых психиатрических симптомокомплексов -демен-ции [263] и аутизма [153].
Встречаются отдельные работы о попытках нейросетевого моделирования в изучении мужского беспло-дия [235], диагностики миеломной болезни [141] и аллергии [145].
Актуальная проблема диагностики злокачественных новообразований, возможно, получит новый уровень осмысления с началом применения нейроалгоритмов. Так, в работе [169] показана 80%-я точность ранней диа-гностики меланом кожи -одного из самых злокачественных заболеваний. Наличие скрытых метастазов этого же заболевания определяется с помощью нейросетевой интерпретации данных хроматографии мочи [154].
Описываются методы диагностики почечных карцином по данным УЗИ [248] и гепатоцеллюлярных кар-цином по данным ядерной морфометрии [170], ранняя диагностика рака печени по данным рентгенограмм и уль-трасонограмм [246], диагностика и прогноз рака простаты [300], диагностика остеопороза и костных образова-ний, а также дифференциальная диагностика злокачественных и доброкачественных костных опухолей [275,285].
По интерпретации данных ядерно-магнитного резонанса проводят диагностику рака кишечника на ранних стадиях [165].
Большое внимание в публикуемых работах уделяется нейросетевой диагностике опухолей молочной же-лезы, представляющих серьезную медико-социальную проблему. Так, по 9 параметрам анализа крови осуществ-ляется дифференциальная диагностика злокачественных и доброкачественных опухолей молочной железы [116]. Однако описываемая нейросеть смогла обучиться ставить верный диагноз только у 80% примеров обучающей выборки. Результат тестирования на контрольной выборке -84% верных диагнозов.
Диагностику опухолей молочной железы проводят также по данным УЗИ [190]. Лечебную тактику у больных с этим заболеванием планирует нейросеть, описанная в [254]. Некоторые авторы проводят нейросете-вой прогноз исхода заболевания [281] и появление рецидива [282]. Система, описанная в [322], осуществляет диагностику рака молочной железы и яичника; прогноз исхода лечения рака яичника с помощью нейросети опи-сан в [222].
Сделаны первые попытки обучения нейронных сетей назначению антимикробной терапии [260].
Одним из серьезных направлений применения нейронных сетей является интерпретация медицинских данных. В последние годы идет бурное развитие новых средств диагностики и лечения. При этом наблюдается как бы "вторая волна" изучения и использования древних, старинных методов, и, наоборот, применение послед-них технических новшеств. Нередко и те и другие методы при использовании предоставляют врачу массу самых разнообразных данных. При этом встает проблема их грамотной и корректной интерпретации. Поиск глубинных закономерностей между получаемыми данными и патологическими процессами начинает отставать от разработ-ки все новых и новых методов, поэтому применение для этой цели нейросетей может оказаться чрезвычайно вы-годным.
В одной из старинных методик диагностики по пульсу используются 14 характеристик пульса, измеряе-мых с нескольких точек. Распознавание и интерпретация данных требует огромного опыта врача, практически невозможного в современных условиях. Нейросеть была применена для "узкой" диагностики только по одной из точек [236], позволяющей оценивать состояние левой почки. Пульс считывается специальным датчиком, совме-щенным с микрофоном. Полученная пульсовая кривая (сфигмограмма) передается в компьютер. Вначале про-грамма анализирует несколько пульсовых волн и выстраивает "среднюю" волну. После этого по 5 точкам этой волны нейронная сеть оценивает состояние левой почки.
Классической проблемой в кардиологии является интерпретация электрокардиограмм, требующая значи-тельного опыта врача [326]. Сотрудники Университета Глазго (Великобритания) ведут исследования по приме-нению нейросетей для ЭКГ-диагностики инфарктов миокарда [332-335]. Входными данными для сетей являются избранные параметры 12-канальной электрокардиограммы и 12-канальной векторкардиограммы (длины зубцов, расстояния между зубцами). Исследователи обучили огромное количество нейросетей (167 сетей для диагности-ки инфаркта миокарда передней стенки и 139 сетей для инфаркта нижней стенки) на массиве данных из 360 элек-трокардиограмм. Обученные сети затем тестировали отдельную выборку с заранее известными ответами (493 случая). Одновременно для получения отдельной серии ответов на тестируемой выборке был использован логи-ческий метод (с заранее заданным алгоритмом). Затем сравнивались результаты тестирования выборки лучшими нейросетями и с помощью логического алгоритма. Сравнение показало, что во многих случаях чувствительность и специфичность нейросетевого теста оказались выше, чем у логического метода. Авторы делают справедливый вывод, что в случаях, когда логический алгоритм решения задачи все-таки можно выстроить, разумно комбини-ровать в экспертных системах оба подхода.
Эти же авторы [334] применили нейросети для дифференцировки фибрилляции предсердий от желудоч-ковых и наджелудочковых экстрасистолий, возникающих на фоне синусового ритма.
Интерпретация ЭКГ с помощью нейросетей [138,157,158] была применена для диагностики злокачествен-ных желудочковых аритмий [208]. Трехслойная сеть с 230 входными синапсами была обучена на 190 пациентов (114 с хронической сердечной недостаточностью и 34 с дилятационной миокардиопатией) различать наличие (у 71 пациента) и отсутствие (у 119 пациентов) желудочковой тахикардии. Результаты тестирования сравнивались с логическим методом интерпретации данных. Показано, что нейросетевой тест обладает большей чувствительно-стью (73% по сравнению с 70 для логического метода) и специфичностью (83 и 59%).
Эти же авторы [209] использовали нейронные сети для интерпретации ЭКГ в диагностике дилятационных кардиомиопатий. В других работах описывается нейросетевая интерпретация ЭКГ для распознавания фибрилля-ции предсердий [334] и других аритмий [173], детекции QRS-комплекса [329], классификации сегмента ST-T [167], дифференцировки синусового и желудочкового ритма [172].
Интересная работа описывает моделирование применения нейросетей для работы электрокардиостимуля-торов (искусственных водителей ритма) [265]. Выпускаемые за рубежом электрокардиостимуляторы задают ритм не жестко, а в зависимости от исходного ритма, генерируемого синусовым узлом сердца. Например, если синусо-вый узел при какой-либо патологии генерирует недостаточное количество импульсов, водитель ритма компенси-рует ритм. Таким образом, электрокардиостимулятор представляет собой систему вход→преобразование→выход, где входом является ритм синусового узла, выходом -собственный ритм элек-трокардиостимулятора, а преобразование осуществляется по заданному логическому алгоритму. Авторы смоде-лировали замену логического преобразователя нейронной сетью, так как взаимоотношения между генерацией импульсов в синусовом узле и требуемым ритмом не линейны и применяемые алгоритмы на практике не всегда эффективны. Нейросеть, обученная на 27 здоровых людях в ситуациях с различной физической нагрузкой, пока-зала гораздо лучшую способность задавать ритм, чем логический алгоритм, применяющийся в электрокардио-стимуляторе.
Похожую работу по моделированию взаимодействий между сердечным ритмом и кардиостимулятором опубликовали [195].
Нейросети применялись для интерпретации таких достаточно сложных данных, как электроэнцефало-граммы [251].
Сконструированы весьма сложные нейросети для анализа данных компьютерной томографии [216] и ин-терпретации миограмм [213,227,294], по которым нейросети были обучены постановке диагноза нейромускуляр-ных заболеваний [233].
Одной из самых сложных задач для нейросетей в практической медицине является обработка и распозна-вание сложных образов, например рентгенограмм [243]. В работе [196] описывается экспертная система интер-претации рентгенограмм груди у новорожденных с выбором одного и более диагнозов из 12.
Нейросети обучали также распознаванию рентгенограмм для выявления узловых образований в легких
[240,244].
Созданы нейросетевые экспертные системы для классификации опухолей молочной железы (определе-ния, доброкачественная опухоль, или злокачественная) по данным маммографии (сканограмма молочной железы) [176,179,311,323,328,337]. По данным, которые приводят авторы, точность такого вывода до применения нейросети составляла не более 75%. При тестировании системы, нейросеть, анализирующая сканограмму, давала правильный ответ в 100% случаев. При тестировании изображение, получаемое в результате метода, представля-ется в виде матрицы точек размером 1024х1024 пиксела с 10-битовой шкалой яркости. Изображение подается на нейросеть, имеющую 2 входных, 80 "скрытых" и 2 выходных нейрона. При этом один из выходных нейронов "отвечает" за доброкачественную опухоль, другой за злокачественную. Диагноз определяется в зависимости от выходного нейрона, выдавшего больший по величине ответ. Столь высокий процент правильности распознава-ния, возможно, случаен, и объясняется недостаточным количеством примеров, использовавшихся при обучении и тестировании нейросети (по 10 примеров). Сеть обучалась методом back-propagation [168,299]. Однако даже при такой малой обучающей выборке нейросеть выигрывала по сравнению с традиционным методом интерпретации сканограммы.
Способом, сходным с описанным выше, нейросети обучали выделению объектов на изображениях, полу-чаемых в результате методов ядерно-магнитного резонанса [143,275].
Несколько работ посвящены нейросетевой обработке лабораторных анализов и тестов. Приводится нейросетевой метод интерпретации лабораторных данных биохимического анализа крови [284]. В работе показа-ны преимущества нейронных сетей в сравнении с линейным дискриминантным анализом, которым параллельно обрабатывались данные. Описываются обработка нейросетями цитогенетических данных [259] и интерпретация данных иммунного анализа [319].
Нейросети использованы в офтальмологии для интерпретации данных периметрии при диагностике глау-комы [189].
Обилие медицинских данных при применении диагностических методов ставит даже проблему хранения этих данных. Нейросети были использованы и для этого. В работах [252,264] описываются нейросети для ком-прессии данных электрокардиографического исследования с целью их экономного хранения.
Особое место среди нейросетевых экспертных систем занимают прогностические модели [303], применя-емые, например, для прогнозирования исходов заболеваний [304].
В 1990 году американская фирма "Апачи Медикл Системз Инк." установила в реанимационном отделении одной из больниц штата Мичиган экспертную систему "Апачи -III" [96]. Ее цель -прогнозирование исхода забо-левания у больных, находящихся в тяжелом состоянии. Для прогноза в компьютер необходимо ввести 27 пара-метров больного: первичный диагноз, симптомы, степень утраты сознания, наличие или отсутствие СПИД и дру-гих заболеваний. После этого система выдает вероятность выживания больного в диапазоне от 0 до 100 процен-тов. Ценность применения системы заключается в том, что она позволяет очень быстро оценить динамику изме-нения состояния больного, незаметную "на глаз". Например, можно получить ответ у системы до и после введе-ния какого-либо лекарства, и, сравнив ответы, посмотреть, будет ли наблюдаться эффект от терапии. Без про-граммы же изменение состояния иногда не удается обнаружить в течение нескольких дней. Тестирование показа-ло, что 95% прогнозов, которые делает программа, сбываются с точностью до 3%, что значительно точнее, чем у лучших врачей. Необходимо отметить, что система была обучена на данных, взятых из историй болезней 17448 пациентов, лечившихся в 40 больницах штата в 1989 году. Очевидно, что если качество работы системы обеспе-чивается таким большим объемом выборки, возможности перенастройки системы не слишком велики. Идеология авторов, создавших эту систему, заключается в как можно большем охвате различных примеров и вариантов (сбор данных в 40 больницах), а не в возможности индивидуализации системы к конкретной клинике. Поэтому данная система не способна к подучиванию в процессе работы, опыт "зашит" в нее жестко. Это может быть су-щественным недостатком при установке программы в регионы, резко отличающиеся по социально-географическим условиям от тех, где проводилось обучение. Кроме того, огромный массив примеров для обуче-ния повышает стоимость программы.
Похожая система моделирования смертности больных в отделении реанимации описана в [161] и более узкоспециализированная система (больные с сердечно-легочной недостаточностью)-в [166].
Прогностические нейросетевые модели могут использоваться в демографии и организации здравоохране-ния. Создана экспертная система, предсказывающая, умрет ли человек (в возрасте 55 лет и старше) в ближайшие 10 лет. Прогноз делается по результатам ответов на 18 вопросов анкеты. В анкету включены такие вопросы, как раса, пол, возраст, вредные привычки, семейное положение, семейный доход. 4 из 18 вопросов выявляют индекс массы тела (body mass index) в различные периоды жизни респондента. Индекс рассчитывается как отношение веса к квадрату роста (индекс более 27 кг/м считается тучностью). Повышенное внимание к этому показателю говорит о его значимости для прогноза жизни.
Приводится описание нейросетевой системы, дающей прогноз исхода у больных с проникающими трав-мами [253].
Для организационного планирования работы лечебных отделений могут быть полезны системы, подоб-ные описанным в [312,313], где определяется прогноз длительности лечения кардиохирургического больного, и в [159], вычисляющей прогноз длительности пребывания психиатрического больного в стационаре.
Нейросети применены для прогноза исходов трансплантации печени [163], прогнозирования исхода у больных раком [142] и предсказания возникновения осложнений у больных с искусственными клапанами сердца [224,225].
Развитие нейросетевых методов дает возможность их использования как инструмента научных исследо-ваний, с помощью которого можно изучать объекты и явления.
Судя по литературным данным, именно биологические научные исследования являются наиболее разви-ваемой областью применения нейросетей [118,223]. В последнее время биологи, знакомые с исследованиями в области нейроинформатики, приходят к выводу, что многие системы в живых организмах работают по принци-пам, сходным с алгоритмами нейронных сетей (или наоборот, нейронные сети работают по принципу биосистем). Таким образом, можно наблюдать "взаимное стимулирование" научных разработок в биологии и нейроинформа-тике. В работе [140] эндокринная система человека рассматривается как нейронная сеть из 30 элементов, которые представлены различными гормонами, взаимодействующими друг с другом с помощью прямых и обратных свя-зей. Похожие исследования проводятся для иммунной системы [316,318]. Японские ученые [331] использовали нейросеть для экспериментов по моделированию нервной системы простых организмов.
Применение нейросетей для исследований в области нейрофизиологии строится на похожих принципах функционирования нейросетей и нервных структур живых организмов [239]. С помощью нейросети осуществле-на попытка моделирования простейшей нервной системы [315] и ассоциативной памяти [144], моделирование связей мозга [147], изучение моторных функций мозга [175] и памяти [205], изучение глазодвигательной функ-ции [156,162] и распознавания движущихся образов [206], моделирование функции мочевого пузыря [122].
С помощью нейросетей исследуются не только физиологические, но и патофизиологические процессы. Проводились, например, нейросетевые исследования шизофрении [160] и роли дефицита допамина в ее развитии [153], эпилепсии [255] и амнезии [148].
Сделана попытка применения нейросети для классификации живых организмов [293]: нередко биологам, открывающим новые виды организмов, требуется определить, к какому виду (классу, типу) относится тот или иной представитель флоры или фауны (как правило, это касается микроорганизмов и растений). Система способ-на работать при отсутствии некоторых входных данных. Это является существенным преимуществом, так как часто при изучении живых объектов не всегда возможно получить всю необходимую информацию. Похожим образом работает система идентификации микроорганизмов [228].
Нейросети использованы для идентификации человеческих хромосом [171,194,218]. В биологических исследованиях, а также в криминалистике, часто бывает нужно определить, к какой из 23 имеющихся у человека пар хромосом относится выделенная хромосома. Точность существующих методов достигала 75 -85%. Нейроклассификатор, на вход которого подается 30 признаков изображения хромосомы, определяет ответ с точ-ностью, приближающейся к 100% [306].
С помощью нейросетей проводилось изучение взаимодействия генов [134], ДНК [302], анализ ДНК по данным проточной цитометрии [283] и распознавание структуры HLA-антигенов [136].
Построена модель взаимодействия между раковыми клетками и отслеживание динамики их субпопуляции
[278].
Вызывает большой интерес применение нейронной сети для предсказания вторичной структуры разнооб-разных белков по аминокислотным последовательностям [164,185,279,287], например, белков вируса СПИДа [110], участков иммуноглобулинов с их классификацией [131]. В работах [174,324] описывается нейросетевой метод кластеризации белков -отнесения их к определенным классам и семействам. Следует заметить, что для решения нестандартных задач, подобных этой, как правило, приходится применять нейросети со специально раз-работанной архитектурой, адаптированной под задачу. Это связано прежде всего со спецификой входных сигна-лов и вида ответа сети.
Нейросетевые технологии используются в фармацевтической промышленности для отработки взаимодей-ствия лекарственных препаратов [215], моделирования прямого [191,214,232] и побочного действия лекарств [108], а также для изучения фармакодинамики препаратов, например, левадопы при болезни Паркинсона [217].
1990 1991 1992 1993 1994 1995
Рисунок 1.1. Динамика числа публикаций о нейронных сетях в медицине и биологии по результатам поиска во Всемирной Медицинской базе данных MedLine и прогноз числа публикаций на 1995 год
Медицинские задачи являются очень удобными в качестве тестов при различных экспериментах с нейронными сетями. В работе [157] авторы использовали задачу диагностики нижних инфарктов миокарда для проверки гипотез о влиянии случайно сгенерированной карты синапсов и случайно отобранных примеров на ка-чество и стабильность обучения нейронных сетей.
Анализ публикаций о нейронных сетях в биологии и медицине, проведенный по Всемирной Медицинской базе данных MedLine, показывает , что количество таких публикаций неуклонно растет с каждым месяцем. На рисунке 1.1 приведена диаграмма роста публикаций с 1990 по 1994 год, а также прогноз числа публикаций на 1995 год, осуществленный нами с помощью нейронной сети с учетом ежемесячного количества публикаций.
На основании проведенного анализа литературы можно сделать следующие выводы.
Глава II. Теоретические и методологические основы создания медицинских нейросетевых экспертных систем
II.1. Задачи, решаемые нейронными сетями
Все задачи, решаемые человеком, с позиций нейроинформационных технологий можно условно класси-фицировать на 2 группы.
Для решения задач первой группы с большим успехом можно использовать традиционные компьютерные программы. Как бы ни был сложен алгоритм, ограниченность набора условий (входных параметров) дает воз-можность составления алгоритма решения и написания конкретной программы, решающей данную задачу. Нет никакого смысла в использовании нейроинформационных технологий для решения таких задач, так как в этом случае нейросетевые методы будут априорно хуже решать такие задачи. Единственным исключением является случай, когда алгоритм вычисления ответа слишком большой и громоздкий и время на решение конкретной зада-чи по этому алгоритму не удовлетворяет практическим требованиям; кроме того, при получении ответа не требу-ется абсолютная точность.
При решении задач второй группы применение нейротехнологии оправдывает себя по всем параметрам, при выполнении, однако, двух условий: во-первых, наличия универсального типа архитектуры и единого универ-сального алгоритма обучения (отсутствие необходимости в их разработке для каждого типа задач), во-вторых, наличия примеров (предыстории, фиксированного опыта), на основании которых производится обучение нейронных сетей. При выполнении этих условий скорость создания экспертных систем возрастает в десятки раз, и соответственно снижается их стоимость.
Практически вся медицинская и биологическая наука состоит именно из задач, относящихся ко второй группе, и в большинстве этих задач достаточно легко набрать необходимое количество примеров для выполнения второго условия. Это задачи диагностики, дифференциальной диагностика, прогнозирования, выбора стратегии и тактики лечения и др. Медицинские задачи практически всегда имеют несколько способов решения и “нечеткий” характер ответа, совпадающий со способом выдачи результата нейронными сетями.
Все неалгоритмируемые или трудноалгоритмируемые задачи, решаемые нейронными сетями, можно классифицировать на два принципиально различающихся типа в зависимости от характера ответа -задачи клас-сификации и задачи предикции.
Задачи классификации. Это основная и очень обширная группа медико-биологических задач. Ответом в них является класс -выбор одного варианта из заранее известного набора вариантов. Классификация может быть бинарной (элементарная классификация)-в этом случае набор возможных ответов состоит из двух вариантов (классов), и n-арной, где число классов более двух. Примерами бинарной классификации могут служить как объ-ективные категории (пол человека -мужской или женский; характер опухоли -доброкачественный или злокаче-ственный), так и субъективные категории (здоров человек или болен; наличие или отсутствие склонности к про-студным заболеваниям). В некоторых случаях не представляется возможным отнесение ответа задачи к объек-тивной или субъективной категории, и это не имеет принципиального значения для обучения и работы нейросе-тевой экспертной системы.
Важной чертой задачи классификации по определению является возможность выбора одного и только одного варианта решения (класса). Поэтому постановка диагноза не может считаться одной классификационной задачей, т.к. у одного человека может одновременно присутствовать несколько патологий. В случае невозможно-сти выбирать один вариант ответа (множественности выбора) задача подразделяется на подзадачи, каждая из которых представляет собой классификационную задачу.
Другой вид задач для нейросетей -задачи предикции, или предсказания. Они подразделяются на предска-зание числа (одномерная предикция) и вектора (векторная предикция, более общий случай). Отличие от класси-фикационных задач заключается в том, что ответ в задачах предикции может быть дробным и принимать любые значения на каком-либо интервале.
Векторная предикция предполагает, что ответ может быть представлен в виде нескольких независимых друг от друга чисел, образующих точку (или вектор) в многомерном пространстве, размерность которого равно количеству предсказываемых чисел. Число координат вектора называется при этом размерностью вектора ответа.
При решении реальных задач возможны различные комбинации предикции и классификации, и постанов-ка задачи должна быть сделана самим предметным специалистом.
II.2. Архитектура нейронной сети
Основой работы самообучающихся нейропрограмм является нейронная сеть, представляющая собой со-вокупность нейронов -простых элементов, связанных между собой определенным образом. Нейроны и меж-нейронные связи задаются программно на обычном компьютере или могут иметь "материальную" основу -осо-бую микросхему (нейрочип, [200]), которые применяются в специально созданных нейрокомпьютерах [11]. Структура взаимосвязей между нейронами в нейрокомпьютере или нейропрограмме аналогична таковой в биоло-гических объектах. Искусственный нейрон имеет коммуникации с другими нейронами через синапсы, передаю-щие сигналы от других нейронов к данному (дендриты) или от данного нейрона к другим (аксон). Кроме того, нейрон может быть связан сам с собой. Несколько нейронов, связанных между собой определенным образом, образуют нейронную сеть.
Нейросеть, также как и биологический аналог, должна иметь каналы для связи с внешним миром. Одни каналы обеспечивают поступление информации из внешнего мира на нейросеть, другие выводят информацию из нейросети во внешний мир. Поэтому одни нейроны сети рассматривается как входные, другие же -как выходные. Часть нейронов может не сообщаться с внешним миром, а взаимодействовать с входными, выходными и такими же нейронами ("скрытые" нейроны).
Очевидно, что существует огромное количество способов соединения нейронов, растущее с увеличением числа нейронов в сети [177]. Наиболее употребительной является слоистая архитектура, в которой нейроны рас-полагаются “слоями”. В наиболее общем случае аксоны каждого нейрона одного слоя направлены к нейронам следующего слоя. Таким образом, нейроны первого слоя являются входными (принимающими информацию из внешнего мира), нейроны последнего с лоя -выходными (выдающими информацию во внешний мир). Схема трехслойной сети изображена на рисунке 2.1.
Другой вид архитектуры -полносвязная, когда каждый нейрон соединен с каждым, в том числе сам с со-бой. Пример простейшей нейросети из 3 нейронов показан на рисунке 2.2. Для удобства изображения из каждого нейрона выходит не один, а несколько аксонов, направленных на другие нейроны или во внешний мир, что ана-логично присоединенным к одному аксону через синапсы нескольким дендритам.
Слоистые сети являются частными случаями полносвязных.
Для построения экспертных систем мы выбрали именно полносвязные нейросети, исходя из следующих соображений. Во-первых, при одинаковом числе нейронов полносвязные сети имеют большее количество меж-нейронных связей, что увеличивает информационную емкость сети. Во-вторых, полносвязная архитектура явля-ется намного более универсальной, что не требует экспериментов с вариациями схемы соединений для каждой задачи. В-третьих, в случае эмуляции сети на обычной ЭВМ полносвязные сети обладают серьезными преимуще-ствами, прежде всего в скорости функционирования и простоте программной реализации без ущерба качеству обучаемости.
II.3. Функционирование нейрона
Рассмотрим устройство и функционирование отдельного нейрона. Каждое соединение от нейрона к нейрону называется синапсом. На рисунке 2.3 представлен нейрон с группой синапсов, соединяющих нейрон либо с другими нейронами, либо с внешним миром. Для рассмотрения работы нейрона неважно, приходит ли сигнал к нейрону из внешнего мира или с другого нейрона, и неважно, куда отправляется сигнал с нейрона. В полносвязных сетях выходной сигнал направляется всем остальным нейронам.
Нейрон состоит из двух функциональных блоков: входного сумматора и собственно нейрона, или преоб-разователя.
Функционирование нейрона происходит следующим образом.
В текущий момент времени через входные синапсы (на рисунке их 3) на нейрон направляются сигналы от других нейронов и/или из внешнего мира. Каждый синапс имеет параметр, называемый весом синапса, и пред-ставляющий какое-либо число. Сигнал, проходящий через синапс, умножается на вес этого синапса. В зависимо-сти от веса, сигнал может быть усилен (модуль веса > 1) или ослаблен (модуль веса < 1) по амплитуде. Сигналы от всех синапсов, ведущих к данному нейрону, принимает сумматор.
Сумматор производит суммирование всех пришедших сигналов и подает на собственно нейрон (преобра-зователь) одно число -полученную сумму. Величина этого числа будет зависеть как от величин исходных сигна-лов, так и от весов синапсов. Нейрон, получивший это число, преобразует его согласно своей функции, в резуль-тате которой получается другое число, и отправляет его по "аксону" всем остальным нейронам через соответ-ствующие синапсы. Последующие нейроны производят с полученными сигналами такие же операции, лишь с тем различием, что во-первых, веса их синапсов могут быть уже другими, во-вторых, другие нейроны могут иметь другой вид функции преобразования. В конструируемых нами нейронных сетях все нейроны имеют одну и ту же функцию. Эта функция, называемая характеристической [234], имеет вид:
f (X) = X/(C+X) (1) где X -сигнал, поступаемый с сумматора, C -константа, называемая характеристикой нейрона. Эксперименталь-ным путем мы получили, что оптимальный диапазон характеристики для решения подавляющего большинства задач составляет от 0,1 до 0,8. Графики характеристической функции для обоих случаев представлены на рисунке
2.4. Выбор функции такого вида обусловлен тем, что она гладкая, непрерывная на всем диапазоне переменных X, диапазон значений всегда ограничен [130]. Подбор характеристики и ее влияние на работу нейронной сети будут рассмотрены ниже.
1
0,8
0,6
0,4
0,2
0-1-0,5-0,200,51
-0,4-0,6-0,8-1
Рисунок 2.4. График характеристической функции
II.4. Функционирование нейросети
В случае эмуляции нейросети на обычном компьютере все математические операции осуществляет про-грамма. Нейронная сеть при этом представляет собой массив синаптических весов. Этот массив может находить-ся либо на диске компьютера в виде файла определенного формата (при хранении нейросети) либо в оперативной памяти компьютера (когда нейросеть функционирует).
При создании новой нейросети в памяти компьютера отводится место под массив синаптических весов, называемый картой. Этот массив заполняется совершенно случайными числами из определенного диапазона. Поэтому каждая созданная сеть даже при одних и тех же параметрах (число нейронов, их характеристика) явля-ется уникальной. Уникальность сетей проявляется в том, что сети с одинаковыми параметрами, обучающиеся на одинаковых задачах, ведут себя неодинаково. Это касается времени обучения, качества обучения, уверенности в выдаваемых ответах при тестировании. В этом еще одно сходство сетей с биообъектами.
Рассмотрим работу сети безотносительно к процессу обучения или выдачи решения. После инициализа-ции сети веса всех синапсов случайны. В начальный момент времени на входные нейроны через входные синап-сы (один или несколько) подается из внешнего мира вектор входных сигналов, представляющий набор чисел (или одно число). Далее этот сигнал начинает распространяться по всем связям между нейронами, изменяясь при про-хождении через каждый нейрон согласно схеме функционирования нейрона. В конечном итоге, после одного прохода выходные нейроны выдадут во внешний мир какие-либо сигналы. Вся процедура однократного прохож-дения сигналов по нейронной сети является тактом функционирования сети. Можно не считывать сигналы с вы-ходных нейронов после одного такта функционирования, а продолжить обмен сигналами еще несколько раз, не подавая сигналов на вход. Обычно количество тактов функционирования между подачей сигналов на вход и сня-тием сигналов с выхода фиксировано для данной сети. Как правило, этот параметр задается при инициализации сети и хранится в файле сети вместе с матрицей коэффициентов (как и некоторые другие параметры -число нейронов, характеристика нейронов и т.д.).
Таким образом, нейронная сеть, получающая на входе некоторый сигнал, способна после прохода его по нейронам выдавать на выходе определенный ответ, который зависит от весовых коэффициентов всех нейронов и от самого сигнала. Очевидно, что при осуществлении таких процедур на только что инициализированной сети мы будем получать на выходе сигналы, лишенные всякого смысла (весовые коэффициенты случайны). Чтобы до-биться выдачи сетью требуемого результата, необходимо обучить ее.
II.5. Общая схема обучения нейронной сети
Для обучения нейронной сети необходима обучающая выборка (задачник), состоящая из примеров. Каж-дый пример представляет собой задачу одного и того же типа с индивидуальным набором условий (входных па-раметров) и заранее известным ответом. Например, в качестве входных параметров в одном примере могут ис-пользоваться данные обследования одного больного, тогда заранее известным ответом в этом примере может быть диагноз. Несколько примеров с разными ответами образуют задачник. Задачник располагается в базе дан-ных, каждая запись которой является примером.
Рассмотрим общую схему обучения нейросети.
При прохождении цикла каждый пример имеет свою оценку. Вычисляется, кроме того, суммарная оценка множества всех примеров обучающей выборки. Если после прохождения нескольких циклов она равна нулю, обучение считается законченным, в противном случае циклы повторяются.
Количество циклов обучения, также как и время, требующееся для полного обучения, зависят от многих факторов -величины обучающей выборки, количества входных параметров, вида задачи, типа и параметров нейросети и даже от случайного расклада весов синапсов при инициализации сети.
С учетом подразделения задач на классификационные и предикционные, рассмотрим принцип вычисле-ния оценки у нейросетей, решающих такие задачи.
II.6. Обучение нейросетей-классификаторов
Обучаемая нейросеть может иметь любое количество нейронов, которое, однако, не должно быть меньше числа классов в задаче, решению которой обучается нейросеть. Обычно количество нейронов устанавливается равным числу входных сигналов в задаче или меньшим. Как правило, в полносвязных нейросетях, применяемых нами, все нейроны являются входными (Каждый из них принимает один, часть или все входные сигналы). Вы-ходными считаются последние нейроны, причем их число в сети-классификаторе равно числу классов в задаче. После работы сети с одним примером выходные сигналы снимаются с каждого выходного нейрона отдельно.
При решении классификационной задачи нужно интерпретировать ответы выходных нейронов, так как окончательным ответом является класс, к которому относится пример. Интерпретация производится следующим образом: так как число выходных нейронов совпадает с количеством классов в решаемой задаче, каждый выход-ной нейрон отвечает за класс с соответствующим номером. Номер выходного нейрона, выдавшего наибольший выходной сигнал, и есть номер класса, к которому, по мнению нейросети, относится данный пример. Однако при обучении необходимо не только установить факт совпадения или несовпадения ответов, но и вычислить оценку, показывающую, насколько вычисленный ответ отличается от требуемого. Это достигается вычислением разности между двумя максимальными выходными сигналами, выданными выходными нейронами. При этом выявляется не только выходной нейрон, выдавший максимальный сигнал, но и выходной нейрон, выдавший второй по вели-чине сигнал. Если число выходных нейронов больше двух (n-арная классификация), ответы остальных нейронов не имеют значения. Если разность не превышает заранее установленного значения (уровня надежности), оценка приравнивается к нулю, и пример считается распознанным абсолютно правильно, и коррекции синаптических весов на данном примере не требуется.
Ситуацию распознавания примера в задачах классификации можно представить в виде некоторых дей-ствий, производящихся в пространстве, размерность которого равна числу классов в задаче. В случае бинарной классификации рабочее пространство представляет собой квадратный участок плоскости (двухмерного простран-ства), минимальные и максимальные координаты которого ограничены значениями -1 и 1.
Рассмотрим рисунок 2.5. Значения вертикальной координатной оси соответствуют выходным сигналам 1-го выходного нейрона (отвечающего за 1-й класс), значения горизонтальной координатной оси -выходным сиг-налам второго выходного нейрона (2-й класс). Пространство разделяется на две части диагональной линией. В текущий момент времени параметры очередного примера подаются на входные нейроны нейросети. После всех преобразований ответ примера проецируется в определенную точку пространства и в зависимости от значений, снятых с выходных нейронов, попадает в одну из областей, разделенных диагональю. Область каждого класса в пространстве соответствует как можно большим значениям (1) "своей" оси координат и как можно меньшим зна-чением (-1) другой оси координат.
Таким образом, чем больше будет значение, снятое с какого-либо выходного нейрона, тем больше будет значение координаты точки по оси, соответствующей этому нейрону, и наоборот. Ситуация, когда значения, сня-тые с обоих нейронов, равны, приведет к попаданию точки на диагональ (независимо от значений чисел). Пунк-тирной линией отсечены зоны “надежности”, находящиеся у углов квадрата, соответствующих классам задачи. Чем больше расстояния между линиями, тем больше заданный уровень надежности и, соответственно, требова-ния к сети. Пример, ответ которого “попал” в свою область и, к тому же, в зону надежности, считается распо-знанным абсолютно верно.
В процессе обучения ответы примеров, подаваемых сети многократно, постепенно "разводятся" как мож-но дальше от диагонали и как можно ближе к углам, каждый из которых соответствует определенному классу. После того, как все примеры попали в зоны “надежности”, соответствующие их классам, сеть считается обучен-ной полностью. Постепенно повышая уровень надежности, можно добиваться большей точности ответов сети и лучшего распознавания примеров обучающей выборки.
При каком минимальном превышении сигнала одного выходного нейрона над сигналом другого считать пример правильно распознанным? Универсального решения не существует, поэтому специалист, обучающий нейросети, сам задает уровень надежности исходя из реальной задачи. В некоторых случаях достаточно только правильно определить класс (с минимальным превышением одного сигнала над другими). Тогда задается н е-большой уровень надежности. В других случаях уровень надежности должен быть увеличен. Максимальное зна-чение уровня надежности равно 2. Это идеальное число, которое в принципе недостижимо при обучении. Оче-видно, что при больших значениях уровня надежности сеть будет обучаться дольше. Кроме того, для каждой реальной задачи существует "свой" предельный уровень надежности, с которым может обучиться нейросеть.
В основе обучения нейросети (подстройки синаптических весов) лежит усовершенствованный метод
двойственного функционирования [10,26,186,187,192]. Введем обозначения : G=(g iM), i=1,M -вектор входных сигналов. X=(x i j), i, j=1,N -матрица синаптических связей между нейронами (x -связь от i-го нейрона к j-му). Сигнал, предъявляемый нейрону, преобразуется по характеристической функции (1). Добавим лишь, что
параметр характеристики должен находиться на интервале (0,1]. Опишем прямое функционирование -процесс, начинающийся с момента подачи сигналов на вход сети и заканчивающийся получением ответа.
на нулевом такте функционирования на нейроны подается вектор Q0 следующего вида: Q =(g1, g2, ..., gM, 0, ..., 0), где вектор Q0 имеет размерность, равную числу нейронов в сети;
каждая координата вектора Q0 подается на отдельный нейрон и преобразуется согласно (1):
A1i =Qi0 / (C+|Qi0|) -выходной сигнал i-го нейрона на первом такте функционирования, С -характери-стика нейрона; Вектор, предъявляемый нейронам нейросети на k-ом такте функционирования, строится по следующей формуле: i N k-1 Q = ∑ x A (2) k j=1 ji j
Выходной вектор на k-ом такте функционирования есть: k i i A =Q / (C+Q ) , где i=1,N, N -число нейронов. i k k
если k=T, где T -число тактов функционирования, то последние S координат (S -число классов) вектора
Ak есть ответ нейросети по данному примеру. Иными словами, при предъявлении входных сигналов они поступают на нейроны и преобразуются со-
гласно формуле (1), затем T-1 раз каждый нейрон передает всем остальным свой сигнал (Ak) посредством внут-
iренних синапсов (матрица X), полученные сигналы суммируется (2) и нейрон опять обрабатывает сигнал с внут-
реннего сумматора (Qik ) по формуле (1).
Можно сказать, что цель обучения -минимизировать функцию оценки H(AT ,X,G), желательно до гло-
бального минимума (если он существует; при обучении мы предполагаем, что он есть). Функция оценки вычисляется следующим образом: Пусть S -число классов, A=(ai ), i=1,S -вектор выходных сигналов, ai ∈[-1,1] согласно (1). Множество
векторов {Ek =(ei)}, где k∈1,S, i=1,S, и ekk >eki ∀ i≠k, назовем множеством правильных ответов для k-го клас-
са. Тогда оценку можно записать как функцию, явно зависимую от выходных сигналов нейросети и неявно -от
адаптивных параметров, при условии, что пример принадлежит k-му классу: H(A)=Dist(A,Ek ), где Dist(.,.) ев-
клидово расстояние в RS. Если A∈Ek , то оценка приравнивается к 0. При введении в функцию оценки уровня надежности будем требовать, чтобы нейросеть выдавала на тре-буемом нейроне сигнал больший, чем сигнал на любом другом на величину r∈[0,2] -уровень надежности. Через
ek обозначим единичный вектор в пространстве RS , у которого k-ая координата равна 1, остальные 0. Тогда
функция оценки одного примера примет вид:
H(A)=Dist(A,Ek +rek ) (3)
В процессе обучения на каждом цикле вычисляется суммарная оценка всех примеров, а адаптивные эле-менты нейросети (матрица X) подстраиваются так, чтобы функция оценки была как можно меньше. Поскольку функция оценки -гладкая функция от своих аргументов (матрица X), то ее минимум находится градиентными методами. В процессе обратного функционирования вычисляются производные ∂H/∂xi,j , i,j=1,N, затем вычисля-
ется направление спуска по BFGS-формуле, наилучший шаг методом парабол, и осуществляется собственно спуск. Так как при обучении число примеров как минимум равно числу классов, для вычисления направления спуска и оптимального шага используются суммарные частные производные по адаптивным параметрам по всем предъявляемым примерам.
В приведенной схеме число входных нейронов точно соответствовало количеству обучающих параметров (размерности вектора входных сигналов). Однако в наших экспертных системах мы использовали более гибкую и одновременно более мощную подачу входных сигналов на вход нейросети. Суть ее заключается в том, что вектор входных сигналов перед подачей на сеть преобразуется умножением на адаптивную матрицу приема сигналов, содержащую подстраиваемые, как и веса синапсов, значения. Кроме повышения скорости и качества обучения, это дает возможность задавать число нейронов в сети произвольным, независимым от числа обучающих пара-метров. Сети с небольшим числом нейронов, естественно, занимают меньше места на диске и в памяти компью-тера, быстрее загружаются с диска для выдачи ответа (иногда для тестирования примеров приходится каждый раз загружать сети с диска, особенно, если сетей много, а все они одновременно не помещаются в оперативной памя-ти).
II.7. Обучение нейросетей-предикторов
Обучение сетей-предикторов принципиально не отличается от обучения классификаторов. Различия за-ключаются в способе оценки ответа сети и смысле уровня надежности.
Как уже говорилось, ответ в задачах предикции выражается любым числом (или вектором чисел) [113]. При этом оценивать правильность ответа достаточно просто. В случае одномерной предикции оценка равна квад-рату разности между известным и вычисленным ответами. Некоторые изменения претерпевает структура нейросети.
В качестве исходной берется полносвязная сеть с адаптивной матрицей приема сигналов. Все нейроны сети на последнем такте функционирования считаются выходными. Над сетью достраивается адаптивный выход-ной сумматор, принимающий сигналы с нейронов с последнего такта функционирования и выдающий результат. Также вводится вектор сдвига, который складывается покоординатно с сигналами, приходящими на нейроны в момент подачи входных сигналов. Вектор сдвига подается на нейроны на каждом такте, а не только в момент подачи входных сигналов, и для удобства содержится в матрице связей нейронов.
Введем обозначения: пусть N-число нейронов в сети, причем характеристическая функция последнего нейрона имеет вид: fN
(x)=x; G=(gi), i=1,M -вектор входных сигналов;
C=(cij), i=1,N-1, j=1,M -адаптивная матрица приема входных сигналов;
i=1,N -адаптивный вектор сдвига;
Xentry =(xNi), X=(xij), i,j=1,N -матрица синаптических связей между нейронами -связь от i-го нейрона к j-му),
(x ij xNN =1, xiN =0, i=1,N-1;
i=1,N -адаптивный выходной сумматор;
Xout =(βi ), Опишем прямое функционирование: на нулевом такте функционирования на нейроны подается вектор Q0 следующего вида: Q0
=CG+Xentry, где Q0(N)=0, и преобразовывается согласно (1):
i i A =Q / (C+Q ) -выходной сигнал i-го нейрона; i 0 0 Выходной вектор сети строится по следующей формуле:
i N Q =∑ x A-подается на следующем такте функционирования 1 j=1 ji j Прямое функционирование на k-ом такте осуществляется следующим образом: i 1) Q подается на i-ый нейрон, k-1
i i Ai=Q / (C+Q ) -выходной сигнал i-го нейрона;
k-1 k-1
i N 2) Q = ∑ x A -выходной вектор сети с k-го такта k j=1 ij j функционирования, i=1,N. С последнего такта снимается вектор A, при этом ответом сети считается r=(
A,X out ). Пусть R -требуемый от сети ответ, тогда оценка сети по данному примеру примет вид:
H=(R-r)2 (4)
Как правило, требуется получить ответ с требуемой точностью. Для этого вводится уровень отклонения (величина, обратная уровню надежности) результата сети от требуемого и оценка принимает вид:
H=min((R+ε-r)2, (R-ε-r)2), если r-R≥ ε
H=0, если r-R<ε (5) ε -допустимое отклонение;
При обратном функционировании координаты адаптивного сумматора Xout подстраиваются согласно
известным алгоритмам, с учетом особенности матрицы связей.
Таким образом, при решении задач предикции смысл уровня надежности кардинально меняется. Теперь его снижение приведет к тому, что от сети будет требоваться большая точность при выдаче ответа на пример. Поэтому уровень надежности в предикторах уместнее называть уровнем отклонения. Естественно, с него снима-ются ограничения по величине, так как точность решения задачи (величина уровня отклонения) зависит от раз-мерности параметра, являющегося ответом, и может изменяться в широких пределах.
В векторных предикторах, где ответ представлен набором чисел, оценка вычисляется как сумма квадратов отклонений по каждой составляющей вектора ответа. Такой же смысл имеет и параметр, задаваемый как уровень отклонения.
II.8. Методологические аспекты обучения нейросетей
Иногда (при решении медико-биологических задач -крайне редко) встречаются ситуации, когда сеть не может обучаться. Это происходит в том случае, когда на определенном этапе обучения исчерпываются дальней-шие возможности поиска закономерностей между обучающими параметрами и результатами. Простейшая ситуа-ция -когда два примера с совершенно одинаковыми наборами параметров подаются сети как принадлежащие различным классам (в классификаторах) или имеющие различное значение ответа (в предикторах). Очевидно, оба этих примера всегда будут попадать в одну и ту же точку в пространстве, их невозможно будет отделить друг от друга, и процесс обучения остановится. Программа, управляющая нейросетями, сигнализирует об окончании процесса обучения, причем указывает, что дальнейшее обучение невозможно. Задача специалиста, обучающего нейросети -избежать таких ситуаций, для чего нужны четкая постановка задачи и тщательный контроль обуча-ющей выборки.
Обученная нейросеть автоматически записывается на диск компьютера как обыкновенный файл и может храниться там, сколько необходимо. В любой момент времени можно считать сеть с диска и продолжить обуче-ние решению данной задачи со старой или новой обучающей выборкой. Одна нейросеть обучается решать только одну задачу классификации или предикции, однако может использовать для обучения различные обучающие выборки. Они могут различаться по количеству примеров, но должны соответствовать друг другу по числу обу-чающих параметров, числу классов (в классификационной задаче), а главное, по смыслу.
Говоря об обучении нейросетей, следует рассмотреть еще один важный аспект этой темы. Мы уже знаем, что успех обучения во многом зависит от числа нейронов в сети, или, точнее, от числа синапсов. Именно весовые коэффициенты синапсов хранят "опыт" сети. Теоретически, бесконечно увеличивая число нейронов и синапсов, всегда можно добиться полного обучения сети на данном задачнике, однако это ли является целью создателя экспертной системы? Очевидно, нет. Главное, чтобы обученная сеть хорошо распознавала примеры, как раз не входящие в задачник.
Проблема заключается в том, что сеть с заведомо большим (избыточным) числом синапсов (относительно данного задачника) может хорошо обучиться, просто "механически запомнив" имеющиеся примеры. Такая сеть обучится быстро (нет необходимости как можно более точной подстройки весов) за счет количества, а не каче-ства.
Хорошим практическим выходом из данной затруднительной ситуации были бы сети, способные автома-тически наращивать число нейронов [184] при невозможности дальнейшего обучения, не теряя при этом уже имеющегося опыта. Последнее условие вызывает значительные трудности. Нейросеть представляет собой единое целое, и добавление нового нейрона к сети, работающей в рамках имеющейся сейчас концепции, приведет к необходимости полностью переучивать сеть. Это требует обращения к первоначальному задачнику, что во мно-гих случаях неприемлемо.
Поэтому создателю самообучающихся систем приходится идти на компромисс: либо делать сеть с неко-торым избытком нейронов, имеющую резерв для накопления опыта, но обладающую относительно низкой спо-собностью к экстраполяции, либо обучить сеть с небольшим числом нейронов, которая вряд ли сможет набрать потом дополнительный опыт. Все это, конечно, зависит еще и от задачника -насколько тесные взаимосвязи име-ются между обучающими параметрами и известными ответами примеров. Чем больше таких взаимосвязей, тем меньше необходимость в "механическом запоминании" примеров. Практика показывает, что большинство биоло-гических и медицинских задач имеют достаточно хорошие взаимосвязи, конечно, при грамотной постановке за-дачи и выборе обучающих параметров. Однако в рамках предлагаемой методологии, с учетом высокой скорости обучения нейросетей разработаны стратегия и тактика обучения, позволяющие обойти вышеуказанный компро-мисс, за счет, правда, большего времени, необходимого для обучения.
II.9. Тестирование примеров
При тестировании примеров необходимость в системе подстройки весов синапсов отпадает, поэтому при создании экспертных систем блок программы, содержащий алгоритмы обучения, может не включаться в про-грамму в случае, если не предполагается доучивать сети в процессе работы экспертной системы. Тестирование примеров нейросетью может проводиться с различными целями:
В первом случае осуществляется тестирование выборки с заранее известными ответами примеров. Таким образом можно проверить, правильно ли сеть определяет ответы примеров и насколько уверенно она это делает. Определенный сетью ответ примера сравнивается с заранее известным. Как правило, сначала тестирование про-водится на той выборке, на которой сеть обучалась. Если сеть обучилась полностью, то при тестировании той же самой обучающей выборки ответы всех примеров будут определяться правильно. Гораздо больший интерес представляет тестирование аналогичной выборки с заранее известными ответами, но примеры которой не участ-вовали в обучении сети. Неправильное определение ответов некоторых примеров может быть вызвано несколь-кими причинами:
При решении конкретных задач сети подаются примеры, ответ которых неизвестен. В этой ситуации про-грамма не может проверить правильность решения.
В классификационных задачах при ответе нейросеть не только выдает результат -класс тестируемого примера. Как уже говорилось, в отличие от большинства экспертных систем, работающих по четким правилам, решение задачи на основе опыта всегда имеет “нечеткий” характер. Поэтому кроме класса тестируемого примера сеть вычисляет коэффициент уверенности в данном решении. Коэффициент уверенности зависит от заданного уровня надежности и рассчитывается по формуле:
КУ = (Max1-Max2) / R x 100%, (6)
где Max1 -ответ выходного нейрона, отвечающего за класс-"победитель", Max2 -ответ выходного нейрона, вы-давшего следующий по максимальной величине сигнал, R -уровень надежности. Судя по формуле ясно, что уве-ренность сети зависит от того, насколько наибольший из выходных сигналов превышает второй по величине сиг-нал. Естественно, если КУ получается более 100%, он приравнивается к этому числу. Из того, что в знаменателе правой части формулы стоит уровень надежности, следует, на первый взгляд, парадоксальный вывод: сеть, обу-ченная лучше (уровень надежности больше) даст меньшую уверенность в ответе, чем сеть, обученная хуже. Од-нако при внимательном рассмотрении проблемы делается ясно, что при тестировании примера первой сетью, выражение, стоящее в числителе, также будет больше (ответ одного нейрона будет намного больше ответа друго-го) вследствие лучшей обученности. Кроме того, КУ выражает все же уверенность конкретной сети, которая во многом зависит от того, насколько тестируемый пример близок к примерам, на которых обучалась эта сеть.
Если пример отличается достаточно сильно, лучше обученная сеть будет и сомневаться больше, чем сеть с меньшим "опытом".
Один из показателей качества обучения -определение прогностической способности нейросети -состоит в подсчете процента правильно распознанных примеров. При сравнении качества обучения двух нейросетей, в случае, когда обе сети дают одинаковую прогностическую способность, можно подсчитывать средний процент уверенности при тестировании выборки. Он рассчитывается как средняя арифметическая процентных величин уверенности, полученных при тестировании каждого примера за известный результат.
Иногда необходимо знать, к каким еще классам, кроме найденного, близок тестируемый пример. Это можно сделать несколькими способами, из которых достаточно трудно выбрать наилучший, однако самый опти-мальный, на наш взгляд, заключается в том, чтобы просто сравнить сигналы, полученные со всех выходных нейронов (их можно выразить в процентах от максимально возможного). Понятно, что когда все выходные сиг-налы близки друг к другу, сеть затрудняется дать уверенный ответ.
Из вышесказанного вытекает очень полезный для практики вывод. Изменяя в различных направлениях значения параметров примера и повторяя его тестирование, можно видеть, что и на сколько нужно изменить, чтобы пример стал принадлежать к требуемому классу. Это может быть полезным для медицинской диагностики и прогнозирования. Предположим, что сеть обучена дифференцировать больных и здоровых людей по набору клинических параметров. Изменяя на компьютере эти параметры, можно добиться, чтобы пример, определяемый как "больной", стал принадлежать классу "здоровый". Таким образом, станет ясно, какие клинические параметры подлежат изменению для улучшения состояния больного.
II.10. Общие аспекты создания медицинских нейросетевых экспертных систем
Любая экспертная система должна состоять условно из четырех блоков [75,181]: интерфейс с пользовате-лем, база знаний, вычислительный блок, блок объяснений, позволяющий пользователю проследить "ход рассуж-дений" системы в конкретном случае. Связующим элементом между этими блоками является метод, с помощью которого экспертная система в ответ на запрос пользователя выдает результат (заключение). В работе [65] пред-лагается классификация таких методов на три основные группы -методы логических правил “в чистом виде”, когда формализация правил получения результата осуществляется специалистом; те же методы, однако формали-зация правил осуществляется исследователем, наблюдающим за работой специалиста со стороны, и методы, ос-нованные на принципе “смотри и учись”.
Создание даже простых экспертных систем, основанных на методах 1 и 2, представляет собой нелегкую задачу, прежде всего потому, что требует совместной работы специалистов различного профиля. Традиционные экспертные системы, основанные на базах знаний и логических правилах, требуют для создания довольно боль-шого времени и средств [289]. Создание традиционной экспертной системы можно условно разделить на не-сколько этапов.
При создании логических экспертных систем наибольшую часть времени занимают 3, 4 и 5 этапы, требу-ющие совместной работы как предметных специалистов, так и программистов и математиков. Несмотря на появ-ление компьютерных средств проектирования экспертных систем, основная работа все равно возложена на спе-циалистов. При этом возникают сразу несколько серьезных проблем.
Первая из них состоит в том, что при решении сложных реальных задач (экономика, проектирование, инженерия, биология) число логических правил значительно увеличивается. Часто возникает настолько сложная система взаимосвязей между ними, что ее просто не удается осмыслить. Разбивка задачи на блоки также не все-гда помогает: во-первых, это тоже не всегда просто сделать, во-вторых, при разбивке иногда могут теряться неко-торые взаимосвязи.
Вторая, еще более серьезная проблема состоит в том, что далеко не всегда удается выразить вычисли-тельный процесс логическими правилами. Это может быть связано как со сложностью самой задачи, так и с осо-бенностями деятельности предметного специалиста. Особенно ярко это проявляется в медицине, где процесс принятия решения во многом опирается на интуицию и опыт врача, не являющегося экспертом в области соб-ственного мышления [65]. Во всех этих случаях говорят, что задача не поддается алгоритмированию. Кроме того, даже если создателям удается разработать алгоритм, никогда нет достаточной гарантии, что он будет корректно работать в реальных условиях, а это можно проверить только после окончания всех работ по созданию системы.
В создании самообучающейся системы также можно выделить несколько этапов, часть из которых совпа-дает с этапами создания традиционных систем.
Резюмируем имеющиеся преимущества нейросетевых экспертных систем перед обычными, которые, как уже говорилось, проявляются только при решении трудноалгоритмируемых задач.
Главным критерием работы нейросетевых экспертных систем должна быть практика -многократные ис-пытания и проверки в самых различных условиях.
Определенным препятствием использования нейросетей может является все же некоторая ограниченность задач, решаемых ими. Иногда в блоке трудноалгоритмируемых задач, решаемых с помощью самообучающейся экспертной системы, могут присутствовать элементы четких правил. В таком случае совершенно логично комби-нировать в одной экспертной системе несколько нейросетей или даже обычные математические методы и строить из них иерархические блоки, одни из которых используют для своих действий результаты работы других. Следу-ет подчеркнуть, что применение неявных алгоритмов не противоречит и не отменяет использование формальных методов, а может дополняться ими при необходимости. Например, если с помощью нейросети определяется оп-тимальная комбинация лекарственных препаратов для лечения пациента, и имеется совершенно четкое противо-показание к назначению определенного препарата, в экспертную систему может быть введен простой логический блок, препятствующий назначению этого лекарства независимо от решения нейросетей.
Ниже мы рассмотрим принципы и особенности создания нейросетевых экспертных систем для биологии и медицины.
II.11. Постановка задачи
Постановка задачи всегда является прерогативой предметных специалистов.
Прежде всего, необходимо определить, что представляет собой акт работы экспертной системы, начина-ющийся со ввода данных (условия задачи) пользователем и заканчивающийся выдачей ответа. Например, в ме-дицинских диагностических задачах акт работы системы чаще всего начинается с введения в ЭВМ данных о па-циенте (симптоматика, анамнез, результаты анализов и т.д.) и заканчивается выдачей возможного диагноза и/или прогноза. Часто одна задача компонуется из нескольких подзадач. В этом случае каждой подзадаче может соот-ветствовать отдельный акт работы системы, хотя для пользователя это может быть совершенно незаметным. Например, по данным о пациенте требуется установить диагноз и назначить соответствующее лечение. Установ-ление диагноза на базе введенных параметров -первая подзадача, назначение терапии -вторая, при этом для назначения терапии нужны не только исходные данные, но и результат решения предыдущей задачи -диагноз.
Полезно сразу же для каждой подзадачи определить ее тип (классификация, предикция, векторная пре-дикция).
Обычно каждая подзадача решается одной нейросетью или несколькими нейросетями, объединенными в один функциональный блок (малые эксперты). При этом введенные данные подаются последовательно на каж-дую нейросеть блока и каждая нейросеть выдает ответ. Ответы могут различаться, поэтому в такой ситуации тре-буется разработать способ получения единственного ответа. Это можно сделать двумя способами:
После определения акта работы системы и разбивки (если требуется) задачи на подзадачи следует разра-ботка схемы обучающих примеров для каждой из подзадач. Схема примера включает список входных и выход-ных параметров для данной подзадачи.
Определение списка входных данных -квалифицированная работа предметного специалиста, требующая знания изучаемой области и ориентировочной важности тех или иных параметров, необходимых для получения ответа. Желательно в начале работы над проектом задать некоторую избыточность списка входных данных. В дальнейшем “лишние” параметры можно будет легко исключить из работы системы, добавить же новые несколь-ко труднее, прежде всего потому, что потребуется вновь обращаться за этими параметрами к источникам данных.
Далее желательно составить наглядную схему движения информации в экспертной системе начиная со ввода данных из внешнего мира и заканчивая выводом ответа (ответов) пользователю. Пример такой схемы при-веден на рисунке 2.6.
Необходимо определить ориентировочные размеры обучающих выборок. Так, в классификационных за-дачах (подзадачах) желательно, чтобы каждый класс ответа был представлен достаточным количеством приме-ров. Необязательно, но желательно, чтобы количества примеров каждого класса не различались слишком сильно (более, чем на порядок).
Следует заметить, что предварительное обучение и тестирование нейросетей м ожно проводить на н е-большом количестве примеров с целью определения дальнейшей стратегии и тактики обучения, а также уточне-ния общего размера обучающей выборки.
II.12. Представление обучающих данных
Следующий этап работы над проектом -разработка представления обучающих данных. Нейросети опери-руют с информацией, представленной только в виде чисел. Числа подаются на входные синапсы нейросети; отве-ты, снимаемые с выходных нейронов, также представляют собой числа, поэтому для оценки примера заранее известный ответ также должен быть представлен в виде числа (чисел). Информация же, на основании которой нейросеть должна давать ответ, может быть самого разнообразного вида: термины, описывающие какие-либо ситуации, числа различного вида и величины [298], динамические ряды, массивы, графики, динамические кри-вые, двух-и трехмерные изображения и т.д. Поэтому возникает необходимость корректного представления этой информации в виде чисел, сохраняющих смысл и внутренние взаимосвязи в данных.
Существует огромное количество способов представления информации для различных целей [204].
Для работы нейронных сетей с медико-биологическими данными мы предлагаем по возможности полную классификацию данных, с которыми может столкнуться создатель медицинских экспертных систем, и оптималь-ные способы их представления в численном виде, учитывающие специфику работы нейросетевых систем. Однако это не готовые рецепты, поэтому в каждом конкретном случае все же требуется квалифицированное решение специалиста.
А. Неупорядоченные варианты -приведенный пример с полом человека. Их можно кодировать произ-вольным способом. Часто к этому типу относятся данные, представляемые всего двумя вариантами (да -нет, со-гласен -не согласен, болел -не болел и т.д.).
Б. Упорядоченные варианты. Такие данные находятся в определенных взаимосвязях друг с другом, кото-рые могут быть выражены отношениями типа "больше", "меньше". Примером может служить степень тяжести заболевания (I,II,III). В любом случае варианты располагаются в определенном порядке -как правило, возраста-ния или убывания.
В. Частично упорядоченные варианты. Способ упорядочивания не очевиден, однако его можно найти, если это необходимо для решения задачи.
3. Совместимые варианты. Информация может быть представлена одним или одновременно несколькими вариантами из известного и ограниченного набора вариантов. Примером может являться наличие у обследуемого каких-либо заболеваний или заболеваний, перенесенных в детстве. В таких случаях имеется два различных под-хода к кодированию данных.
А. Если варианты неупорядоченные, наилучший (но, к сожалению, не всегда удобный) способ состоит в том, чтобы разбить признак на несколько признаков, количество которых равно количеству вариантов и каждый из них кодировать отдельно. Каждый подпризнак в таком случае делается самостоятельным признаком и подает-ся на отдельный входной синапс нейросети.
Б. Если варианты упорядоченные, можно применить принцип битовой маски.
После разработки списка обучающих параметров для каждой подзадачи и определения способа представ-ления каждого параметра и ответа можно приступать к формированию обучающих выборок -сбора информации и помещения ее в базы данных.
II.13. Инициализация нейронной сети
После формирования обучающей выборки производится инициализация нейронной сети (сетей), для ко-торой определяются стартовые параметры. Данная подглава посвящена выбору стартовых параметров нейросети в зависимости от обучающей выборки и цели обучения.
Разработанная нами методика создания нейросетевых экспертных систем включает фиксированный набор стартовых параметров, выбор которых может осуществляться предметным специалистом. Однако даже этот не-большой набор может быть минимизирован путем автоматизации установки достаточно очевидных параметров.
Список стартовых параметров включает следующие пункты (параметры, выбор которых может быть ав-томатизирован, помечены звездочками):
1*. Выбор типа нейронной сети;
2.* Имя файла нейронной сети;
3. Схема подачи обучающих данных, которая определяет количество входных сигналов и соответствую-
щих им входных синапсов, а также ответ;
4*. Включение или выключение нормирования входных сигналов;
5*. Количество нейронов;
6*. Параметр плотности (количество нейронов, на которые подается один входной сигнал);
7*. Время отклика нейросети (число тактов функционирования нейросети при прохождении одного при-мера с момента подачи входных сигналов до выдачи ответа);
8*. Величина характеристики нейронов.
Как видно, в минимизированном варианте списка параметров специалист-пользователь должен всего лишь поставить задачу, не задумываясь о выборе остальных параметров.
Рассмотрим методику задания каждого параметра, а также вариант, который принимается при автомати-ческой установке.
Следует заметить, что в рамках принятой нами идеологии создание нейросетей должно осуществляться при наличии стартовой обучающей выборки, находящейся в базе данных, что значительно облегчает выбор па-раметров пользователем и дает возможность автоматизации выбора параметров.
Таблица 2.1. Схема подачи обучающих параметров и определение ответа, устанавливаемые стандартно
Поля базы данных | Количество входных синапсов, на которые подается обучающий параметр | Номера входных синап-сов, на которые подает-ся обучающий параметр |
---|---|---|
1. Диагноз | 1 | -(Ответ) |
2. Возраст | 1 | 1 |
3. Пол | 1 | 2 |
4. Количество эритроцитов | 1 | 3 |
5. Количество лейкоцитов | 1 | 4 |
В первой схеме база данных содержит 6 полей, содержащих данные об обследуемых. Первое поле содер-жит ответ (диагноз), остальные поля являются обучающими. Если поле, содержащее ответ, первое в базе данных, не требуется переопределять ответ. В приведенном примере 5 обучающих полей, данные каждого из них будут подаваться на один соответствующий входной синапс.
Во втором примере поле, содержащее ответ, стоит последним; кроме того, имеются поля, содержащие код обследуемого и его фамилию. В этой ситуации пользователь должен указать, что ответом является именно поле “Диагноз”.
Подавать на вход нейросети код обследуемого не имеет никакого смысла, поэтому данное поле выключа-ется из схемы подачи входных сигналов, несмотря на то, что оно может иметь числовой тип. Поле, содержащее фамилию обследуемого, также выключается из схемы, т.к. оно является не числовым, а символьным. Поля, со-держащее данные о количестве эритроцитов и гемоглобине, подаются соответственно на 2 и 3 входных синапса создаваемой нейросети, что будет определять их относительно большее влияние на выдачу ответа у обученной сети. Таким образом, несмотря на то, что число обучающих параметров равно по прежнему 5, число входных синапсов будет увеличено до 8.
Таблица 2.2. Схема подачи обучающих параметров и определение ответа, заданные создателем нейросети
Поля базы данных | Количество входных синапсов, на которые подается обучающий параметр | Номера входных синап-сов, на которые подает-ся обучающий параметр |
---|---|---|
1. Код пациента | - | - |
2. Ф.И.О. пациента | - | - |
3. Возраст | 1 | 1 |
4. Пол | 1 | 2 |
5. Количество эритроцитов | 2 | 3, 4 |
6. Количество лейкоцитов | 1 | 5 |
7. Гемоглобин | 3 | 6, 7, 8 |
8. Диагноз | - | -(Ответ) |
Подачу некоторых входных параметров на несколько входных синапсов можно рекомендовать и в случа-ях, когда общее число обучающих параметров мало (единицы).
4. Включение или выключение нормирования входных сигналов. Нормирование входных сигналов пред-ставляет собой один из видов предобработки и является исключительно важным в методологии создания нейросетевых экспертных систем. При нормировании на входной синапс подается не величина параметра (для данного примера), а ее эквивалент, полученный путем пересчета по определенной схеме. Мы применяем норми-рование входных сигналов на диапазон [-1...1]. Система нормирования имеет два аспекта -методологический и технологический. Первый состоит в том, что нормирование позволяет унифицировать представление информа-ции внутри “черного ящика” нейросетевой экспертной системы и поэтому отменяет необходимость создателю и/или пользователю экспертной системы контролировать диапазоны числовых значений медико-биологических данных. Технологический аспект заключается в следующем. Разработанная технология обучения нейронных се-тей предусматривает универсальную структуру и алгоритмы обучения для медико-биологических данных любого характера. Однако в результате проводимых нами многочисленных экспериментов было установлено, что наибо-лее универсальная и быстрообучающаяся архитектура полносвязной сигмоидной (имеющей характеристическую функцию нейронов) нейросети оптимально работает при нахождении входных сигналов в диапазоне приблизи-тельно [-1...1]. При расширении этого диапазона происходит сначала практически незаметное, плавное, а затем быстро нарастающее снижение качества обучения, особенно ярко проявляющееся при сильно различающихся диапазонах у разных входных сигналах. На рисунке 2.7 показан график зависимости общего числа тактов обуче-ния простых двухнейронных сетей от диапазона, на который нормировались данные. Все сети создавались с ис-ходно одной и той же картой весов синапсов (что достигалось копированием карты) и одинаковыми параметра-ми. По оси Х отложены диапазоны, на которые нормировались одни и те же значения входного сигнала. Числа на оси Х показывают величину диапазона (центр диапазона в приводимых экспериментах являлся нулем). Первая точка с величиной диапазона 2 означает нормирование входного сигнала на диапазон [-1...1]. По оси Y отложено общее число тактов функционирования сетей, каждый раз заново обучавшихся на данных, нормированных на соответствующий диапазон. Как можно видеть, общее число тактов функционирования при увеличении диапазо-на входных значений растет, хотя и довольно плавно.
Еще в большей степени нормирование влияет на экстраполяционные возможности нейросети. Исследова-ния показали, что процент правильно распознанных примеров, не входящих в обучающую выборку, максимален также при нормировании входных данных на диапазон [-1...1].
50000
0 2 4 16 256 65536
Диапазон
Рисунок 2.7. График зависимости общего числа тактов обучения от диапазона нормирования входных сигналов
Учитывая результаты экспериментов, разработанная методология предусматривает нормирование всех входных параметров на диапазон [-1...1]. Каждый входной сигнал перед подачей на синапс пересчитывается по формуле
Yi= 2 * (xi -mini) / (maxi -mini) -1 (7),
где x-исходный сигнал, Yi-получаемый нормированный сигнал, min и max -соответственно минимальное и
максимальное значения интервала входных параметров в поле, подаваемом на синапс i.
Диапазон входных параметров рассчитывается для каждого поля, подаваемого на синапсы нейросети. Расчет происходит при создании нейросети. После создания нейросеть хранит минимум и максимум диапазона в своем файле. Расчет диапазонов происходит автоматически исходя из значений, заданных в примерах обучающей выборки. Поэтому желательно, чтобы обучающая выборка содержала примеры с возможными крайними значе-ниями всех обучающих параметров. Если впоследствии, например при дообучении или тестировании, какое-либо значение будет находится вне промежутка min..max, пересчитанное значение будет соответственно лежать за пределами диапазона [-1...1]. Если "выпадение" из интервала будет небольшим (десятые доли), это практически не повлияет на качество дообучения и тестирование.
Тем не менее, рекомендуется после создания нейросети (до начала всякого обучения!) внимательно про-смотреть диапазоны значений, соответствующие каждому входному синапсу, и если в будущем предполагается подача значений вне данного диапазона, вручную изменить его. Ни в коем случае нельзя менять диапазоны после обучения нейросети, т.к. это приведет к последующей некорректной обработке входных сигналов, сбою при до-обучении и некорректному тестированию. При автоматическом задании параметров сети всегда устанавливается нормирование, автоматический подсчет диапазонов значений и расширение их на заданную относительную ве-личину. Отмена нормирования предусматривается в основном для проведения экспериментов и исследований, как возможность дополнительной настройки.
Кроме нормирования входных сигналов, устанавливается нормирование значений ответов у нейросетей-предикторов. Проведенные эксперименты показали безусловное преимущество такого подхода. Нормирование значений ответов проводится по схеме, аналогичной нормированию входных сигналов.
5. Количество нейронов. Этот параметр определяет суммарное количество синаптических связей нейрон-ной сети. Для полносвязной нейросети оно равно квадрату числа нейронов. Если сеть использует адаптивную матрицу входных сигналов (в нашей методике это делается всегда), общее число подстраиваемых связей равно квадрату числа нейронов плюс произведение числа входных синапсов и плотности подачи входных сигналов (на сколько нейронов подается каждый входной сигнал).
Оптимальное количество нейронов во многом зависит от решаемой задачи. Большее число нейронов по-вышает гарантию успешного обучения, но увеличивает размер нейросети, а значит, время ее срабатывания при тесте и время ее загрузки с диска компьютера в память. В общем случае, число нейронов может быть равно числу обучающих параметров. В классификаторах без адаптивной матрицы входных сигналов количество нейронов устанавливается автоматически и равно сумме числа обучающих параметров и количества классов в задаче. Если набор входных параметров избыточен (предполагается, что для обучения можно обойтись лишь частью этого набора) можно задавать число нейронов меньшим.
Не представляется возможным корректно исследовать зависимость качества обучения от числа нейронов, т.к. невозможно создать сети с одинаковыми стартовыми картами и разным числом нейронов. При сравнении сетей с различными картами на качество будет влиять (хотя и не сильно) индивидуальность сети, определяемая случайными стартовыми значениями синаптических весов.
При автоматическом задании числа нейронов предлагается следующая технология. Инициализируется и обучается нейросеть с небольшим количеством нейронов (например, 2). При невозможности обучения, в зависи-мости от суммарной оценки и количества входных синапсов рассчитывается новое, увеличенное количество нейронов. Инициализируется и обучается новая сеть, повторяющая параметры предыдущей, но имеющая заново установленное большее число нейронов. Процесс повторяется до тех пор, пока какая-либо из сетей не обучится полностью. Недостатком метода является увеличение времени, затрачиваемого на обучение. Преимущества -создателю экспертной системы нет необходимости экспериментировать с различным количеством нейронов, на что в конечном итоге может потребоваться гораздо больше времени. Кроме того, предлагаемый способ позволяет избежать создания заранее слишком избыточной сети, которая может быстро и хорошо обучиться на обучающей выборке, однако будет обладать низкой экстраполяционной способностью.
Как видно из диаграммы, с увеличением времени отклика наблюдается снижение процента правильно распознанных примеров тестовой выборки, несмотря на то, что все 9 нейросетей полностью обучились на обуча-ющей выборке.
100
80
% 60
40
20
0 2 3 4 5 6 7 8 910
Время отклика
Рисунок 2.8. Процент правильно распознанных примеров тестовой выборки в зависимости от заданного времени отклика бинарных классификаторов с исходно одинаковыми картами
Эксперименты показали, что увеличение времени отклика приводит также к увеличению общего числа тактов функционирования, необходимого для полного обучения сетей практически на всех медицинских задачах, обсуждаемых ниже. Кроме того, увеличение реального времени, требуемого на один такт работы нейросети при большом времени отклика, увеличивает еще и машинное время, требуемое для обучения. Поэтому при автомати-ческом задании времени отклика оно принимается равным 2.
8. Величина характеристики нейронов. Как уже говорилось, при прохождении сигнала через нейроны он пересчитывается по функции нейрона, имеющей заданный параметр характеристики. В результате величина сиг-нала всегда уменьшается, причем чем больше характеристика нейрона, тем существеннее уменьшение одного и того же сигнала (Рисунок 2.9).
Кроме того, разность двух поданных сигналов (уже нормированных) после их преобразования по харак-теристической функции будет различной в зависимости от характеристики и зон, в которых находятся поданные сигналы. Функция с малой характеристикой обеспечивает относительно большую разность между преобразован-ными сигналами, которые до преобразования находились или на значительном расстоянии друг от друга, или группировались в зоне наиболее крутого участка функции (около нуля). Наоборот, функция с большой характе-ристикой лучше разделяет сигналы, попадающие в крайние зоны и находящиеся на небольшом расстоянии друг от друга. Так как довольно значительная часть медико-биологических параметров подчиняется закону нормаль-ного распределения или же носят дискретный характер, нейронные сети с малой характеристикой нейрона обу-чаются на этих данных гораздо быстрее, особенно, если в задаче, например, классификации, классы достаточно легко разделимы в пространстве входных параметров. Однако сети с большей характеристикой обладают значи-тельно лучшими экстраполяционными способностями, хотя и хуже обучаются.
0,10,20,30,40,50,60,70,80,911,11,21,31,4
Характеристика
Рисунок 2.10. Процент правильно распознанных примеров тестовой выборки в зависимости от заданной величи-ны характеристики нейронов у сетей с исходно одинаковыми картами
Приводимые на рисунке 2.10 диаграммы зависимости процента правильно распознанных примеров тесто-вой выборки от характеристики сети никак не могут претендовать на обобщение закономерности, однако выяв-ленная тенденция позволила выработать достаточно простую методологию задания характеристики (в том числе автоматической). Если характеристика устанавливается пользователем, рекомендуется вначале обучать сеть с небольшой характеристикой, а при успешном обучении генерировать и обучать новые сети, увеличивая этот па-раметр. Нельзя менять характеристику у обучающейся или обученной сети, т.к. это приведет к некорректной об-работке входных сигналов. Мы рекомендуем диапазон значений характеристики от 0,1 до 0,8.
При автоматическом задании этого параметра характеристика вначале устанавливается небольшой, а за-тем, в случае успешного обучения нейросети, постепенно повышается.
II.14. Стратегия и тактика обучения нейронных сетей
Под стратегией обучения нейросетей понимается общий план обучения, включающий разбивку задачи на подзадачи, определение типа и количества нейросетей, обучаемых по каждой из них, предварительные парамет-ры сетей, планирование действий в случае возможных затруднений.
Тактика представляет собой возможное вмешательство оператора в процесс обучения с целью его ускоре-ния, подстройки некоторых параметров, а также оптимальные действия при невозможности дальнейшего обуче-ния сети.
Сформулируем цель обучения, на достижение которой направлены стратегия и тактика. Целью будем считать полное на данном задачнике обучение нейросети (набора нейросетей-экспертов) с минимально возмож-ным числом подстраиваемых связей, максимально возможной характеристикой и максимально возможным уров-нем надежности (минимальным уровнем отклонения). Дополнительным условием может быть минимальное (или определенное пользователем) число входных сигналов.
Критерием достижения цели будем считать результат тестирования набора примеров с известными отве-тами, не входящих в обучающую выборку. Требуемый результат определяется пользователем.
Рассмотрим, как влияют на качество и длительность обучения некоторые параметры. В таблицу 2.3 све-дены зависимости между обучением (требуемым временем и качеством) сети, ее параметрами, особенностями задачи и используемого компьютера.
Таблица 2.3.
Зависимость времени и качества обучения нейросетей от их параметров, особенностей задачи и применя-емого компьютера. Стрелки в двух правых колонках показывают, как изменяются длительность и качество обу-чения при изменении параметра, указанного слева
Параметр | Длительность | Качество обуче- |
обучения | ния | |
Увеличение тактовой частоты компьютера | ↓ | - |
Вывод информации в процессе обучения | ↑ | - |
на экран в графическом режиме (по сравнению с текстовым режимом) | ||
---|---|---|
Увеличение количества примеров | ↑ | ↑ |
Увеличение количества обучающих параметров | ↑ | ↑ |
Увеличение количества классов (в классификаторах) | ↑ | ↓ |
Увеличение размерности вектора ответа (в предикторах) | ↑ | ↓ |
Близкое количество примеров каждого класса (в классификаторах) | ↓ | ↑ |
Повышение уровня надежности (в классификаторах) | ↑ | ↑ |
Повышение уровня отклонения (в предикторах) | ↓ | ↓ |
Увеличение числа нейронов | ↑ | ↓ |
Увеличение параметра плотности | ↑ | ↑ |
Увеличение времени отклика сети | ↑ | ↓ |
Увеличение характеристики | ↑ | ↑ |
Разработанная методология включает две стратегии: с участием пользователя и без него. Автоматизиро-ванное выполнение стратегии может проводиться в двух вариантах -повторять принципы “ручной” стратегии, или использовать другие правила. Кроме того, стратегии автоматического обучения подразделяются еще на два класса -стратегии решения подзадачи и стратегии решения единой задачи, состоящей из взаимосвязанных (па-раллельно или иерархически) подзадач. Мы заранее отказались от “ручной” стратегии решения единой ком-плексной задачи, так как, во-первых, они встречаются не так уж часто, во-вторых, при их решении (особенно при достаточно большом количестве связанных подзадач) число подстраиваемых параметров, за которым необходи-мо следить пользователю, может очень сильно вырасти.
Примером может служить минимизация набора обучающих параметров в системе из нескольких иерархи-чески связанных нейросетей, одни из которых используют для выдачи результата ответы других как входные параметры. Следует заметить, что пользователь вовсе не должен обладать знаниями этих стратегий. Именно для такого случая и разработаны автоматизированные стратегии обучения. Рассмотрим вначале принципы “ручной” стратегии для решения одной подзадачи (сведенной к элементарной -классификации или предикции).
Как правило, первый стратегический шаг для решения подзадачи -создание нейросети с параметрами, максимально выгодными для подтверждения факта принципиальной возможности обучения. В этом случае зада-ется число нейронов и плотность, равные исходному количеству обучающих параметров (в случае классифика-ционных задач эти параметры можно еще увеличить на число классов в задаче). Задаются минимальные значения времени отклика нейросети, характеристика и уровня надежности (для предикторов -требуемый уровень допу-стимого отклонения). Если такая нейросеть обучается успешно, можно считать, что задача имеет закономерно-сти, связывающие входные параметры и результат.
Далее желательно найти максимальный уровень надежности (в классификаторах) или минимальный уро-вень отклонения (для предикторов), с которым может обучиться сеть. Для этого нет необходимости генерировать новую нейросеть. Разработанный нами программный инструментарий (программа AcceStat-2000 “NeuroMaster”) позволяет задать режим доучивания с автоматическим ступенчатым повышением уровня надежности. Это озна-чает, что после каждого успешного полного обучения уровень надежности будет автоматически повышаться на заданную пользователем величину (шаг), и обучение будет продолжаться, пока не перестанет быть возможным. После окончания процесса предыдущий уровень надежности, при котором сеть обучилась полностью, и является максимально возможным для данной сети.
В случае предикторов используется понятие уровня отклонения, который определяет максимальное рас-хождение между требуемым (заранее известным) и вычисляемым сетью ответами, при котором пример считается правильно распознанным. При этом качество обучения тем выше, чем меньший уровень отклонения позволяет сети тестировать все примеры правильно, т.е. увеличивается точность ответа сети. Автоматический режим при этом снижает уровень отклонения после каждого полного обучения. Минимально возможный уровень отклоне-ния равен нулю (абсолютное совпадение ответов) и практически не может быть достигнут.
Один из принципов стратегии -создание и обучение для каждой подзадачи не одной, а нескольких нейросетей. Желательно создать несколько сетей с разными характеристиками и после их обучения сравнить их прогностические способности. Весьма вероятно, что при тестировании контрольной выборки разными нейросе-тями у каждой из них будут свои собственные ошибки. Решение в таком случае принимается на основании голо-сования и сравнения коэффициентов уверенности каждой из сетей.
Как правило, классификаторы, распознающие несколько классов одновременно, обучаются несколько хуже, чем бинарные классификаторы. В наших исследованиях встречались ситуации, когда задача с 5 классами не могла быть решена одним 5-классовым классификатором, а система из нескольких бинарных классификаторов прекрасно решала задачу. В подобных ситуациях есть несколько способов решения проблемы.
Изменение весов классов.
При обучении классификатора каждому классу задачи можно присвоить вес -"степень внимания", кото-рая будет уделяться нейросетью примерам данного класса. Исходно веса всех классов равны единице. При уве-личении веса какого-либо класса оценка каждого примера, принадлежащего этому классу, будет умножаться на его вес. Таким образом, нейросеть будет прилагать особые усилия для распознавания примеров этого класса. При задании нулевого веса оценки всех примеров класса будут равны нулю и эти примеры будут считаться распо-знанными. Практически это эквивалентно исключению всех примеров класса из обучения.
Изменение весов классов -элемент как стратегии, так и тактики. В стратегическом плане можно спроек-тировать систему "малых экспертов" [25]. Если задача включает, например, 3 класса, можно использовать 3 нейросети, каждая из которых обучается с повышенным весом "своего" класса. В итоге такая нейросеть будет различать все 3 класса, но "свой" класс -особенно хорошо. При тестировании примера решение принимается опять таки голосованием с учетом особого мнения "экспертов".
Разделение задачи.
Если одна нейросеть не может обучиться различать несколько классов или делает это недостаточно хо-рошо, можно разделить задачу между несколькими разными сетями (принцип, основанный на дихотомии). Это делается следующим образом. Предположим, задача имеет 4 класса. Создается 3 бинарных классификатора. Пер-вый обучается отличать примеры 1 класса от примеров 2,3 и 4 классов, объединенных в один класс. Второй би-нарный классификатор обучается отличать примеры 2 класса от примеров 3 и 4 класса, также объединенных в один класс. Третья сеть обучается различать примеры 3 и 4 класса. Тестирование примера при этом осуществля-ется так: пример подается первой сети. Если она относит его к 1 классу, ответ и есть 1 класс, тестирование пре-кращается. Если сеть относит пример ко 2 классу, это означает, что на самом деле он может принадлежать 2,3 или 4 классам. Поэтому пример подается второй сети. В зависимости от ее ответа тест может остановиться или продолжиться третьей сетью. В такой системе пример в конце концов оказывается распознанным.
Для предикционных задач подобный способ неприемлем по причине отсутствия классов, поэтому про-стейший способ -вычисление среднего ответа у нескольких нейросетей. Более сложный метод -привлечение классификаторов для решения предикционных задач. В случае одномерной предикции можно разбить интервал значений ответа на несколько участков (необязательно равных) и обучить классификатор распознавать, к какому участку принадлежит пример. Если точности ответа недостаточно, для каждого участка создается и обучается свой предиктор, умеющий определять ответ только у примеров, отнесенных классификатором к этому участку. Здесь мы наблюдаем иерархическую систему нейросетей, в которой предикторы подчинены "центральному" классификатору. Подобная система может работать и в задачах классификации, когда число классов слишком велико.
После успешного обучения по вышеприведенным схемам желательно переобучить сети с повышением характеристики, особенно в случае недостаточно удовлетворительных результатов контрольного тестирования.
В общем случае, уменьшение количества связей нейросети (путем контрастирования существующей сети или обучения новых сетей с меньшим числом нейронов и плотностью) лучше всего производить в последнюю очередь, после того, как были настроены предыдущие параметры и результаты тестирования по-прежнему высо-ки. То же касается и минимизации входных параметров, которая, так же как и принципы автоматической страте-гии, будут рассмотрены ниже.
Тактика обучения.
В подавляющем большинстве случаев при обучении сети не требуется никакого вмешательства в этот процесс. Однако все же бывают ситуации, когда сеть не может обучаться. Здесь требуются некоторые действия пользователя, которые мы называем "тактикой обучения". Как правило, нейросеть перестает обучаться не сразу, а через некоторое время после начала процесса. При этом нейросетевая программа сигнализирует оператору о не-возможности дальнейшего обучения и в простейшем случае останавливает процесс.
Первое, что необходимо сделать -проверить корректность заданных параметров нейросети. Самая про-стая причина -недостаточное количество нейронов, малая плотность или слишком высокая характеристика. Если же все параметры заданы оптимально, можно применить специальное средство, называемое “удар” [26].
Удар может помочь в ситуации, когда сеть попадает в локальный минимум при минимизации целевой функции обучения. Когда производится удар, в карту синаптических весов вносится случайный вклад, макси-мальная величина которого задается заранее. Новое значение синаптического веса вычисляется по формуле
x = x0 + B * (Random -0,5) (8)
где x -новое значение синаптического веса, x0 -исходное значение синаптического веса, B -заданный уровень
удара (в диапазоне 0..1), Random -случайно сгенерированное для данного синаптического веса число (в диапа-зоне 0..1).
После удара обучение продолжается. Проведенные эксперименты показывали, что особенно эффективен удар у сетей с адаптивной матрицей входных сигналов. Задание оптимального уровня удара вручную может по-требовать некоторого опыта пользователя. Для этого желательно наблюдать за динамикой с нижения средней оценки на протяжении нескольких десятков циклов до момента остановки обучения. Если за этот период оценка снижалась быстро, лучше задавать уровень удара в пределах 0,1-0,2. Если оценка на протяжении многих циклов "зависла" около какого-либо значения, следует задать небольшой уровень удара (0,0001 -0,001). Задание макси-мального уровня удара (1,0) практически полностью обновляет карту весов, что равнозначно инициализации но-вой сети.
Частое применение удара небольшого уровня может быть полезным для создания помехоустойчивых нейросетей [26].
В разработанных нами нейросетевых программах используется как ручной, так и автоматический режимы удара. В последнем случае после остановки обучения программа производит удар и продолжает обучение. Толь-ко если после трех (или количества, определенного пользователем) попыток удара обучение по-прежнему невоз-можно, программа останавливает процесс.
Если и применение удара не приносит эффекта, причину невозможности обучения следует искать в обу-чающей выборке. Как уже говорилось, самая частая причина -наличие в выборке идентичных по обучающим параметрам примеров, имеющих различный ответ. В принципе, это почти тупиковая ситуация, и единственным выходом из нее является увеличение количества обучающих параметров, при котором добавленные параметры будут различными у таких примеров. В самом деле, очевидно, что различные ответы в такой ситуации определя-ются факторами, не нашедшими отражение в обучающих параметрах. В простейшем случае можно исключить один из идентичных примеров, однако в таком случае в экспертную систему заранее закладывается возможность ошибки.
Невозможность дальнейшего обучения в классификаторах иногда может быть спровоцирована неверной постановкой задачи, точнее, заданной классификационной моделью. Н апример, при бинарной классификации примеры одного из классов представляют на самом деле два различных подкласса, группирующихся по парамет-рам "по разные стороны" от другого класса задачи. В этом случае можно использовать нейросеть для коррекции классификационной модели путем кластеризации примеров.
Существует несколько методов нейросетевой кластеризации, наиболее простой из которых заключается в последовательном исключении из процесса обучения наиболее трудных примеров с помощью “слабых” нейросе-тей, настройка параметров которых заранее не дает возможности для полного обучения (например, слишком ма-лое число нейронов). В процессе прохождения каждого цикла обучения программа отслеживает самый трудный пример на этом цикле -пример с наибольшей оценкой. После захода сети в тупик можно исключить этот пример из дальнейшего обучения, пометив его, и продолжить процесс. В конце концов может накопиться некоторое ко-личество исключенных примеров, после чего сеть обучится полностью. Часто получается, что все исключенные примеры принадлежат только одному из классов задачи, что является свидетельством неоднородности класса. Это можно проверить путем обычных статистических методов, сравнив группу исключенных примеров как с оставшимися примерами этого же класса, так и с примерами других классов. Различия могут послужить поводом для изменения классификационной модели.
Это не самый лучший способ кластеризации, однако он может с успехом применяться как при создании экспертных систем, так и в научных исследованиях для изучения различных явлений. По сравнению с многочис-ленными существующими способами кластеризации он имеет определенное преимущество, заключающееся в возможности “наведенной” кластеризации, т.е. такой, к которой пользователь “подталкивает” программу, не зная заранее точных критериев -параметров, по которым ее следует проводить, и имея лишь интуитивное представле-ние о возможном результате. В практике врача-исследователя такое может встречаться довольно часто, напри-мер, когда он интуитивно относит какие-либо 2 примера к разным классам, однако не может формализовать принцип разделения. Применение нейросети может помочь в этом случае найти закономерность и экстраполиро-вать ее на большой набор данных.
Как уже говорилось, изменение весов классов может считаться тактическим действием, так как может осуществляться прямо в процессе обучения. Поводом для изменения веса класса обычно служит его средняя оценка, значительно (в несколько раз) превосходящая оценки остальных классов.
II.15. Дополнительные возможности нейросетей и автоматизированные стра-тегия и тактика обучения
В этом разделе будут рассмотрены несколько дополнительных возможностей нейросетей, разработанных в рамках построения теории и методологии создания нейросетевых экспертных систем, и полезных для практиче-ского применения.
Обученная нейросеть не только умеет распознавать примеры, но и хранит достаточно важную информа-цию, которую можно получить, грамотно сформулировав вопрос для сети. Возможность нейросетей содержа-тельно отвечать на поставленные вопросы позволяет использовать их не только как "решающие" устройства, но и как инструменты для проведения научных исследований.
Вычисление информативности обучающих параметров и их минимизация.
Врач, ставящий диагноз больному, всегда старается анализировать весь комплекс сведений о пациенте -жалобы, анамнез болезни и жизни, данные клинического осмотра и лабораторных анализов. При этом одна часть параметров имеет принципиальное значение для принятия решения, другая же не столь важна и даже может про-сто игнорироваться.
Нейросеть, принимающая решение на основе опыта, поступает сходным образом. Поэтому исследователю очень важно знать, какие из параметров важны для сети, а какие -не очень. Следует сказать, что абсолютно не-значимых параметров практически не бывает, и каждый входной сигнал в большей или меньшей степени влияет на принятие решения.
Разработанный нами метод позволяет выявить относительную значимость входных параметров, которая может представлять самостоятельный интерес или служить для последующей минимизации их набора.
Для этого включаются несколько циклов обучения нейронной сети с заранее завышенным уровнем надежности и внесением в матрицу синапсов случайного вклада после прохождения каждого цикла. При прохож-дении циклов используется метод подсчета градиентов по входным сигналам, подаваемым на нейронную сеть, и последующего их сравнения, осуществляемого двумя различными методами по выбору пользователя программы.
Первый метод насчитывает значимость каждого параметра как максимальное значение модуля градиента по всем примерам. Этот режим полезно применять в тех случаях, когда в обучающей выборке имеются примеры, "выбивающиеся" из общей массы, и которые могут существенно влиять на принятие решения об ответе. Данный метод будет прежде всего учитывать наличие таких примеров.
Второй метод насчитывает значимость каждого параметра как среднюю величину модуля градиента по всем примерам обучающей выборки. Результат применения этого метода показывает среднюю значимость пара-метров по всей обучающей выборке. Если в обучающей выборке имеются примеры, "выбивающиеся" из общей массы, и которые могут существенно влиять на принятие решения об ответе, то влияние таких примеров на зна-чимость параметров будет нивелироваться. Данный метод полезно применять в тех случаях, когда обучающая выборка достаточно однородна и необходимо, чтобы возможные "выбивающиеся" примеры существенно не вли-яли на оценку значимости параметров. Результатом применения метода является набор значений, каждое из ко-торых соответствует определенному входному параметру и может сравниваться с остальными.
Применение метода имеет ценность как для научных исследований, так и при практическом применении нейросетей для экспертных систем, так как позволяет уменьшать набор входных параметров, подаваемых нейросети для получения ответа. Действительно, часто для диагностики и прогноза больному проводят сложные и дорогостоящие методы исследования, порой небезвредные для здоровья. Однако во многих случаях представ-ляется возможным получить ответ и без них.
В нейросетевых программах предусмотрен как ручной, так и автоматический режимы минимизации входных параметров, причем последний может применяться как самостоятельно, так и в случае задания автома-тического определения стратегии обучения. Использование “ручной” минимизации параметров имеет смысл только после того, как нейросеть достаточно хорошо обучена, в противном случае исключение параметров может привести к ухудшению экстраполяционных возможностей сети и затруднению последующего обучения.
Если режим минимизации включен, он начинает работать после полного обучения нейронной сети. При этом осуществляется вычисление относительных показателей значимости и входной синапс, имеющий мини-мальную значимость. После этого этот синапс отключается от приема сигналов, и обучение продолжается. Пред-полагается, что нейросеть сможет обучиться без данного параметра. Если сеть вновь обучилась, после повторно-го вычисления значимости выключается следующий синапс и т.д. В итоге сеть перестанет обучаться, когда набор входных параметров будет слишком мал для полноценного обучения. После этого можно проанализировать раз-личные варианты исключения параметров и выбрать их оптимальный набор. Эксперименты с самыми разными медицинскими задачами показывали, что во многих случаях приблизительно четверть обучающих параметров может быть исключена совершенно безболезненно. Это подтверждает гипотезы об априорной избыточности дан-ных в задачах медицинской диагностики и прогнозирования, решаемых человеком.
Подстройка параметров примера для получения требуемого ответа нейросети.
При применении обученной нейронной сети может возникнуть обратная задача, относящаяся к области нейросетевого моделирования [151] -выяснить, в каком направлении и на какие величины необходимо изменить параметры примера, чтобы сеть выдала требуемый ответ. Приведем простой гипотетический пример. При тести-ровании примера сетью, разделяющей больных и здоровых, получен ответ "больной". Как нужно изменить пара-метры этого примера, чтобы он "перешел" в класс "здоровый"? Как уже говорилось, можно вручную изменять параметры, каждый раз тестируя пример после такого изменения. Однако это не самый быстрый и удобный спо-соб, особенно, если число параметров велико, а решение принимается несколькими нейросетями. Поэтому нами был разработан специальный автоматизированный метод подстройки параметров для получения требуемого от-вета нейросети.
При решении данной проблемы прежде всего необходимо разделить все параметры примера на подстраи-ваемые и неподстраиваемые. Например, невозможно изменить возраст пациента, поэтому такой параметр являет-ся неподстраиваемым. После определения набора подстраиваемых параметров для каждого из них задается диа-пазон возможных изменений. Необходимо помнить, что в случае каждого примера эти диапазоны могут дикто-ваться конкретной ситуацией (одному больному допустимо снизить частоту сердечных сокращений до 50, дру-гому же -только до 70).
После этого для каждой нейросети (если их несколько) необходимо задать требуемый ответ -тот, которо-го должна добиться эта сеть. Важно отметить, что выполняемая затем автоматическая процедура подстройки выполняется одновременно несколькими нейросетями, так как подстройка, выполненная одной сетью, может резко ухудшить ответ других. Таким образом, каждая сеть, как правило, идет на некоторый компромисс.
В итоге вырабатывается оптимальное решение, одинаково хорошо (или плохо) удовлетворяющее все сети, принявшие участие в процедуре. Исследователь может проанализировать решение, сравнив ответы каждой нейросети до и после подстройки примера.
Ниже приводится краткое описание принципа данной процедуры.
Рассмотрим дискретную синхронно функционирующую нейронную сеть, обучающуюся по алгоритму двойственного функционирования, состоящую из функциональных элементов, преобразовывающих проходящие через них сигналы непрерывно дифференцируемым образом. Эти элементы могут иметь адаптивные параметры, подстраиваемые в процессе обучения. Зависимость от параметров также предполагается достаточно гладкой.
При обучении вычисляется функция оценки для исследуемого примера при прямом функционировании; при функционировании назад определяются частные производные адаптивных параметров сети, затем происхо-дит оптимизация в направлении (вычисляемом, например, по BFGS-формуле), уменьшающем значение функцио-нала оценки. Процесс повторяется до тех пор, пока значение функционала оценки не станет достаточно малым.
Пусть требуется определить, какие значения должны принять координаты входного вектора сигналов, чтобы обученная нейросеть приняла требуемое решение. Пусть βi, где i=1,N -нормированный в диапазон [-1...1]
вектор входных сигналов. Укажем те координаты βi, которые не подлежат изменению: αi, где i=1,N, αi ={0,1}.
Функционал оценки вычисляется в предположении, что требуемый ответ -Aт , полученный -Aп , H=H(Aт ,Aп).
Параметры примера подстраиваются по следующей схеме:
χi= αi, i=1,N (9)
Автоматическое задание стратегии обучения.
Рассмотрим полностью автоматизированное задание стратегии построения решающего блока. Прежде всего определяется список подзадач, причем в каждой подзадаче определяется список обучающих параметров (он может быть общим для всех подзадач) и ответы. Затем задается, сколько нейросетей-экспертов будут решать каждую подзадачу (в простейшем случае -по одному). Далее определяется, будет ли проводится минимизация обучающих параметров. Если да, то можно задать произвольную минимизацию (нахождение минимально воз-можного для решения задачи списка параметров) или определяется набор параметров, который желательно оста-вить в списке или, наоборот, исключить из списка. Эту операцию можно провести отдельно для каждой подзада-чи, для групп подзадач или для всей задачи в целом. Как дополнительный параметр, можно указать для каждой подзадачи контрольные выборки, на которых будут проверяться результаты обучения и требуемое качество обу-чения (в процентах правильно распознанных примеров (для классификаторов) или максимально допустимого отклонения (для предикторов). Это все, что должен сделать пользователь при автоматизированном построении решающего блока.
Непосредственно обучение проводится исходя из следующей стратегии. Обучение каждого эксперта в каждой подзадаче начинается с автоматической инициализации нейросети минимальной конфигурации (число нейронов -2, плотность -1, характеристика -0,1, уровень надежности -0,1 (для классификаторов), уровень от-клонения для предикторов -требуемый или вычисленный исходя из характера значений ответа (в самом общем случае берется 1/3 минимальной разности между значениями ответа), время отклика -2. Проводится обучение нейросети. Дальнейшие действия определяются результатом обучения. В случае успешного обучения проводится тест указанной контрольной выборки и в случае неудовлетворительного результата инициализируется новая сеть с увеличенной характеристикой (шаг увеличения -0,1). При невозможности обучения инициализируется новая сеть с большим числом нейронов и плотностью.
Таким способом проводится обучение сетей по всем подзадачам. Обученные сети запоминаются. Если задана минимизация параметров, создаются рабочие копии обученных нейросетей и проводится вычисление зна-чимости параметров для каждой сети, после чего следует минимизация параметров у каждой нейросети. Если требуется связанная минимизация (для нескольких нейросетей одновременно), окончательное отключение мини-мально значимого на данном этапе обучения параметра производится только после того, как все нейросети в свя-занной группе успешно обучились с исключением данного параметра. В процессе обучения могут автоматически применяться тактические методы (удар, изменение весов классов).
Исходя из приведенного описания, управление стратегией осуществляется по заранее заданному алгорит-му. При необходимости пользователь может корректировать стратегию в процессе построения решающего блока на любом его этапе.
II.16. Основные положения теории и методологии создания нейросетевых ме-дицинских экспертных систем
Глава III. Программный инструментарий для создания нейросетевых экс-пертных систем
Разработана программа AcceStat-2000 “NeuroMastrer” -инструментарий, позволяющий создавать нейросе-тевые экспертные системы. Программа рассчитана на функционирование в операционной системе Windows-95/98 и работает с файлами баз данных MicroSoft Access – 98 (возможен экспорт и импорт файлов Paradox).
Программа работает со следующими типами файлов:
Пользователь создает нейронные сети, связанные с выбранными параметрами (полями) любой таблицы базы данных. При создании сети программа автоматически связывает каждый входной и выходной синапс нейросети с полем базы данных, имеющим уникальное имя. Это обеспечивает корректное нахождение и исполь-зование данных нейросетью при обучении и тестировании независимо от структуры таблицы и порядка располо-жения в ней обучающих параметров. При этом пользователю нет необходимости следить за подачей сигналов на синапсы нейросети. Созданные пользователем нейронные сети записываются на диск и могут храниться любое количество времени.
Объем, занимаемый файлом нейронной сети на магнитном носителе, очень мал и приблизительно вычис-ляется, как 6 x квадрат числа нейронов (реальный объем на несколько сотен байт больше, так как в файл нейросе-ти записываются еще несколько ее параметров и имена полей базы данных, с которыми связаны входные и вы-ходные синапсы). Так, объем нейросети с 20 нейронами составляет чуть более 3 Кб. Поэтому на диске одного персонального компьютера можно разместить огромное количество нейронных сетей, используемых сотнями экспертных систем.
Для удобства и обеспечения четкой логики в работе пользователь может использовать возможность опре-деления подзадач и задач, сохраняя директивы стратегии обучения в специальных файлах. Программа позволяет проверять обученность нейросетей путем тестирования примеров любой базы дан-ных. Предусмотрено 2 режима тестирования.
Программа дает возможность подсчета значимости обучающих параметров. Эта операция может произ-водится как по прямому указанию пользователя, так и автоматически согласно заданной стратегии обучения, в этом случае результаты подсчета значимости параметров используются программой для определения дальней-ших действий на каком-либо этапе решения подзадачи.
При конструировании экспертной системы пользователь прежде всего определяет базу данных, структура таблиц (шаблон данных) которой будет использоваться создаваемой экспертной системой.
Важной частью работы пользователя с экспертной системой является ввод исходных данных. Для удобно-го ввода данных необходим индивидуальный в каждой экспертной системе редактор данных с пояснениями и расшифровкой информации. Программа обеспечивает пользователю возможность ввода данных в удобной фор-ме. Объекты ввода информации связываются в форме с полями установленной таблицы и обеспечивают помеще-ние информации при редактировании в соответствующие ячейки базы данных.
На следующем этапе пользователь определяет список нейронных сетей, которые будут использоваться экспертной системой, и последовательность их использования.
Созданные пользователем установки могут быть сохранены в файле-проекте экспертной системы и запи-саны на диск для обеспечения возможности последующего редактирования и конструирования похожих эксперт-ных систем.
На основе созданных установок создается исполняемый файл экспертной системы. Она готова к работе.
Глава IV. Прогнозирование осложнений инфаркта миокарда
Инфаркт миокарда (ИМ)-тяжелое и достаточно часто встречающееся заболевание. Бурное распростране-ние этого заболевания за последние полвека сделало его одной из наиболее острых проблем современной меди-цины. Заболеваемость ИМ остается высокой во всех странах. Особенно это касается городского населения высо-коразвитых стран, испытывающего стремительный ритм современной жизни и подвергающегося хроническому воздействию стрессовых факторов, а также нерегулярного и не всегда сбалансированного питания [13]. Наиболее часто ИМ встречается у мужчин старше 50 лет, особенно работающих в областях с высоким уровнем эмоцио-нальной нагрузки (управленческие должности, связанные с принятием решений, журналистика, вождение авто-мобиля и др.).
Несмотря на то, что внедрение современных лечебно-профилактических мероприятий несколько снизило смертность от инфарктов, она продолжает оставаться довольно высокой. Особенно настораживает высокая смертность в госпитальную стадию (во время нахождения больного в клинике), которая по данным различных авторов составляет от 4 до 20 %. Процент смертности больных инфарктом, по данным, приводимым в [40], по-следние годы держится на уровне 12 -15%, однако сам автор считает эти цифры заниженными вследствие нена-дежной диагностики некоторых видов инфаркта.
Причинами высокой смертности в госпитальный период являются, в значительной мере, развитие различ-ных осложнений.
Одними из самых частых осложнений ИМ являются различные нарушения ритма сердца, возникающие в острый и подострый периоды заболевания. По данным мониторных исследований, различные аритмии наблюда-ются у 90% больных, перенесших инфаркт миокарда [72].
Примерно у 10 % больных в остром периоде наблюдаются признаки воспаления наружной оболочки сердца -перикардита, который может продолжаться в течении нескольких дней. Перикардит редко бывает непо-средственной причиной летального исхода у больных, однако на его фоне легче развиваются нарушения ритма и проводимости.
Тромбоэмболические осложнения встречаются примерно у 56% больных ИМ. Чаще всего возникают тромбоэмболии легочной артерии и ее ветвей, сосудов головного мозга, ведущие либо к смерти, либо к серьез-ным осложнениям (нарушения мозгового кровообращения, инфаркт-пневмонии). Реже наблюдаются тромбоэм-болии нижнего отдела брюшной аорты, артерий нижних конечностей, почечных и мезентериальных артерий, артерий селезенки. Довольно часто (по данным Bedell et al. (1986, Бостон), в 39% случаев) тромбоэмболии не-крупных сосудов вообще прижизненно не диагностируются.
Нередко инфаркт развивается на фоне уже имеющейся застойной сердечной недостаточности (ЗСН). В острый и подострый периоды может наблюдаться возникновение или усугубление уже имеющейся ЗСН. Как правило, она возникает у больных с обширным трансмуральным ИМ, повторным ИМ, у лиц пожилого возраста. Развитию сердечной недостаточности способствует артериальная гипертензия. У больных ИМ возникнове-ние/усугубление ЗСН чаще происходит на 3-4 неделе заболевания.
Разрывы сердца являются относительно нечастым, но крайне тяжелым осложнением инфаркта, в боль-шинстве случаев ведущим к смерти больного.
Из других, относительно редко встречающихся осложнений можно назвать эрозии и язвы желудочно-кишечного тракта, парез кишечника и др.
Насколько велика роль профилактики осложнений, можно судить по данным [40] о причинах смертности больных ИМ в госпитальном периоде. Смертность больных в первые 24 часа в 37% случаях наступала от острой сердечной недостаточности, в 26% -от разрыва миокарда, в 21% -от нарушений сердечного ритма. Те же самые осложнения определяют смертность в период от 24 часа до 3 недель: сердечная недостаточность -44%, разрыв сердца -27%, аритмии -16%.
В настоящее время разработаны схемы лечения больных инфарктом миокарда, включающие профилакти-ку вышеуказанных осложнений. Особое внимание при этом уделяется профилактике нарушений ритма и тром-боэмболий. Однако порой эти профилактические мероприятия оказываются недостаточно эффективными, свиде-тельством чему является пока довольно большое количество осложнений.
В связи с этим поиски возможностей прогнозирования осложнений, которые могут возникнуть в госпи-тальный период, представляются очень актуальными, и представляют одну из наиболее сложных задач кардиоло-гии [90]. Прогнозирование необходимо осуществлять при поступлении больного в стационар, сразу же после проведения стандартных методов обследования. Оно должно быть быстрым, проводиться неоднократно в про-цессе наблюдения за больным по мере поступления новых данных о его состоянии.
Прогнозированию течения инфаркта миокарда посвящено большое количество работ. Их можно условно подразделить на две большие группы -выявление прогностически неблагоприятных признаков и применение разнообразных математических методов [97]. К первой группе можно отнести работы по изучению значения воз-раста [203], пола [128], локализации инфаркта [128] , наличия эндокринных заболеваний [292], артериальной ги-пертонии [31,97], сердечной недостаточности [203,292] и многих других параметров для прогноза заболевания.
Первыми математическими подходами к прогнозированию течения и исходов инфаркта стали известные коронарные индексы Норриса [267], Пила [273] и Шнура [290], основанные на изучении прогностического значе-ния ряда признаков, подсчитываемого в баллах. Впоследствии разрабатывались и другие математические спосо-бы прогноза [23,92]. Использовались линейный и многовариантный дискриминантные анализы [245,262,269], мультивариантный логистический регрессионный анализ [317], методы максимального правдоподобия и линей-ной логистической модели [229], метод прогностической стратификации [262,317].
Несмотря на разнообразие методов, пожалуй, только индексы Пила и Шнура нашли практическое приме-нение. Однако существенным недостатком этих, да и многих других методов является их применимость в основ-ном на группах объектов. Многие методы выдают в основном абстрактный прогноз типа “благоприятный” или “неблагоприятный” исход [90], не позволяющий оценивать риск конкретных осложнений.
Кроме того, как уже говорилось, любое прогнозирование в медицине должно учитывать географические и социальные особенности региона, где проживают пациенты, поступающие на обследование и лечение, и даже особенности конкретной клиники. Как показано в работе [90], большая часть математических аппаратов, разра-ботанных для прогноза инфаркта, может корректно работать лишь на исследованном контингенте. Невозмож-ность полного учета всех возможных сочетаний факторов ставит преграду для разработки универсальных мате-матических алгоритмов прогнозирования осложнений инфаркта миокарда. Учет же в каждом случае локальных факторов потребует разработку математических моделей для каждого региона или контингента. Использование нейроинформационных технологий частично решает эту проблему, давая возможность динамического подучива-ния нейронных сетей по локальным данным, не прибегая к статистическим методам и математическому модели-рованию. Такое подучивание экспертной системы может производится прямо в клинике по мере накопления дан-ных о больных.
Получение прогноза осложнений позволит врачу более целенаправленно проводить профилактику, уси-лить наблюдение за больным, скорректировать режим физической активности пациента (особенно в предполага-емые сроки возникновения осложнения). Прогноз может определять более длительное и интенсивное лечение антикоагулянтами при угрозе тромбоэмболических осложнений, антиаритмическими препаратами -для профи-лактики аритмий [90]. Применение нейросетей позволит более детально изучить роль различных факторов и их сочетаний в развитии осложнений, что может дать ценные данные для разработки новых схем профилактики и лечения.
IV.1. Постановка задачи
При создании базового ядра экспертной системы прогнозирования осложнений инфаркта миокарда мы выбрали 4 вида осложнений, достаточно частых и/или довольно опасных. Это фибрилляция предсердий, тром-боэмболические осложнения, перикардит и возникновение/усугубление хронической СН. К сожалению, такое серьезное осложнение, как разрыв сердечной мышцы, пока еще не вошло в число прогнозируемых осложнений.
Рисунок 4.1. Выбранные осложнения инфаркта миокарда и постановка задач для экспертной системы
При постановке задачи мы исходили из необходимости прогнозировать возможность возникновения каж-дого из четырех выбранных осложнений в отдельности и возможного срока его появления, считая от момента поступления больного в стационар. Очевидно, что для прогнозирования каждого осложнения необходима своя нейронная сеть (или группа нейроэкспертов). Одна сеть может давать только один ответ (итог консилиума нейро-экспертов тоже один ответ), тогда как у одного больного может наблюдаться несколько осложнений одновремен-но и в разные сроки (варианты ответа не являются взаимоисключающими).
Таким образом, задача разбивается на 8 подзадач, четыре из которых решаются нейросетями-классификаторами (возникновение осложнений), и четыре -нейросетями-предикторами (сроки возникновения осложнений). На рисунке 4.1 показана схема разделения задачи на подзадачи.
IV.2. Обучающая выборка и входные параметры
Ниже приводится список обучающих параметров. Если значения параметра представляет собой выбор из нескольких вариантов, после названия параметра перечислены числовые значения и соответствующая им рас-шифровка каждого варианта. Параметры, кодируемые как отсутствие/наличие признака (0/1), помечены*.
1. Возраст, лет
2. Пол: 0 -женский, 1 -мужской
8. Вид комплекса QRS на ЭКГ: 1 -не изменен (мелкоочаговый, интрамуральный, нетрансмуральный инфаркт), 2 -типа QR (крупноочаговый инфаркт), 3 -типа QS (трансмуральный инфаркт)
9. Инфаркты миокарда в анамнезе -количество (0 -если не было)
13. Наличие застойной сердечной недостаточности: 0 -нет, 1 -I стадия, 2 -II-а стадия, 3 -II-б стадия, 4 -III стадия
14. Нарушение ритма в анамнезе: 0 -нет, 1 -Предсердная экстрасистолия, 2 -Желудочковая экстрасистолия, 3 -Пароксизмы фибрилляции предсердий, 4 -Пароксизмы трепетания предсердий, 5 -Суправентрикулярная пароксизмальная тахикардия, 6 -Желудочковая пароксизмальная тахикардия, 7 -Фибрилляция желудочков, 8 -Синдром слабости синусового узла (СССУ), проявляющийся синусовой брадикардией, 9 -СССУ, проявляющийся синоатриальной блокадой II степени II типа, 10 -СССУ, проявляющийся тахибрадикардией, 11 -Указание на неизвестный тип нарушения ритма
15. Нарушение внутрисердечной проводимости в анамнезе: 0 -нет, 1 -Атриовентрикулярная блокада I степени,
2 -Атриовентрикулярная блокада II степени I типа, 3 -Атриовентрикулярная блокада II степени II типа, 4 -Атриовентрикулярная блокада III степени, 5 -Блокада передней ветви левой ножки пучка Гиса (БПВЛНПГ), 6 -Блокада задней ветви левой ножки пучка Гиса (БЗВЛНПГ), 7 -Неполная блокада левой ножки пучка Гиса (НБЛНПГ), 8 -Полная блокада левой ножки пучка Гиса (ПБЛНПГ), 9 -Неполная блокада правой ножки пучка Гиса (НБПНПГ), 10 -Полная блокада правой ножки пучка Гиса (ПБПНПГ), 11 -Нарушение синоатриальной проводимости, 12 -Нарушение внутрипредсердной проводимости
20. Концентрация калия в крови, ммоль/л
21. Наличие гипокалиемии*
22. Концентрация натрия в крови, ммоль/л
30. Размер левого желудочка по ЭхоКГ, мм
Параметры с 3-го по 7-й охватывают зоны возможной локализации инфаркта. Разделение параметра лока-лизации поражения сердечной мышцы на 5 параметров объясняется возможностью наличия у больного пораже-ния сразу нескольких зон. Параметр 8 отражает вид комплекса QRS на ЭКГ, который может оставаться не изме-ненным (при мелкоочаговом, интрамуральном, нетрансмуральном инфаркте); принимать форму QS, характерную для трансмурального инфаркта; или QR (крупноочаговый инфаркт). Параметры Нарушение ритма в анамнезе и Нарушение внутрисердечной проводимости в анамнезе выражают основные нарушения ритма и проводимо-сти в анамнезе. Несмотря на то, что у больного может быть одновременно несколько нарушений ритма (или про-водимости), было решено выделять наиболее серьезное нарушение.
Как видно, большинство параметров относятся к субъективным категориям, выработанным в процессе накопления опыта в определенных клинических школах. Многие параметры могут принимать всего два значения -0 (нет признака) и 1 (есть признак). Обратим внимание на пары параметров калий и гипокалиемия, натрий и гипернатриемия, зубец P и увеличенный зубец P, левое предсердие и увеличенное левое предсердие, левый желудочек и увеличенный левый желудочек. Учитывая, что первые параметры в парах изменяются плавно (относятся к объективной категории -измеряемые концентрации или размеры), а наличие сдвигов (субъективные категории) существенно для прогноза, было решено ввести дополнительные качественные параметры, фиксиру-ющие наличие выраженных отклонений в данных по принципу "Нет отклонения (0) или есть отклонение (1)". Проведенное впоследствии обучение нейросетей с такими дополнительными параметрами и без них подтвердило обоснованность такого подхода.
Для параметра концентрации калия значения 4 ммоль/л и более соответствуют значению "0" параметра гипокалиемия, если же калий снижается менее этого числа, параметр гипокалиемия принимает значение "1" (есть отклонение). Для натрия это число составляет 150 (при увеличении концентрации натрия гипернатриемия принимает значение "1"); для параметра зубец P -0,1 (при удлинении зубца параметр увеличенный зубец P при-нимает значение "1"). Параметры увеличенное левое предсердие и увеличенный левый желудочек принимают значение "1" при увеличении соответственно размера левого предсердия более 36 мм и левого желудочка более 55 мм. Для правого желудочка мы не использовали аналогичный дополнительный параметр, т.к. при инфаркте миокарда (при отсутствии патологии, вызывающей перегрузку правых отделов сердца) размер правого желудоч-ка, довольно редко выходит за пределы нормы, однако сам его размер может иметь значение для прогноза.
Стартовая обучающая выборка для создания экспертной системы составила 300 человек, поступивших в отделение реанимации и интенсивной терапии Красноярской городской больницы N 20 с диагнозом "инфаркт миокарда". Все вышеперечисленные обучающие параметры фиксировались при поступлении каждого больного в отдельной анкете.
Таблица 4.1. Количество больных инфарктом миокарда поклассам в каждой из четырех выделенных по осложнениям подгрупп
Осложнение | Количество больных |
Фибрилляция предсердий | |
нет | 217 |
пароксизмальная форма | 60 |
постоянная форма | 23 |
Перикардит | |
нет | 172 |
есть | 128 |
Тромбоэмболические осложнения | |
нет | 242 |
есть | 58 |
Возникновение или усугубление сердечной недостаточности | |
нет | 144 |
есть | 156 |
Если в течение срока госпитализации у больного развивалось какое-либо из выбранных осложнений, эта информация также вносилась в анкету с указанием дня его возникновения с момента госпитализации. Вся ин-формация из анкет переносилась в базу данных. Количества больных, у которых возникло то или иное осложне-ние, приводятся в таблице 4.1.
IV.3. Прогнозирование факта и времени возникновения фибрилляции предсердий
По данным разных авторов, фибрилляция предсердий (ФП) наблюдается у 17-28% больных ИМ [72,99]. ФП встречается несколько чаще у женщин, чем у мужчин (24,5 и 10,6% соответственно) [56]; при повторном инфаркте миокарда, чем без него (25,9 и 14,1%). ФП чаще развивается при наличии у больных сердечной недо-статочности, чем без нее (24,8 и 7,3% соответственно). С увеличением возраста больного вероятность осложне-ния растет. Четкой зависимости от локализации поражения сердечной мышцы не выявлено, однако замечено, что частота возникновения ФП возрастает при обширных (передне-задних) и глубоких инфарктах. Частота возникно-вения ФП зависит от расширения левого предсердия, степени гипертрофии миокарда левого желудочка, выра-женности обструкции пути оттока [44].
Одними из частых предвестников ФП являются предсердная экстрасистолия и синусовая тахикардия. По данным [56], синусовая тахикардия предшествовала развитию ФП в 96,3% случаев.
Наиболее опасное время развития этого осложнения -первые часы после начала заболевания. Однако на первые 24 часа заболевания приходится, по данным [44], только 3% ФП. Ранние пароксизмы ФП связаны с заку-поркой левой огибающей коронарной артерии проксимальнее места отхождения от нее левопредсердной ветви и с нарушением кровотока в артерии атриовентрикулярного узла [207]. Причины пароксизмальной ФП в более позднее время могут быть различными: повышение конечного диастолического давления в левом желудочке и митральная регургитация, психогенные, нервно-рефлекторные воздействия, расстройства электролитного (гипо-калиемия) и кислотно-основного равновесия, воздействие лекарств [44].
У пациентов с ФП летальный исход наблюдается достоверно чаще, чем у больных без ФП (36,7 и 17,1% соответственно) [56]. Отмечается, что при появлении ФП в первые сутки заболевания исход у больных был луч-ше, чем при более позднем ее возникновении. Летальный исход в этих группах наступил соответственно в 11,8 и 65% случаев [56].
Возникающая аритмия подразделяется на две формы -пароксизмальную и постоянную. Фибрилляция предсердий считается пароксизмальной, если продолжается не более 14 суток. Наличие ФП дольше этого перио-да считается постоянной формой [86].
При решении подзадачи о прогнозировании возникновения и формы ФП были выделены три класса:
1 класс -отсутствие осложнения;
2 класс -возникновение пароксизмальной формы ФП;
3 класс -возникновение постоянной формы ФП.
Следующим этапом работы был подбор оптимальных параметров нейросетей. Для проведения экспери-ментов вначале были инициализированы 8 комплектов нейросетей, каждый из которых состоял из 4 нейросетей-классификаторов -одного трехклассового и трех бинарных (Таб. 4.2). Несмотря на то, что первая нейросеть в комплекте должна различать все три класса, для повышения точности решения задачи было решено включить в решающий блок дополнительные бинарные классификаторы. Нейросети каждого комплекта имели определен-ную характеристику (начиная от 0,1 у нейросетей 1-го комплекта и заканчивая 0,8 у нейросетей 8-го комплекта, шаг изменения -0,1). Все нейросети имели по 32 нейрона (соответственно числу входных параметров) и плот-ность, также равную 32. Время отклика у всех сетей было установлено равным 2.
Таблица 4.2. Комплект нейросетей для прогнозирования возникновения фибрилляции предсердий и определения ее формы
Одноименные нейросети каждого комплекта имели идентичные исходные синаптические карты, что до-стигалось копированием файлов сетей.
Для экспериментов из общей выборки (300 человек) отдельно для каждого типа нейросетей были выделе-ны обучающая группа (250 человек) и контрольная (тестирующая) группа (50 человек). Разделение выборки про-изводилось случайным образом. Все нейросети вначале обучались на 250 пациентах обучающей выборки, а затем тестировались на контрольной группе.
Все 32 нейронные сети (8 комплектов с различными характеристиками) были полностью обучены на вы-борке из 250 человек. Результаты теста показаны на рисунке 4.2, где для каждого типа нейросети приведена зави-симость числа правильно распознанных примеров контрольной выборки от характеристики, с которой обучались нейросети этого типа.
Параметр характеристики, соответствующий наилучшему качеству обучения, для каждой нейросети име-ет свой оптимум (0,5 для трехклассового классификатора, 0,6, 0,5 и 0,3 для трех бинарных классификаторов в соответствующем порядке). Однако в целом, как видно, у нейросетей с большими характеристиками наблюдается лучшая способность к экстраполяции.
Число праваильно распознанных примеров
48 46 44 42 40 38 36 34 32 30 28 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
Характеристика
Рисунок 4.2. Количество правильно распознанных нейросетями примеров контрольной выборки (50 примеров) в зависимости от параметра характеристики (задача прогнозирования возникновения фибрилляции предсердий и ее формы). Каждая линия (с 1-й по 4-ю) соответствует одному типу нейросетей в каждом комплекте
На следующем этапе были инициализированы 9 комплектов нейросетей с оптимальными для каждого типа нейросети характеристикой. В каждом комплекте нейросети имели определенное время отклика (от 2 в 1-м комплекте до 10 в 9-м комплекте). Все 36 нейросетей были полностью обучены на обучающей выборке и затем протестированы на контрольной группе. Результаты теста представлены на рисунке 4.3, где для каждого типа нейросетей приведена зависимость количества правильно распознанных примеров контрольной выборки от вре-мени отклика, с которым обучались нейросети этого типа.
1 2 3 4 5 6 7 8 910
Время отклика
Рисунок 4.3. Количество правильно распознанных нейросетями примеров контрольной выборки (50 примеров) в зависимости от времени отклика (задача прогнозирования возникновения фибрилляции предсердий и ее формы). Каждая линия (с 1-й по 4-ю) соответствует одному типу нейросетей в каждом комплекте
Прослеживается достаточно четкая закономерность снижения качества обучения при увеличении времени отклика, поэтому для дальнейших экспериментов было выбрано время отклика, равное двум.
Далее была выяснена зависимость качества обучения от плотности подачи входных сигналов на нейроны (Рис. 4.4).
Число правильно распознанных примеров
30 25 20 15 10 5 0
0 10 20 30
Плотность
50 45 40 35
Рисунок 4.4. Количество правильно распознанных нейросетями примеров контрольной выборки (50 примеров) в зависимости от плотности подачи входных сигналов (задача прогнозирования возникновения фибрилляции пред-сердий и ее формы). Каждая линия (с 1-й по 4-ю) соответствует одному типу нейросетей в каждом комплекте
Были взяты 4 значения плотности -1, 10, 20, 32. Первое и последнее значения являются минимальными и максимальными, остальные -промежуточными. Нейросети, имевшие максимально возможную при заданном числе нейронов плотность (32), показали наилучшее качество обучения. С плотностью 1 смогла полностью обу-читься лишь нейросеть, разделяющая 1 и 3 классы. Из нейросетей, разделяющих 2 и 3 классы (пароксизмальная и постоянная форма фибрилляции предсердий), смогли обучиться только сети с плотностью 20 и 32.. Это косвенно указывает на относительно большую сложность разделения этих классов.
Таким образом, для экспериментов по выбору оптимальных параметров нейросетей были инициализиро-ваны и обучены 84 нейронные сети с различными параметрами. Обучение всех этих сетей потребовало 46 часов машинного времени -работы программы MultiNeuron -2.0 (очень старая DOS-версия нейросетевого пакета – предшественника AcceStat-2000 “NeuroMaster”), при этом на протяжении этого времени не требовалось участия оператора. Однако заметим, что проведенные эксперименты далеко не охватили всех возможных вариантов ком-бинации стартовых параметров. В частности, из 32 возможных (при 32 нейронах) параметров плотности были взяты только 4. Не проводилось также экспериментов с разным числом нейронов. Очевидно, что ручной перебор всевозможных комбинаций параметров занял бы огромное количество времени и практически не представляется возможным. Поэтому с учетом выявленных закономерностей и разработанной методологии было выполнено обучение нейросетей с помощью автоматического задания стратегии.
При определении стратегии в данной задаче мы не ставили цель минимизации обучающих параметров, во-первых, потому что их количество не велико, во-вторых, потому что почти все эти параметры доступны в кли-нике. Кроме того, с учетом преимущества гипердиагностики по сравнению с гиподиагностикой, классам 2 и 3 были установлены веса, равные 2, тогда как классу 1 был установлен вес 1.
В таблице 4.3 приводятся параметры нейросетей и качество их обучения, полученные в результате при-менения автоматизированной стратегии.
Общее время на обучение нейросетей при автоматическом задании стратегии составило 32 часа, что зна-чительно меньше, чем в случае ручного перебора вариантов. Общее число тактов функционирования составляло от 9482 до 36112.
Таблица 4.3. Параметры 4 типов нейросетей (соответственно поставленным подзадачам), полученные в результате автоматического задания стратегии
Параметры | Нейросеть 1 (1,2,3 классы) | Нейросеть 2 (1,2 классы) | Нейросеть 3 (1,3 классы) | Нейросеть 4 (2,3 классы) |
---|---|---|---|---|
Нейроны | 30 | 24 | 20 | 30 |
Плотность | 24 | 24 | 20 | 28 |
Характеристика | 0,6 | 0,4 | 0,6 | 0,4 |
Время отклика | 2 | 2 | 2 | 2 |
Уровень надежности | 1,2 | 1,2 | 1,4 | 1,0 |
Число правильно рас-познанных примеров контрольной выборки | 46 | 44 | 46 | 40 |
Относительная значимость
0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05
0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
Параметры
Рисунок 4.5. Суммарная для четырех обученных нейросетей значимость обучающих параметров при прогнозиро-вании возникновения или усугубления фибрилляции предсердий
Таким образом, для прогнозирования возникновения фибрилляции предсердий был сформирован нейросетевой консилиум, работающий следующим образом. Пример тестируется всеми 4 сетями, каждая из ко-торых выдает свой ответ. Далее, если хотя бы две нейросети из четырех выдают совпадающий ответ, он прини-мается в качестве окончательного. Если мнения разделились поровну, сравниваются коэффициенты уверенности нейросетей и побеждает ответ пары, коэффициенты уверенности у которой выше. Если и эти коэффициенты ока-зываются равными, что, в общем, маловероятно, пользователь экспертной системы специально уведомляется о невозможности принятия ею окончательного решения. В любом случае, пользователю выводятся коэффициенты уверенности каждой нейросети.
При проверке работы консилиума из 4 нейросетей на контрольной выборке были получены результаты, приведенные в таблице 4.4.
Таблица 4.4 Результаты тестирования консилиума, проведенные на контрольной выборке из 50 примеров, не участвующих в обучении
Вычислено как... | ||||
---|---|---|---|---|
Класс 1 | Класс 2 | Класс 3 | ||
Класс 1 -30 | 28 | 2 | - | |
Класс 2 -12 | - | 11 | 1 | |
Класс 3 8 | - | 1 | 7 |
Анализ ошибок, сделанных при тестировании контрольной выборки, показывает, что из 4 ошибок в опре-делении класса, 3 являются гипердиагностикой, и только в 1 случае вместо постоянной формы ФП была прогно-зирована пароксизмальная. По всей видимости, это явилось результатом того, что классам 2 и 3 при обучении нейросетей были приданы веса, большие, чем классу 1.
Был проведен анализ значимости обучающих параметров для принятия сетями решения об ответе. На рисунке 4.5 изображена диаграмма с 32 столбцами, каждый из которых соответствует одному параметру. Высота столбца определяет относительную (по сравнению с другими параметрами) значимость данного параметра. От-метим, что анализ значимости не указывает, как зависит ответ от изменения того или иного параметра, а лишь говорит о степени зависимости.
Наличие нарушений ритма в анамнезе является самым важным параметром для прогнозирования ФП, что вполне согласуется с клиническими данными: возникновение ФП чаще наблюдается у больных, уже имевших нарушения ритма. Следующими по значимости идут наличие гипокалиемии и частота пульса. Сильное влияние этих параметров на возникновение ФП также является общеизвестным фактом. Заметим, что непосредственная концентрация калия является слабым по значимости параметром, также как и концентрация натрия. Это своеоб-разным образом подтверждает установленные границы нормы для калия и натрия: возможно, выявив существен-ные закономерности между ответом и наличием гипокалиемии и гипернатриемии, сеть слабо нуждается в ин-формации о точных концентрациях калия и натрия, что проявляется в небольшой значимости этих параметров. Далее следует величина зубца P, регистрируемая по ЭКГ, указывающая на время прохождения электрического импульса по предсердиям, и параметр, показывающий увеличение зубца P. Наличие эндокринных заболеваний в анамнезе шестой по значимости параметр. Рассмотрение механизма влияния этого параметра требует специаль-ного исследования с изучением различных эндокринных патологий у больных инфарктом.
Наименее значимыми параметрами оказались нижняя и задняя локализация инфаркта миокарда. При ана-лизе малозначимых параметров необходима его корректная интерпретация. В данном случае малая значимость этих показателей говорит не о том, что при таких локализациях редко возникает ФП (такая закономерность, в особенности сильная, наоборот, привела бы к увеличению значимости), а о том, что при наличии такой локализа-ции возникновение ФП наблюдается не чаще и не реже, чем без нее (отсутствие взаимосвязи). Малозначимыми параметрами также являются наличие стенокардии в анамнезе и увеличение левого желудочка. Однако увеличе-ние левого предсердия достаточно значимо для прогноза.
При сравнении диаграммы значимости с таблицей результатов статистической обработки видно, что да-леко не всегда самые значимые параметры имеют самые выраженные различия в подгруппах. Например, если по самому значимому показателю -аритмиям в анамнезе -много достоверных различий, то гипокалиемия и частота пульса не различаются достоверно. Это связано с тем, что нейросеть "рассматривает" параметры не в отдельно-сти, а во взаимосвязи со всеми остальными.
Если нейросетевой консилиум делает вывод о возможности возникновения фибрилляции предсердий па-роксизмальной или постоянной формы, возникает необходимость в прогнозировании возможного времени появ-ления осложнения. Поэтому при сборе обучающих данных у больных с осложнениями фиксировалось, на какой день после поступления возникло каждое осложнение.
В полной обучающей выборке из 300 больных у 60 возникла пароксизмальная форма ФП, и у 23 -посто-янная. Осложнение возникало в сроки от 1 до 27 дней. В первой подгруппе средний срок до появления осложне-ния составил 3,59±1,14 дней, во второй -1,3±0,37 дней. Эти показатели достоверно не различаются. При проведе-нии корреляционного анализа по выявлению взаимосвязей срока появления осложнения с обучающими парамет-рами достоверных коэффициентов корреляции не обнаружено.
Группа из 83 человек составила обучающую выборку для нейросетей-предикторов. Кроме исходных 32 входных параметров, на дополнительный входной синапс предикторам подавалась возникшая форма ФП. Обу-ченные с автоматическим заданием стратегии предикторы имели по 33 входных синапса, 33 нейрона. При обуче-нии предикторов был применен метод увеличения уровня допустимого отклонения при невозможности дальней-шего обучения. Обучение было начато с уровня отклонения 0,1. Это означает, что при вычислении срока возник-новения аритмии предиктор может ошибаться не более чем на 0,1 дня. В действительности, конечно, такая точ-ность не требуется, хотя бы потому, что срок возникновения осложнений определялся с точностью до 1 дня.
Относительная значимость
0,3
0,25
0,2
0,15
0,1
0,05
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
Параметры
Рисунок 4.6. Значимость обучающих параметров для прогнозирования возникновения перикардита
Предиктор одиннадцать раз прекращал обучение, однако после каждой остановки требования к точности ответа смягчались (уровень допустимого отклонения повышался на 0,1). Полное обучение стало возможным при уровне отклонения 1,1. Это означает, что на обучающей выборке нейросеть определяет момент возникновения фибрилляции предсердий с точностью почти ±1 день. При проверке предикторов на тестирующей выборке мак-симальная ошибка, допущенная нейросетью, составила 3 дня.
Исследование значимости обучающих параметров для прогнозирования срока возникновения ФП показа-ло, что наиболее информативными данными для нейросети являются локализация инфаркта (в особенности, по-ражение передних и нижних отделов), вид комплекса QRS, наличие бронхитов в анамнезе, длина зубца P на ЭКГ. Сама форма ФП слабо определяла срок возникновения осложнения, т.к. была лишь восемнадцатой по значимо-сти. Наименьшую значимость имели показатели УЗИ сердца.
Подача данных о больном предиктору для предсказания времени возникновения аритмии должна осу-ществляться только в том случае, если консилиум классификаторов принял решение о возможности факта воз-никновения ФП. Предикторы обучались только на больных с возникшим осложнением и ничего "не знают" о больных без осложнения, поэтому подача данных о больном без прогнозируемого осложнения приведет к заранее некорректному ответу предиктора.
IV.4. Прогнозирование возникновения перикардита
Прогнозирование возникновения перикардита, также как и последующих осложнений, представляет со-бой бинарную классификацию (возникнет -не возникнет).
Инициализированные нейронные сети -классификаторы -имели по 32 входных синапса и 32 нейрона, как и в предыдущей подзадаче. Сети обучались лишь за 184400 -243522 такта, что довольно много по сравнению с предыдущей задачей. Это говорит о том, что прогнозирование перикардита, видимо, представляет несколько бо-лее трудную задачу. Нейросети, инициализированные с характеристикой более 0,4 и числом тактов функциони-рования 3 и более вообще не смогли обучиться на данном задачнике. Поэтому окончательные сети, полученные при автоматическом задании стратегии, имели характеристику 0,4 и число тактов функционирования 2. Процент правильно распознанных примеров в тестирующей выборке составил всего 76%, что также подтверждает труд-ность задачи. Задание различных весов классов привело к тому, что, как и в предыдущей задаче, большинство неправильных ответов (70%) составляло гипердиагностику.
Тремя наиболее значимыми показателями для прогноза перикардита оказались возраст, наличие аритмий в анамнезе и увеличение левого предсердия (Рис. 4.6). Одними из самых значимых параметров были также ги-пернатриемия, длина интервала QT на ЭКГ, концентрация калия и гипокалиемия. Существенная значимость обо-их последних параметров указывает на то, что, в отличие от ФП, здесь имеют значение не только резкое сниже-ние калия, за которое отвечает параметр “Гипокалиемия”, но и тонкие изменения концентрации элемента, учиты-ваемые в показателе “Калий”.
При сборе данных для обучающей выборки нами были взяты только случаи эпистенокардического пери-кардита. Перикардиты как проявление синдрома Дресслера в обучающую выборку пока не включались, поэтому сроки возникновения перикардита у наших пациентов были в пределах первых четырех дней заболевания.
Нейросети-предикторы, созданные для предсказания времени возникновения перикардита, смогли полно-стью обучиться лишь с уровнем допустимого отклонения, равным 2. Это говорит о практическом отсутствии закономерностей между используемыми обучающими параметрами и ответом. Применение такой нейросети бес-смысленно, так как разброс в ошибке вычисления полностью накрывает диапазон значений ответа. Поэтому в экспертную систему эти сети не были включены.
IV.5. Прогнозирование факта и времени возникновения тромбоэмболических осложнений
Тромбоэмболические осложнения обычно возникают в первые две недели после инфаркта миокарда. Ча-ще всего источником тромбоэмболий являются пристеночные тромбы, которые образуются в полости сердца, обычно в месте локализации некротизированного участка сердечной мышцы при трансмуральных и субэндокар-дальных инфарктах. Факторами, способствующими образованию тромбов, являются обширные инфаркты, ане-вризмы, мерцательная аритмия, застойная сердечная недостаточность [98]. Кроме того, возникновению тром-боэмболий способствуют ожирение, варикозное расширение вен [83]. Локализация инфаркта играет некоторое значение в развитии тромбоэмболий. Так, отмечается более редкое возникновение этого осложнения при нижней локализации инфаркта [13]. У 58 из 300 больных обучающей выборки возникли те или иные тромбоэмболические осложнения различной степени тяжести и локализации (легочная артерия и ее ветви, сосуды головного мозга).
Несмотря на это, инициализированный комплекс нейронных сетей показал достаточно хорошую обучае-мость. 30-нейронные сети обучались за 94282 -112116 тактов с уровнем надежности 1,4, характеристикой 0,6 и числом тактов функционирования 2.
Основными значимыми показателями в данной подзадаче являются наличие обмороков, аритмий, застой-ной сердечной недостаточности и инфарктов миокарда в анамнезе (Рис. 4.7). Последние два параметра связаны с изменениями в свертывающей системе крови, которые, в свою очередь, могут увеличивать риск возникновения тромбоэмболических осложнений.
Проверка нейросетей на тестирующей выборке показала правильное распознавание в 82% случаев. При анализе примеров, на которых были сделаны ошибки, выяснилось, что у всех неверно распознанных больных время появления осложнения было 20 и более дней с момента поступления в стационар.
Проведенные эксперименты по обучению предикторов, прогнозирующих время развития тромбоэмболий подтвердили найденную закономерность. Предикторы, которые мы пытались обучить на всех 58 больных с раз-вившимися тромбоэмболиями, не смогли обучиться. Была применена методика последовательного исключения из обучающей выборки примеров с максимальными оценками. Только после того, как предиктор исключил 24 больных, он смог обучиться с уровнем отклонения 1,3. Все исключенные больные имели время возникновения осложнения от 18 до 28 дней (группа с “поздней” тромбоэмболией). Все оставшиеся больные -от 1 до 17 дней (группа с “ранней” тромбоэмболией).
Был сделан вывод, что настолько четкое разделение обучающей выборки происходит вследствие сильно различающихся закономерностей, связывающих обучающие параметры и срок возникновения тромбоэмболии в двух образованных подгруппах. При сравнении этих подгрупп на достоверность различия показателей выявлено, что у больных подгруппы с поздним тромбоэмболиями чаще наблюдается 3 стадия гипертонической болезни (4,17% и 27,2%), реже наблюдается гипокалиемия (41,67% и 20,59%). По остальным параметрам обучающей вы-борки достоверных различий не было обнаружено.
Относительная значимость
0,3
0,25
0,2
0,15
0,1
0,05
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
Параметры
Рисунок 4.7. Значимость обучающих параметров для прогнозирования возникновения тромбоэмболических осложнений
На следующем этапе исследования были созданы сети-классификаторы, которые обучались различать 3 класса: больных без тромбоэмболии, больных с "ранней" тромбоэмболией и больных с "поздней" тромбоэмболи-ей. Эти сети смогли обучиться решению задачи лишь после исключения из обучающей выборки нескольких (от 4 до 6) примеров 3 класса.
Полностью обучиться смогли лишь бинарные классификаторы, различающие больных с "ранней" и "поздней" тромбоэмболией. При тестировании эти сети показывали хорошую распознаваемость примеров 1 клас-са (88%) и довольно низкую распознаваемость примеров 2 класса (66%).
После разделения больных на 2 подгруппы и обучения классификаторов, разделяющих эти подгруппы, была сделана попытка обучить предикторы для прогнозирования времени возникновения осложнения в каждой подгруппе отдельно. На "ранней" группе предиктор обучился полностью, на "поздней" группе предиктор не смог обучиться вообще, несмотря на применение нескольких стратегических и тактических шагов. Этот факт объясня-ется отсутствием закономерностей, связывающих исходные параметры больного и появление тромбоэмболиче-ских осложнений в более поздний период, что подтверждают результаты статистического анализа подгрупп.
Таким образом, обучение нейронных сетей показало возможность прогнозирования возникновения тром-боэмболических осложнений после инфаркта миокарда. Тромбоэмболии, возникающие в первые 2 недели после инфаркта, прогнозируются хорошо. Время их появления также достаточно хорошо поддается прогнозу на основе исходных данных. Тромбоэмболии, которые возникают после 2 недель, прогнозируются гораздо хуже, что под-тверждено комплексом из 12 нейросетей -классификаторов и предикторов -с различной постановкой задач. Про-гнозировать время появления некоторых "поздних" тромбоэмболий по исследуемым параметрам, по-видимому, не представляется возможным. Единственными показателями, достоверно различающимися у больных о беих подгрупп, являются частота третей стадии гипертонической болезни и гипокалиемии, что, безусловно, не может приниматься в качестве критерия для прогноза.
Схема нейросетевого прогноза тромбоэмболических осложнений с учетом проведенных экспериментов несколько изменяется относительно первичной постановки задачи (Рис. 4.8).
Таким образом, судя по результатам проведенных экспериментов можно предположить, что возникнове-ние "ранних" тромбоэмболий во многом определяется состоянием больного до и во время возникновения ин-фаркта миокарда, т.е. в какой-то степени предопределено. Возникновение же "поздних" тромбоэмболий, по-видимому, обусловлено факторами, выходящими на первый план во время подострого периода инфаркта мио-карда. Единственной информацией о состоянии больных во время этого периода в наших данных были факты и время возникновения других осложнений. Однако дополнительное статистическое исследование взаимосвязей между возникновением "поздних" тромбоэмболий и других осложнений также не выявило значимых закономер-ностей.
В заключение этой подглавы можно сделать два вывода. Во-первых, нейронные сети в данном случае служили инструментом проведения научных исследований, позволяющим ставить содержательные вопросы ис-следователю. Была изложена последовательность и логика проведения экспериментов для иллюстрации такого подхода. Во-вторых, что касается самой проблемы, то она требует дальнейшего углубленного изучения после сбора дополнительных данных о протекании госпитального периода у больных инфарктом, что поможет расши-рить знания о причинах и механизмах развития тромбоэмболических осложнений. Вполне вероятно, что такое исследование приведет к необходимости дифференцированной профилактики "ранних" и "поздних" тромбоэмбо-лических осложнений.
IV.6. Прогнозирование факта и времени возникновения или усугубления сердеч-ной недостаточности
У значительной части больных с инфарктом миокарда СН наблюдается уже при поступлении в клинику. Это связано с нарушением моторной функции сердца вследствие некроза участка миокарда. Возникновение при этом СН носит острый характер и нередко ведет к развитию кардиогенного шока и смерти больного. У многих больных инфаркт миокарда развивается на фоне уже имеющейся хронической СН, и значительно усугубляет ее [72]. Развитию СН способствует артериальная гипертензия.
Довольно большую опасность представляет возникновение или резкое усугубление уже имеющейся хро-нической (застойной) СН в подостром периоде. Состояние больного в процессе лечения в клинике постепенно улучшается, больной увеличивает физическую активность, однако в какой-то момент неожиданно возникают или усиливаются симптомы хронической СН. Возникновение или усугубление СН наблюдается у значительной части больных, и бывает иногда настолько выраженным, что ведет к резкому ухудшению течения заболевания. Как уже говорилось, подобные ситуации могут возникнуть уже на 3 -4 неделе после начала заболевания.
Диагностика развившейся СН не представляет особого труда. Схемы лечения СН также достаточно хоро-шо отработаны.
При сборе обучающих данных больные, у которых в течение госпитального периода произошло возник-новение застойной СН на фоне ее отсутствия или усугубление уже имеющейся СН, были объединены в специ-альную группу, составившую 156 человек.
Нейросетевые классификаторы из 32 нейронов обучились решению задачи за 51744 -78828 тактов с уровнем надежности 1,0 -1,2. Число тактов функционирования -2, характеристика -0,4.
Весьма интересная диаграмма получилась в этой задаче при анализе значимости параметров (Рис. 4.9). Наличие ЗСН в анамнезе является не только самым значимым параметром, но и значительно превышает значи-мость остальных параметров. Важность этого параметра подтверждается и результатом корреляционного анали-за. Вполне естественно, что при столь высокой корреляции с ответом (0,72) нейросеть выделила этот показатель в качестве основного для принятия решения.
Относительная значимость
0,5
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
Параметры
Рисунок 4.9. Значимость обучающих параметров для прогнозирования возникновения или усугубления СН
При проверке обученных сетей на тестирующей выборке они правильно распознавали 78% примеров. Проанализировав неправильно распознанные примеры, мы обнаружили, что у всех этих людей время возникно-вения или усугубления ЗСН составляет 18 и более дней.
Проведение и результаты последующих экспериментов практически повторяли описанное в предыдущей главе для тромбоэмболий. Предикторы смогли обучиться прогнозированию времени развития ЗСН, только ис-ключив 31 пример -больных со сроком развития этого осложнения 18 дней и более. Следует отметить, что в от-личие от ситуации с тромбоэмболиями, в число примеров, по которым предикторы смогли обучиться, попали 5 больных со сроком возникновения ЗСН от 21 до 24 дней. Однако в число исключенных больных не попал ни один, имеющий время возникновения или усугубления ЗСН менее 18 дней. Раздельное обучение предикторов на полученных подгруппах привело к такому же результату, как и при тромбоэмболиях: на подгруппе "ранней" СН предиктор обучился прогнозировать срок ее возникновения с уровнем допустимого отклонения 1,2; попытка обу-чить предикторы на подгруппе "поздней" ЗСН не удалась.
В данном случае был проведен статистический анализ полученных подгрупп, который не выявил никаких достоверных различий между параметрами.
Таким образом, закономерность, выявленная при исследовании тромбоэмболических осложнений, про-слеживается и в ситуации с сердечной недостаточностью. Нейросети-предикторы достаточно хорошо обучаются прогнозировать время возникновения этих осложнений только на больных, у которых они появились не позднее 17 дня. Четкое совпадение этого значения в двух ситуациях с различными осложнениями, по которым обучались совершенно независимо друг от друга различные нейросети, указывает на то, что этот момент времени является своеобразной "точкой перехода" к иным причинно-следственным связям в протекании периода реконвалесцен-ции. За этой точкой, по-видимому, либо значительно ослабевает действие стартовых факторов развития инфаркта миокарда, либо возникают новые факторы, определяющие дальнейшее состояние больного.
IV.7. Изучение влияния исследуемых параметров на прогноз осложнений ин-фаркта миокарда
Проведение подобных исследований с помощью нейронных сетей имеет две основные цели. Во-первых, это изучение взаимосвязей между параметрами и ответами, которое позволяет глубже понять зависимость осложнений инфаркта от комплексного воздействия факторов. Во-вторых, моделирование ответа нейросетей на конкретном больном иногда позволяет выяснить оптимальные способы профилактики патологических состоя-ний.
В данной работе намечены лишь способы проведения таких работ, которые проиллюстрированы приме-рами.
Первый метод заключается в последовательном изменении значения одного или двух параметров и про-верке, как изменяется ответ данной нейросети после каждого изменения. В случае одного параметра ответ нейросети можно представлять как в виде класса, так и в виде сигналов, снимаемых с каждого выходного нейро-на (в случае классификатора). В случае двух параметров ответ обычно можно представлять только в виде класса. Ограничение не носит принципиальный характер и связано в основном с возможностями графического представ-ления результатов.
Величина выходного сигнала
70
60
50
40
30
20
10
0
0 0,05 0,1 0,15 0,2 0,25
Длина зубца Р по ЭКГ
Рисунок 4.10. Зависимость ответа нейросети от изменения длины зубца P (по ЭКГ) у больного с инфарктом мио-карда, осложнившимся фиблилляцией предсердий
На рисунке 4.10 представлен график изменения сигналов, снимаемых с трех выходных нейронов нейросе-ти, прогнозирующей возникновение и форму фибрилляции предсердий. Моделирование ответа происходит на больном, параметр P(длина зубца P по ЭКГ) равен 0,16. Рисунок иллюстрирует, что происходит с ответом нейросети в зависимости от плавного изменения параметра. Как видно, в точке 0,16 (исходное значение) сигнал с третьего нейрона при таком значении превышает сигналы с 1 и 2 выходных нейронов, что и определяет ответ сети -прогнозируется возникновение постоянной формы фибрилляции предсердий. Моделируемое увеличение значения параметра приводит сначала к плавному, а затем резкому увеличению выходного сигнала 3 нейрона. Это означает, что нейросеть все больше и больше уверена в своем ответе. Уменьшение значения параметра P приводит в точке 0,1 к тому, что сигнал с третьего нейрона становится ниже, чем сигнал с первого. Таким обра-зом, при значении P<0,1 ответ сети коренным образом изменяется: теперь нейросеть считает, что аритмия вообще не возникнет. Естественно, все моделируемые изменения параметра P происходят при фиксированных значениях других параметров.
На рисунке приведен яркий пример, в котором при изменении одного параметра в какой-то момент про-исходила смена ответа классификатора. В действительности, во многих случаях даже значительное изменение одного параметра может приводить лишь к изменению соотношений выходных сигналов, но не к смене ответа сети. Проведение эксперимента с этим же параметром, но на данных другого больного может значительно изме-нить график.
На рисунке 4.11 изображена зависимость ответа той же нейросети от изменения теперь уже 2 параметров у больного с инфарктом миокарда, осложнившегося пароксизмальной формой фибрилляции предсердий. Распо-лагая возможностями лишь двухмерного изображения, трудно показать изменения ответов каждого нейрона (они представляли бы три пересекающиеся плоскости в трехмерной системе координат), поэтому каждой координате на рисунке соответствует класс, который выдает сеть при соответствующих значениях параметров: частота сер-дечных сокращений по ЭКГ и длина зубца P по ЭКГ.
Построение подобных диаграмм не представляет сложности при использовании нейропрограмм и может использоваться для определения индивидуальных особенностей больных и групповых закономерностей. При большом числе параметров интерпретация соответствующего количества диаграмм становится трудоемкой. Кро-ме того, во многих случаях желательно подстраивать многие параметры одновременно, добиваясь нужного отве-та.
Нейросеть обеспечивает такую возможность с помощью метода, описанного выше. В таблице 4.5 приве-ден пример больного, для которого нейросеть прогнозирует возникновение постоянной формы фибрилляции предсердий.
В первой колонке находится список параметров, причем те из них, которые возможно подстраивать, вы-делены жирным шрифтом. В данном случае их всего 5. Во второй колонке находятся исходные значения каждого параметра. В третьей колонке приведены новые значения параметров, вычисленные нейросетью так, чтобы ответ изменился на "возникновение пароксизмальной формы фибрилляции предсердий". Нейросеть старается подстра-ивать параметры оптимальным способом, чтобы все сдвиги были минимальными. В четвертой колонке нейросеть продолжила подстройку параметров, чтобы "перевести" больного в класс 1 -"отсутствие фибрилляции предсер-дий".
Исходные сигналы выходных нейронов в приводимом примере составляли 31,5 (1 класс), 9,3 (2 класс) и 87,1 (3 класс), что и определяло прогноз постоянной формы ФП.
Для того, чтобы изменить ответ с 3-го класса на 2-й, нейросеть "предложила" снизить концентрацию натрия со 146 до 120, уменьшить частоту пульса со 120 до 90, уменьшить длину зубца P на ЭКГ с 0,11 до 0,04 (что автоматически изменяет параметр “Увеличенный зубец Р” с 1 на 0), и увеличить длину зубца QT с 0,32 до 0,38. Как видно, основные изменения затронули концентрацию натрия и частоту пульса. Нейросеть не изменила концентрацию калия, который, по-видимому, не играет существенной роли для определения прогноза при дан-ном уникальном наборе параметров. Сигналы выходных нейронов теперь составляют 8,9, 13,9 и 10,9.
Таблица 4.5 Подстройка нейросетью разрешенных параметров у больного с прогнозируемой постоянной формой фиб-рилляции предсердий (класс 3) для получения требуемого ответа (сначала класс 2, затем класс 1)
2. Пол | 1 | ||
---|---|---|---|
3. Передний инфаркт | 1 | ||
4. Боковой инфаркт | 1 | ||
5. Нижний инфаркт | 0 | ||
6. Задний инфаркт | 0 | ||
7. Инфаркт м/ж перегородки | 0 | ||
8. QRS | 3 | ||
9. Инфаркты в анамнезе | 0 | ||
10. Стенокардия | 6 | ||
11. Класс стенокардии | 2 | ||
12. Стадия ГБ | 0 | ||
13. ЗСН | 1 | ||
14. Аритмии | 3 | ||
15.Нарушения проводимости | 0 | ||
16. Эндокринные заболевания в анамнезе | 0 | ||
17. Тромбоэмболии в анамнезе | 0 | ||
18. Бронхит в анамнезе | 0 | ||
19. Обмороки в анамнезе | 0 | ||
20. Калий | 3,5 | 3,5 | 3,8 |
21. Гипокалиемия | 1 | 1 | 1 |
22. Натрий | 146 | 120 | 120 |
23. Гипернатриемия | 0 | 0 | 0 |
24. Пульс | 120 | 90 | 74 |
25. Зубец P | 0,11 | 0,04 | 0,04 |
26. Увеличение зубца P | 1 | 0 | 0 |
27. QT | 0,32 | 0,38 | 0,32 |
28. Левое предсердие | 40 | ||
29. Увеличение левого предсердия | 1 | ||
30. Левый желудочек | 76 | ||
31. Увеличение левого желудочка | 1 | ||
32. Правый желудочек | 22 |
Теперь потребуем от нейросети продолжить подстройку параметров, чтобы "перевести" больного в класс
1. Концентрация натрия и длина зубца P оставлены прежними, незначительно возросла концентрация калия, су-щественно снижена частота пульса, а длина зубца QT возвращена на прежний уровень. Теперь при таком наборе значений параметров нейросеть выдает ответ "1-й класс"(сигналы выходных нейронов -16,7, 13,3 и 8,7). Не-смотря на достижение требуемого ответа, сигнал с 1 выходного нейрона не намного превышает остальные, что определяет достаточно высокий риск развития осложнений.
Приведенный пример является удобным в плане возможности подстройки параметров. В действительно-сти, многие примеры не удается "перевести" в требуемый класс вследствие того, что прогнозируемый неблаго-приятный ответ во многом определяется неподстраиваемыми параметрами, например, данными анамнеза или показателями эхокардиографии. В таких случаях нейросеть добивается лишь "минимального риска" возникнове-ния неблагоприятного ответа, определяемого соотношением сигналов на выходных нейронах.
Так как у больного возможно возникновение и других осложнений, подстройка параметров должна осу-ществляться одновременно всеми нейросетям, отвечающими за прогноз нескольких осложнений. В заключение этой главы можно сделать следующие выводы.
Глава V. Ранняя диагностика и дифференциальная диагностика злокаче-ственных опухолей сосудистой оболочки глаза
Злокачественные опухоли глаза -достаточно распространенные заболевания, которые составляют 3-3,5% всех злокачественных новообразований человека и 0,5% общей патологии органа зрения. Большинство этих опу-холей -меланомы сосудистого тракта глаза, отличающиеся высокой злокачественностью [16].
По литературным данным, больные с меланомами сосудистого тракта составляют 0,02-0,08% поликлини-ческих глазных больных и 0,25-0,5% стационарных больных. Общая частота опухолей увеального тракта глаза составляет 0,02-0,06% среди всех опухолей человека. В 8-15% случаев внутриглазная опухоль является причиной удаления глаза [84].
Летальность среди больных увеальной меланомой при 5-и летнем наблюдении после энуклеации (удале-нии глаза) в среднем составляет от 20 до 50% [16].
Злокачественные меланомы наблюдаются во всех отделах сосудистого тракта. Однако наиболее часто встречается локализация меланомы хориоидеи (сосудистой оболочки глаза), затем цилиарного тела и реже всего радужной оболочки.
Успех и результаты лечения увеальной меланомы во многом зависят от своевременной и по возможности ранней диагностики этого заболевания [63].
Трудность диагностики заключается в том, что на начальных стадиях меланома чаще всего развивается бессимптомно. Большинство больных не предъявляют никаких жалоб, и заболевание выявляется, как правило, случайно. В поздних же стадиях ее могут маскировать или симулировать глазные заболевания, клиническая кар-тина которых сходна с клинической картиной, вызываемой опухолью. Это прежде всего относится к некоторым видам отслойки сетчатки и заболеваниям, ведущим к нарушению прозрачности внутриглазных сред (осложнен-ные катаракты, гемофтальм и т.д.).
Сложности в дифферинциально-диагностическом плане могут также вызывать другие заболевания задне-го отрезка глаза. Это прежде всего заболевания сосудистой оболочки, дистрофические заболевания сетчатки, доброкачественные новообразования сетчатки и зрительного нерва, а также невусы хориоидеи, особенно в начальных стадиях их озлокачествления.
К настоящему времени количество методов диагностики внутриглазных меланом значительно увеличи-лось, однако все ныне существующие методы имеют недостатки, ограничивающие их применение в каждом кон-кретном случае.
Так, расхождения между клиническими и патологоанатомическими диагнозами злокачественных меланом сосудистого тракта составляют в среднем от 10-15% до 30% [37]. Поэтому диагностика внутриглазных опухолей и в настоящее время нередко бывает трудной и ошибочной, и дальнейший поиск новых и усовершенствование известных диагностических методов является важной задачей офтальмологии.
V.1. Методы диагностики увеальных меланом
В настоящее время существует довольно много разновидностей методов диагностики внутриглазных опу-холей, в частности увеальных меланом.
Решающее значение в диагностике меланом хориоидеи имеют методы исследования в проходящем свете и, главным образом, офтальмоскопия. Именно с помощью офтальмоскопии часто впервые возникает подозрение на внутриглазную опухоль. При офтальмоскопии можно выявить и самые ранние признаки меланомы. Недостат-ки этого метода -невозможность его проведения при непрозрачности оптических сред глаза. Правильная интер-претация полученной картины не всегда точна из-за сложностей в дифферинциально-диагностическом плане с другими заболеваниями заднего отрезка глаза, сходными в своем проявлении с клинической картиной меланомы.
С помощью флюоресцентной ангиографии (ФАГ) можно выявить начальные стадии меланомы хориои-деи, провести дифференциальную диагностику с некоторыми неонкологическими заболеваниями заднего отрезка глаза, оценить эффективность проводимой лучевой терапии и органосохранного лечения. Недостаток метода -невозможность его проведения при отсутствии прозрачности глазных сред, а также при непереносимости боль-ным флюоресцеина. Эффективность ФАГ, по мнению различных авторов, составляет около 65% [16,39].
Метод диафаноскопии (транссклерального просвечивания) позволяет выявить локализацию, размеры опухоли, определить ее проекцию на склеру, что имеет значение для выбора оптимальной тактики хирургическо-го вмешательства. Есть сообщения об успешном применении его при мутных средах глаза [3]. Однако диагно-стическая эффективность диафаноскопии до сих пор дискутируется и не имеет однозначной оценки, составляя по мнению разных авторов от 78,8% до 90% [3,39,60]. К недостаткам, отмечаемым ими, относятся возможность по-явления ложноположительных или ложноотрицательных результатов при некоторых заболеваниях. Метод крова-вой диафаноскопии, кроме всего, не является безразличным для глаза. Расхождение во взглядах на эффектив-ность диафаноскопии можно объяснить прежде всего субъективностью этого метода, что является его основным недостатком.
Из инвазивных методов в последнее время продолжает дискутироваться возможность применения аспи-рационной биопсии непосредственно самой ткани опухоли или сред, окружающих ее (субретинальная жидкость, стекловидное тело и т.д.). Осложнения, связанные с прямым хирургическим вмешательством на пораженном глазу, сдерживают широкое использование этой методики. К недостаткам метода следует также отнести и несо-вершенство в технике окраски мазков, связанных с трудоемкостью существующих методик и несовершенством способов окраски пунктата [39,60].
Наиболее эффективным при диагностике внутриглазных меланом в последнее время является метод уль-тразвукового исследования (УЗИ). По мнению различных авторов, его эффективность в среднем составляет 8090%. С помощью УЗИ можно диагностировать внутриглазные опухоли, в том числе и меланомы хориоидеи раз-личных размеров вне зависимости от прозрачности оптических сред глаза, установить их точную локализацию, степень проминенции, динамику развития, отношение к окружающим тканям. Однако ряд авторов отмечает не-которые недостатки метода УЗИ [39]. Так, отмечается его неэффективность при ширине опухоли менее 1-2 мм и величине проминенции менее 2 мм, с его помощью нельзя диагностировать опухоли, расположенные в так назы-ваемой "мертвой зоне"-зоне, прилежащей к зонду; невозможно установить злокачественность или доброкаче-ственность процесса; метод не всегда точен при обширных гемофтальмах или другой патологии стекловидного тела.
Радиоизотопная диагностика позволяет диагностировать новообразования сосудистой оболочки глаза вне зависимости от прозрачности оптических сред, дает представление не только о наличии или отсутствии опухоли, но и об интенсивности обменных процессов в ней, позволяет проводить оценку эффективности органосохранного лечения [29]. Однако результаты исследования зависят от локализации исследуемого очага. Из-за малой длины пробега В-частиц, излучаемых фосфором, наиболее достоверные результаты получаются при непосредственном приближении счетчика к исследуемому очагу. Поэтому при расположении опухоли в заднем отделе глаза за эква-тором применяют метод трансконъюнктивального подхода в условиях операционной. Таким образом, невозмож-ность диагностики маленьких по размеру новообразований, расположенных в центральных отделах глазного дна, необходимость оперативного вмешательства при трансконъюнктивальном подходе, необходимость наличия спе-циальных условий для радиологической лаборатории и операционной, а также введение в организм сенсибилизи-рованного больного сильных в антигенном отношении веществ ограничивает широкое применение этого метода. Большинством авторов он расценивается как дополнительный, но диагностическая эффективность его признается достаточно высокой -до 80%.
Из других методов диагностики новообразований увеального тракта глаза, применяющихся реже, но по-рой эффективных, следует отметить иммунологические исследования крови больных раком, исследования, направленные на определение опухолевых клеток в периферической крови, продуктов метаболизма опухоли и др.
Оценивая эффективность описанных методов диагностики внутриглазных опухолей, следует отметить, что в настоящее время нет способов, которые могли бы претендовать на абсолютную достоверность. Каждый метод имеет свои положительные и отрицательные стороны, свою разрешающую способность и пределы досто-верности. Лишь комплексное применение всех или нескольких диагностических методов может помочь в ранней и своевременной диагностике внутриглазных опухолей и способствовать своевременному применению наиболее рациональных лечебных мероприятий.
Пожалуй, ни один из вышеперечисленных методов не может использоваться как скрининговый, позволя-ющий проводить массовые профилактические обследования населения. Особенно это касается отдаленных райо-нов на территории России, где сложно проводить исследования, требующие специальной аппаратуры и квалифи-цированных специалистов.
V.2. Метод исследования пигмента ресниц для диагностики увеальных меланом
С учетом вышесказанного в Красноярском Межобластном Центре Микрохирургии Глаза им. П.Г.Макарова был разработан принципиально новый метод диагностики увеальных меланом. Дополнительная интерпретация этого метода проводится с помощью нейронных сетей, что значительно увеличивает его диагно-стическую ценность.
Идея использования исследования содержания пигмента в ресницах с целью диагностики увеальных ме-ланом была впервые высказана А.С.Миньковым и В.В.Малышевым в 1989 г., предложившими новый способ вы-деления меланина из волос и ресниц [5]. На основе этого способа, совместно с усовершенствовавшей его Е.В.Бутаковой, и было проведено данное исследование.
Объектом исследования метода являются ресницы правого и левого глаз. У обследуемого достаточно взять по 1-2 ресницы с каждого глаза. Процедура удаления четырех ресниц занимает всего несколько секунд, абсолютно безболезненна и может проводиться в любых условиях. Вся остальная методика проводится в биохи-мической лаборатории и не требует присутствия больного. Это делает метод "дистанционным", идеально подхо-дящим для скринингового обследования.
Метод основан на том, что при возникновении и росте увеальных опухолей, начиная с самой ранней ста-дии, они активно продуцируют пигмент меланин. Ресницы были взяты в качестве объекта исследования как наиболее близкорасположенная к заднему отрезку глаза пигментсодержащая структура, связанная с ним анато-мически и функционально через систему кровеносных сосудов и нервов. Процессы продукции меланина, проис-ходящие в опухоли, находят отражение в содержании меланина в ресницах пораженного глаза, тогда как ресницы здорового глаза остаются относительно неизменными. Ресницы, взятые с обоих глаз, обрабатываются отдельно в специальных растворах, которые затем помещаются в спектрофотметр. Определение количества меланина в рас-творах осуществляется при помощи спектрофотометрического анализа в диапазоне от 400 до 600 нм с интерва-лом 20 нм на спектрофотометре "SPECOL" /Карл-Цейс-Йена, ГДР/. Результатом анализа для каждого глаза явля-ются 11 показателей оптической плотности, косвенно характеризующие количество растворенного пигмента (всего 22 значения), которые необходимо интерпретировать для постановки диагноза.
V.3. Формальный способ интерпретации данных метода
Для интерпретации данных метода без нейросети был предложен коэффициент асимметрии (КА), выра-жающий соотношение содержания меланина в ресницах левого и правого глаза. КА рассчитывается для каждой из 11 длин волн, на которых проводится измерение, и вычисляется путем деления большего значения на мень-шее. Таким образом, КА, равный единице, говорит о приблизительно одинаковом содержании меланина в ресни-цах левого и правого глаза. Необходимость измерения КА для нескольких длин волн вызвано тем, что меланин состоит из некоторого количества фракций, имеющих несколько различающиеся спектры. Предложенный диапа-зон позволяет с наибольшей эффективностью "захватить" эти спектры. После многочисленных экспериментов и статистической обработки были установлены несколько типов распределения КА в зависимости от его средней величины и изменения по длинам волн:
пределяясь по всем длинам волн, либо увеличиваясь с увеличением длины волны. Ниже будет рассказано, как применялся этот способ для диагностики заболевания.
V.4. Постановка задачи
Целью данного исследования была разработка нейросетевой экспертной системы, интерпретирующей данные вышеназванного метода и позволяющей производить скрининговую диагностику увеальных меланом. Необходимо было также сравнить прогностическую способность нейронной сети и формального способа, изло-женного в предыдущем разделе.
По локализации опухоли сосудистого тракта можно разделить на опухоли хориоидеи и опухоли иридоци-лиарной области.
Опухоли хориоидеи по стадии развития подразделяются на две основных подгруппы: опухоли ранней стадии ("Т1-Т2") и опухоли поздней стадии ("Т3"). Подобная классификация, объединяющая некоторые патофи-зиологические стадии, определяется клинической значимостью той или иной стадии. С учетом такой клиниче-ской классификации схема постановки задачи представлена на рисунке 5.1.
Нейросетевое решение задачи может быть осуществлено несколькими способами:
Второй вариант предпочтительнее, так как разделяет задачу на отдельные подзадачи, решение которых более просто для нейросетей, чем решение всей задачи сразу.
V.5. Входные параметры и обучающая выборка
В качестве входных параметров использовались 22 показателя оптической плотности (по 11 с каждого глаза), получающиеся в результате применения метода. Мы будем и меновать эти параметры буквой R или L (Right -правый глаз, Left -левый глаз) и частотой, на которой снимался параметр (например, R-400, L-540). Так как коэффициенты асимметрии гораздо больше отражают наличие патологии, чем сами показатели оптической плотности, они также использовались как обучающие параметры (обозначаются буквой K и соответствующей частотой). В качестве дополнительных параметров мы использовали пол (0 -женский, 1-мужской) и возраст обследуемых. Таким образом, использовались 35 обучающих параметров.
Обучающая выборка составила 195 человек, которые находились под наблюдением в Красноярском меж-областном центре микрохирургии глаза им. П.Г.Макарова в период с 1991 по 1993 г.
90 человек в возрасте от 18 до 86 лет составили основную группу, в которую были включены больные меланомой увеального тракта различной локализации и стадии развития.
Контрольная группа составила 105 человек: больных с неонкологической патологией органа зрения и здоровых людей.
Характеристика основной группы.
Основная группа подразделялась на три подгруппы: больных с меланомой хориоидеи Т1-Т2(класс 1), меланомой хориоидеи стадии Т3(класс 2), и больных меланомой иридоцилиарной области (класс 3) (Таб. 5.1).
Стадия развития опухоли оценивалась по системе TNM. Опухоли хориоидеи составили 70% случаев, опу-холи иридоцилиарной области -30%, что согласуется с литературными данными по соотношению частоты встре-чаемости этих заболеваний.
Таблица 5.1. Распределение больных опухолями сосудистого тракта в зависимости от локализации и стадии заболева-ния
больных | |||
---|---|---|---|
1 | Опухоли хориоидеи стадии Т1-Т2 | 27 | 30,0 |
2 | Опухоли хориоидеи стадии Т3 | 39 | 43,3 |
3 | Опухоли иридоцилиарной области | 24 | 26,7 |
Все пациенты получили за время нахождения в стационаре полное клиническое обследование, позволив-шее подтвердить или исключить им диагноз меланомы хориоидеи. Это обследование включало как традицион-ные офтальмологические методы, такие как определение остроты зрения, офтальмоскопия в прямом и обратном виде, биомикроскопия, периметрия, тонометрия, так и специальные методы, применяемые для диагностики этого заболевания, такие как эхография и двухмерное ультразвуковое В-скеннирование (УЗИ), бинокулярная офталь-москопия, диафаноскопия,(ФАГ), телеангиография, компьютерная томография. Всем больным, которым в ре-зультате установления диагноза внутриглазной опухоли была произведена энуклеация глаза, проводилась гисто-логическая верификация новообразования с установлением морфологической структуры меланомы.
Характеристика контрольной группы.
В контрольную группу больных, составившую основу для проведения сравнительного анализа при вы-полнении данной работы, вошли больные с неонкологической патологией глаза и здоровые люди в возрасте от 19 до 85 лет.
При анализе патологии глаз больных контрольной группы были получены следующие результаты (Таб. 5.2).
Таблица 5.2. Распределение больных контрольной группы по нозологии
№ | Диагноз | Число больных | % от общего числа больных |
---|---|---|---|
1 | Здоровые | 24 | 22,8 |
2 | Отслойка сетчатки | 24 | 22,8 |
3 | Катаракта | 26 | 24,9 |
4 | Миопия | 11 | 10,5 |
5 | Воспалительные заболевания увеального тракта | 7 | 6,7 |
6 | Патология стекловидного тела | 7 | 6,7 |
7 | Невус хориоидеи | 8 | 7,6 |
8 | Менингиома | 3 | 2,8 |
Основными диагнозами, преобладавшими у больных этой группы были отслойка сетчатки (24%), во з-растная или осложненная катаракта (24%) и миопия различных стадий, в 3-х случаях осложненная гемофталь-мом, отслойкой сетчатки и катарактой (10%). Остальная патология глаз имела место в меньшем количестве слу-чаев. Подбор больных с вышеперечисленными заболеваниями глаза был обусловлен тем, что эти заболевания наиболее часто затрудняют правильную диагностику внутриглазной злокачественной опухоли.
Основным признаком больных, включенных в контрольную группу исследования, явилось достоверное отсутствие злокачественной меланомы сосудистого тракта глаза, подтвержденное инструментально и клиниче-ски.
Статистическая обработка данных.
Статистическая обработка показала, что все параметры оптической плотности не различаются достоверно ни в одной паре подгрупп как при разбивке на 4 класса, так и при разбивке согласно поставленной задаче. Однако почти по всем коэффициентам асимметрии группа больных меланомой хориоидеи стадии Т1-Т2 существенно отличалась от всех остальных групп (Р<0,05 -P<0,001). Три остальные группы не различались друг с другом до-стоверно ни по одному показателю.
Во всех исследуемых подгруппах КА имел небольшую тенденцию к увеличению с повышением частоты, для которой они рассчитываются. В группе больных меланомой хориоидеи стадии Т1-Т2 эта тенденция выражена очень ярко. Иллюстрация распределения коэффициента асимметрии в каждом из четырех классах приведена на Рис. 5.2.
8 7 6 5 4 3 2 1
КА
0 400 420 440 460 480 500 520 540 560 580 600
Частота
Рисунок 5.2. Зависимость КА от частоты при спектрофотометрии в четырех исследуемых подгруппах. Класс 1 -опухоли хориоидеи стадии Т1-Т2, Класс 2-опухоли хориоидеи стадии Т3, Класс 3 -опухоли иридоцилиарной области, Класс 4 – контроль
Таблица 5.3. Степень скоррелированности показателей оптической плотности в исследуемых группах (средние коэф-фициенты корреляции и достоверность их различия)
Группа | n | Средний k корреляции | Достоверность различия |
Опухоли хориоидеи стадии Т1-Т2 | 27 | 0,947 | P4<0,01 |
Опухоли хориоидеи стадии Т3 | 39 | 0,922 | P4<0,05 |
Опухоли иридоцилиарной области | 24 | 0,916 | - |
Группа контроля (здоровые и больные с отсутствием опухоли) | 105 | 0,814 | P1<0,01 P2<0,05 |
Можно видеть, что график распределения КА у больных с опухолями хориоидеи стадии Т1-Т2 значитель-но отличается от всех остальных, тогда как между тремя оставшимися группами различия небольшие.
При проведении корреляционного анализа во всех четырех группах обследованных выявлены сильные корреляционные взаимосвязи между всеми показателями оптической плотности. При этом степень скоррелиро-ванности показателей в группах несколько различается (Табл. 5.3).
Степень скоррелированности показателей наивысшая в группе больных ранней стадии опухоли хориои-деи и наименьшая в группе контроля, причем средние коэффициенты корреляции между этими группами досто-верно различаются.
V.6. Оценка эффективности методов диагностики меланомы хориоидеи
Как уже говорилось, для четкой верификации диагнозов обследуемым проводилось всестороннее обсле-дование с применением нескольких методов, позволяющих выявлять меланомы. Данные, позволяющие оценить эффективность этих методов, приведены в таблице 5.4.
Основными методами диагностики меланомы хориоидеи всех стадий явились в нашем исследовании оф-тальмоскопия и ультразвуковые методы (эхография и В-скеннирование), примененные большинству больных и показавшие при этом высокую эффективность.
Тонометрия и периметрия основную информационную нагрузку не несли и использовались как вспомога-тельные к вышеперечисленным.
Таблица 5.4. Эффективность методов диагностики опухолей сосудистого тракта глаза
* первое число указывает количество случаев, когда применение метода подтвердило диагноз меланомы, второе число -количество случаев, когда метод не выявил меланому.
деи | тодом больных | ||||||
---|---|---|---|---|---|---|---|
стадии Т1- | стадии | Всего | стадии | стадии Т3 | Общий | ||
Т2 | Т3 | Т1-Т2 | |||||
Офтальмоскопия | 19 / 7* | 29 / 5 | 48 / 12 | 73 | 85 | 80 | |
Биомикроскопия | 2 / 20 | 16 / 4 | 18 / 24 | 9 | 80 | 43 | |
УЗИ | 22 / 2 | 31 / 1 | 53 / 3 | 92 | 97 | 95 | |
Эхография | 16 / 8 | 27 / 6 | 43 / 14 | 38 | 82 | 75 | |
Периметрия | 15 / 4 | 12 / 2 | 27 / 6 | 79 | 86 | 82 | |
Тонометрия | 5 / 21 | 2 / 11 | 7 / 32 | 19 | 15 | 18 | |
ФАГ | 7 / 2 | 3 / 0 | 10 / 2 | 78 | 100 | 83 | |
Диафаноскопия | 3 / 1 | 6 / 0 | 9 / 1 | 75 | 100 | 90 |
Диафаноскопия и ФАГ использовались при обследовании небольшого количества больных и применя-лись по показаниям; ФАГ и телеангиография -преимущественно при дифференциальной диагностике небольших по размеру опухолей стадии Т1-Т2 от заболеваний заднего отрезка глаза неопухолевого характера при наличии прозрачности внутриглазных сред; диафаноскопия -при дифференциальной диагностике опухолей стадии Т3 в сложных и клинически неясных ситуациях. Во всех этих случаях они показали достаточно высокую эффектив-ность.
Сравнение эффективности диагностических методов увеальных меланом, примененных в нашем исследо-вании, показало, что наиболее информативным и диагностически ценным из ныне существующих являются уль-тразвуковое исследование, В-скеннирование и эхография.
Нужно отметить, что для наиболее полной и точной диагностики необходимо применение всех возмож-ных диагностических методов в комплексе. Однако проведение скрининговых обследований с помощью описан-ных методов явно затруднено, так как требует наличия квалифицированных специалистов и соответствующего оборудования.
V.7. Оценка эффективности метода диагностики меланом сосудистого трак-та глаза с помощью изучения пигмента ресниц
Рассмотрим теперь, какова эффективность предлагаемого нового метода для диагностики исследуемых заболеваний.
С учетом принятых значений коэффициента асимметрии, отражающего характер распределения пигмента ресниц, его значения были проанализированы у больных с неонкологической патологией органа зрения и здоро-вых людей, составивших контрольную группу и у больных с пигментными новообразованиями сосудистого трак-та глаза различной локализации, составивших основную группу.
Результаты анализа с вычислением среднего КА в подгруппах приведены в таблице 5.5.
В контрольной группе преобладало симметричное распределение меланина -88 человек (83,8%). Асим-метрия отмечена у 17 человек (16,2%), причем несколько преобладающим явился легкий тип -10 человек (9,5%).
Среди этих больных у 5 человек была диагностирована катаракта, у 5 чел.-отслойка сетчатки, у 5 чел. имела место сложная сочетанная патология.
Симметричное распределение меланина явилось преобладающим также в группах больных с опухолями иридоцилиарной области -24 человека (100%) и с опухолями хориоидеи стадии Т3 -35 человек (89,8%). У 4 че-ловек (10,2%) меланомой хориоидеи стадии Т3 была отмечена асимметрия. У этих больных имели место боль-шие, хорошо пигментированные меланомы хориоидеи с участками оранжевого пигмента, кровоизлияниями, некроза на поверхности, представляющие собой, по данным [15], наиболее злокачественную форму этого заболе-вания.
Таблица 5.5. Характер распределения пигмента (коэффициент асимметрии) в исследуемых группах
Группа | Распределение пигмента в ресницах | Средний | ||
---|---|---|---|---|
(количество человек) | КА | |||
симметрич- | легкая | выраженная | ||
ное | асимметрия | асимметрия | ||
Опухоли хориоидеи стадии Т1-Т2 | 2 (7,4%) | 8 (29,6%) | 17 (63,0%) | 4,88±0,62 |
Опухоли хориоидеи стадии Т3 | 35 (89,8%) | 2 (5,1%) | 2 (5,1%) | 1,40±0,05 |
---|---|---|---|---|
Опухоли хориоидеи всех ста-дий | 37 (56,1%) | 10 (15,1%) | 19 (28,8%) | - |
Опухоли иридоцили-арной области | 24 (100%) | 0 (0%) | 0 (0%) | 1,37±0,05 |
Группа контроля | 88 (83,8%) | 10 (9,5%) | 7 (6,7%) | 1,81±0,26 |
В группе больных с опухолями хориоидеи стадии Т1-Т2 преобладающим выявлено асимметричное рас-пределение меланина -25 человек (92,6%), причем выраженная асимметрия преобладала и имела место у 17 чел. (63%), слабая -у 8 человек (29,6%). У 2 человек (7,4%) распределение меланина было симметричным.
Таким образом, чувствительность теста для диагностики опухолей хориоидеи стадии Т1-Т2 составила:
число больных с меланомой Т1-Т2, давших положительный результат 25 Se = --------------------------------------------------x 100% = ------x 100 = 92,6% общее число больных меланомой Т1-Т2 27
Специфичность теста составила: число обследованных без меланомы Т1-Т2, давших отрицательный результат 147
Sp = ------------------------------------------x 100% = -------х 100 = 87,5% общее число обследованных без 168 меланомы Т1-Т2
Таким образом, асимметричный тип распределения пигмента между ресницами правого и левого глаз можно считать признаком меланомы хориоидеи преимущественно начальных стадий развития и использовать его для диагностики этого заболевания.
Результат теста считается:
Очевидно, что отсутствие различий в КА у обследованных контрольной группы и больных меланомой хориоидеи стадии Т3 и меланомой иридоцилиарной области не дает возможности скринингового выявления этих заболеваний только на основании КА.
V.8. Комплекс нейронных сетей
Для более точной диагностики меланом хориоидеи стадии Т1-Т2, а также выявления остальных исследу-емых патологий решено было применить нейронные сети.
Вначале соответственно поставленной задаче была инициализирована нейронная сеть-классификатор, который обучался различать основную и контрольную группы и имел следующие параметры: 35 нейронов, 35 входных синапсов, число тактов функционирования -2, характеристика -0,1. Через 4961236 тактов функциони-рования нейросеть перестала обучаться с величиной суммарной оценки 0,06241, при этом оставались нераспо-знанными 7 примеров (2 из основной и 3 из контрольной группы).
Это означало, что объединение трех групп больных с опухолями в одну основную не вполне корректно, так как при этом в один массив попадают группы, очень сильно различающиеся по ряду показателей. В кон-трольную группу, наоборот, выделяются больные, близкие по параметрам к двум подгруппам основной группы. Естественно, что при неудачной попытке обучения классификатора первой ступени обучение последующих сетей по этой схеме бессмысленно.
Поэтому постановка задачи и, соответственно, классификационная модель, были изменены (Рис. 5.3).
1 ступень
2 ступень
По этой схеме бинарный классификатор первой ступени определяет, имеется ли у обследуемого опухоль хориоидеи стадии Т1-Т2. Если сеть дает отрицательный ответ, пример должен подаваться трехклассовому клас-сификатору 2 ступени для отнесения к одной из трех оставшихся групп.
Нейросети для новой схемы имели те же параметры, что и сеть, инициализированная в первой схеме.
Стартовое обучение классификатора первой ступени проводилось на 15 примерах больных с опухолью хориоидеи Т1-Т2 (1 класс) и 45 примерах обследуемых с отсутствием этой патологии (по 15 примеров из каждой группы) (2 класс). Заметим, что в первый класс обучающей выборки был включен один из примеров больных меланомой Т1-Т2, у которого наблюдалось симметричное распределение пигмента, т.е. больной, диагноз которо-го не выявлялся с помощи логической интерпретации теста. Нейросеть обучилась за 534667 тактов функциони-рования. При тестировании примеров, не вошедших в стартовую обучающую выборку, получены следующие результаты. Все оставшиеся 12 примеров больных меланомой Т1-Т2 были распознаны верно, в том числе и вто-рой больной с симметричным распределением пигмента. Из 123 оставшихся для теста примеров обследуемых без меланомы Т1-Т2 нейросеть распознала верно 119 и поставила диагноз меланомы Т1-Т2 четырем.
Малое количество примеров первого класса в тестирующей выборке не позволяет принять полученную 100-процентную чувствительность теста с нейросетью за достоверную величину, однако специфичность, рассчи-танная на 123 примерах 2 класса, составляет 96,7% (119 / 123 x 100%), что значительно выше, чем специфичность теста без применения нейросети (87,5%). После проверки работы нейросети все примеры тестирующей выборки были использованы для доучивания нейросети. При обучении сеть добилась правильного распознавания всех 195 примеров, т.е. обучилась полностью.
На рисунке 5.4 представлен анализ значимости входных параметров, разделенных на три группы -11 ча-стот для левого глаза, правого глаза и КА.
0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05
0 400 420 440 460 480 500 520 540 560 580 600
Частота
Рисунок 5.4. Значимость обучающих параметров (показателей оптической плотности для левого и правого глаза и КА) для классификатора, разделяющего больных меланомой хориоидеи стадии Т1-Т2 и остальных обсле-дованных (меланомы хориоидеи стадии Т3, меланомы иридоцилиарной области, контрольная группа)
Самым значимым параметром оказался КА для частоты 440 нм. На графиках прослеживается две области значимости параметров, соответствующие частотам 440 и 540 нм. По остальным частотам значимость парамет-ров меньше. Естественно, сравнение значимости параметров для левого и правого глаза бессмысленно, однако совпадение их пиков, а также пиков значимости КА говорит, что фракции пигмента, выявляемые на частотах, соответствующих пикам, очевидно, больше остальных определяют различие в данных между обследуемыми с наличием и отсутствием меланом стадии Т1-Т2.
Для проверки этого предположения был создан классификатор, аналогичный предыдущему, однако име-ющий только 8 входных синапсов и 8 нейронов. Набор входных параметров был значительно сокращен. Для обу-чения были оставлены пол, возраст, показатели оптической плотности для левого и правого глаза и КА только на частотах 440 и 540 нм. Стартовая выборка была аналогичной предыдущей. Нейросеть обучилась за 1118723 так-та. При тестировании оставшихся примеров результат был несколько хуже: из 12 примеров 1 класса уже не все, а только 11 были распознаны правильно. Неверно распознанный пример, как и следовало ожидать, имел симмет-ричный тип распределения пигмента. Из 123 оставшихся примеров 2 класса ошибка наблюдалась уже в 8 случа-ях.
После этого было решено проверить, на каком минимальном количестве частот следует проводить изме-рения, чтобы тест с применением нейросети имел такую же чувствительность и специфичность, как и тест с 11 частотами. Оказалось, что используя, кроме 440 и 540 нм, частоты, 520 и 560 нм, новая нейросеть с 14 входными синапсами дает специфичность, большую, чем сеть, обучавшаяся на 11 частотах: из 123 примеров 2 класса ошиб-ка наблюдалась уже только в трех случаях. Именно такой результат, скорее всего, случаен, однако совпадение его с результатом теста по 11 частотам говорит, что исходный набор параметров является избыточным. Это утвер-ждение пока что касается только диагностики меланомы хориоидеи стадии Т1-Т2, проводимой с помощью клас-сификатора 1 ступени.
Стартовое обучение классификатора 2 ступени проводилось на 19 примерах больных меланомой хориои-деи стадии Т3 (1 класс), 12 примерах больных меланомой иридоцилиарной области (2 класс) и 52 примерах кон-трольной группы (3 класс). Обучение полностью закончилось после 673024 тактов функционирования нейросети. Результаты тестирования примеров, не вошедших в обучающую выборку, представлены в таблице 5.6.
Таблица 5.6. Тестирование контрольной выборки классификатором 2 ступени
Группа | Число примеров тестиру-ющей выборки | Число примеров, правиль-но распознанных нейросе-тью |
---|---|---|
Опухоли хориоидеи стадии Т3 | 20 | 18 (90,0%) |
Опухоли иридоцилиарной области | 12 | 10 (83,3%) |
Контрольная группа | 53 | 48 (90,6%) |
Успешность обучения классификатора 2 ступени и хороший результат тестирования говорит о том, что, несмотря на отсутствие достоверных различий между показателями в исследуемых группах, существуют законо-мерности, позволяющие нейросети не только различать примеры при обучении, но и достаточно успешно экстра-полировать опыт для тестирования новых примеров.
После проведенного тестирования классификатор 2 ступени был дообучен на полной обучающей выбор-ке, т.е. с включением в нее примеров, не вошедших в стартовую обучающую выборку.
Графики, иллюстрирующие значимость обучающих параметров для классификатора 2 ступени, представ-лены на рисунке 5.5.
0,25
0,2
0,15
Значимость
0,1
0,05
0
400 420 440 460 480 500 520 540 560 580 600
Частота
Рисунок 5.5. Значимость обучающих параметров (показателей оптической плотности для левого и правого глаза и КА) для классификатора 2 ступени, разделяющего больных меланомой хориоидеи стадии Т3, больных меланомой иридоцилиарной области и контрольную группу)
Можно видеть, что на графиках прослеживаются те же самые пики значимости параметров, что и в предыдущей подзадаче: это показатели оптической плотности и КА на частотах 440 и 540 нм. Совпадение наибо-лее значимых параметров в различных подзадачах подтверждает предположение о том, что исследование содер-жания пигмента на этих частотах является наиболее информативным для диагностики и дифференциальной диа-гностики злокачественных опухолей сосудистой оболочки глаза.
Созданный классификатор, использующий в качестве входных параметров 8 показателей, как и в преды-дущей подзадаче, обучился за 1733290 тактов и при тестировании показал следующий результат (соответственно предыдущей нейросети): 17 из 20 (85%); 9 из 12 (75%); 45 из 53 (84,9%).
Итак, диагностическую ценность описанного метода определяют следующие преимущества:
отрезка глаза неопухолевой этиологии, клиническая картина которых затрудняет правильный диагноз; -относительная быстрота и несложность выполнения; -высокая объективность оценки конечного результата; -полная безвредность и безопасность для больного, определяющая практическое отсутствие противопо-
казаний к применению исследования. Применение нейронных сетей для интерпретации результатов теста дает следующие преимущества:
Глава VI. Моделирование лечения и прогнозирование его непосредствен-ных результатов у больных облитерирующим тромбангиитом
Облитерирующий тромбангиит (болезнь Бюргера)-тяжелое воспалительное заболевание сосудов мелкого и среднего калибра, сопровождающееся тромбозом и нарушением их проходимости.
Этиология этого заболевания до настоящего времени остается неизвестной [30]. Для возникновения и развития облитерирующего тромбангиита имеют значения расстройства эндокринной [33], вегетативной [32], и иммунной [24,30,242] систем. Одним из важных факторов в этиологии заболевания является курение [59,67,321]. Развитие заболевания провоцируется переохлаждением, физическими и психическими перегрузками, травмами, инфекционными заболеваниями, местной инфекцией. Подавляющее большинство больных тромбангиитом -мужчины молодого возраста (18 -45 лет) [67,68,257]. По данным [67], женщины составляют лишь 2% больных.
Лечение облитерирующего тромбангиита -трудная, далеко еще не решенная задача. В начальных стадиях заболевания, когда превалирует ангиоспастический компонент, обычно ограничиваются терапевтическими меро-приятиями -назначением дезагрегантов, противовоспалительных и антигистаминных препаратов. Однако забо-левание часто носит злокачественный характер и быстро приводит к ампутации конечности [199,242,321] и соот-ветственно ранней инвалидизации больных молодого, трудоспособного возраста.
Оперативные вмешательства производятся при неэффективности терапевтического лечения и/или при исходно значительных степенях ишемии, вызванных нарушением проходимости сосудов вследствие их тромбоза (II, III и IV стадии заболевания). Применение оперативных вмешательств, практически всегда дающих положи-тельный эффект (прямые реваскуляризирующие операции), ограничено случаями, когда процесс носит сегмен-тарный характер [67,256], что бывает крайне редко. Основное количество выполняемых операций -непрямые реваскуляризирующие операции, которые носят паллиативный характер [256]. Их многообразие объясняется скорее не успехами ангиохирургии в данной области, а отражает взгляды различных хирургических школ на пре-валирование одного или другого фактора в этиопатогенезе облитерирующего тромбангиита. Так, например, для коррекции нарушений вегетативной нервной системы применяют различные виды симпатэктомии [32,67,256]; для ко ррекции нарушений эндокринной системы -адреналэктомию, рентгенэндоваскулярную деструкцию надпочечников [51]; для улучшения микроциркуляции и стимулирования коллатерального кровотока -остеотре-панацию [339], артериализацию венозного кровотока [68], транспозицию большого сальника [210] и т.д.
Неопределенные представления об этиопатогенезе заболевания затрудняют постановку правильного диа-гноза. Облитерирующий тромбангиит приходится дифференцировать с такими заболеваниями, как облитериру-ющий атеросклероз у лиц молодого возраста [199,272], системными коллагенозами [257], феноменом Рейно [310], диабетической ангиопатией, холодовым нейроваскулитом и т.д..
Для постановки диагноза "облитерирующий тромбангиит" мы использовали следующие характерные [198,257,321] диагностические признаки:
VI.1. Характеристика обследованных больных
В 1990 -1994 гг. в отделении хирургии сосудов Краевой Клинической Больницы 1 г.Красноярска под наблюдением находилось 130 больных облитерирующим тромбангиитом в возрасте от 21 до 53 лет (средний воз-раст 37,2±0,5 лет). Из них мужчин 129 (99,2%), женщин -1 (0,8%). Большинство больных (79,2%) страдали обли-терирующим тромбангиитом более 24 месяцев. 115 (88,5%) больных ранее проходили курс терапевтического лечения, 30 (23,2%) ранее оперированы по поводу этого заболевания. К моменту исследования 42 больных были инвалидами. Таким образом, контингент больных является типичным для данного заболевания.
Все больные до лечения предъявляли жалобы на боли в нижних конечностях различной интенсивности, возникающие в покое и/или при ходьбе. У 37 больных (28,5%) наблюдалась 3 степень ишемии [67], у 60 (46,2%) 4 степень ишемии. У 17 больных (13,1%) поражение носило мультифокальный характер с локализацией процесса в сосудах не только нижних, но и верхних конечностей. Течение заболевания осложнялось флебитом у 26 (13,1%) больных. При клиническом исследовании у 51 (39,2%) больных выявлены сопутствующие заболевания: язвенная болезнь -9 (6,9%), эрозивный гастродуоденит -33 (25,4%), лекарственная непереносимость -19 (14,6%), артери-альная гипертензия -8 (6,2%). Все больные были курильщиками.
При исследовании больных использовали рентгенконтрастную ангиографию, ультразвуковое дуплексное сканирование с цветным допплеровским картированием кровотока, допплерографию, фиброгастроскопию, элек-трокардиографию, клинический, биохимический и иммунологический анализы крови. При анализе ангиограмм поражение большеберцовых артерий выявлено у 115 (88,5%) больных, подколенной и берцовых артерий у 40 (30,8%) больных. По результатам дуплексного сканирования и допплерографии средние величины объемной ско-рости кровотока и периферического сопротивления подколенной артерии при ее проходимости составили 253,11±49,7 мл/мин и 0,85±0,08 соответственно. При иммунологическом и биохимическом исследовании крови у 48 (36,9%) больных выявлены признаки вторичного иммунодефицита, у 46 (35,4%) -гиперадреналемии.
Курс консервативной терапии, включающий в себя дезагреганты, ангиопротекторы, флеботоники, проти-вовоспалительные и антигистаминные препараты, проводили всем больным вне зависимости от тяжести заболе-вания. Монотерапию вазапростаном проводили больным с 3 и 4 степенями ишемии (8 человек, 6,2%). Иммуно-коррекцию проводили по показаниям у 23 (17,6%) больных в зависимости от типа расстройства иммунной систе-мы.
Оперативные вмешательства произведены у 80 (61,5%) больных. 26 (20,0% ) больным была произведена люмбальная поясничная симпатэктомия, из них двусторонняя -5 (3,9%). Операции проводились под эндотрахе-альным наркозом из ретроперитонеального доступа, резецировали 3 и 4 поясничные ганглии. 46 (35,4%) больным с высокими цифрами катехоламинов в суточной моче и крови производили рентгенэндоваскулярную деструкцию надпочечников [51]. После пункции и катетеризации бедренной вены и установки катетера в центральной надпо-чечниковой вене гидродинамически разрушался надпочечник, далее эмболизировали н адпочечниковую вену спиралью Гиантурко. Деструкция считалась удавшейся при появлении болевого симптома в поясничной области с иррадиацией в подреберье, тахикардии, гипотонии, тошноты, гипергидроза, тремора. Подобные явления наблюдались в первые двое суток, далее купировались самостоятельно.
При нормальных цифрах катехоламинов, ранее произведенной симпатэктомии и при проходимости под-вздошной артерии на стороне поражения 9 (6,9%) больным производилась реваскуляризирующая остеотрепана-ция (РОТ) [339]. Создавали в сумме 15 -17 трепанационных отверстий на бедренную, большеберцовую и пяточ-ные кости.
При неэффективности комплексного лечения и прогрессировании ишемии 2 (1,5%) больным была произ-ведена ампутация бедра, 5 (3,9%) -ампутация голени.
Учитывались только непосредственные результаты (на момент выписки больного из клиники). Результат оценивался как:
У больных со 2 степенью ишемии (26 больных) удалось достигнуть хороших результатов в 20 (74,1%) случаях. Неудовлетворительных результатов не было. В большинстве случаев оперативные вмешательства (РОТ или люмбальная симпатэктомия) были эффективны -удалось увеличить безболевую дистанцию в 2 и более раз.
У больных с 3 степенью ишемии при использовании моновидной терапии препаратом вазапростан (8 больных) удалось добиться удовлетворительных результатов в 6 случаях. Применение рентгенэндоваскулярной деструкции надпочечников (15 больных) у 13 больных позволило перевести ишемию во 2 стадию и/или значи-тельно снизить интенсивность болей в покое. Результаты рентгенэндоваскулярной деструкции надпочечников коррелировали с выраженностью болевого синдрома. Не удалось достигнуть положительного эффекта (хороших и удовлетворительных результатов) у 2 больных с интенсивными болями, требующими назначение наркотиче-ских анальгетиков и с явлениями ортостатического отека нижних конечностей. Люмбальная симпатэктомия (12 больных) была эффективна у 9.
У 13 больных с обширными язвенно-некротическими изменениями стоп (в ряде случаев и голени), выра-женным болевым синдромом только в 6 случаях удалось достигнуть положительного эффекта, всем им была про-ведена. рентгенэндоваскулярная деструкция надпочечников. РОТ была проведена у 4 больных (эффективна у 1), люмбальная симпатэктомия у 2 больных (не эффективна во всех случаях). Не удалось сохранить конечность у 5 (30%) больных данной группы.
У 47 больных с умеренными язвенно-некротическими изменениями пальцев стоп эффект от проведенного комплексного лечения был более выражен: хорошие и удовлетворительные результаты были получены у 32 больных. Наиболее эффективным оказалось применение рентгенэндоваскулярной деструкции надпочечников -хорошие результаты были достигнуты у 22 из 26 больных. У 8 больных, которым была произведена люмбальная симпатэктомия или РОТ, удалось добиться регресса имеющихся трофических расстройств и снизить интенсив-ность или полностью купировать боли в покое в 2 и 3 случаях соответственно.
VI.2. Обучающие параметры и ответы
На каждого больного, находившегося под наблюдением, заполнялась анкета, состоящая из 3 логических разделов.
Первый раздел (104 пункта) включает вопросы, касающиеся анамнеза жизни и данного заболевания, со-путствующих заболеваний, состояние органов и систем, подробное описание имеющегося у больного тромбанги-ита с характеристикой состояния сосудов конечностей, данные лабораторных и инструментальных методов ис-следования, характеристику проводившегося ранее лечения. Другими словами, этот раздел отражает исходный статус больного на момент его поступления в хирургическое отделение.
Второй раздел (11 пунктов) характеризует проведенное в стационаре лечение (консервативное и/или опе-ративное). В этот раздел включена малая ампутация (пальцев стопы или части стопы).
Третий раздел (4 пункта) содержит сведения о непоcредственных исходах проведенного лечения. Заме-тим, что в этот раздел включена большая ампутация (пораженной конечности), являющаяся неблагоприятным исходом заболевания.
Ниже приводится полный список исследуемых параметров у больных. Многие параметры представляют собой альтернативный выбор из двух вариантов (помечены *). В других случаях дается расшифровка всех вари-антов.
Раздел 1. Исходный статус.
Раздел 2. Проводимое лечение в клинике.
Раздел 3. Непосредственные исходы лечения.
VI.3. Постановка задачи
Существующие методы терапевтического и оперативного лечения облитерирующего тромбангиита часто малоэффективны и процент выполняемых ампутаций остается высоким [242,257,321]. Перед врачом стоит задача подобрать оптимальное сочетание методов лечения, действующих на ведущие звенья патогенеза у конкретного больного. Целью проводимого исследования стало создание самообучающейся нейросетевой экспертной систе-мы, позволяющей прогнозировать непосредственные исходы заболевания и выбирать оптимальное сочетание терапевтических и хирургических воздействий. Соответственно этому экспертная система подразделяется на два функциональных блока, каждый из которых решает свой круг задач.
Один блок (блок "И" -исходы) прогнозирует непосредственные исходы заболевания, который зависит от двух групп параметров. Первая группа -исходный статус больного, фиксированные параметры, отражающие состояние больного на момент поступления в клинику, а также данные анамнеза. Однако исход заболевания за-висит не только от исходных параметров, но и от проводимого в клинике лечения. Поэтому вторая группа пара-метров, необходимая для прогноза -примененные методы лечения. Параметры этой группы неизвестны при по-ступлении, на этот момент их можно только предполагать. Однако при обучении нейросети используются уже пролеченные больные с известным набором терапевтических и хирургических воздействий. Обучив нейросети прогнозировать исходы тромбангиита в зависимости от исходного статуса и проведенного лечения, можно моде-лировать результат, оставляя неизменными фиксированные параметры и подстраивая предполагаемые методы лечения.
Другой блок экспертной системы обучается прямому выбору наиболее оптимальных методов лечения (блок "Л"), используя только первый, фиксированный набор параметров. Однако в такой постановке задачи есть одно узкое место. Во-первых, некоторым больным с незначительными степенями ишемии назначается лечение, направленное на стабилизацию процесса, а не на получение "благоприятного" исхода. Этим больным назначается только стандартное консервативное лечение, и нет смысла использовать экспертную систему для его оптимиза-ции. Во-вторых, у некоторых больных, несмотря на применяемые методы лечения, не удается добиться благо-приятного исхода заболевания. Причина может быть заключена как в тяжелом и запущенном заболевании, так и в неверно выбранной тактике лечения.
Если включить больных из таких групп в обучающую выборку, мы будем либо некорректно ставить зада-чу (если больному назначается только стабилизирующая терапия или если причина неблагоприятного исхода в самом больном), либо закладывать в нейросеть ошибочную тактику. Поэтому нейросети блока "Л" логично обу-чать только на примерах больных, которым, помимо стабилизирующей, назначалась другая терапия и лечение которых закончилось успешно.
Однако как разделить исходно "трудных" больных, и тех, кому следовало бы скорректировать лечение? Для этого прежде всего все обследованные больные, которым назначалось не только стабилизирующее лечение, были разделены на две группы -с благоприятным и неблагоприятным исходом. В основу такого деления были положены критерии, базирующиеся на трех показателях состояния больного, определяющихся после лечения:
Из 130 обследованных больных 15-и назначалась только стабилизирующая терапия, поэтому они были сразу исключены из обучающей выборки для нейросетей блока "Л". 33 больных попали в группу "трудных". Ис-тории болезней этих больных подверглись тщательному ретроспективному анализу для выяснения наиболее ве-роятных причин неуспешного лечения. В результате был сделан вывод, что 21 случай из 33 представляют собой изначально трудные, запущенные случаи заболевания, лечение которых вследствие этого было малоэффектив-ным. Эти примеры были также исключены из обучающей выборки для нейросетей блока "Л".
Рисунок 6.1. Схема разбивки обучающей выборки по группам параметров и примеров и использования этих групп для обучения нейросетей двух функциональных блоков экспертной системы: Пунктирная линия -блок "И", прогнозирующий исходы заболевания,(третью группу параметров) на основании 1 и 2 группы параметров (исходный статус и предполагаемое лечение). Нейросети обучаются на всех примерах. Тонкая сплошная линия -Фильтрующая нейросеть блока "Л", определяющая, будет ли эффективно лечение данного больного на основании только фиксированного набора параметров (исходного статуса). Обучается на всех примерах, разделенных на 2 класса. Толстая сплошная линия -Основные нейросети блока "Л", вычисляющие вторую группу параметров (лечение) на основании первой (исходный статус). Обучаются только на примерах больных с успешным результатом лече-ния
В отношении оставшихся 12 больных было сделано заключение, что тактика их лечения либо не являлась оптимальной, либо больные отказывались от предложенного лечения. Анализ динамики состояния этих больных и проводимого лечения с учетом неблагоприятного результата позволил экспертам определить предполагаемую схему лечения в отношении каждого из этих больных, обеспечивающую максимальную вероятность благоприят-ного исхода.
Заметим, что до сих пор при постановке задач мы исходили из заранее известных ответов, получаемых "объективным" образом (фиксация осложнений, подтверждение диагноза). В данном случае наблюдается вклю-чение в задачу предполагаемых ответов, отражающих "субъективный" опыт специалистов.
Таким образом, в обучающей выборке для нейросетей блока "Л", определяющих оптимальную стратегию лечения, остались 94 примера, включающие 12 примеров со "скорректированным" лечением. Однако эти нейросети не обучаются на примерах больных, которым назначается стабилизирующая терапия, а также трудных случаев, поэтому для получения корректного ответа при подаче этим нейросетям примера нужно иметь доста-точно высокую вероятность того, что этому больному будет назначено лечение и благоприятный исход у него вообще возможен. Поэтому в экспертном блоке "Л" предусматривается дополнительная нейросеть-фильтр, обу-чающаяся различать больных двух групп: в первой находятся больные с назначенной стабилизирующей терапией и "трудные" больные; во второй -все остальные.
На рисунке 6.1 изображена схема обучающей выборки с разбивкой по группам параметров и примеров, и указано, какая часть выборки используется для обучения нейросетей каждого функционального блока экспертной системы.
На рисунке 6.2 представлена схема работы экспертной системы.
Следует более подробно остановиться на ампутации пораженной конечности. При прогнозировании большой ампутации как вероятного исхода заболевания, прогнозирование остальных исходов заболевания (ди-намика ишемии, динамика трофических расстройств, исчезновение болей) становится некорректным.
С учетом поставленной задачи были сформированы подгруппы примеров больных для обучения нейрон-ных сетей. Для решения подзадач блока "И" примеры были сгруппированы по классам четырьмя способами (Таб. 6.1), для решения подзадач блока "Л" -11 способами (Таб. 6.2).
Таблица 6.1. Подзадачи 1 блока (“И”) экспертной системы, соответствующие им классы и количества примеров каждо-го класса
Подзадача | Классы | Число примеров |
---|---|---|
1. Прогнозирование динамики | 1. Уменьшение ишемии | 85 |
ишемии | 2. Без изменений | 38 |
3. Усиление ишемии | 7 | |
2. Прогнозирование динамики | 1. Динамики нет | 50 |
трофических расстройств | 2. Уменьшение трофических рас- | |
стройств | 80 | |
3. Прогнозирования исчезновения | 1. Боли остались | 57 |
болей в покое | 2. Боли исчезли | 73 |
4. Ампутация | 1. Не производилась | 123 |
2. Производилась | 7 |
ющая” нейросеть) | 2. Больные с благоприятным исхо- | 24 |
---|---|---|
дом и больные со смоделирован- | ||
ным лечением | ||
106 | ||
1. Назначение вазапростана | 1. Не назначать | 122 |
2. Назначать | 8 | |
2. Плазмоферез, иммунопротек- | 1. Не назначать | 111 |
торы | 2. Назначать | 19 |
3. Пульстерапия | 1. Не проводить | 126 |
2. Проводить | 4 | |
4. Симпатэктомия | 1. Не проводить | 104 |
2. Односторонняя | 21 | |
3. Двухсторонняя | 5 | |
5. Деструкция надпочечников | 1. Не проводить | 84 |
2. Односторонняя | 25 | |
3. Двухсторонняя | 21 | |
6. Эмболизация надпочечников | 1. Не проводить | 82 |
2. Односторонняя | 41 | |
3. Двухсторонняя | 7 | |
7. Компактотомия или РОТ | 1. Не проводить | 120 |
2. Проводить | 10 | |
8. Ревизия | 1. Не проводить | 127 |
2. Проводить | 3 | |
9. Ампутация | 1. Не проводить | 125 |
2. Проводить | 5 | |
10. Реконструктивная операция | 1. Не проводить | 126 |
2. Проводить | 4 | |
11. Некрэктомия | 1. Не проводить | 125 |
2. Проводить | 5 |
VI.4. Статистическая обработка данных в исследуемых подгруппах
Проведенная статистическая обработка выявила лишь небольшое количество достоверных различий в изучаемых подгруппах.
В группе больных, которым назначалась иммунотерапия (плазмоферез, иммунопротекторы) достоверно (P<0,01) снижено количество лимфоцитов Т-хелперов в периферической крови. У больных, которым производи-ли симпатэктомию, длительность последнего ухудшения состояния (до момента поступления в клинику) досто-верно ниже (P<0,05), чем у больных, которым такое лечение не назначали. В этих же подгруппах наблюдается достоверная разница в количестве тромбоцитов и эозинофильных лейкоцитов в периферической крови (в обоих случаях P<0,05).
В группе больных с произведенной деструкцией надпочечников длительность последнего ухудшения состояния достоверно ниже (P<0,05). В этой же группе достоверно снижена (P<0,01) дистанция, которую спосо-бен пройти больной до появления боли (перемежающаяся хромота). Кроме того, у этих больных повышено коли-чество тромбоцитов (P<0,05). Похожие закономерности прослеживаются и в группе с произведенной эмболиза-цией надпочечников (меньше длительность последнего ухудшения, P<0,05; снижена дистанция, которую спосо-бен пройти больной до появления боли, P<0,01). Кроме того, у больных этой группы наблюдается достоверное увеличение количества лейкоцитов в периферической крови (P<0,05).
Следует отметить, что различия наблюдаются по параметрам, исследуемым до, а не после назначенного лечения, следовательно, в какой-то степени характеризуют исходно различное состояние больных, а не измене-ния, произошедшие после лечения. Конечно, небольшое количество достоверных различий между показателями во многом объясняется малым числом единиц наблюдения в некоторых группах.
Корреляционный анализ также не выявил достаточно сильных взаимосвязей как между параметрами внутри исследуемых подгрупп, так и между обучающими показателями и ответами.
VI.5. Создание и обучение нейронных сетей
Согласно поставленным задачам были инициализированы 32 нейронные сети, по две на каждую задачу. В каждой паре одна из нейросетей копировала стартовую синаптическую карту другой для последующего сравне-ния. Одна сеть имела характеристику 0,1, другая -0,8. Все нейросети имели по 35 нейронов, каждый входной сигнал подавался на все нейроны (плотность 35).
Во многих подзадачах имеется довольно сильно различающиеся количества примеров в классах. Поэтому веса классов с небольшим количеством примеров были увеличены таким образом, чтобы произведение веса од-ного класса на количество примеров в нем было приблизительно равно произведению веса другого класса на со-ответствующее число примеров. Кроме того, в данном исследовании был применен метод изменения весов от-дельных примеров. Это касалось тех больных, которым были произведены ампутации. Повышение весов этих примеров дополнительно выделяет их из общей группы, завышая их оценку и увеличивая требования к нейросети по их распознаванию. Общий вес примера при этом равен произведению его индивидуального веса на вес класса, к которому пример относится. Для примеров больных с ампутациями общий вес примеров в некоторых задачах достигал 50, т.е. был в 50 раз больше весов основной массы примеров в другом классе (где вес класса и веса при-меров были равны единице).
Все нейросети имели время отклика, равное 3 тактам функционирования.
Полное время обучения нейросетей составило от 52822 до 1274114 тактов функционирования. Быстрее всех обучились сети, определяющие в качестве исхода ампутацию, медленнее всех -сети, отвечающие за реко-мендацию деструкции надпочечников.
VI.6. Анализ значимости обучающих параметров
Для каждой из обученных нейронных сетей был проведен анализ значимости обучающих параметров. Ниже представлен список пяти наиболее значимых параметров для каждого вида нейросетей.
11.Нейросети, рекомендующие реконструктивную операцию: время появления первых жалоб, флебит нижних
конечностей, сахарный диабет, язвенная болезнь желудка или двенадцатиперстной кишки, заболевания пече-
ни; 12.Нейросети, рекомендующие некрэктомию: улучшение в анамнезе, перемежающаяся хромота, фибриноген,
заболевания печени, поражения нижних конечностей. 13.Нейросети, прогнозирующие динамику ишемии конечностей: длительность наблюдающегося ухудшения, по-
ражения нижних конечностей, деструкция надпочечников в анамнезе, РОТ в анамнезе, абсолютное количество
лимфоцитов;
14.Нейросети, прогнозирующие динамику трофических расстройств: переохлаждение в анамнезе, деструкция надпочечников в анамнезе, эмболизация надпочечников в анамнезе, назначение вазапростана в анамнезе, ча-стота сердечных сокращений;
15.Нейросети, прогнозирующие исчезновение болей в покое: время появления первых жалоб, длительность
наблюдающегося ухудшения, деструкция надпочечников в анамнезе, эмболизация надпочечников в анамнезе,
абсолютное количество лимфоцитов; 16.Нейросети, прогнозирующие ампутацию как исход лечения: переохлаждение в анамнезе, поражение нижних
конечностей, поражение верхних конечностей, деструкция надпочечников в анамнезе, панкреатит.
Как можно видеть, многие параметры попадают в первую пятерку по значимости (из более чем сотни) одновременно для нескольких нейронных сетей. Так, время появления первых жалоб (приблизительно отражаю-щее длительность заболевания) попало в список у 6 нейросетей, переохлаждение в анамнезе -у 7, поражение нижних конечностей -у 8, длительность наблюдающегося ухудшения и заболевания печени -у 4, перемежающа-яся хромота, флебит нижних конечностей и улучшения в анамнезе -у 3 нейросетей. С учетом того, что все сети обучались совершенно независимо друг от друга (значимость параметров для одной сети никак не влияет на зна-чимость параметров для других сетей) решению различных задач, можно думать о том, что перечисленные пара-метры являются важными для оценки течения заболевания в целом и во многом определяют стратегию лечения и прогноз состояния пациента.
Подавляющее большинство параметров, попавших в списки -качественные признаки, отражающие анамнез, течение и тяжесть заболевания, состояние больного. В списки практически не попали, за редкими ис-ключениями, данные лабораторных анализов, более подверженные случайным колебаниям. Поэтому, логично, что при обучении и принятии решений нейросети опираются на стабильные данные, фиксирующие существен-ные характеристики и изменения состояния больных.
VI.7. Минимизация набора входных параметров
Проведенный анализ значимости параметров и эксперименты с моделированием ответа нейросетей одно-значно показали избыточность первоначально заданного набора параметров. Действительно, блок параметров, отражающий анамнез заболевания и сопутствующие патологии, является намного более значимым практически для всех обученных нейросетей, по сравнению с блоком лабораторных показателей. Это не означает, что данные лабораторных параметров вовсе не нужны для работы нейросетей, однако дает возможность провести экспери-менты по минимизации исходного набора параметров.
Важно отметить, что минимизацию параметров до предела имеет смысл проводить только в исследова-тельских целях. Во-первых, если в экспертной системе работают несколько нейросетей, каждая определит свой собственный минимальный набор параметров -вероятность того, что он будет одинаков для всех нейросетей, уменьшается с увеличением количества нейросетей и увеличением количества параметров. Во-вторых, неболь-шая избыточность параметров важна для возможности подучивания нейросетей. Действительно, если сеть обуче-на на минимально возможном количестве параметров и при дальнейшем доучивании ей попадается пример, не вписывающийся в предыдущий опыт, имеющегося количества синапсов может не хватить для доучивания.
Однако для иллюстрации избыточности набора параметров в нашей задаче мы провели автоматическую предельную минимизацию параметров для всех нейронных сетей, обучавшихся с характеристикой 0,8. Полу-ченные после автоматической минимизации данные об исключенных параметрах подтверждают предположение о большей значимости данных анамнеза и течения тромбангиита по сравнению с данными лабораторных и функ-циональных методов исследования. Значимые параметры группируются в логические блоки.
В первом блоке данных, важных практически для всех нейросетей, находятся такие параметры, как время появления первых жалоб, длительность наблюдающегося ухудшения, наличие в анамнезе улучшений состояния, а также переохлаждений.
Следующий важный блок данных -сопутствующие заболевания, наиболее важными из которых для нейросетей являются заболевания печени, эрозивный дуоденит, панкреатит и шейный остеохондроз.
Третий блок -показатели, характеризующие заболевание на момент обследования (локализация и тяжесть поражений). Как видно из диаграммы, степень поражения нижних конечностей является одним из наиважнейших параметров. Существенную значимость имеют поражение контралатерального АБ верхних конечностей, флебит нижних конечностей, окклюзия подколенной артерии и артерий голени.
Четвертый важный блок данных -проводившееся в анамнезе лечение, наиболее значимым из которого нейросети посчитали деструкцию надпочечников (11 нейросетей оставили этот параметр и только 5 -исключи-ли). Важными в этом блоке оказались консервативная терапия, показывающая, в конечном итоге, лечился ли во-обще до этого времени больной; пульстерапия, симпатэктомия, эмболизация надпочечников. Практически незна-чимыми оказались проведенные в анамнезе реконструктивные операции и операции на контралатеральной ко-нечности.
Пятый блок данных -параметры, отражающие иммунологический статус больного. По сравнению с вы-шеперечисленными блоками эти параметры обладают меньшей значимостью, однако факт, что из всего списка лабораторных показателей нейросети выделили именно иммунологические данные, указывает, что их учет играет достаточно важную роль при принятии некоторых решений о лечении и прогнозе исхода, что согласуется с дан-ными [106]. Характерно, например, что из четырех видов иммуноглобулинов нейросети оставили действительно самые важные -IgG и IgM, наиболее активно участвующие в иммунологических реакциях.
Из других лабораторных параметров можно выделить, пожалуй, только количество эритроцитов -показа-тель, оставленный пятью нейросетями.
Наконец, последний блок данных, важный только для нейросетей, прогнозирующих непосредственные исходы заболевания, -лечение проведенное в клинике.
Таким образом, минимизация данных позволяет отказаться от использования довольно большого числа параметров при определении оптимальной стратегии лечения больных тромбангиитом и прогнозировании его непосредственных исходов. Во-первых, это существенно облегчает работу пользователя при использовании экс-пертной системы. Во-вторых, это представляет интерес для дальнейшего изучения облитерирующего тромбанги-ита, позволяя сконцентрировать внимание исследователей на наиболее значимых параметрах и провести ряд ис-следований по выявлению их роли в этиологии и патогенезе заболевания.
При определении окончательного набора входных параметров прежде всего было решено отказаться от использования всех данных, исключенных при минимизации всеми нейросетями. Кроме того, были исключены параметры, оставленные одной или двумя нейросетями, если они не входили ни в один из вышеперечисленных значимых блоков. Ниже приводится окончательный список данных.
На базе вновь сформированного списка были обучены новые нейросети с такими же параметрами, как и у нейросетей стартового комплекса. Единственным отличием было меньшее число входных синапсов.
VI.8. Тестирование экспертной системы
Для тестирования экспертной системы мы использовали 35 клинических примеров обследованных и про-леченных больных с известными исходами заболевания. Эти примеры не входили в обучающую выборку.
Тестирование каждого примера проводилось следующим образом. Сначала тестировались 4 нейросети, прогнозирующие непосредственные исходы заболевания, причем в качестве параметров лечения, проведенного в клинике, использовались данные о реально назначенном хирургами лечении. Затем пример тестировался нейросетями, назначающими оптимальный набор методов лечения. После этого проводился повторный тест нейросетями, прогнозирующими исходы, но теперь в пример подставлялись предполагаемые методы лечения, назначенные нейросетями.
Рассмотрим вначале результаты первого теста. Нейросеть, прогнозирующая динамику ишемии, сделала правильное заключение в 29 случаях из 35 (82,9%). Регресс трофических расстройств прогнозировался правильно в 14 из 17 случаях имеющихся трофических расстройств (только у 17 больных имелись трофические расстрой-ства, поэтому в остальных случаях прогноз не имел смысла). Это составило 82,4%. Нейросеть, прогнозирующая динамику болевого синдрома, сделала правильное предсказание в 22 из 25 случаев (88%). Ответы сети, отвечаю-щей за предполагаемую ампутацию, совпали в 33 случаях из 35 (94,3%).
Всего в тестирующей выборке имелось 9 больных, у которых не совпал хотя бы один прогноз. У осталь-ных пациентов все прогнозы делались 4 нейросетями правильно. Из этих 9 больных 7 были отнесены нейросе-тью-”фильтром” к категории “трудных”.
Интерес представляют две ошибки нейросети, прогнозирующей ампутацию. У данных больных ампута-ция не была проведена в сроки госпитализации, однако была выполнена в первые 2 месяца после выписки. Таким образом, нейросеть правильно предсказала отсроченные исходы, поэтому эти два случая нельзя считать явными ошибками.
Рассмотрим результаты теста нейросетей, назначающих лечение больным. Из 35 примеров нейросеть-”фильтр” признала “трудными” 10 больных. Из них у 7 человек лечение, назначенное врачами, проводилось как поддерживающее, так как положительный эффект лечения изначально рассматривался как крайне маловероят-ный.
У 12 примеров из 25 (35 примеров минус признанные “трудными”) лечение, назначенное нейросетями, полностью совпало с реально назначенным хирургами, и только в одном случае прогноз исходов оказался оши-бочным. Рассмотрим этот случай.
Больной С., 42 лет, болен в течение 5 лет, поступил с критической ишемией (IV степени). Больному была назначена консервативная терапия и вазапростан. На фоне такой терапии 3 из 4 нейросетей прогнозировали улучшение состояния пациента. Однако на момент выписки эффекта от лечения не наблюдалось. При дальней-шем наблюдении за больным отмечался регресс ишемии, регресс трофических расстройств и купирование болей в покое.
В остальных случаях наблюдались некоторые расхождения. При этом у 10 больных нейросети назначили другое лечение, которое (по результатам анализа хирургов), можно было действительно назначить данным боль-ным. Исходы, прогнозируемые после такого лечения, были такими же, как и в случае реально назначенных ле-чебных мероприятий.
В 3 примерах лечение, назначенное нейросетями, было похоже (по некоторым методам) на реально назначенное, однако превосходило его по мощности. В этих случаях прогнозировались исходы, гораздо лучшие, чем наблюдавшиеся в реальности.
Приведем достаточно интересный пример, иллюстрирующий работу системы. Больной Ч., 42 лет, дав-ность заболевания 10 лет, ранее неоднократно лечившийся по поводу данного заболевания. На момент поступле-ния наблюдались мультифокальные поражения как верхних, так и нижних конечностей с критической ишемией. Больному была назначена консервативная терапия и предложено проведение РОТ верхней конечности. В данном случае после данной операции врачами предполагался хороший клинический эффект. Однако больной от опера-ции отказался, состояние его осталось без изменений. Нейросети, прогнозировавшие исходы при реально назна-ченном лечении (только консервативная терапия), правильно предсказали отсутствие положительной динамики. Нейросети, отвечающие за стратегию лечения, назначили данному больному консервативную терапию и РОТ, при этом прогнозируемые исходы были оптимистичны.
В заключение главы можно сделать следующие выводы.
Глава VII. Нейросетевая экспертная система дифференциальной диагно-стики "острого живота"
Задача дифференциальной диагностики "острого живота", несмотря на огромное количество разработок в этой области, для практической хирургии остается одной из самых актуальных проблем [100,297]. Свыше 90% больных хирургических стационаров -больные с острыми хирургическими заболеваниями органов брюшной полости [27]; оперативные вмешательства при этой патологии составляют от 20 до 40% всей оперативной дея-тельности хирургических стационаров [6].
При постановке диагноза и планировании лечебных мероприятий от практического хирурга требуется принятие единственно правильного решения, от которого часто зависит жизнь больного. Решение должно быть принято как можно в более сжатые сроки, причем в условиях, зачастую не позволяющих получить развернутые данные лабораторных и инструментальных исследований.
Трудности в постановке точного диагноза связаны с тем, что боли в животе могут сопровождать чрезвы-чайно большое количество заболеваний. Некоторые из них требуют неотложного хирургического вмешательства, лечение других ограничивается консервативными мероприятиями.
Опыт практической хирургии показывает, что наиболее часто встречающимися острыми заболеваниями брюшной полости являются следующие: острый аппендицит (ОА), острый холецистит (ОХ), острый панкреатит (ОП), осложнения язвенной болезни желудка и двенадцатиперстной кишки, острая кишечная непроходимость (ОКН), дифференциальная диагностика которых представляет в некоторых случаях значительные сложности, особенно при поступлении больных в клинику в отдаленные сроки от начала заболевания или с изначально ати-пичным или стертым течением заболевания [127].
Неверная оценка состояния больного приводит, с одной стороны к неоправданным оперативным вмеша-тельствам, с другой стороны -к недооценке тяжести течения заболевания и, следовательно, недостаточно быст-рой и эффективной помощи пациенту [71]. Так, по данным [139] при анализе результатов лечения 1000 больных, поступивших в отделение неотложной помощи по поводу острых болей в животе, обнаружено, что 11 из них ошибочно выписаны, а при повторном поступлении у них обнаружены острые хирургические заболевания (у 8 -ОКН, у 3 -ОА). Авторы [330], проведя анализ неоправданных лапаротомий, пришли к выводу, что дооперацион-ные диагнозы, неподтвержденные на операции, распределяются следующим образом: 56% -ОА, 13% -"острый живот", 7% -ОХ и ОП, 4% -внематочная беременность, 3% -перфорация полого органа.
Наиболее распространенным среди хирургических заболеваний органов брюшной полости является ОА [6,27,69,101]. Заболеваемость ОА среди различных групп населения составляет от 40 до 78 случаев на 10000 населения [36,81,95], а оперативное лечение аппендицита среди других острых заболеваний живота составляет от 30 до 80% [69,85,101] Диагностика ОА в большинстве случаев несложна, однако у 5-7% больных [6] он протекает атипично, что связано с нетипичным расположением отростка, ареактивным течением заболевания у пожилых больных и детей, наличием сопутствующей патологии, беременностью [6]. По данным [101], диагноз острого аппендицита был выставлен ошибочно у 12,6 -14,3% больных.
Весьма опасными осложнениями язвенной болезни желудка и двенадцатиперстной кишки являются про-бодение язвы (по данным некоторых авторов, оно встречается в 6-44,1% случаев осложненной язвенной болезни [6]. По данным [101] перфоративная язва (ПЯБ) неверно диагностировалась в 30% случаев такой патологии, при-чем конкурентными диагнозами являлись ОА, ОКН, ОП, ОХ. Язвенная болезнь, осложненная кровотечением (КЯБ), составляет 8-15% среди всех случаев данной патологии [27,69]. Летальность при этом, по данным [6], со-ставила 16,6%.
ОКН составляет в среднем от 1,2 до 9% всех остро протекающих заболеваний живота [27,80,82]. Несмот-ря на достаточно полное изучение этиопатогенеза, клиники и лечения, ОКН все еще дает высокую летальность, колеблющуюся от 10 до 25% [27,69]. ОХ среди заболеваний органов живота занимает второе место после аппен-дицита и составляет 2-19% [62,69,101]. Процент ошибочных диагнозов по данным [101] составил 15,8-20,39%.
По данным некоторых авторов [80], за последние годы количество случаев панкреатита возросло в 25-30 раз. Работы последнего десятилетия свидетельствуют о том, что частота ОП среди заболеваний "острого живота" колеблется от 0,8 до 11,8 % [27]. По мнению Г.Н.Акжигитова, острый панкреатит в группе острых хирургических заболеваний органов брюшной полости занимает 3 место, уступая лишь острому аппендициту и холециститу [27]. Несмотря на широкую осведомленность врачей об этом заболевании, диагностические ошибки на догоспи-тальном этапе наблюдаются в 50-60% случаев [6]. В работе [69] отмечена прямая связь развития панкреатита с заболеваниями желчевыводящих путей, в частности, с острым холециститом. О связи холецистита с панкреати-том впервые писал еще Керте [230]. Автор работы [73] на основании данных 86 авторов приводит данные за 1964-1970 гг. о том, что в 44,8% случаев панкреатит развился на фоне холецистита, в 44,15% ему предшествовал холецистит. Дилафай обосновал термин холецистопанкреатит [81]. По данным П.В.Кравченко [41], В.В.Виноградова [20], холецистопанкреатит встречается в 12-17%.
Для решения диагностических проблем, возникающих при острых заболеваниях органов брюшной поло-сти, предпринимались неоднократные попытки создания диагностических систем [2,14,28,53,70,94].
Одной из наиболее интересных работ является диагностическая система дифференциальной диагностики "острого" живота, разработанная в 1972 г. Назаровым [57]. При создании системы был обработан огромный мас-сив данных о больных с 11 патологиями. На основании статистической обработки были построен набор правил вывода, позволяющий определять наиболее вероятное заболевание. Система показала хорошие результаты при клинической проверке. Однако нужно заметить, что, как и остальные системы, основанные на формальных алго-ритмах, данная диагностическая машина не может накапливать опыт в процессе работы, и тем более адаптиро-ваться к локальным условиям функционирования, что значительно суживает области применения системы.
VII.1. Характеристика исследованных клинических примеров
Нами было обработаны 216 историй болезней из архивов клинических больниц г. Красноярска, специали-зирующихся на приеме экстренной хирургической патологии -ГКБ N 7, ККБ N1, ГБСМП, что позволило нам работать с уже верифицированными диагнозами, подтвержденными комплексными клинико-лабораторными ис-следованиями, данными гистологического исследования, данными операционных находок. Данные о 49 пациен-тах были получены в результате непосредственного клинического наблюдения от момента поступления в хирур-гический стационар и до постановки окончательного диагноза.
Всего нами было проанализировано 265 клинических примеров. Статистические данные приведены в таблице 7.1.
При определении набора входных параметров, необходимых для принятия решения экспертной системой, мы проанализировали структуру историй болезней различных клиник города, данные литературы, возможности лабораторно-инструментальных баз хирургических стационаров при приеме экстренных больных. Таким обра-зом, набор входных параметров отражает клинический минимум обследования пациента, используемый врачами хирургических отделений в практической деятельности.
Таблица 7.1. Характеристика обследованных больных
Возраст | Пол | |||||||
---|---|---|---|---|---|---|---|---|
Диагноз | n | M ±n | диапазон | Мужчины | Женщины | |||
ОА | 63 | 26,3±1,2 | 15-55 | 26 (41,3%) | 37 (58,7%) | |||
ОХ | 64 | 50,2±2,3 | 18-78 | 11 (17,2%) | 53 (82,8%) | |||
ОП | 52 | 45,9±2,3 | 17-81 | 27 (51,9%) | 25 (48,1%) | |||
ОКН | 27 | 44,3±3,9 | 19-91 | 13 (48,2%) | 14 (51,8%) | |||
КЯБ | 37 | 50,3±2,6 | 16-75 | 24 (64,9%) | 13 (35,1%) | |||
ПЯБ | 22 | 36,8±3,3 | 17-72 | 21 (95,4%) | 1 (4,6%) |
Поскольку данная работа является первым опытом применения компьютерной нейросетевой экспертной системы для дифференциальной диагностики "острого живота", мы не ставили целью охватить все многообразие заболеваний, проявляющихся данным синдромом. На основании описанных в литературе примеров и статистиче-ской информации хирургических клиник города была выделена группа наиболее часто встречающихся заболева-ний, протекающих с синдромом "острого живота": острый аппендицит, острый холецистит, острый панкреатит, острая кишечная непроходимость, язвенная болезнь, осложненная кровотечением и язвенная болезнь, осложнен-ная перфорацией. Этот набор диагнозов и послужил основой для создания экспертной системы.
Для оптимизации работы с клиническими данными была разработана анкета, содержащая набор входных параметров и диагноз, являющийся ответом. Параметры можно разделить на несколько больших групп: жалобы, предъявляемые больным при поступлении в стационар; анамнестические сведения (история болезни и жизни пациента); данные объективного исследования и результаты выполненных на момент поступления лабораторных исследований.
Ниже приводится список исследуемых параметров со способами кодировки информации. Параметры, отмеченные звездочкой (*), кодируются следующим образом: 0 -отсутствие признака, 1 -наличие признака (ло-гический тип).
Паспортная часть
Ф.И.О. пациента ________________________________________ История болезни_______/______ Дата поступления ___/___/1994
Исследуемые параметры
0 -не было,
1 -в сроки 1 год и менее 2 -в сроки 1-5 лет 3 -в сроки 5 лет и более
Локализация боли
Per rectum
Per vagina
0 -обесцвечен 1 -норма 2 -мелена
100. Частота мочеиспускания:
1 -анурия 2 -олигурия 3 -норма 4 -учащенное мочеиспускание
101. Болезненность при мочеиспускании *
Данные лабораторных исследований
Анализ крови:
102. Группа крови _______ 103. Резус-фактор _______ 104. Гемоглобин ______ 105. Эритроциты ______ 106. Гематокрит ______ 107. Тромбоциты ______ 108. Лейкоциты ______ 109. СОЭ ______ 110. Сахар крови ______ 111. Амилаза крови ______ 112. Диастаза мочи ____ 113. Билирубин общий 114. Билирубин прямой ______ 115. Билирубин непрямой ______ 116. Проба Вельтмана _______ 117. АЛТ ______
118. АСТ ______ _ 119. Общий белок ______ 120. Фибриноген _______ 121. Протромбиновое время _______ 122. Протромбиновый индекс _______ 123. Время свертывания крови ______ 124. Натрий плазмы _____ 125. Калий плазмы_____ 126. Кальций крови _____ 127. Хлориды крови _____ 128. Мочевина _____
Анализ мочи:
129. Лейкоциты мочи _____ 130. Эритроциты мочи _____ 131. Белок мочи * 132. Эпителий в моче
0 -нет 1 -единичный 2 -сплошь
VII.2. Постановка задачи
При постановке задачи для обучения нейросетей мы исходили из того, что экспертная система должна выбирать один или несколько предполагаемых диагнозов из заданного набора (6 диагнозов) на основании 131 параметра пациента при поступлении в клинику. Для экспериментов были созданы два набора нейронных сетей, каждый из которых состоял из 7 нейросетей, решающих следующие задачи.
Нейросеть № 0. Шестиклассовый классификатор, выдающий в качестве ответа 1 диагноз из 6.
Нейросеть № 1. Бинарный классификатор со следующим определением классов: 1 класс -ОА; 2 класс -любой другой из 5 оставшихся диагнозов.
Нейросеть № 2. Бинарный классификатор со следующим определением классов: 1 класс -ОХ; 2 класс -любой другой из 5 оставшихся диагнозов.
Нейросеть № 3. Бинарный классификатор со следующим определением классов: 1 класс -ОП; 2 класс -любой другой из 5 оставшихся диагнозов.
Нейросеть № 4. Бинарный классификатор со следующим определением классов: 1 класс -ОКН;2 класс -любой другой из 5 оставшихся диагнозов.
Нейросеть № 5. Бинарный классификатор со следующим определением классов: 1 класс -КЯБ;2 класс -любой другой из 5 оставшихся диагнозов.
Нейросеть № 6. Бинарный классификатор со следующим определением классов: 1 класс -ПЯБ;2 класс -любой другой из 5 оставшихся диагнозов.
Все 14 нейросетей (по 7 в каждом наборе) имели следующие параметры: -число нейронов -6; -число нейронов, на которое подается каждый входной сигнал (плотность) -6; -время отклика -2 такта функционирования;
Наборы различались по характеристике, разной для сетей каждого набора. В первом наборе нейросети имели характеристику 0,1, во втором -0,8.
Обучающие параметры -131 параметр пациента, ответ -диагноз или группа диагнозов согласно выше-приведенной схеме.
Для обучения нейросетей были взяты 216 примеров, данные которых были взяты из историй болезни па-циентов с уже подтвержденными диагнозами.
Остальные 49 примеров больных, наблюдавшихся в клинике, были оставлены для тестирования эксперт-ной системы.
VII.3. Результаты и обсуждение
Все 14 созданных нейросетей и обучающая выборка из 216 примеров были объединены в проект обучения экспертной системы согласно методологии, использующейся в программе AcceStat-2000 “NeuroMaster”.
Общее время обучения 14 нейросетей составило 3 ч. 22 мин. машинного времени. Все нейросети обучи-лись полностью (все примеры обучающей выборки распознавались правильно каждой нейросетью согласно по-ставленной ей задаче).
Результаты клинической проверки.
Для тестирования созданной экспертной системы использовались 49 примеров, не участвующих в обуче-нии нейросетей. В таблице 7.2 приведены результаты тестирования отдельно для каждой нейросети.
Как видно из таблицы, некоторые отдельные нейросети показывают недостаточно высокий результат при тестировании. Однако при работе экспертной системы в тестировании каждого примера принимает участие не одна нейросеть, а набор из 7 сетей -одного 6-классового классификатора и шести бинарных, отвечающих каждый за свое заболевание. Для окончательного набора из 7 нейросетей мы выбрали нейросети, показавшие наилучшие результаты при тестировании: из первого набора -нейросети № 0, 1, 3, 4, 5; из второго набора -нейросети № 2, 6. Возникает вопрос об интерпретации ответов всех сетей, принимающих участие в тестировании и определения окончательного решения о наиболее вероятном диагнозе.
Таблица 7.2.
Результаты теста экспертной системы на 49 примеров тестирующей выборки.
# -означает остальные 5 диагнозов для бинарных классификаторов, обучавшихся различать один диагноз со всеми остальными
Нейросе ть | Число примеров класса /число ошибок | Общее число ошибок на 49 при-мерах |
---|---|---|
1-й набор нейросетей (с характеристикой 0,8) | ||
0 | ОА -19 / 0 ОХ -7 / 4 ОП -12 / 4 ОКН -2 / 0 КЯБ -3 / 0 ПЯБ -6 / 2 | 10 |
1 | ОА -19 / 0 # -30 / 6 | 6 |
2 | ОХ -7 / 3 # -42 / 1 | 4 |
3 | ОП -12 / 5 # -37 / 3 | 8 |
4 | ОКН -2 / 2 # -47 / 1 | 3 |
5 | КЯБ -3 / 0 # -46 / 0 | 0 |
6 | ПЯБ -6 / 4 # -43 / 4 | 8 |
2-й набор нейросетей (с характеристикой 0,1) | ||
0 | ОА -19 / 0 ОХ -7 / 1 ОП -12 / 6 ОКН -2 / 1 КЯБ -3 / 0 ПЯБ -6 / 4 | 12 |
1 | ОА -19 / 0 # -30 / 8 | 8 |
2 | ОХ -7 / 2 # -42 / 2 | 4 |
3 | ОП -12 / 3 # -37 / 6 | 9 |
4 | ОКН -2 / 2 | 3 |
# -47 / 1 | ||
5 | КЯБ -3 / 0 | 0 |
# -46 / 0 | ||
6 | ПЯБ -6 / 2 | 2 |
# -43 / 0 |
Интерпретацию ответов нейросетевого консилиума мы проводили двумя способами -формальным и нейросетевым.
Формальная интерпретация осуществлялась следующим образом. Так как класс, выдаваемый нейросетью в качестве ответа, определяется как номер выходного нейрона, выдавшего наибольший сигнал, то для каждого диагноза устанавливался вес, величина которого складывалась из сигналов нейронов всех сетей, причем именно тех нейронов, которые были ответственны за данный класс (диагноз). В случае бинарных классификаторов сиг-налы нейронов, ответственных за 2 класс (остальные заболевания), прибавлялись к весам соответствующих забо-леваний. В итоге мы получали 6 чисел, показывающих суммарный вес каждого диагноза. Диагноз, набравший наибольший вес, считался окончательным ответом системы.
Таблица 7.3. Результаты двух способов интерпретации теста 49 примеров консилиумом из 14 нейросетей
Число правильно распознанных примеров | |||
---|---|---|---|
Диагноз | Число примеров | Формальный способ интерпрета-ции | Нейросетевой способ интерпрета-ции |
ОА | 19 | 19 (100%) | 19 (100%) |
ОХ* | 7 | 4 (57%) | 5 (71%) |
ОП* | 12 | 10 (84%) | 9 (75%) |
ОКН | 2 | 1 (50%) | 0 (0%) |
КЯБ | 3 | 3 (100%) | 3 (100%) |
ПЯБ | 6 | 4 (66%) | 3 (50%) |
Всего | 49 | 41 (83,7%) | 39 (80,0%) |
* Как будет показано ниже, данные результаты отражают наличие у больных холецистопанкреатита, поэтому имеющиеся ошибки не могут рассматриваться как явные.
Нейросетевой способ интерпретации сводился к обучению 6-классовой нейросети классификатора вычис-лять диагноз на основании ответов нейронов, выданных всеми нейросетями консилиума.
Результаты интерпретации с помощью обоих методов приведены в таблице 7.3.
Формальный способ интерпретации решения нейросетевого консилиума показал незначительное пре-имущество, поэтому и был взят за основу при создании экспертной системы. Таким образом, прогностическая способность экспертной системы после стартового обучения составила 83,7%. Однако мы провели тщательный разбор всех случаев ошибок, который выявил следующие закономерности.
Большинство примеров, на которых нейросети делали ошибки, были одни и те же для многих нейросетей.
Как видно из таблицы, наиболее точно нейросистема диагностирует острый аппендицит и кровотечение при язвенной болезни. Основное количество ошибок возникало при диагностике острого холецистита и острого панкреатита, причем в этих случаях нейросистема путала эти диагнозы между собой. Более того, при этом пра-вильный диагноз набирал вес, находящийся на втором месте. Это означает, что в случае диагностики острого холецистита (наибольший вес) острый панкреатит оказывался на втором месте (следующий по величине вес) и наоборот. Как известно, при развитии патологического процесса в одном из органов панкреато-дуоденальной системы другие органы, как правило, не остаются интактными, и клинически решить вопрос о преобладании па-тологии в одном из них зачастую не представляется возможным. В таких случаях больному выставляется диагноз холецистопанкреатит. Все примеры, которые при тестировании распознавались ошибочно (острый холецистит как панкреатит и наооборот) относились, судя по анализу клинических данных, как раз именно к такой группе. Поэтому 5 из 6 неверных результатов, выданных нейросистемой для этих примеров, не являются явными диагно-стическими ошибками, так как в этих случаях оба диагноза занимали первые два места по набранным весам.
По данным проведенного тестирования, для нейросетевой системы представлял определенные трудности дифференциальный диагноз между острым панкреатитом и перфоративной язвой (2 ошибки), что имеет место и в клинической практике -при остром панкреатите с выраженным болевым синдромом в 4 случаях из 265 проана-лизированных клинических примеров, врачами приемного покоя выносились оба диагноза в качестве предвари-тельного и предпочтение одному из них отдавалось уже в процессе динамического наблюдения за состоянием пациента. Также следует учитывать, что небольшое количество примеров 6 класса (перфоративная язва -22), как показали результаты теста, несомненно, недостаточно для качественного обучения нейросетей.
В одном случае экспертная система распознавала пример 4 класса (ОКН) как острый аппендицит. При анализе примера выявлено, что оба диагноза вынесены врачом приемного покоя в качестве предварительного и в дальнейшем, при изучении данных истории болезни выяснилось, что больная после проведения консервативной терапии была выписана с диагнозом "кишечная колика". Данная ошибка достаточно серьезная и говорит о необ-ходимости расширения списка диагнозов, определяемых экспертной системой.
При создании экспертной системы, в частности, при конструировании экранного окна для выводов ре-зультатов теста, мы исходили из необходимости выведения полной информации о весах всех диагнозов, выдава-емых системой в каждом случае. Так как диагнозы холецистопанкреатита подразумевают наличие одновременно 2 ответов (два к ласса), случаи, когда веса этих двух ответов находятся рядом, не могут рассматриваться как ошибки работы системы, при этом наиболее вероятный диагноз формулируется как холецистопанкреатит. С уче-том этой поправки, прогностическая способность системы составляет 93,9% (3 ошибки из 49 примеров).
VII.4. Минимизация обучающих параметров
Для выяснения наиболее значимых параметров и возможной минимизации их набора было проведено обучение нейросетей со ступенчатой минимизацией параметров до предельно малого их числа.
Минимизация и оценка качества тестирования проводились следующим образом. Вычислялась значи-мость параметров отдельно для каждой из нейросетей, входящих в окончательный набор. Затем по каждому па-раметру подсчитывалась сумма относительных показателей значимости, выданных каждой нейросетью. Пара-метр, набравший минимальную сумму, считался наименее значимым и исключался из обучения (у всех нейросе-тей закрывались входные синапсы, соответствующие этому параметру). После этого проводилось доучивание всех нейросетей и тест контрольной выборки. Минимизация была остановлена, как только одна из нейросетей перестала обучаться.
На рисунке 7.1 изображен график, иллюстрирующий, как изменялось количество правильно распознан-ных примеров тестирующей выборки в зависимости от набора параметров в течение процесса минимизации. Ди-агностическая точность стала снижаться после того, как число параметров стало менее 103 и упала до 65,3% (32 примера из 49) при минимально возможном числе параметров (29). Интересно, что в некоторых случаев умень-шение числа обучающих параметров несколько повышало диагностическую точность.
Число правильно распознанных пример
50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 35 34 33 32 31 30
131121111101 91 81 71 61 51 41 31
Количество обучающих параметров
На рисунке 7.2 приводится минимальный набор параметров, при котором все нейросети полностью обу-чались с соответствующей суммарной относительной значимостью каждого из этих параметров. Так как приво-димая значимость параметров складывается из показателей значимости параметров для всех нейросетей (отвеча-ющих за различные диагнозы), диаграмма показывает, насколько в среднем значим для нейросетевого консилиу-ма каждый параметр при выборе одного из 6 выбранных диагнозов. Как видно, тремя наиболее значимыми пара-метрами являются боль в правом подреберье, симптом Ортнера и наличие камней. Очевидно, что высокая значи-мость этих параметров отражает необходимость дифференцировки “на первом этапе” заболеваний печени и под-желудочной железы от остальных выбранных диагнозов. Эта информация не представляет практического интере-са, однако иллюстрирует опорные точки в диагностике, которые использует нейросетевой консилиум.
Значимость
0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0
1 3 5 7 9 11131517192123252729
Параметры
Рисунок 7.2. Минимальный набор параметров, на котором обучаются все нейросети набора и суммарная относительная значимость каждого из этих параметров:
1 (3). Пол 2 (15). Слабость 3 (17). Рвота желудочным содержимым 4 (19). Рвота "кофейной гущей" 5 (20). Рвота желчью 6 (27). Бледность кожных покровов 7 (28). Акроцианоз 8 (32). Нарушение ритма сердечных сокращений 9 (33). Боль (нет, тупая, острая) 10 (34). Постоянная боль 11 (37). Колющая боль 12 (41). Боль в эпигастрии 13 (43). Боль в левом подреберье 14 (46). Боль в правой подвздошной области 15 (50). Боль в левой половине грудной клетки 16 (56). Иррадиация боли в левую половину грудной клетки 17 (67). Погрешность в диете накануне заболевания 18 (69). Физическое перенапряжение в анамнезе 19 (70). Операции на органах брюшной полости в анамнезе 20 (78). Симптом Кохера 21 (79). Симптом Щеткина -Блюмберга 22 (80). Симптом Ровзинга 23 (81). Симптом Воскресенского 24 (85). Симптом Ортнера 25 (86). Френикус-симптом 26 (91). Печень увеличена 27 (93). Наличие камней 28 (98). Характер стула 29 (99). Цвет кала
В число наиболее значимых параметров попали основные характеристики болевого синдрома, важные диагностические признаки (симптомы Кохера, Щеткина -Блюмберга, Ровзинга, Воскресенского) и большинство основных характеристик клинического состояния пациента.
Таким образом, набор из 29 параметров является минимально допустимым для работы экспертной систе-мы, при этом необходимо учитывать, что увеличение числа вводимых параметров существенно повышает диа-гностическую точность системы.
Проведенное исследование позволяет сделать следующие выводы:
Глава VIII. Нейросети для изучения иммунореактивности
Недостаток четких лабораторных критериев иммунологической недостаточности, большая вариабель-ность различных показателей состояния иммунной системы [47], особенно при разных патологиях, определяет необходимость поиска простых и эффективных методов, позволяющих дифференцировать состояния иммуноре-активности. Наибольшей информативностью обладают показатели субпопуляционного состава лимфоцитов кро-ви, а также параметры их внутриклеточного метаболизма [66]. Однако трудно делать вывод о состоянии иммун-ной системы, основываясь на величинах отдельных параметров. Необходима комплексная оценка, учитывающая многообразие гомеостатических состояний иммунной системы.
Мы попытались применить нейросети для диагностики вторичной иммунологической недостаточности -иммунодефицита (ИД). Причинами его являются многие факторы в различном сочетании (другие заболевания, вредные привычки, наследственная предрасположенность, экологические и социальные условия, питание, авита-миноз и др.). В отличие от первичного ИД, причиной которого являются явные, легко выявляемые генетические дефекты, диагноз вторичного ИД весьма сложен.
При иммунологическом обследовании в крови больного определяют различные показатели, главные из которых -количество лимфоцитов (клеток иммунной системы) и абсолютные и относительные (соотношения) количества различных классов лимфоцитов. Кроме того, полезно оценить активность основных внутриклеточных ферментов лимфоцитов и содержание в крови иммуноглобулинов. На основании полученной иммунограммы нужно установить, имеется ли у обследуемого ИД. Сложность заключается в том, что даже у здорового человека могут наблюдаться существенные сдвиги отдельных параметров, а яркий больной может иметь незначительные изменения. Все это связано во-первых, с индивидуальными особенностями иммунной системы, а во-вторых, им-мунная система может на короткое время среагировать на какие-либо внешние воздействия (стресс, переохла-ждение, переутомление) весьма непредсказуемым образом.
Поэтому необходимо оценивать весь комплекс параметров сразу во всех имеющихся взаимосвязях, что на глаз сделать довольно трудно даже для достаточно опытного врача.
VIII.1. Постановка задачи и результаты обучения нейросетей
Первоначально нейросети была поставлена задача научиться по набору параметров давать простой ответ: имеется ИД у больного или нет. Была сформирована обучающая выборка, состоящая из тщательно обследован-ных людей, диагноз которым был установлен на основании клинического и иммунологического анализа. Она состояла из двух классов; первый -здоровые люди (51 человек), второй -с диагнозом ИД (42 человека). У обсле-дуемых изучалась активность основных внутриклеточных ферментов лимфоцитов [77], проводились иммуноло-гические тесты первого уровня [49,249]. Определялось содержание в крови лейкоцитов, иммуноглобулинов раз-личных классов (IgA, IgM, IgG, IgE), циркулирующих иммунных комплексов (ЦИК), относительное и абсолют-ное количество лимфоцитов и их субпопуляций: тотальных розеткообразующих клеток (т-РОК), теофиллинрези-стентных (ТФР-РОК), теофиллинчувствительных (ТФЧ-РОК), ранних (р-РОК), и стабильных (с-РОК) [35,220]. Эти показатели служили обучающими параметрами.
Нейросеть состояла из 6 нейронов, плотность -6, время отклика -2, характеристика -0,8.
Несмотря на кажущуюся простоту задачи и многочисленные попытки, нейросеть не смогла обучиться решать задачу в поставленном виде. Тогда было решено постепенно исключать из обучения самые трудные при-меры (имеющие максимальную оценку), чтобы добиться полного обучения на оставшихся. Программа MN_TRAIN делала это автоматически, исключая труднейший пример каждый раз, когда нейросеть заходила в локальный минимум и не могла обучаться далее. Естественно, в конце концов сеть обучилась полностью, исклю-чив из обучающей выборки 30 примеров. После обучения было обнаружено, что все до одного исключенные примеры относятся ко 2 классу (больные с ИД). Таким образом, группа примеров 2 класса оказалась разделенной нейросетью на 2 подгруппы (исключенную и оставшуюся). Далее была проведена статистическая обработка по-лученных групп.
Общая группа индивидуумов с диагнозом ИД достоверно отличалась от группы здоровых только по од-ному показателю клеточного метаболизма (фон НАДФ-МДГ, Таб. 8.1) и одному показателю клеточного иммуни-тета (соотношение ТФР-РОК/ТФЧ-РОК, Таб. 8.2). Оставшаяся же группа лиц достоверно отличалась от здоровых людей уже по 8 исследуемым параметрам (причем все они превышали аналогичные параметры у здоровых лю-дей).
Таблица 8.1. Активность НАД(Ф)-зависимых дегидрогеназ лимфоцитов крови у здоровых людей, лиц с иммунодефи-цитом и в группах, выделенных нейросетью (мкЕ + m)
Группы лиц с ИД | ||||
---|---|---|---|---|
Параметры | Здоровые n=51 1 | общая n=42 2 | оставшаяся n=12 3 | исключенная n=30 4 |
Фон Г6ФДГ | 0,03±0,002 | 0,03±0,003 | 0,03±0,006 | 0,03±0,003 |
Фон Г3ФДГ | 5,15±0,71 | 5,12±0,78 | 7,49±2,32 | 4,17±0,59 |
Фон ЛДГ | 2,51±0,44 | 2,44±0,33 | 3,50±0,59 | 2,01±0,38 P3<0,05 |
Фон МДГ | 5,10±0,77 | 4,51±0,69 | 6,97±1,65 | 3,52±0,66 P3<0,05 |
Фон НАДФ-МДГ | 0,11±0,01 | 0,08±0,007 Р1<0,05 | 0,09±0,01 | 0,08±0,008 P3<0,05 |
Фон НАДФ-ГДГ | 0,44±0,11 | 0,48±0,12 | 1,05±0,35 P1<0,05 | 0,26±0,08 P3<0,01 |
Фон НАД-ГДГ | 3,16±0,42 | 3,67±0,40 | 5,24±0,90 P1<0,05 | 3,04±0,40 P3<0,05 |
Г6ФДГ | 4,75±1,05 | 5,73±0,90 | 9,75±2,19 P1<0,05 | 4,12±0,78 P3<0,01 |
Г3ФДГ | 6,38±1,09 | 6,38±1,22 | 11,65±3,15 | 4,27±1,00 P3<0,01 |
ЛДГ | 8,06±1,03 | 8,29±0,85 | 9,33±1,43 | 7,87±1,05 |
МДГ | 14,77±1,59 | 14,53±1,40 | 17,02±2,80 | 13,53±1,64 |
НАДФ-МДГ | 0,92±0,26 | 1,78±0,50 | 2,54±1,17 P1<0,05 | 1,47±0,54 |
НАДФ-ГДГ | 1,53±0,51 | 1,75±0,57 | 2,53±1,02 | 1,44±0,69 |
НАД-ГДГ | 6,68±0,68 | 7,16±0,83 | 9,77±1,93 | 6,11±0,84 P3<0,05 |
Обратная ЛДГ | 38,90±9,10 | 35,60±9,80 | 75,30±28,40 | 19,69±6,9 |
P3<0,001 | ||||
Обратная МДГ | 151,00±19,60 | 109,20±15,20 | 181,10±35,10 | 80,4±13,7 P3<0,01 |
ГР | 6,38±0,86 | 6,55±0,86 | 8,53±1,13 | 5,76±0,87 |
Группы лиц с ИД | ||||
---|---|---|---|---|
Параметры | Здоровые n=51 1 | общая n=42 2 | оставшаяся n=12 3 | исключенная n=30 4 |
Лейкоциты | 5,97±0,34 | 6,38±0,42 | 7,72±1,11 P1<0,05 | 5,85±0,38 P3<0,05 |
Лимфоциты % | 44,7±1,2 | 43,5±1,5 | 41,8±3,2 | 44,2±1,7 |
Лимфоциты абс. | 2,60±0,14 | 2,80±0,18 | 3,28±0,37 P1<0,05 | 2,60±0,20 |
т-РОК % | 62,6±2,0 | 68,1±1,9 | 69,5±4,0 | 67,5±2,3 |
т-РОК абс. | 1,74±0,12 | 1,91±0,13 | 2,24±0,21 | 1,78±0,15 |
ТФР-РОК % | 40,9±1,7 | 45,3±1,9 | 39,8±3,4 | 47,3±2,3 P1<0,05 |
ТФР-РОК абс. | 1,11±0,09 | 1,26±0,11 | 1,23±0,23 | 1,27±0,13 |
ТФЧ-РОК % | 24,0±1,5 | 24,6±2,3 | 32,1±5,5 P1<0,05 | 21,7±2,3 P3<0,05 |
ТФЧ-РОК абс. | 0,67±0,07 | 0,68±0,08 | 0,95±0,16 | 0,58±0,08 P3<0,05 |
р-РОК % | 46,3±1,5 | 45,3±1,8 | 44,7±3,8 | 45,6±2,1 |
р-РОК абс. | 1,29±0,1 | 1,28±0,10 | 1,49±0,22 | 1,19±0,11 |
с-РОК % | 8,1±1,1 | 8,5±1,0 | 9,3±1,8 | 8,1±1,2 |
с-РОК абс. | 0,23±0,03 | 0,28±0,04 | 0,39±0,09 P1<0,05 | 0,23±0,04 |
ТФЧ / ТФР | 2,07±0,17 | 2,94±0,4 P1<0,05 | 1,68±0,38 | 3,42±0,52 P1<0,01,P3<0,05 |
IgA | 2,17±0,45 | 1,54±0,08 | 1,56±0,13 | 1,54±0,10 |
IgM | 0,57±0,04 | 0,67±0,09 | 0,92±0,26 P1<0,05 | 0,57±0,06 |
IgG | 8,97±0,41 | 8,80±0,37 | 9,43±0,59 | 8,53±0,47 |
IgE | 15,76±3,03 | 15,34±3,47 | 11,82±3,72 | 16,74±4,65 |
ЦИК | 35,68±5,29 | 31,43±4,71 | 34,55±8,05 | 30,00±6,12 |
156,6
160
140100105,112084,7
100
%80
60
40
20
0
Рисунок 8.1. Иллюстрация сдвигов клеточного метаболизма лимфоцитов (приведены суммарные относи-тельные величины) у больных с иммунодефицитными состояниями в сравнении со здоровыми людьми.
Уровень клеточного метаболизма лимфоцитов:
В подгруппе больных, примеры которых были исключены в процессе обучения нейросети Исклю-ченная группа достоверно отличалась от группы здоровых по 2 показателям иммунного с татуса. Однако наибольшее количество достоверных различий наблюдалось между исключенной и оставшейся группами -10 по параметрам клеточного метаболизма и 4 по параметрам иммунного статуса.
Анализ направлений параметров в полученных подгруппах показал противоположную направленность сдвигов некоторых из них по сравнению с группой здоровых. Наиболее яркие противонаправленные сдвиги наблюдались почти по всем параметрам активности внутрилимфоцитарных ферментов (Рис. 8.1). Интерес пред-ставляет также достоверный разнонаправленный сдвиг соотношения ТФР-РОК/ТФЧ-РОК, указывающий на раз-личную направленность дифференцировки лимфоцитов в подгруппах, выделенных нейросетью.
Анализируя примеры больных, попавших в разные подгруппы, можно предположить, что нейросеть, ис-пользуя заданные обучающие параметры, разделила общую выборку лиц с ИД на две группы с различными со-стояниями иммунореактивности.
В оставшейся группе при депрессии иммунного ответа наблюдается компенсаторная реакция иммунной системы, проявляющаяся прежде всего увеличением активности внутриклеточных ферментов.
В исключенных примерах большинство метаболических показателей приближается к аналогичным пара-метрам здоровых индивидуумов и, вероятно, наблюдается компенсаторная реакция, выражающаяся в активации иммунореактивности [76].
Таким образом, в данном случае нейронная сеть, обучавшись на неверно заданной классификационной модели (что сначала не было известно исследователям), стала источником гипотезы о разнородности одного из классов.
С учетом скорректированной классификационной модели были инициализированы 10 новых нейросетей-экспертов для классификации теперь уже всех 3 полученных групп. Нейросети имели параметры, аналогичные предыдущей. Все они полностью обучилась различать заданные 3 новых класса. При анализе значимости обуча-ющих параметров самыми информативными оказались соотношение ТФР-РОК/ТФЧ-РОК и активности дегидро-геназ лимфоцитов.
Таким образом, новые 3-классовые нейросети накопили определенный опыт дифференцировки трех со-стояний иммунореактивности -характерного для здоровых людей (1 класс) и две фазы измененной иммунореак-тивности, характерной для состояний вторичного иммунодефицита (2 и 3 классы).
VIII.2. Применение обученных нейросетей для изучения иммунореактивности при язвенной болезни желудка и двенадцатиперстной кишки
С помощью полученной нейросетевой модели было решено изучить состояния иммунореактивности у больных язвенной болезнью желудка (ЯБЖ) и двенадцатиперстной кишки (ЯБДПК).
Выбор данной патологии был обусловлен тем, что, несмотря на достаточно многочисленные исследова-ния иммунного статуса у больных язвенной болезнью, данные, приводимые в литературе, весьма противоречивы [78].
Авторы работы [21] не выявили никаких различий в показателях гуморального иммунитета между здоро-выми лицами и больными язвенной болезнью. В [12] указывается на снижение концентрации иммуноглобулинов всех классов у больных язвой желудка. Обнаружено увеличение концентрации иммуноглобулина А при неизмен-ном уровне IgM и IgG у больных неосложненными формами язвенной болезни [45], однако большинство иссле-дователей приводят данные об увеличении у больных язвой титров иммуноглобулинов всех классов [52,58]. Вы-явлено снижение общего количества лимфоцитов при ЯБ [42].
Количество в крови В-лимфоцитов по-разному оценивается в литературе. В [7] выявлено снижение абсо-лютного и относительного количества В-клеток у больных, но большинство исследователей все же находят по-вышение количества В-лимфоцитов при ЯБ, особенно в стадии обострения [38,52,87]. Данные о содержании у больных ЯБ количества Т-лимфоцитов в крови также противоречивы. Авторы [79] не выявили различий в содер-жании Т-лимфоцитов между больными ЯБ и здоровыми лицами, тогда как в работе [1] говорится о повышенном количестве Т-клеток у больных. Большинство же авторов выявляли снижение как относительного, так и абсо-лютного количества Т-лимфоцитов у больных язвой [7,12,38,52,87]).
Исследовав состояние клеточного иммунитета при язвенной болезни с различной степенью тяжести, ав-торы [45] выявили у больных неосложненными формами язвенной болезни лишь тенденцию к снижению количе-ства Т-лимфоцитов и теофиллинчувствительных лимфоцитов; при усугублении тяжести заболевания эти показа-тели оказались несколько ниже; при осложненных формах язвенной болезни наблюдалось резкое снижение пока-зателей. В работе [58] показано, что снижение количества Т-лимфоцитов более выражено при язвах с локализа-цией в желудке (в 67% случаев), чем при язвах ДПК (53%). Некоторые исследователи находят при язвенной бо-лезни увеличенное количество малодифференцированных форм Т -лимфоцитов [93]. По данным авторов, этот показатель был особенно высок в группе больных язвенной болезнью ДПК. Снижение количества Т-хелперов и увеличение количества Т-супрессоров при язвенной болезни отмечают в [38]. Уменьшение количества клеток обеих субпопуляций найдено в исследованиях [7,52].
Повышение функциональной активности Т-лимфоцитов у больных язвой описывают в [79], и наоборот, снижение ее найдено в [43]. В последней работе также приводятся данные о снижении функциональной активно-сти клеток, относящихся к субпопуляции Т-супрессоров. Авторы [9] обнаружили увеличение супрессорной ак-тивности Т-лимфоцитов.
Необходимо отметить, что при значительном количестве работ, выполненных иммунологическими мето-дами, структурно-метаболические параметры лимфоцитов при ЯБЖ и ЯБДПК изучены явно недостаточно. Меж-ду тем, как показали результаты нейросетевой кластеризации, активность основных внутриклеточных ферментов лимфоцитов достаточно значимо изменяется при различных фазах иммунодефицитного состояния.
Учитывая широкую распространенность язвенной болезни и недостаточную эффективность профилакти-ческих, а часто и лечебных мероприятий, дальнейшие исследования патогенеза заболевания и подходов к кор-рекции нарушений основных гомеостатических и регуляторных систем остаются актуальными.
Всего нами было обследовано 186 человек в возрасте от 17 до 55 лет: для контроля теста были взяты 50 здоровых лиц без хронической патологии (средний возраст 40,0±1,8 г.), 56 больных ЯБЖ (средний возраст 44,1±1,8 г. ), и 80 больных ЯБДПК (средний возраст 41,2±1,2 г.). Для обследования были отобраны лица, у кото-рых не было сопутствующих острых и хронических заболеваний. Все больные были обследованы в стадии обострения язвенной болезни при поступлении в стационар и до назначения им терапевтических мероприятий. Верификация диагноза проводилась с учетом прежде всего данных эндоскопического исследования.
Кроме перечисленных параметров, у всех обследованных изучалось содержание моноаминов (катехола-минов и серотонина) в лимфоцитах флюоресцентным методом, определялся фенотип HLA [307] и относительный показатель текучести мембран лимфоцитов с помощью флюоресцентного зонда МБА.
Все 186 примеров обследованных лиц были протестированы 10 обученными нейросетями для выяснения, к какому из 3 классов, по мнению нейросетевого консилиума, принадлежит каждый пример. Итоговое решение нейросетевого консилиума об ответе определялось формальным методом путем суммирования сигналов выход-ных нейронов. Класс, набравший максимальную сумму, считался окончательным ответом.
Прежде всего было проанализировано, как распределились 3 класса иммунореактивности среди групп обследованных лиц по диагнозам (Таб. 8.3).
Таблица 8.3. Распределение классов иммунореактивности среди обследованных групп (здоровые и больные ЯБЖ и ЯБДПК)
Класс иммуно-реактивности | Здоровые | Больные ЯБЖ | Больные ЯБДПК |
---|---|---|---|
1 | 44 (88%) | 4 (7,1%) | 12 (15%) |
2 | 2 (4%) | 8 (14,2%) | 63 (78,8%) |
3 | 4 (8%) | 44 (78,7%) | 5 (6,2%) |
Всего ------------> | 50 (100%) | 56 (100%) | 80 (100%) |
Из таблицы видно, что 44-м примерам из 50 здоровых лиц нейросети определили 1 класс, соответствую-щий нормальной иммунореактивности. Однако интерес представляет распределение классов в зависимости от локализации язвы у больных язвенной болезнью. Большинство больных ЯБЖ были отнесены нейросетями к 3 классу со сниженной активностью лимфоцитарных дегидрогеназ, а большая часть больных ЯБДПК были распо-знаны как 2 класс, для которого характерна активация этих ферментов.
Был проведен статистический анализ всех параметров у 186 обследованных лиц. Анализ проводился при делении выборки на подгруппы как по диагнозам, так и по классам иммунореактивности, полученным при тести-ровании нейросетями. Результаты его подтвердили выявленные закономерности. Интерес представляют резуль-таты статобработки параметров, не участвовавших в обучении и тесте нейросетей -содержания в перифериче-ской крови катехоламинов и серотонина (Таб. 8.4) и показателя текучести мембран лимфоцитов.
Таблица 8.4. Содержание катехоламинов и серотонина в лимфоцитах обследованных лиц по подгруппам, соответству-ющим классу иммунореактивности
Параметр, | 1 класс | 2 класс | 3 класс |
---|---|---|---|
мВ | 1 | 2 | 3 |
Катехоламины | 14,42±0,74 | 19,84±1,11 P1,3<0,001 | 12,79±1,34 |
Серотонин | 42,61±6,17 | 40,16±3,23 P3<0,01 | 59,51±6,84 |
Показатель текучести мембран лимфоцитов (определяемый с помощью флюоресцентного зонда МБА) обследованных лиц по подгруппам, соответствующим классу иммунореактивности также имел различную направленность сдвига (1 класс -24,69±2,07, 2 класс -21,12±1,47, 3 класс -34,53±2,32; P1,3<0,01, P2,3<0,001).
Следует отметить, что содержание и соотношение катехоламинов и серотонина в клетках хорошо согла-суется с активностью внутриклеточных ферментов и, очевидно, с одной стороны влияет на их уровень (особенно ферментов энергетического цикла и отчасти пентозо-фосфатного пути), с другой стороны, уровень энергетики и биосинтетических процессов определяют и интенсивность синтеза рецепторов на мембранах лимфоцитов, связы-вающих биологически активные вещества крови. Проведенное исследование убедительно показало, что для больных язвенной болезнью с различной локализацией язвы характерны различные состояния иммунореактивно-сти, проявляющиеся как на уровне внутриклеточного обмена иммунокомпетентных клеток, так и на уровне меж-клеточных взаимодействий лимфоцитов.
Однако требовалось ответить на вопрос, с чем наиболее тесно связаны наблюдающиеся изменения внут-риклеточного метаболизма лимфоцитов -с классом измененной иммунореактивности или с наличием язвы опре-деленной локализации? Ответ на этот вопрос подразумевает вы явление причинно-следственных взаимосвязей между наличием язвы и состоянием иммунной системы. Эта проблема дискутируется многими авторами [78,155] -является ли язвенная болезнь причиной иммунологических и внутрилимфоцитарных метаболических сдвигов, или исходные патологические состояния иммунной системы приводят к возникновению язвенной болезни.
При проведении статистических исследований выявленные закономерности в изменении параметров про-слеживались как при группировке обследуемых по классам иммунореактивности (согласно тесту нейросетями), так и при группировке по диагнозам (отсутствие язвы, ЯБЖ, ЯБДПК). Оба вида группировки были достаточно близки, и при сравнении показателей не удавалось выявить достоверно более тесные закономерности в том или другом способе группировки. Некоторые параметры больше различались в группах с разными диагнозами, дру-гие же -в группах с разной иммунореактивностью.
Мы попытались использовать нейросетевой метод для исследования данных взаимосвязей. Для этого бы-ли созданы 40 пар 3-классовых нейронных сетей. В каждой паре нейросети имели идентичные стартовые матри-цы синаптических связей и одинаковые параметры -число нейронов (6), плотность (6), время отклика (2), харак-теристика (0,4). Однако нейросетям в каждой паре были поставлены разные задачи: одной -по набору из 39 ис-следованных параметров обучиться распознавать класс иммунореактивности, другой -по тому же набору пара-метров распознавать диагноз. Таким образом, каждой задаче, соответствующей тому или иному способу группи-ровки, обучались по 20 нейросетей.
Расчет строился на том, что в одном из способов группировки присутствуют все же более тесные законо-мерности в сдвигах параметров, и нейросети, соответствующие данному способу, в среднем обучатся быстрее, что могло быть статистически подтверждено вследствие достаточно большого количества нейросетей. Измерение среднего количества тактов обучения нейросетей в каждой задаче показал следующие результаты: при группи-ровке по диагнозам -34812±2452, при группировке по классам иммунореактивности -32346±3610 тактов обуче-ния. Хотя при втором способе среднее число тактов обучения несколько меньше, применение парного критерия Стьюдента показало, что достоверного различия между этими величинами нет, поэтому данный эксперимент не позволил ответить на поставленный вопрос.
При анализе полученных результатов было сделано предположение о различающихся причинно-следственных связях между локализацией язвы и изменениями иммунореактивности в зависимости именно от локализации язвы. Поэтому был проведен повторный эксперимент, однако задача обучения нейросетей теперь была поставлена шире -для каждой локализации язвы в отдельности. Было создано два набора по 40 теперь уже бинарных нейросетей-классификаторов. Схема постановки задачи и результаты обучения представлены в табли-це 8.5.
Как видно, разделение задачи выявило закономерности в скорости обучения сетей. В первом наборе (за-дача с 3-м классом иммунореактивности и соответствующей ему ЯБЖ) нейросети, распознающие класс иммуно-реактивности, обучились несколько быстрее (хотя имеется только тенденция к достоверному различию). Это ука-зывает на более тесную взаимосвязь сдвигов параметров при ЯБЖ именно с классом иммунореактивности. Во втором наборе наблюдается противоположная картина -нейросети, связывающие параметры с диагнозом ЯБДПК обучились достоверно быстрее.
Таблица 8.5. Схема постановки эксперимента и его результаты -среднее количество тактов обучения нейросетей в комплектах
1 набор нейросетей | 2 набор нейросетей | ||
---|---|---|---|
Первые сети в парах | Вторые сети в парах | Первые сети в парах | Вторые сети в парах |
обучаются различать 1 | обучаются различать | обучаются различать 1 | обучаются различать |
и 3 классы иммуноре- | здоровых и больных | и 2 классы иммуноре- | здоровых и больных |
активности | ЯБЖ | активности | ЯБДПК |
22788±2034 | 26624±26664 | 24936±2182 | 18512±1285 |
P<0,1 | P<0,05 |
Полученные результаты позволяют сделать предположение о том, что нарушения иммунореактивности, проявляющиеся снижением уровня метаболизма лимфоцитов и уменьшением текучести их мембран, играют определенную роль в возникновении и развитии ЯБЖ и могут быть одним из первичных звеньев патогенеза этого заболевания. Это согласуется с повышенным содержанием в лимфоцитах этих больных серотонина [48].
При ЯБДПК выявленные изменения, возможно, наоборот, являются следствием патологического процес-са в стенке двенадцатиперстной кишки. Это косвенно подтверждается повышенным содержанием катехоламинов в лимфоцитах у больных ЯБДПК [8,22]. Выявленные изменения можно объяснить стрессовыми воздействиями на организм, если принять их доминирующее положение в этиопатогенезе язвенной болезни.
В пользу предлагаемой гипотезы говорят и данные, полученные при изучении распределения HLA-антигенов. Продукты генов HLA являются ключевыми детерминантами для взаимодействия иммунокомпетент-ных клеток.
У больных ЯБЖ выявлено достоверное повышение частоты встречаемости в локусе А антигенов HLA-A1 и Aw19 (реальный риск -2,82 и 4,90 соответственно); в локусе В -антигенов HLA-B21 и B35 (реальный риск -5,55 и 3,31 соответственно), что согласуется с данными [78,155]. Повышение частоты антигена HLA-A1, по-видимому, связано с тем, что между генами HLA-A1 и B35 выявляется очень высокая степень неравновесного сцепления (гаметная ассоциация -0,124). Такое сильное неравновесное сцепление не фиксируется ни для каких других антигенов HLA у обследованных нами больных и в контроле. У больных с ЯБЖ выявляется также высо-кое неравновесное сцепление между генами HLA-A1 и B8 (гаметная ассоциация -0,067), однако это обычная картина, наблюдаемая почти во всех популяциях Европы. Повышение частоты встречаемости гена HLA-A1 у больных ЯБЖ скорее всего вторично за счет повышения частоты гена HLA-B35 и наличия высокого неравновес-ного сцепления между этими генами.
В отношении антигена HLA-Aw19 следует заметить, что помимо широкой специфичности, у этого гена имеется 5 сплитов, что вызывает затруднение при его идентификации. M.S.Schanfield (1980), составляя мировую сводку по распределению всех антигенов системы HLA в популяциях земного шара, не включил в нее только данные, касающиеся антигена HLA-Aw19 именно в связи с отсутствием четкости и надежности выявления этого антигена.
Повышение антигена HLA-B21 тоже нельзя считать доказанным, хотя для этого гена у больных язвенной болезнью желудка фиксируется большое значение реального риска (5,55). Следует учитывать, что ген HLA-B21 редко встречается в популяции, поэтому велика вероятность случайного накопления его у больных.
Заслуживает внимания лишь повышение частоты встречаемости антигена HLA-B35 при ЯБЖ.
При язвенной болезни ДПК картина иная. Частота антигена HLA-B35 у этих больных даже ниже, чем в контроле. Достоверное повышение фиксируется для антигенов HLA-A10 -в локусе А и антигенов HLA-B5, B16 и B21 в локусе В (реальный риск -3,97; 2,59; 2,18 и 2,10 соответственно). Еще раз хотелось бы подчеркнуть, что в связи с низкой популяционной частотой антигена HLA-B21 трудно составить окончательное суждение о значи-мости повышения частоты этого антигена у больных. То же самое можно сказать в отношении антигена HLAB16.
Таким образом, для ЯБДПК выявляется две сильных ассоциации с генами системы HLA, в то время как для ЯБЖ -только одна. Анализ литературы показал, что ассоциации ЯБДПК с антигеном HLA-B5 обнаружены многими авторами [78,155].
Таким образом, была показана возможность использования нейронных сетей для постановки и проверки гипотез. Данные, полученные в результате проведенного исследования, хорошо согласуются с хорошо известны-ми различиями клинической картины при язвах желудка и ДПК, что послужило поводом для попыток разделить язвенную болезнь на две разные нозологические формы [78]. Однако очевидно, что высказанная гипотеза о раз-личии причинно-следственных связей между локализацией язвы и изменениями иммунореактивности требует проведения дополнительного исследования.
В заключение главы можно сделать следующие выводы.
Заключение
Новые экономические условия функционирования учреждений здравоохранения России, переход к си-стеме медицинского страхования требует серьезной перестройки организации их работы. Одним из важнейших факторов, способствующих успеху этих проектов, является внедрение новых высокоэффективных технологий, прежде всего в области информационного обеспечения предприятий. Наряду с сервисными информационными системами (СУБД, текстовые редакторы, коммуникационные, деловые и офисные программные пакеты) все большее внимание уделяется компьютерным экспертным системам, оказывающим специалистам помощь в при-нятии решений, диагностике, прогнозировании, управлении и оптимизации.
Наибольшее распространение экспертные системы получили в таких областях, как экономика, медицина, научные исследования. Однако, несмотря на имеющиеся серьезные разработки, практическое применение экс-пертных систем сдерживается сложностью и высокой стоимостью их создания, а главное -ограниченными воз-можностями оптимизации существующих технологий к работе конкретных специалистов.
Проведенное нами исследование имело целью разработку и проверку принципиально новой технологии создания компьютерных экспертных систем. Первая и главная особенность этой технологии -возможность ее использования предметными специалистами без участия математиков и программистов. Второй особенностью является возможность создания индивидуальных экспертных систем, максимально адаптированных к условиям работы не только данного учреждения, но и конкретного специалиста. Третья отличительная черта заключается в том, что создаваемые системы способны к постоянному автоматическому динамическому изменению -улучше-нию и оптимизации собственных алгоритмов, по которым осуществляется вычисление результата. Это означает, что система никогда не является сделанной раз и навсегда -в процессе работы она может накапливать свой опыт. Четвертая особенность -при разработке системы отсутствует стадия формализации предметных знаний. Это осо-бенно важно для медицинских задач, в которых зачастую трудно или невозможно формализовать правила приня-тия решений. Системе, самообучающейся по принципу “смотри и учись”, необходимы примеры задач с заранее известными ответами, причем совершенно не важно, каким образом получены ответы. Это может быть интуи-тивное решение специалиста, итог работы консилиума или объективный результат, полученный путем наблюде-ния за явлениями.
Важными характеристиками разработанной технологии являются высокая скорость обучения, при кото-ром к тому же не требуется участие человека, и возможность ее использования на обычных стандартных персо-нальных компьютерах без дополнительного специального оборудования.
Для разработки теории и методологии создания и применения нейросетевых экспертных систем были проведены эксперименты с нейронными сетями. Эксперименты проводились как на конкретных практических задачах, так и на экспериментальных задачниках. Были изучены свойства и поведение нейронных сетей, имею-щих различные параметры и характеристики, при обучении решению разнообразных задач. В результате прове-денных исследований были подобраны оптимальная архитектура, параметры и алгоритмы обучения нейронных сетей.
В качестве базовой архитектуры была выбрана полносвязная сигмоидная нейронная сеть с нейронами, имеющими характеристическую функцию преобразования сигнала с постоянной константой характеристики. В качестве базового алгоритма обучения был выбран и усовершенствован алгоритм двойственного функциониро-вания, что позволило многократно (в 1000 -10000 раз) повысить скорость обучения нейросетей. Это определило возможность использования технологии на обычных персональных компьютерах (с последовательным доступом к памяти) путем эмуляции работы нейросети программным способом.
Была разработана методология работы с медицинской информацией применительно к нейросетевым экс-пертным системам. В частности, был выбран метод нормирования входных сигналов (обучающих параметров) на диапазон значений [-1...1], что позволило унифицировать любую числовую информацию при подаче ее для обу-чения сети. При этом отпала необходимость адаптации архитектуры сетей к конкретным задачам.
Были проведены эксперименты и разработан метод вычисления нейросетью значимости обучающих па-раметров, который может использоваться не только при создании и оптимизации практических нейросетевых приложений, но и для проведения научных исследований с помощью нейросетевой обработки информации. В частности, это дает возможность извлечения дополнительной информации в процессе работы обучающихся нейросетей, например, продукции и проверки гипотез.
В результате проведенных экспериментов разработан метод подстройки параметров тестируемого приме-ра для получения требуемого ответа нейросети. Это может найти применение в экспертных системах принятия решений и нейросетевого моделирования, позволяя специалисту строить интуитивные модели явлений и выби-рать наилучшую тактику достижения цели.
Разработаны и экспериментально подтверждены автоматические стратегия и тактика обучения нейросе-тей путем надстройки над функционированием нейросети формального алгоритма, обеспечивающего оптималь-ное изменение параметров обучения для достижения цели, определенной специалистом.
На основе созданной теории была разработана методология создания нейросетевых экспертных систем предметными специалистами, включающая методику представления информации, адаптированную для обучения нейросетей, технологию постановки задачи, определение и связывание иерархических блоков экспертной систе-мы. Использование методологии не исключает комбинацию в одной экспертной системе одновременно несколь-ких (формальных и нейросетевых) методов продукции выводов как на стадии получения промежуточных резуль-татов, так и при вычислении окончательного решения. Была показана важность применения метода нейросетевых экспертов -нескольких нейросетей, решающих одну и ту же задачу с последующей интерпретацией решения нейросетевого консилиума несколькими способами.
Важной частью проведенной работы стало создание программного обеспечения для обучения нейросетей и создания экспертных систем. Программа AcceStat-2000 “NeuroMaster” предназначена для обучения нейросетей, работы с базами данных, проведения экспериментов с нейросетями. Она позволяет работать с проектами задач, осуществляя последовательное обучение любого количества нейросетей в автономном режиме без участия опе-ратора. Программа дает возможность пользователю быстро сконструировать любое количество экспертных си-стем, определить списки нейросетей, участвующих в их работе и задать режимы отображения результатов.
С помощью разработанного программного комплекса были проведены испытания технологии создания конкретных практических нейросетевых приложений для различных областей медицины (кардиология, офталь-мология, ургентная хирургия, сосудистая хирургия).Всего были изучены 1204 клинических примера, включаю-щих лиц с различными патологиями и контрольные группы, необходимые для обучения нейросетей.
Создание каждой экспертной системы проводилось согласно разработанной технологии и включало: изу-чение проблемы; постановку задачи; набор обучающих данных и тестирующих примеров; обучение нейросетей; определение оптимальной схемы экспертной системы; проведение дополнительных экспериментов; разработку и создание интерфейса программы; подключение к ней обученных нейросетей; испытание системы на примерах, не входящих в обучающую выборку; доучивание системы на этих примерах для улучшения ее работы.
Одной из экспертных систем стала программа для прогнозирования осложнений инфаркта миокарда, воз-никающих в течение госпитального периода. Обучение системы проводилось на 300 клинических примерах. Экспертная система работает и продолжает обучаться в отделении неотложной терапии и в отделении реабили-тации Красноярской Городской больницы № 20.
Разработана экспертная система для интерпретации данных оригинального метода, применяемого для ранней и скрининговой диагностики злокачественных опухолей сосудистой оболочки глаза. Экспертная система, обученная на 195 примерах, показала более высокую чувствительность и специфичность по сравнению с разра-ботанным ранее формальным алгоритмом. Результаты нейросетевой минимизации параметров позволили пред-ложить упрощение метода без ущерба точности диагностики. Программа установлена в Красноярской Межобл-астном Центре микрохирургии глаза им. П.Г.Макарова.
Две системы созданы для практической хирургии.
Первая из них обучена назначению оптимальной стратегии лечения больных облитерирующим тромбан-гиитом и прогнозированию его непосредственных исходов. Система обучена на 165 клинических примерах и аккумулирует опыт нескольких врачей-специалистов. Программа работает на базе нейросетей, связанных в иерархические блоки (одни сети используют ответы других для принятия решения) и позволяет моделировать результаты предполагаемого лечения. В процессе исследований был применен метод минимизации обучающих параметров, позволивший сократить их список на одну треть. Экспертная система установлена в отделении сосу-дистой хирургии Красноярской Краевой Больницы № 1.
Вторая система разработана для решения классической задачи ургентной хирургии -дифференциальной диагностики заболеваний, сопровождающихся синдромом “острого живота”. Система показала высокую точ-ность заключений. Вместе с тем ее испытание показало необходимость расширения списка диагностируемых нозологий. При создании системы использовался метод малых нейросетевых экспертов, для интерпретации за-ключений которого были испытаны два способа -формальный и нейросетевой (супервизорный). Формальный метод в данном случае показал несколько более высокую точность и был принят за основу при окончательной компоновке программы. Экспертная система работает в отделении неотложной хирургии Красноярской Краевой Больницы № 1.
Успешность применения нейросетей для решения случайно выбранных задач медицинской диагностики, прогнозирования и принятия решений говорит о необходимости дальнейшей оптимизации и совершенствования данной технологии и расширения областей ее применения, по крайней мере в биологии и медицине.
На основании результатов проведенной работы можно сделать следующие выводы.
Литература
12.Бейшеналиев А.С., Балабекова А.К., Осмоналиев А.К. Показатели иммунобиологической реактивности при осложненных формах язвенной болезни // 4 Всесоюзный Съезд гастроэнтерологов.: Тез. докл. -Москва, Ле-нинград, 1990.-Т.1.-С.137-138.
13.Болезни сердца и сосудов. Под ред. Е.И.Чазова. М.: Медицина, 1992.-Т.2.-С.90. 14.Брайнес С.Н., Шрайбер М.И., Браиловский В.Л. и др. О диагностике хронического аппендицита с помощью алгоритма распознавания на ЭВМ // Экспериментальная хирургия и анестезиология.-1967.-N.5.-С.26-28. 15.Бровкина А.Ф. Диагностика и лечение опухолей хориоидеи // Актуальные проблемы офтальмологии: Сб. науч. работ.-М.: Медицина, 1981.-С.211-216.
16.Бутакова Е.В., Миньков А.С. Исследование пигмента ресниц в диагностике увеальных меланом // Актуальные вопросы офтальмологии. Иркутск, 1994.-С.13-14.
17.Быховский М.Л. Метод фазового интервала в проблеме диагностики // Экспериментальная хирургия и анесте-зиология.-1962.-N.2.-С.16-19.
18.Быховский М.Л., Вишневский А.А., Харнас С.Ш. Вопросы построения диагностического процесса при помо-щи математических машин // Экспериментальная хирургия и анестезиология.-1961.-N.4.-С.3-15.
19.Вальд А. Последовательный анализ. М.: Физматгиз, 1960.-76 с.
20.Виноградов В.В. Хирургия панкреатита. М.: Медицина, 1974.-95 с.
21.Воробьева Т.А., Салупере В.П., Уйбор М. Реакции гуморального и клеточного иммунитета при язвенной бо-лезни в зависимости от состояния слизистой оболочки желудка // Тер. архив.-1985.-N.9.-С.95-98.
22.Галкина О.В., Альперина Е.Л., Подгорная Е.К. и др. Изменение уровня допамина и его метаболитов в структу-рах мозга и иммунокомпетентных органах при формировании иммунного ответа // Бюллет. эксп. биол. и мед.-1990.-N.7.-С.66-68.
23.Гельфанд И.М., Губерман Ш.А., Гиндикин С.Г. и др. Некоторые задачи классификации и прогнозирования из различных областей медицины.-Вопросы кибернетики. Задачи медицинской диагностики и прогнозирования с точки зрения математика. М., 1985.-С.110-125.
24.Гервазиев В.Б., Полушкин Б.В., Косихина Н.К., Быков В.М. Системные и регионарные изменения иммуноло-гических показателей у больных тромбангиитом нижних конечностей // Хирургия.-1986.-N.12.-С.77-81.
25.Гилев С.Е., Горбань А.Н., Миркес Е.М. Малые эксперты и внутренние конфликты в обучаемых нейронных сетях // Доклады Академии Наук СССР.-1991.-Т.320, N.1.-С.220-223.
26.Горбань А.Н. Обучение нейронных сетей. М.: Параграф, 1990.-160 с.
27.Граков Б.С., Лубенский Ю.М., Нихенсон Р.А. Методы диагностики и интенсивной терапии в абдоминальной хирургии. Красноярск: Издательство Красноярского университета, 1992.-236 с.
28.Гублер Е .В. Вычислительные методы анализа и распознавания патологических процессов. Л.: Медицина, 1978.-294 с.
29.Дубинская Л.Р., Лещев Е.В. Радиофосфорный тест как метод оценки эффективности органосохранного лече-ния внутриглазных опухолей // Диагностика и лечение внутриглазных опухолей: Сб. науч. тр. Междунар. сим-поз. по офтальмоонкологии, Москва, 30 окт -1 нояб. 1984.-М., 1986.-С.48-50.
30.Дюжиков А.А. Обоснование патогенетического и хирургического лечения облитерирующего эндартериита (клинико-экспериментальное исследование). Автореф. дис.... докт. мед. наук.-М., 1980.-С.38.
31.Ермаков Е.В., Чернов А.П., Цызик А.И. и др. Анализ госпитальной летальности при инфаркте миокарда // Сов. мед.-1979.-N 9.-С.8-12.
32.Захарова Г.Н., Симпатэктомия и ее роль в комплексном лечении облитерирующего эндартериита // Хирургия.-1969.-N.10.-С.114-119.
33.Карнищенко Н.Н., Дюгликов А.А., Поляк А.И. Облитерирующий эндартериит (патогенез, диагностика, клини-ка и лечение) // Ростов: Изд. Ростовск. ун-та, 1985.-280 с.
34.Кирсанов Э.Ю. Оценка производительности нейрокомпьютеров // Нейрокомпьютер.-1992.-N.2.-С.37-42
35.Кожевников В.С., Волчек И.А. Функциональная активность субклассов Т-лимфоцитов и их роль в патогенезе вторичных иммунодефицитов // Функциональные характеристики циркулирующего пула иммунокомпетент-ных клеток: Сб. науч. тр. -Новосибирск, 1984.-С.11-17.
36.Колесов В.И. Острый аппендицит. -М.: Медицина, 1959.-110 с.
37.Коптев В.И. Изотоподиагностика Р-32 в офтальмоонкологии // Диагностика, клиника и лечение в офтальмоон-кологии: Сб. науч. работ -Оренбург, 1982.-С.21-22.
38.Копьев В.Ю., Шептулин Л.А. Проблемы иммунологии язвенной болезни // Клиническая медицина.-1988.-
N.5.-С.20-25.
39.Котелянский Э.О. Внутриглазные опухоли.-М.: Медицина, 1974.-223 с.
40.Костюк Ф.Ф. Инфаркт миокарда.-Красноярск: Офсет, 1993.-224 с.
41.Кравченко П.В. Резекция поджелудочной железы: Автореф. дис. ... Докт. мед. наук. -Горький, 1954.-50 с.
42.Кривицкий Д.И., Шуляренко В.А., Параций Ф.Ф. и др. Состояние иммунной реактивности у больных с язвен-
ной болезнью, осложненной пенетрацией // Врачебное дело.-1988.-N.6.-С.67-69.
43.Крышень В.П., Шамшонкова Т.П., Вчерашняя Н.Н. Состояние иммунологической реактивности при экспери-ментальной язве желудка // Физиологический журнал.-1987.-N.1.-С.88-90.
44.Кушаковский М.С. Аритмии сердца.-Санкт-Петербург: Гиппократ, 1992.-544 с.
45.Лазарев И.А., Русаков В.И., Ткачева Т.Н. Иммунопатологические изменения у больных язвенной болезнью желудка и двенадцатиперстной кишки и их иммунокоррекция // 4 Всесоюзный Съезд гастроэнтерологов.: Тез. докл. -Москва, Ленинград, 1990.-Т.1.-С.702-703.
46.Лебедев К.А., Понякина И.Д. Дискретно-динамический анализ -новый метод оценки иммунного статуса чело-века // Итоги науки и техники ВИНИТИ. Сер. Иммунология.-1988.-Т.22.-С.147-170.
47.Лебедев К.А., Понякина И.Д. Иммунограмма в клинической практике. -М.: Наука, 1990.-224 с.
48.Левандо В.А., Суздальский Р.С., Кассиль Г.Н. и др. Стрессорные иммунодефициты у человека // Успехи фи-зиологических наук.-1990.-Т.21, N.3.-С.79-97.
49.Лозовой В.П., Кожевников В.С., Волчек И.А. и др. Методы исследования Т-системы иммунитета в диагности-ке вторичных иммунодефицитов при заболеваниях и повреждениях.-Томск, 1986. 18 с.
50.Лозовой В.П., Шергин С.М. Структурно-функциональная организация иммунной системы.-Новосибирск, 1981.-226 с.
51.Лохман В.Ф., Спасюк В.В. Рентгеноэндоваскулярная деструкция надпочечников в клинике внутренних болез-ней // Новые технологии в рентгенохирургии. Тез. IX Всесоюзного симпозиума (с участием иностранных спе-циалистов), Москва, 2-3 октября 1989 г.-М., 1989.-С.129-130.
52.Малов Ю.С. Состояние иммунитета у больных язвенной болезнью // Врачебное дело.-1990.-N.1.-С.19-22.
53.Марасанов В.В. Математические модели дифференциальной диагностики заболеваний. Кишинев: Штиинца,
1973.-62 с.
54.Масалович А.И. От нейрона к нейрокомпьютеру // Журнал доктора Добба.-1992.-N.1.-С.20-24.
55.Мышкин К.И. Математическое моделирование в обучении клинической хирургии // Математическое модели-
рование в клинической хирургии. Саратов.-1969.-С.108-111.
56.Назаров Б.В. Прогностические аспекты некоторых нарушений ритма и проводимости при остром инфаркте миокарда: Автореф. дис.... канд. мед. наук.-Новосибирск, 1982.-22 с.
57.Назаров Ю.И. Диагностическая система распознавания некоторых острых хирургических заболеваний органов брюшной полости: Дис....канд. мед. наук.-Красноярск, 1972.-206 с.
58.Недвецкая Л.М., Прозоровская К.Н., Ахмедов М.М. Иммунологические аспекты язвенной болезни // Совет-
ская медицина.-1987.-N.3.-С.32-36.
59.Нестеров В.С. Клиника болезней сердца и сосудов.-Киев: Здоров'я, 1974.-512 с.
60.Нивинская М.М. Клиника и лечение меланом.-М., 1970.-С.7-9.
61.Нифантьев О.Е. Механическая непроходимость кишечника. Красноярск: Издательство Красноярского универ-
ситета, 1989.-208 с.
62.Нифантьев О.Е. Острый холецистит. -Красноярск: Издательство Красноярского университета, 1990.-205с.
63.Опухоли глаза, его придатков и орбиты./ под ред. Н.А.Пучковской -Киев: Здоров'я, 1978. -230 с.
64.Парин В.В., Баевский Р.М. Медицина и техника.-М.: Знание, 1968.-С.36-49.
65.Переверзев-Орлов В.С. Советчик специалиста. Опыт разработки партнерской системы // М.: Наука, 1990.-133
с. 66.Подосинников И.С., Чухловина М.Л. Метаболизм и функция лимфоцитов при первичных иммунодефицитных
состояниях // Иммунология.-1986.-N.4.-С.30-38.
67.Покровский А.В. Клиническая ангиология.-М.: Медицина, 1979.-368 с.
68.Покровский А.В., Дан В.Н., Хоровец А.Г. и др. Артериализация венозного кровотока стопы в лечении тяжелой
ишемии у больных с окклюзиями артерий голени и нефункционирующей плантарной дугой // Хирургия.-1990.-N.5.-С.35-42.
69.Поляков П.И. Острая хирургическая патология органов брюшной полости. Новосибирск: Наука, 1982.-246 с.
70.Постнова Т.Б. Информационно-диагностические системы в медицине. М.: Наука, 1972.-233 с.
71.Ротков И.Л. Диагностические и тактические ошибки при остром аппендиците. М.: Медицина, 1988.-208 с.
72.Руда М.Я., Зыско А.П. Инфаркт миокарда. М.: Медицина, 1981. 288 с.
73.Руфанов И.Г. Панкреатиты в связи с воспалительными процессами желчных путей и пузыря.-М., 1925.-95 с.
74.Савельев В.С., Буянов В.М., Хрущева В.М. Изменения в свертывающей и антисвертывающей системах крови у больных желудочно-кишечными кровотечениями язвенной этиологии.-Тезисы докладов 9-го пленума прав-ления Всесоюзного общества хирургов.-Тбилиси, 1966.-С.53-55.
75.Савушкин С.А. Нейросетевые экспертные системы // Нейрокомпьютер.-1992.-N.2.-С.29-36.
76.Савченко А.А., Захарова Л.Б., Кондаков А.Е. Метаболизм лимфоцитов и иммунологические параметры крови у жителей Заполярья, здоровых и часто болеющих острыми респираторными заболеваниями // Иммунология.-1991.-N.6.-С.46-48.
77.Савченко А.А., Сунцова Л.Н. Высокочувствительное определение активности дегидрогеназ в лимфоцитах периферической крови человека биолюминесцентным методом // Лаб. дело.-1989.-N.11.-С.23-25.
78.Сапроненков П.М. Иммунология желудочно-кишечного тракта.-Л., 1987.-159 с.
79.Сергеев С.А., Гладкий А.П., Зотов Л.А. Язвенная болезнь. -М., 1983.-С.50-55.
80.Скрипниченко Д.Ф. Итоги деятельности хирургической службы УССР за 10 лет.-Труды Х пленума хирургов Украины.-Киев, 1964.-С.30-39.
81.Скрипниченко Д.Ф. Неотложная хирургия брюшной полости.-Киев, 1966.-120 с.
82.Стручков В.И., Гостищев В.К., Стручков Ю.В. Хирургическая инфекция. -М.: Медицина, 1991.-560 с.
83.Тепляков А.Т., Гаргапеева А.А. Ишемия и инфаркт миокарда. Томск: Изд. Томск. ун-та, 1994.-406 с.
84.Терентьева Л.С., Котелянский Э.О. и др. Диагностика и лечение внутриглазных опухолей: Метод. рекоменд.-Одес. НИИ глазных болезней и тканевой терапии им. В.П.Филатова. Ужгор. гос. ун-т.-Одесса, 1979.-29 с.
85.Ткаченко Г.К. Организация хирургической помощи в Казахстане.-Актуальные вопросы абдоминальной и со-судистой хирургии.-Актюбинск, 1974.-С.3-5.
86.Томов Л., Томов Ил. Нарушения ритма сердца // Пер. с болг.-София: Медицина и физкультура, 1976.-276 с.
87.Успенский В.М., Валуевич В.В., Новикова И.А. Клеточный иммунитет и его коррекция у больных с предъяз-венным состоянием // Врачебное дело.-1987.-N.9.-С.40-42.
88.Федоров А. Borland Pascal: Практическое использование Turbo Vision 2.0. -Киев: Диалектика, 1993.-272 с.
89.Федоров А., Рогаткин Д. Borland Pascal в среде Windows.-Киев: Диалектика, 1993.-656 с.
90.Фонсова Е.А. Прогнозирование течения острого инфаркта миокарда у мужчин в возрасте до 60 лет: Дис....канд. мед. наук.-М., 1989.-164 с.
91.Фурно Г., Дас Д., Спренгер Г. и др. Микрокомпьютерные медицинские системы: проектирование и примене-ние. Пер. с англ., М.: Мир, 1983.-541 с.
92.Халфен Э.Ш., Яценко К.С., Заферман Д.М. Математическое прогнозирование исходов инфаркта миокарда // Клин. мед.-1967.-N.7.-С.9-16.
93.Хлевная Н.В., Головина Т.Э. Патогенетическое обоснование иммунокоррегирующего лечения язвенной бо-лезни двенадцатиперстной кишки // 4 Всесоюзный Съезд гастроэнтерологов.: Тез. докл. -Москва, Ленинград, 1990.-Т.1.-С.627-629.
94.Чумаков А.А. Диагностика острого перитонита с помощью электронно-вычислительных машин: Дис....канд. мед. наук.-Ярославль, 1971.-202 с.
95.Чухриенко Д.П. Непроходимость кишечника.-Киев: Здоров'я, 1958.-155 с.
96.Шварц Э., Трис Д. Программы, умеющие думать // Бизнес Уик.-1992.-N.6.-С.15-18.
97.Штейн Л.Б. Опыт прогнозирования в медицине с помощью ЭВМ.-Л.: Ленинградский университет, 1987.-146 с.
98.Шульман В.А. Осложнения инфаркта миокарда. Методические указания для самостоятельной работы студен-тов.-Красноярск, 1990.-22 с.
99.Шульман В.А., Костюк Ф.Ф., Назаров Б.В. и др. Мерцательная аритмия при инфаркте миокарда // Кардиоло-гия.-1975.-N.11.-С.117.
100.Элькин М.А. Острый живот. М.: Медицина, 1981.-266 с.
101.Яругский Е.Е. Диагностика острых заболеваний и травм живота на догоспитальном этапе. -Ташкент: Меди-цина, 1983.-172 с.
102.Abeyratne U.R., Kinouchi Y., Oki H. et al. Artificial neural networks for source localization in the human brain // Brain Topogr.-1991.-V.4, N.1.-P.3-21.
103.Ajay F. A unified framework for using neural networks to build QSARs // J. Med. Chem.-1993.-V.36, N.23.-P.3565-3571.
104.Akay M. Noninvasive diagnosis of coronary artery disease using a neural network algorithm // Biol. Cybern.-1992.-V.67, N.4.-P.361-367.
105.Akay M., Welkowitz W. Acoustical detection of coronary occlusions using neural networks // J. Biomed. Eng.-1993.-V.15, N.6.-P.469-473.
106.Albuguergue R.R., Delgado L., Correia P. et al. Circulating immune complexes in Buerger's Disease. Endarteritis obliterans in young men // J. Cardiovasc. Surg.-1989.-V.30, N.5.-P.821-825.
107.Allen J., Murray A.. Development of a neural network screening aid for diagnosing lower limb peripheral vascular disease from photoelectric plethysmography pulse waveforms // Physiol. Meas.-1993.-V.14, N.1.-P.13-22.
108.Alvager T., Smith T.J., Vijai F. Neural-network applications for analysis of adverse drug reactions // Biomed. Instrum. Technol.-1993.-V.27, N.5.-P.408-411.
109.Amari S.-I. The Brain and Computer // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.1.-P.7-8.
110.Andreassen H., Bohr H., Bohr J. et al. Analysis of the secondary structure of the human immunodeficiency virus (HIV) proteins p17, gp120, and gp41 by computer modelling based on neural network methods // J. Acquir. Immune Defic. Syndr.-1990.-V.3, N.6.-P.615-622.
111.Asada N., Doi K., MacMahon H. et al. Potential ucefulness of an artificial neural networks for differential diagnosis of interstitial lung diseases: pilot study // Radiology.-1990.-V.177, N.3.-P.857-860.
112.Asanovic K., Beck J., Feldman J. et al. Designing a connectionist networ supercomputer // Int. J. Neural Syst.-1993.-V.4, N.4.-P.317-326.
113.Asary K.V., Eswaran C. A Self-organizing Neural Network for Multidimensional Mapping and Classification of Multiple Valued Data // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.2.-P.2488-2491.
114.Ashutosh K., Lee H., Mohan C.K et al. Prediction criteria for succesful weaning from respiratory support: statistical and connectionist analyses // Crit. Care Med.-1992.-V.20, N.9.-P.1295-1301.
115.Astion M.L., Wener M.H., Thomas R.G., Hunder G.G., Bloch D.A. Application of neural networks to the classification of giant cell arteritis // Arthritis Reum.-1994.-V.37, N.5.-P.760-770.
116.Astion M.L., Wilding P. Application of neural networks to the interpretation of laboratory data in cancer diagnosis // Clin. Chem.-1992.-V.38, N.1.-P.34-38.
117.Atamanchuk Z.M., Petrov A.A. Some problems of building and learning of neural networks while creating user's expert system // The RNNS/IEEE Symposium on Neuroinformatics and Neurocomputers, Rostov-on-Don, Russia, October 7-10,1992.-Rostov/Don, 1992.-V.2.-P.1133-1135.
118.Aynsley M., Hofland A., Morris A.J. et al. Artificial intelligence and the supervision of bioprocesses (real-time knowledge-based systems and neural networks) // Adv. Biochem. Eng. Biotechnol.-1993.-N.48.-P.1-27.
119.Babel W., Hetterich N., Muller T. Classification of oxygen transport to tissue with neural networks // Adv. Exp. Med. Biol.-1992.-V.317.-P.681-687.
120.Barreto J.M., De-Azevedo F.M. Connectionist expert systems as medical decision aid // Artif. Intell. Med.-1993.-V.5, N.6.-P.515-523.
121.Barschdorff D., Ester S., Dorsel T et al. Phonographic diagnostic aid in heart defects using neural networks // Biomed. Tech. Berlin.-1990.-V.35, N.11.-P.271-279.
122.Bastiaanssen E.H., Vanderschoot J., Van-Leeuwen J.L. Learning procedure in a neural control model for the urinary bladder // Neurourol. Urodyn.-1993.-V.12, N.3.-P.285-288.
123.Baxt W.G. A neural network trained to identify the presence of myocardial infarction bases some decisions on clinical associations that differ from accepted clinical teaching // Med. Decis. Making.-1994.-V.14, N.3.-P.217-222.
124.Baxt W.G. Analysis of the clinical variables driving decision in an artificial neural network trained to identify the presence of myocardial infarction // Ann. Emerg. Med.-1992.-V.21, N.12.-P.1439-1444.
125.Baxt W.G. Complexity, chaos and human physiology: the justification for non-linear neural computational analysis // Cancer Lett.-1994.-V.77, N.2-3.-P.85-93.
126.Baxt W.G. Use of an artificial neural network for the diagnosis of myocardial infarction // Ann. Intern. Med.-1991.-V.115, N.11.-P.843-848.
127.Beal J.M. The acute abdomen // Davis-Christopher Textbook of Surgery. Philadelphia: W.B.Saunders, 1982.-875 p.
128.Beaune J. Le pronostic vital de l’infarctus du myocarde a 1 et 6 mois. Etude statistique de la valeur previsionnelle des donnees recueillies a la phase aique et unite de soins intensifs a propos de 312 cas.-Lyon: These Medicine, 1972.-144
p. 129.Becraft W.R. Diagnostic applications of artificial neural networks // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.2.-P.2807-2810.
130.Bedenbaugh P., Gerstein G.L. Rectification of correlation by a sigmoid nonlinearity // Biol. Cybern.-1994.-V.70, N.3.-P.219-225.
131.Bengio Y., Pouliot Y. Efficient recognition of immunoglobulin domains from amino acid sequences using a neural network // Comput. Appl. Biosci.-1990.-V.6, N.4.-P.319-324.
132.Berrios G.E., Chen E.Y. Recognising psychiatric symptoms. Relevance to the diagnostic process // Br. J. Psychiatry.-1993.-V.163.-P.308-314.
133.Bertolucci E., Mariotti R., Biadi O. et al. Two different neural network models for coronary artery disease classification // Eur. Heart J.-1993.-V.14.-Abstr. Supplement XVth Congress of the European Society of Cardiology, August, 1993.-(348).-P.23.
134.Bignone F.A.. Cells-gene interactions simulations on a coupled map lattice // J. Theor. Biol.-1993.-V.161, N.2.-P.231-249.
135.Binns M.D., Clough F.J., Garth S.C. An architecture for fully integrated large scale neural networks // Int. J. Neural Syst.-1993.-V.4, N.4.-P.327-332.
136.Bisset L.R., Fierz W. Using a neural network to identify potential HLA-DR1 binding sites within proteins // J. Mol. Recognit.-1993.-V.6, N.1.-P.41-48.
137.Borrett D.S., Yeap T.H., Kwan H.C. Neural networks and Parkinson’s disease // Can. J. Neurol. Sci.-1993.-V.20, N.2.-P.107-113.
138.Bortolan G., Willems J.L. Diagnostic ECG classification based on neural networks // J. Electrocardiol.-1993.-V.26, Suppl.-P.75-79.
139.Brewer R.J., Golden G.T., Hitch D.C. et al. Abdominal pain. An analysis of 1000 consecutive cases in a university hospital emergency room // Am. J. Surg.-1976.-N.131.-P.219-223.
140.Budilova E.V., Teriokhin A.T. Endocrine networks // The RNNS/IEEE Symposium on Neuroinformatics and Neurocomputers, Rostov-on-Don, Russia, October 7-10, 1992.-Rostov/Don, 1992.-V.2.-P.729-737.
141.Bugliosi R., Tribalto M., Avvisati G. et al. Classification of patients affected by multiple myeloma using a neural network software // Eur. J. Haematol.-1994.-V.52.-N.3.-P.182-183.
142.Burke H.B. Artificial neural networks for cancer research: outcome prediction // Semin. Surg. Oncol.-1994.-V.10, N.1.-P.73-79.
143.Cagnoni S., Coppini G., Rucci M. et al. Neural network segmentation of magnetic resonance spin echo images of the brain // J. Biomed. Eng.-1993.-V.15, N.5.-P.355-362.
144.Carrie J.R. Evaluation of a neyral network model of amnesia in diffuse cerebral atrophy // Br. J. Psychiatry.-1993.-V.163.-P.217-222.
145.Chae Y.M., Jang T.Y., Park I.Y. et al. The development of a decision support system for diagnosing nasal allergy // Yonsei Med. J.-1992.-V.33, N.1.-P.72-80.
146.Chan K.H., Johnson K.A., Becker J.A. et al. A neural network classifier for cerebral perfusion imaging // J. Nucl. Med.-1994.-V.35, N.5.-P.771-774.
147.Chawanya T., Aoyagi T., Nishikawa I. et al. A model for feature linking via collective oscillations in the primary visual cortex // Biol. Cybern.-1993.-V.68, N.6.-P.483-490.
148.Chen E.Y. Neural network model of amnesia // Br. J. Psychiatry.-1994.-N.164.-P.125-126.
149.Chiou Y.S., Lure Y.M. Hybrid lung nodule detection (HLND) system // Cancer Lett.-1994.-V.77, N.2-3.-P.119-126.
150.Cho S., Reggia J.A. Multiple disorder diagnosis with adaptive competitive neural networks // Artif. Intell. Med.-1993.-V.5, N.6.-P.469-487.
151.Clark J.W. Neural network modelling // Phys. Med. Biol.-1991.-V.36, N.10.-P.1259-1317.
152.Cohen I.L., Sudhalter V., Landon-Jimenez D. et al. A neural network approach to the classification of autism // J. Autism Dev. Disord.-1993.-V.23, N.3.-P.443-466.
153.Cohen J.D., Servan-Schreiber D. A theory of dopamine function and its role in cognitive deficits in schizophrenia // Schizophr. Bull.-1993.-V.19, N.1.-P.85-104.
154.Cohen M.E., Hudson D.L., Banda P.W. et al. Neural network approach to detection of metastatic melanoma from chromatographic analysis of urine // Proc. Annu. Symp. Comput. Appl. Med. Care.-1991.-P.295-299.
155.Corti R.E., Doweck J., Ferro F. et al. Aspectos geneticos de la enfermedad ulcrosa gastroduodenal // Prensa med. argent..-1986.-V.73, N.15.-P.642-645.
156.Crawford J.D., Vilis T. Modularity and parallel processing in the oculomotor integrator // Exp. Brain Res.-1993.-V.96, N.3.-P.443-456.
157.Dassen W., Mulleneers R., Den Dulk K. Does randomization influence the interpretation of the electrocardiogram by an artificial neural network? // Eur. Heart J.-1993.-V.14.-Abstr. Supplement XVth Congress of the European Society of Cardiology, August, 1993.-(P952).-P.159.
158.Dassen W., Mulleneers R., Den Dulk K. et al. Artificial neural networks and ECG interpretation. Use and abuse // J. Electrocardiol.-1993.-V.26, Suppl.-P.61-65.
159.Davis G.E., Lowell W.E., Davis G.L. A neural network that predicts psychiatric length of stay // MD Comput.-1993.-V.10, N.2.-P.87-92.
160.Delahunty A., Morice R., Frost B. Specific cognitive flexibility rehabilitation in schizophrenia // Psychol. Med.-1993.-V.23, N.1.-P.221-227.
161.Doig G.S., Inman K.J., Sibbald W.J. et al. Modeling mortality in the intensive care unit: comparing the performance of a back-propagation, associative-learning neural network with multivariate logistic regression // Proc. Annu. Symp. Comput. Appl. Med. Care.-1993.-P.361-365.
162.Doricchi F., Guariglia C., Paolucci S. et al. Disturbances of the rapid eye movements (REMs) of REM sleep in patients with unilateral attentional neglect: clue for the understanding of the functional meaning of REMs // Electroencephalogr. Clin. Neurophysiol.-1993.-V.87, N.3.-P.105-116.
163.Doyle H.R., Dvorchik I., Mitchell S. et al. Predicting outcomes after liver transplantation. A connectionist approach // Ann. Surg.-1994.-V.219, N.4.-P.408-415.
164.Dubchak I., Holbrook S.R., Kim S.H. Prediction of protein folding class from amino acid composition // Proteins.-1993.-V.16, N.1.-P.79-91.
165.Dwarakanath S., Ferris C.D., Pierre J.W. et al. A neural network approach to the early detection of cancer // Biomed. Sci. Instrum.-1994.-V.30.-P.239-243.
166.Ebell M.H. Artificial neural networks for predicting failure to survive following in-hospital cardiopulmonary resuscitation // J. Fam. Pract.-1993.-V.36, N.3.-P.297-303.
167.Edenbrandt L., Devine B., Macfarlane P.W. Classification of electrocardiographic ST-T segments -human expert vs artificial neural network // Eur. Heart J.-1993.-V.14, N.4.-P.464-468.
168.Erb R.J. Introduction to backpropagation neural network computation // Pharm. Res.-1993.-V.10, N.2.-P.165-170.
169.Ercal F., Chawla A., Stoeker W.V. et al. Neural network diagnosis of malignant melanoma from color images // IEEE Trans. Biomed. Eng.-1994.-V.41, N.9.-P.837-845.
170.Erler B.S., Hsu L., Truong H.M. et al. Image analysis and diagnostic classification of hepatocellular carcinoma using neural networks and multivariate discriminant functions // Lab. Invest.-1994.-V.71, N.3.-P.446-451.
171.Errington P.A., Graham J. Application of artificial neural networks to chromosome classification // Cytometry.-1993.-V.14, N.6.-P.627-639.
172.Evans S.J., Hastings H., Bodenheimer M.M. Differentiation of beats of ventricular and sinus origin using a self-training neural network // PACE Pacing Clin. Electrophysiol.-1994.-V.17, N.4.-P.611-626.
173.Farrugia S., Yee H., Nickolls P. Implantable cardioverter defibrillator electrogram recognition with a multilayer perceptron // PACE Pacing Clin. Electrophysiol.-1993.-V.16.-P.228-234.
174.Ferran E.A.., Ferrara P. Clustering proteins into families using artificial neural networks // Comput. Appl. Biosci.-1992.-V.8, N.1.-P.39-44.
175.Fetz E.E. Cortical mechanisms controlling limb movement // Curr. Opin. Neurobiol.-1993.-V.3, N.6.-P.932-939.
176.Floyd C.E.Jr., Lo J.Y., Yun A.J. et al. Prediction of breast cancer malignancy using an artificial neural network // Cancer.-1994.-V.74, N.11.-P.2944-2948.
177.Forrest D.V., Flory M.J., Anderson S. Neural network programming // N.Y.State J. Med.-1991.-V.91, N.12.-P.553.
178.Fu H.C., Shann J.J. A fuzzy neural network for knowledge learning // Int. J. Neural Syst.-1994.-V.5, N.1.-P.13-22.
179.Fujita H., Horita K., Endo T. et al. Neural Network Approach to Classification of Benign and Malignant Tumours in Mammograms // Med. Imag. Tech.-1992.-V.10.-P.126-129.
180.Fujita H., Katafuchi T., Uehara T. et al. Application of artificial neural network to computer-aided diagnosis of coronary artery disease in myocardial SPECT bull's-eye images // J. Nucl. Med.-1992.-V.33, N.2.-P.272-276.
181.Galushkin A.I., Savushkin S.A. Neural network expert system // The RNNS/IEEE Symposium on Neuroinformatics and Neurocomuters, Rostov-on-Don, Russia, October 7-10, 1992.-Rostov/Don, 1992.-V.2.-P.1116-1123.
182.Galushkin A.I., Sudarikov V.A., Shabanov E.V. Neuromathematic: the methods of solving problems on neurocomputers // The RNNS/IEEE Symposium on Neuroinformatics and Neurocomuters, Rostov-on-Don, Russia, October 7-10, 1992.-Rostov/Don, 1992.-V.2.-P.1179-1188.
183.Gabriel G., Schizas C.N., Pattichis C.S. et al. Qualitative Morphological Analysis of Muscle Biopsies Using Neural Networks // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.1.-P.943-946.
184.Garis H. Neurite Networks. The Genetic Programming of Cellular Automata Based Neural Nets which grow // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.2.-P.2921-2924.
185.Gerloff D.L., Jenny T.F., Knecht L.J. et al. A secondary structure prediction of the hemorragic metalloprotease family // Biochem. Biophys. Res. Commun.-1993.-V.194, N.1.-P.560-565.
186.Gilev S.E., Gorban A.N., Mirkes E.M. Several Methods for Accelerating the Traning Process of Neural Networks in Pattern Recognition // Advances in Modelling & Analysis, AMSE Press.-1992.-V.12, N.4.-P.29-53.
187.Gilev S.E., Gorban A.N., Mirkes E.M. Small Experts and Internal Conflicts in Leanable Neural Networks // Advances in Modelling & Analysis, AMSE Press.-1992.-V.24, N.1.-P.45-50.
188.Gindi G.R., Darken C.J., O’Brien K.M. et al. Neural network and conventional classifiers for fluorescence-guided laser angioplasty // IEEE Trans. Biomed. Eng.-1991.-V.38, N.3.-P.246-252.
189.Goldbaum M.H., Sample P.A., White H. et al. Interpretation of automated perimetry for glaucoma by neural network // Invest. Pphthalmol. Vis. Sci.-1994.-V.35, N.9.-P.3362-3373.
190.Goldberg V., Manduca A., Ewert D.L. et al. Improvement in specificity of ultrasonography for diagnosis of breast tumours by means of artificial intelligence // Med. Phys.-1992.-V.19, N.6.-P.1475-1481.
191.Gonzales L.P., Arnaldo C.M. Classification of drug-induced bahaviors using a multi-layer feed-forward neural network // Comput. Methods Programs Biomed.-1993.-V.40, N.3.-P.167-173.
192.Gorban A.N. Neurocomputing in Siberia // Advances in Modelling & Analysis, AMSE Press.-1992.-V.34, N.2.-P.21-28.
193.Gorban A.N., Waxman C. How many neurons are sufficient to elect the U.S.A. president? Two! // Preprint N 191B, Russian Academy of Sciences, Sib. Branch, Institute of Biophysics.-Krasnoyarsk, 1992.-29 p.
194.Graham J., Errington P., Jennings A. A neural network chromosome classifier // J. Radiat. Res.-1992.-N.33.-P.250-257.
195.Greenhut S.E., Jenkins J.M., MacDonald R.S. A stochastic network model of the interaction between cardiac rhythm and artificial pacemaker // IEEE Trans. Biomed. Eng.-1993.-V.40, N.9.-P.845-858.
196.Gross G.W., Boone J.M., Greco-Hunt V. et al. Neural networks in radiologic diagnosis. II. Interpretation of neonatal chest radiographs // Invest. Radiol.-1990.-V.25, N.9.-P.1017-1023.
197.Guo Z., Durand L.G., Lee H.C. et al. Artificial neural networks in computer-assisted classification of heart sounds in patients with porcine bioprosthetic valves // Med. Biol. Eng. Comput.-1994.-V.32, N.3.-P.311-316.
198.Hagen B., Lohse S. Clinical and radiological aspects of Buerger's disease // Cardiovasc. Intervent. Radiol.-1984.-V.7, N.6.-P.283-293.
199.Hallett J.W., Greenwood L.H., Robison J.G. Lower extremity arterial disease in young adults // Ann. Surg.-1985.-V.202, N.5.-P.647-652.
200.Hamilton A., Churcher S., Edwards P.J. et al. Pulse stream VLSI circuits and systems: the EPSILON neural network chipset // Int. J. Neural Syst.-1993.-V.4, N.4.-P. 395-405.
201.Hart A., Wyatt J. Evaluating black-boxes as medical decision aids: issues arising from a study of neural networks // Med. Inf. Lond.-1990.-V.15, N.3.-P.229-236.
202.Harvey R.M. Nursing diagnosis by computers: an application of neural networks // Nurs. Diagn.-1993.-V.4, N.1.-P.26-34.
203.Henning H., Gilpin E.A., Cowell J.W. et al. Prognosis after acute myocardial infarction. A multivariate analysis of mortality and survival // Circulation.-1979.-V.59.-P.1124-1130.
204.Hernandez C.A., Espi J., Nakayama K. How to choose the training data for neural network medical diagnosis systems // Biomed. Sci. Instrum.-1993.-N.29.-P.283-290.
205.Herrmann M., Ruppin E., Usher M. A neural model of the dynamic activation of memory // Biol. Cybern.-1993.-V.68, N.5.-P.455-463.
206.Hirahara M., Nagano T. A neural network model for visual motion detection that can explain psychophysical and neurophysiological phenomena // Biol. Cybern.-1993.-V.68, N.3.-P.247-252.
207.Hod H., Lew A.S., Keltai M. et al. Early atrial fibrillation during evolving myocardial infarction: a consequence of impaired left atrial perfusion // Circulation.-1987.-V.75, N.1.-P.146-150.
208.Hoher M., Kestler H.A., Palm G. et al. Neural network based QRS classification of the signal averaged electrocardiogram // Eur. Heart J.-1994.-V.15.-Abstr. Supplement XII-th World Congress Cardiology (734).-P.114.
209.Hoher M., Kestler H.A., Weismuller P. et al. Neural Networks and single lead late potentials analysis of the signal averaged electrocardiogram // Eur. Heart J.-1993.-V.14.-Abstr. Supplement XVth Congress of the European Society of Cardiology, August, 1993.-(P2510).-P.449.
210.Hoshino Sh., Nakayama K., Igary T. et al. Long-term results of omental transplantation for chronic occlusive arterial diseases // Int. Surg.-1983.-V.68, N.1.-P.47-50.
211.Hsu W., Hsu L.S., Tenorio M.F. The ClusNet algorithm and time series prediction // Int. J. Neural Syst.-1993.-V.4, N.3.-P.247-255.
212.Hu Y.H., Tompkins W.J., Urrusti J.L. et al. Applications of artificial neural networks for ECG signal detection and classification // J. Electrocardiol.-1993.-V.26, Suppl.-P.66-73.
213.Hudgins B., Parker P., Scott R.N. A new strategy for multifunction myoelectric control // IEEE Trans. Biomed. Eng.-1993.-V.40, N.1.-P.82-94.
214.Hussain A.S., Johnson R.D., Vachharajani N.N. et al. Feasibility of developing a neural network for prediction of human pharmacokinetic parameters from animal data // Pharm. Res.-1993.-V.10, N.3.-P.466-469.
215.Hussain A.S., Yu X.Q., Johnson R.D. Application of neural computing in pharmaceutical product development // Pharm. Res.-1991.-V.8, N.10.-P.1248-1252.
216.Ichihashi H., Miyoshi T., Nagasaka K. Computed Tomography by Neuro-Fuzzy Inversion // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.1.-P.709-712.
217.Jamieson P.W. A computational model of levodopa pharmacodynamics in Parkinson’s disease // Clin. Neuropharmacol.-1991.-V.14, N.6.-P.498-513.
218.Jennings A.M., Graham J. A neural network approach to automatic chromosome classification // Phys. Med. Biol.-1993.-V.38, N.7.-P.959-970.
219.Jensen E.W., Demant L., Sanchez R. A model for estimation of the pulmonary capillary pressure // Methods Inf. Med.-1994.-V.33, N.1.-P.139-142.
220.Jondal M., Holm G., Wigzell H. Surface markers on human T and B lymphocytes // J. Exp. Med.-1972.-V.136, N.2.-P.207-215.
221.Kane G. Neural network analysis is now commonplace in the medical literature // J. Electrocardiol.-1993.-V.26, N.3.-P.239-240.
222.Kappen H.J., Neijt J.P. Advanced ovarian cancer. Neural network analysis to predict treatment outcome // Ann. Oncol.-1993.-V.4, Suppl. 4.-P.31-34.
223.Karim M.N., Rivera S.L. Artificial neural networks in bioprocess static estimation // Adv. Biochem. Eng. Biotechnol.-1992.-N.46.-P.1-33.
224.Katz A.S., Katz S., Wickham E. et al. Prediction of valve-related complications for artificial heart valves using adaptive neural networks: a preliminary study // J. Heart Valve Dis.-1993.-V.2, N.5.-P.504-508.
225.Katz S., Katz A.S., Lowe N. et al. Neural net-bootstrap hybrid methods for prediction of complications in patients implanted with artificial heart valves // J. Heart Valve Dis.-1994.-V.3, N.1.-P.49-52.
226.Kazmierczak S.C., Catrou P.G., Van-Lente F. Diagnostic accuracy of pancreatic enzymes evaluated by use of multivariate data analysis // Clin. Chem.-1993.-V.39, N.9.-P.1960-1965.
227.Kelly M.F., Parker P.A., Scott R.N. The application of neural networks to myoelectric signal analysis: a preliminary study // IEEE Trans. Biomed. Eng.-1990.-V.37, N.3.-P.221-230.
228.Kennedy M.J., Thakur M.S. The use of neural networks to aid in microorganism identification: a case study of Haemophilus species identification // Antonie Van Leeuwenhoek.-1993.-V.63, N.1.-P.35-38.
229.Kitchin A.H., Pocock S.J. Prognosis of patients with acute myocardial infarction // Brit. Heart J.-1977.-V.39.-P.1167-1171.
230.Korte W. Die chirurgie des Pancreas. -Hed. Pract. Chir.-1923.-N 3.-P.12-23.
231.Korver M., Lucas P.J. Converting a rule-based expert system into a belief network // Med. Inf. Lond.-1993.-V.18, N.3.-P.219-241.
232.Koutsoukos A.D., Rubinstein L.V., Faraggi D. Discrimination techniques applied to the NCI in vitro anti-tumour drug screen: predicting biochemical mechanism of action // Stat. Med.-1994.-V.13, N.5-7.-P.719-730.
233.Kumaravel N., Kavitha V. Automatic diagnosis of neuro-muscular diseases using neural network // Biomed. Sci. Instrum.-1994.-N.30.-P.245-250.
234.Labos E. A unit paradox for artificial neuronal networks // Neurobiology.-1993.-V.1, N.3.-P.207-222.
235.Lamb D.J., Niederberger C.S. Artificial intelligence in medicine and male infertility // World J. Urol.-1993.-V.11, N.2.-P.129-136.
236.Lee H.-L., Suzuki S., Adachi Y. et al. Fuzzy Theory in Traditional Chinese Pulse Diagnosis // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.1.-P.774-777.
237.Lehmann T. A hadware efficient cascadable chip set for ANN’s with on-chip backpropagation // Int. J. Neural Syst.-1993.-V.4, N.4.-P.351-358.
238.Leong P.H., Jabri M.A. Kakadu -a low power analogue neural network classifier // Int. L. Neural Syst.-1993.-V.4, N.4.-P.381-394.
239.Levine D.S., Parks R.W., Prueitt P.S. Methodological and theoretical issues in neural network models of frontal cognitive functions // Int. J. Neurosci.-1993.-V.72, N.3-4.-P.209-233.
240.Lin J.S., Ligomenides P.A., Freedman M.T. et al. Application of artificial neural networks for reduction of false-positive detections in digital chest radiographs // Proc. Annu. Symp. Comput. Appl. Med. Care.-1993.-P.434-438.
241.Lipkin M. The likelihood concept in differential diagnosis // Perspect. Biol. Med.-1964.-N.7.-P.485-497.
242.Lisak S.Z., Welling R.E. Buerger's disease: a distinct clinical entity // Vasc. Surg.-1980.-V.14, N.5.-P.346-351.
243.Lo J.Y. Floyd C.E.Jr., Baker J.A. et al. An artificial neural network for estimating scatter exposures in portable chest radiography // Med. Phys.-1993.-V.20, N.4.-P.965-973.
244.Lo S.C., Freedman M.T., Lin J.S. et al. Automatic lung nodule detection using profile matching and back-propagation neural network techniques // J. Digit. Imaging.-1993.-V.6, N.1.-P.48-54.
245.Luria M.N., Knoke J.D., Margolis R.M. et al. Acute myocardial infarction prognosis after recovery // Ann. Intern. Med.-1976.-V.85, N 5.-P.561-565.
246.Maclin P.S., Dempsey J. How to improve a neural network for early detection of hepatic cancer // Cancer Lett.-1994.-V.77, N.2-3.-P.95-101.
247.Maclin P.S., Dempsey J. Using an artificial neural network to diagnose hepatic masses // J. Med. Syst.-1992.-V.16, N.5.-P.215-225.
248.Maclin P.S., Dempsey J., Brooks J. et al. Using neural networks to diagnose cancer // J. Med. Syst.-1991.-V.15, N.1.-P.11-19.
249.Mancini G., Herenens J. Immunochemical quantitation of antigens by single radical immunodiffusion // Immunochemistry.-1965.-V.2.-P.235-249.
250.Margolis R.H. Detection of hearing impairment with the acoustic stapedius reflex // Ear Hear.-1993.-V.14, N.1.-P.3-10.
251.Masic N., Pfurtscheller G. Neural network based classification of single-trial EEG data // Artif. Intell. Med.-1993.-V.5, N.6.-P.503-513.
252.McAuliffe J.D. Data compression of the exercise ECG using a Kohonen neural network // J. Electrocardiol.-1993.-V.26, Suppl.-P.80-89.
253.McGonigal M.D., Cole J., Schwab C.W. et al. A new approach to probability of survival scoring for trauma quality assurance // J. Trauma.-1993.-V.34, N.6.-P.863-868.
254.McGuire W.L., Tandon A.K., Allred D.C. et al. Treatment decisions in axillary node-negative breast cancer patients // Monogr. Natl. Cancer Inst.-1992.-V.11.-P.173-180.
255.Mehta M.R., Dasgupta C., Ullal G.R. A neural network model for kindling of local epilepsy: basic mechanism // Biol. Cybern.-1993.-V.68, N.4.-P.335-340.
256.Miany S., Mingazzini P., Biasi G.M. et al. Occlusive arterial disease in young patients // J. Cardiovasc. Surg.-1984.-V.28, N 4.-P.353-356.
257.Mills J.L., Taylor L.M., Poster S.M.. Buerger's disease in the modern era // Amer. J. Surg.-1987.-V.154, N.1.-P. 123-129.
258.Modai I., Stoler M., Inbar-Saban N. et al. Clinical decisions for psychiatric inpatients and their evaluation by a trained neural network // Methods Inf. Med.-1993.-V.32, N.5.-P.396-399.
259.Molnar B., Szentirmay Z., Bodo M. et al. Application of multivariate, fuzzy set and neural network analysis in quantitative cytological examinations // Anal. Cell Pathol.-1993.-V.5, N.3.-P.161-175.
260.Morrell R., Wasilauskas B., Winslow R. Personal computer-based expert system for quality assurance of antimicrobial therapy // Am. J. Hosp. Pharm.-1993.-V.50, N.10.-P.2067-2073.
261.Moseholm L., Taudorf E., Frosig A. Pulmonary function changes in asthmatics associated with low-level SO2 and NO2 air pollution, weather, and medicine intake. An 8-month prospective study analyzed by neural networks // Allergy.-1993.-V.48, N.5.-P.334-344.
262.Moss A.J., Davis H.T., Conard D.L. et al. Digitalis associated cardiac mortality after myocardial infarction // Circulation.-1981.-V.64.-P.1150-1156.
263.Mulsant B.H. A neural network as an approach to clinical diagnosis // MD Comput.-1990.-V.7, N 1.-P.25-36.
264.Nagasaka Y., Iwata A. Perfomance Evaluation of BP and PCA Neural Networks for ECG Data Compression // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.1, P.1003-1006.
265.Nakajima H., Anbe J., Egoh Y. et al. Evaluation of neural network rate regulation system in dual activity sensor rate adaptive pacer // European Journal of Cardiac Pacing and Electrophysiology.-Abstracts of 9th International Congress, Nice Acropolis -French, Rivera, June 15-18, (228), 1994.-Rivera, 1994.-P.54.
266.Neopolitan R.E., Computing the confidence in a medical decision obtained from an influence diagram // Artif. Intell. Med.-1993.-V.5, N.4.-P. 341-363.
267.Norris R.M., Brandt P.W.T., Caughey D.E. et al. A new coronary prognostic index // Lancet.-1969.-V.8.-P.274-281.
268.Okamoto Y., Nakano H., Yoshikawa M. et al. Study on decision support system for the interpretation of laboratory data by an artificial neural network // Rinsho. Byori.-1994.-V.42, N.2.-P.195-199.
269.Oxman H.A., Connolly D.C., Nobrega F.T. et al. Factors influencing the subsequent prognosis of patients surviving their first myocardial infarction // Circulation.-1972.-V.96.-P.200.
270.Parks R.W., Long D.L., Levine D.S. et al. Parallel distributed processing and neural networks: origins, methodology and cognitive functions // Int. J. Neurosci.-1991.-V.60, N.3-4.-P.195-214.
271.Patil S., Henry J.W., Rubenfire M. et al. Neural network in the clinical diagnosis of acute pulmonary embolism // Chest.-1993.-V.104, N.6.-P.1685-1689.
272.Patra Ph., Despins Ph., Duveau D. et al. Les arteriopathies des membres inferieurs du suset de moins de 40 ans. Nature et prognostic. A propos de 41 malades operes // J. Chir. (Paris).-1985.-V.122, N.4.-P.247-254.
273.Peel A.A.F., Semple T., Wang J. et al. A coronary prognostic index for grading the severity of infarction // Brit. Heart J.-1962.-V.24.-P.745-760.
274.Piraino D.W., Amartur S.C., Richmond B.J. et al. Application of an artificial neural network in radiographic diagnosis // J. Digit. Imaging.-1991.-V.4, N.4.-P.226-232.
275.Piraino D.W., Amartur S.C., Richmond B.J et al. Segmentation of magnetic resonance images using an artificial neural network // Proc. Annu. Symp. Comput. Appl. Med. Care.-1991.-P.470-472.
276.Poli R., Cagnoni S., Livi R. et al. A Neural Network Expert System for Diagnosing and Treating Hypertension // Computer.-1991.-N.3.-P.64-71.
277.Poon C.S. Adaptive neural network that subserves optimal homeostatic control of breathing // Ann. Biomed. Eng.-1993.-V.21, N.5.-P.501-508.
278.Prideaux J.A., Mikulecky D.C., Clarke A.M. et al. A modofoed neural network model of tumour cell interactions and subpopulation dynamics // Invasion Metastasis.-1993.-V.13, N.1.-P.50-56.
279.Rabow A.A., Scheraga H.A. Lattice neural network minimization. Application of neural network optimization for locating the global-minimum conformation of proteins // J. Mol. Biol.-1993.-V.232, N.4.-P. 1157-1168.
280.Ramacher U., Schildberg P. Recent developments in neurodynamics and their impact on the design of neuro-chips // Int. J. Neural Syst.-1993.-V.4, N.4.-P.309-316.
281.Ravdin P.M., Clark G.M. A practical application of neural network analysis for predicting outcome of individual breast cancer patients // Breast Cancer Res. Treat.-1992.-V.22, N.3.-P.285-293.
282.Ravdin P.M., Clark G.M., Hilsenbeck S.G et al. A demonstration that breast cancer recurrence can be predicted by network analysis // Breast Cancer Res. Treat.-1992.-V.21, N.1.-P.47-53.
283.Ravdin P.M., Clark G.M., Hough J.J. et al. Neural network analysis of DNA flow cytometry histograms // Cytometry.-1993.-V.14, N.1.-P.74-80.
284.Reinbnerger G., Weiss G., Werner-Felmayer G. et al. Neural networks as a tool for utilizing laboratory information: comparison with linear discriminant analysis and with classification and regression trees // Proc. Natl. Acad. Sci., USA.-1991.-V.88, N.24.-P.11426-11430.
285.Reinus W.R., Wilson A.J., Kalman B. et al. Diagnosis of focal bone lesions using neural networks // Invest. Radiol.-1994.-V.29, N.6.-P.606-611.
286.Rinast E., Linder R., Weiss H.D. Neural network approach for computer-assisted interpretation of ultrasound images of the gallbladder // Eur. J. Radiol.-1993.-V.17, N.3.-P.175-178.
287.Rost B., Sander C. Prediction of protein secondary structure at better that 70% accuracy // J. Mol. Biol.-1993.-V.232, N.2.-P.584-599.
288.Rozenbojm J., Palladino E., Azevedo A.C. An expert clinical diagnosis system for the support of the primary consultation // Salud. Publica Mex.-1993.-V.35, N.3.-P.321-325.
289.Saito K., Nakano R. Medial diagnostic expert system based on PDP model // Proc.of IEEE, San Diego, 1988.-V.1.-P.255-261.
290.Schnur S. Mortality rates in acute myocardial infarction. A proposed method for measurily quantitively severity of illness in admission to the hospital // Ann. Intern. Med.-1953.-V.39.-P.1018-1025.
291.Scott J.A., Palmer E.L. Neural network analysis of ventilation-perfusion lung scans // Radiology.-1993.-V.186, N.3.-P.661-664.
292.Sellier L., Leger L., Diebold B. et al. Pronostic immediat et along term de l’infarctus du myocarde // Arch. Mal. Coeur.-1977.-V.70.-P.1155.
293.Senna A.L., Junior W.M., Carvallo M.L.B., Siqueira A.M. Neural Networks in Biological Taxonomy // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.1.-P.33-36.
294.Sepulveda F., Wells D.M., Vaughman C.L. A neural network representation of electromyography and joint dynamics in human gait // J. Biomech.-1993.-V.26, N.2.-P.101-109.
295.Shufflebarger C.M. What is neural network? // Ann. Emerg. Med.-1992.-V.21, N.12.-P.1461-1462.
296.Siebler M., Rose G., Sitzer M. et al. Real-time identification of cerebral microemboli with US feature detection by a neural network // Radiology.-1994.-V.192, N.3.-P.739-742.
297.Silen W. Cope’s early diagnosis of the acute abdomen. New-York: Oxford University Press, 1979.-149 p.
298.Sima J., Neruda R. Neural Networks as expert systems // Neural Network world.-1992.-V.2, N.6.-P.775-783.
299.Sitting D.F., Orr J.A. A parallel implementation of the backward error propagation neural network training algorithm: experiments in event identification // Comput. Biomed. Res.-1992.-V.25, N.6.-547-561.
300.Snow P.B., Smith D.S., Catalona W.J. Artificial neural networks in the diagnosis and prognosis of prostate cancer: a pilot study // J. Urol.-1994.-V.152, N.5.-P.1923-1926.
301.Snowden S., Brownlee K.G., Smye S.W. et al. An advisory system for artificial ventilation of the newborn utilizing a neural network // Med. Inf. Lond.-1993.-V.18, N.4.-P.367-376.
302.Snyder E.E., Stormo G.D. Identification of coding regions in genomic DNA sequences: an application of dynamic programming and neural networks // Nucleic Acids Res.-1993.-V.21, N.3.-P.607-613.
303.Spackman K.A. Combining logistic regression and neural network to create predictive models // Proc. Annu. Symp. Comput. Appl. Med. Care.-1992.-P.456-459.
304.Steen P.M. Approaches to predictive modelling // Ann. Thorac. Surg.-1994.-V.58, N.6.-P.1836-1840.
305.Stefanuk V.L. Expert systems and its applications // The lectures of Union's workshop on the main problems of artificial intillegence and intellectual systems. Part 2, Minsk, 1990.-P.36-55.
306.Sweeney J.W.P., Musavi M.T., Guidi J.N. Probabilistic Neural Network as Chromosome Classifier // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.1.-P.935-938.
307.Terasaki P.I. Microdroplet lymphocyte cytotoxicity test // Manual of tissue typing technic. ues.-Betezda, 1970.-P.42-45.
308.Todd B.S., Stamper R., Macpherson P. A probabilistic rule-based expert system // Int. J. Biomed. Comput.-1993.-V.33, N.2.-P.129-148.
309.Tourassi G.D., Floyd C.E., Sostman H.D. et al. Acute pulmonary embolism: artificial neural network approach for diagnosis // Radiology.-1993.-V.189, N.2.-P.555-558.
310.Trafford J.C., Lafferty K., Potter C.E. et al. An epidemiological survey of Raynaud's phenomenon // Europ. J. Vasc. Surg.-1988.-V.2, N.3.-P.167-170.
311.Tsai D.-Y., Fujita H., Horita K. et al. Classification of Breast Tumours in Mammograms Using a Neural Network: Utilisation of Selected Features // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.1.-P.967-970.
312.Tu J.V., Guerriere M.R. Use of a neural network as a predictive instrument for length of stay in the intensive care unit following cardiac surgery // Proc. Annu. Symp. Comput. Appl. Med. Care.-1992.-P.666-672.
313.Tu J.V., Guerriere M.R. Use of a neural network as a predictive instrument for length of stay in the intensive care unit following cardiac surgery // Comput. Biomed. Res.-1993.-V.26, N.3.-P.220-229.
314.Turbo Vision. Version 2.0. Programming Guide.-Borland International, Inc., 1992.-618 p.
315.Van Leeuwen J.L. Neural network simulations of the nervous system // Eur. J. Morphol.-1990.-V.28, N.2-4.-P.139-147.
316.Varela F.J., Coutinho A., Dupire B. et al. Cognitive networks: immune, neural and otherwise // Teoretical immunology. Ed. by Perelson A.-Addison Wesley, 1988.-Part 2.-P.359-375.
317.Vedin A., Wilhelmsen L., Wedel H. et al. Prediction after myocardial infarction // Acta. Med. Scand.-1977.-V.201.-P.309-316.
318.Vertosick F.T., Kelly R.H. The immune system as a neural network: a multi-epitope approach // J. Theor. Biol.-1991.-V.150, N.2.-P.225-237.
319.Vertosick F.T., Rehn T. Predicting behavior of an enzyme-linked immunoassay model by using commercially available neural network software // Clin. Chem.-1993.-V.39, N.12.-P.2478-2482.
320.Volmer M., Wolthers B.G., Metting H.J. et al. Artificial neural network predictions of urinary calculus compositions analyzed with infrared spectroscopy // Clin. Chem.-1994.-V.40, N.9.-P.1692-1697.
321.Welling R.E. Buerger's disease // Revisited Angiology.-1982.-V.33, N.4.-P.239-250.
322.Wilding P., Morgan M.A., Grygotis A.E. et al. Application of backpropagation neural networks to diagnosis of breast and ovarian cancer // Cancer Lett.-1994.-V.77, N.2-3.-P.145-153.
323.Wolberg W.H., Mangasarian O.L. Computer-aided diagnosis of breast aspirates via expert systems // Anal. Quant. Cytol. Histol.-1990.-V.12, N.5.-P.314-320.
324.Wu C., Whitson G., McLarty J. et al. Protein classification artificial neuron system // Protein Sci.-1992.-V.1, N.5.-P.667-677.
325.Wu F.Y., Slater J.D. Regional cerebral blood flow estimation by neural network-based parametric regression analysis // Int. J. Biomed. Comput.-1993.-V.33, N.2.-P.119-128.
326.Wu F.Y., Slater J.D., Honig L.S. et al. A neural network design for event-related potential diagnosis // Comput. Biol. Med.-1993.-V.23, N.3.-P.251-264.
327.Wu F.Y., Yen K.K. A PC-based neural network for on-line measurement of regional cerebral blood flow // Comput. Biol. Med.-1992.-V.22, N.1-2.-P.23-32.
328.Wu Y., Giger M.L., Doi K. et al. Artificial neural networks in mammography: application to decision making in the diagnosis of breast cancer // Radiology.-1993.-V.187, N.1.-P.81-87.
329.Xue Q., Hu Y.H., Tomkins W.J. Neural-network-based adaptive matched filtering for QRS detection // IEEE Trans. Biomed. Eng.-1992.-V.39, N.4.-P.317-329.
330.Yaijko R.D., Stell G. Exploratory celiotomy for acute abdominal pain // Am. J. Surg.-1974.-N.128.-P.773-776.
331.Yamada S., Nakashima M., Shiono S. Neural Network Model to Simulate Neuronal Responses of Aplysia Gillwithdrawal Reflex // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.1.-P.37-40.
332.Yang T.-F., Devine B., Macfarlane P.W. Combination of artificial neural networks and deterministic logic in the electrocardiogram diagnosis of inferior myocardial infarction // Eur. Heart J.-1994.-V.15.-Abstr. Supplement XII-th World Congress Cardiology (2408).-P.449.
333.Yang T.-F., Devine B., Macfarlane P.W. Computer assisted electrocardiogram detection of myocardial infarction by software based artificial neural networks // Eur. Heart J.-1994.-V.15.-Abstr. Supplement XII-th World Congress Cardiology (2407).-P.449.
334.Yang T.-F., Devine B., Macfarlane P.W. Deterministic logic versus software-based artificial neural networks in the diagnosis of atrial fibrillation // J. Electrocardiol.-1993.-V.26, Suppl.-P.90-94.
335.Yang T.-F., Devine B., Macfarlane P.W. Differentiation of atrial fibrillation from sinus rhythm and (supra)ventricular extrasystoles using software based neural networks // Eur. Heart J.-1993.-V.14.-Abstr. Supplement XVth Congress of the European Society of Cardiology, August, 1993.-(P1300).-P.235.
336.Zatari D., Botros N., Dunn F. In vivo liver differentiation by ultrasound using an artificial neural network // J. Acoust. Soc. Am.-1994.-V.96, N.1.-P.376-381.
337.Zhang W., Doi K., Giger M.L. et al. Computerized detection of clustered microcalcifications in digital mammograms using a shift-invariant artificial neural network // Med. Phys.-1994.-V.21, N.4.-P.517-524.
338.Zhang X., Li J. Self-organizing map as a new method for clustering and data analysis // Proceedings of 1993 International Joint Conference on Neural Networks, Nagoya, Japan, October 25-29, 1993.-Nagoya, 1993.-V.2.-P.2448-2451.
339.Zusmanovich F.N. Osteotrepanation is an alternative to amputation of an ishemic extremity // Surg.-1992.-N.1.-P. 93-94.