13. Теория Демпстера-Шафера Если свидетельства об одной гипотезе приводят к нескольким значениям функции доверия, то они объединяются по правилу комбинирования Демпстера: , где — мера конфликта взвешенных множеств.
14.
15.
16.
17.
18.
19. Опросники Мерки клиента Характеристики телосложения Пожелания по фасонным э лементам Правила выбора фасонных э лементов Правила расчета прибавок Рекомендации по выбору фасонных э лементов Рекомендуемые прибавки Итоговый выбор фасонных э лементов Вывод рекомендаций по выбору фасонных э лементов Расчет рекомендуемых прибавок Взаимодействие Хранимые знания Характеристики ткани
20.
21.
Notes de l'éditeur
Существует множество правил вывода информации (выбора правил, порядка их применения). Широко распостранён метод резолюций и его модификации.
Один из распостранённых способов работы с неопределённостью — использование аппарата теории вероятности и Байесовской статистики ([4], [6]). Знания экспертной системы представляются в виде таблиц вероятностей: априорных вероятностей исходов, а также условных вероятностей характеристик задачи при каждом заданном исходе. Алгоритм вывода использует эти таблицы применяя теорему Баейса, вычисляя вероятность каждого возможного исхода на заданных входных данных ([4]). Формально, хранятся следующие величины: Компоненты вектора M характеризуют задачу: например, для описания факта наличия или отсутствия какой-либо характеристики, они принимают только значения "0" или "1". В нескольких независимых сравнительных исследованиях разных способов представления неопределённостей, Байесовский подход показал лучшие результаты ([3]). Байесовский подход к формализации неопределённости успешно используется для систем диагностики — в частности, медицинской. Он использовался в системах диагностики болей в животе (в [7] приводится пример экспертной системы, совершавшей вдвое меньше ошибок, чем эксперты), врождённых болезней сердца, классификации пациентов сердечных приступов и других ([4]). У вероятностного подхода есть и ряд недостатков. Один из них возникает при моделировании сложных проблем: над множественными совместными распределениями неудобно строить вывод ([5]). Также для некоторых проблем лучше подходят заточенные под них способы представления неопределённости.
Один из классических подходов решения проблемы представления неопределённости — нечёткие множества и нечёткая логика, введённые Заде. Основная идея состоит в представлении фактов с мерой их достоверности (истинности). Над фактами, представленными таким образом, определён набор операций, аналогичных операциям алгебры логики, которые к тому же вычисляют достоверность результата. Кроме этих операций определён также набор модификаторов естественного языка ("очень", "не", "немного", и т.п.), которые определенным образом изменяют вероятность факта, перед которым присутствуют. Например, "очень" может соответствовать возведению достоверности выражения в квадрат, а "не" — вычитанию достоверности выражения из единицы. Удобство такого представления в том, что оно легко используется в схемах логического вывода на основе правил, а также в том, что они позволяют построить достаточно простое отображение внутреннего представления данных системы на язык ввода экспертной системы. В отличие от Байесовского подхода, на выходе получается цепочка применённых к входным данным логических правил, которую легко преобразовать в обоснование полученного результата. Обратим внимание, что обозначенные правила для конъюнкции и дизъюнкции эквивалентны вероятностному выводу в предположении максимальной корелляции A и B. Если события A и B не взаимоисключающие, в нечёткой логике это промоделировать без модификаций не удастся ([3]). Также дополнительные неудобства вносит неоднозначность трактовки модификаторов.
Не всякую неопределённость можно представить с помощью вероятностного подхода. Например, если о подбрасываемой монете ничего не известно, можно предположить, что вероятности выпадения орла и решки 0,5. Если же нам известно, что монета идеально сбалансирована — мы однозначно знаем, что вероятности выпадения орла и решки составляют 0,5. При вероятностном подходе эти ситуации моделируются одинаково, что не полностью соответствует действительности. Теория Демпстера-Шафера позволяет явным образом моделировать отсутствие знаний о распределении вероятностей. В ней рассматривается такое понятие, как функция доверия. В случае с монетой, о которой ничего не известно, и у выпадения орла, и у выпадения решки будет нулевое доверие. В случае равномерной монеты меры доверия выпадания орла и решки составят 0,5. В этом подходе рассматривается множество всех подмножеств элементарных исходов. Для каждого подмножества рассматриваются свидетельства (на основе входных данных), поддерживающие и опровергающие гипотезу о том, что имеет место быть это подмножество; в качестве опровергающих свидетельств рассматриваются только те, которые поддерживают противоположную гипотезу (т.е. на вероятность данной гипотезы может повлиять только противоположная гипотеза; остальные, пересекающиеся с данной, не учитываются).
Нормировочный коэффициент (1-K) отбрасывает все конфликтные ситуации (т.е. если из одного источника известно, что у события A вероятность 99%, у события B — 1%, а из другого источника известно, что у события C вероятность 99%, у события B — 1%, то правило комбинирования Демпстера даст вывод, чтоб событие B достоверно: m(B) = Bel(B) = 1, несмотря на то, что оба источника считают его очень неправдоподобным).
Заметным плюсом теории Демпстера-Шафера является то, что она одновременно представляет метод моделирования отсутствия знания, правила вывода над данными, представленными таким образом, а также алгоритм разрешения конфликтов, чего нет ни в Байесовском подходе, ни при использовании нечёткой логики. Однако существенным недостатком является комбинаторный взрыв, возникающий при построении опорных знаний: необходимо вводить веса множества всех подмножеств множества элементарных исходов (хотя на практике потребуется вводить коэффициенты только для интересных случаев, а остальным можно назначить нулевые коэффициенты). Другой заметный недостаток — отсутствие эффективной процедуры построение вывода на основе функций доверия. По этим причинам теория Демпстера-Шафера не использовалась широко в экспертных системах ([3]).
Такой подход позволяет позволяет в простой форме представить знания с неопределённостью, построить вывод по входным данным и разрешить конфликты, не накладывая существенных ограничений. Как и в случае нечёткой логики, используется логический вывод, который также может использоваться как обоснование ответа. Коэффициенты, используемые в декларативных правилах данного метода, называются факторами достоверности, что и определяет название метода.
MYCIN была ранней экспертной системой разработанной за 5 или 6 лет в начале 1970х годов в Стендфордском университете. Она была написана на Лиспе как докторская диссертация Edward Shortliffe под руководством Bruce Buchanan, Stanley N. Cohen и других. В этой же лаборатории была ранее создана экспертная система Dendral, но на этот раз внимание было акцентировано на использовании решающих правил с элементами неопределенности. MYCIN был спроектирован для диагностирования бактерий, вызывающих тяжелые инфекции, такие как бактериемия и менингит, а также для рекомендации необходимого количества антибиотиков в зависимости от массы тела пациента. Название системы происходит от суффикса «-мицин», часто встречающегося в названиях антибиотиков. Также Mycin использовалась для диагностики заболеваний свертываемости крови. MYCIN оперировала с помощью довольно простой машины вывода, и база знаний из ~600 правил. После запуска, программа задавала пользователю (врачу) длинный ряд простых «да/нет» или текстовых вопросов. В результате, система предоставляла список подозреваемых бактерий, отсортированный по вероятности, указывала доверительный интервал для вероятностей диагнозов и их обоснование (то есть MYCIN предоставляла список вопросов и правил, которые привели её к именно такому ранжированию диагнозов), а также рекомендовала курс лечения. Несмотря на успех MYCIN, она вызвала дебаты по поводу правомерности её машины вывода. Исследования, проведенные разработчиками, показали, что эффективность системы минимально зависит от конкретных числовых особенностей реализаций правил вывода. Они допустили, что эффективность в значительно большей степени зависит от способа представоения знаний и способа вывода. Этот вопрос был рассмотрен в (Shortliffe EH and Buchanan BG. A model of inexact reasoning in medicine. Mathematical Biosciences 23:351-379, 1975) и потом в их подробной книге о MYCIN и связанных с ней экспериментах (Rule Based Expert Systems: The MYCIN Experiments of the Stanford Heuristic Programming Project, EH Shortliffe, eds. Reading, MA: Addison-Wesley, 1984). [править]Результаты Исследования, проведенные в Stanford Medical School, обнаружили, что MYCIN предлагает приемлемую терапию примерно в 69 % случаев, что лучше, чем у экспертов по инфекционным болезням, которых оценивали по тем же критериям. Это исследование часто цитируют, чтобы продемонстрировать возможную степень несогласия между решениями врачей, даже если они эксперты, когда нет «золотого стандарта» для правильного лечения (Yu VL, et al. Antimicrobial selection by a computer — a blinded evaluation by infectious disease experts. Journal of the American Medical Association 242:1279-1282, 1979). [править]Практическое использование Фактически, MYCIN никогда не использовалась на практике. И не в силу низкой её эффективности. Как уже упоминалось, в тестах она превосходила профессоров Stanford medical school. Некоторые исследователи поднимали этические и правовые вопросы, связанные с использованием компьютеров в медицине — если программа дает неправильный прогноз или предлагает неправильное лечение, кто должен отвечать за это? Тем не менее, наибольшей проблемой и настоящей причиной, почему MYCIN не используется в повседневной практике, было состояние технологий системной интеграции, особенно во времена её создания. MYCIN была автономной системой, требующей от пользователя набора всей необходимой информации. Программа запускалась на сервере с разделением времени, доступному по раннему Интернету (ARPANet), когда еще не было персональных компьютеров. В наше время, подобная система была бы интегрирована с системой медицинских записей, извлекала бы ответы на свои вопросы из базы данных о пациентах, и была бы значительно менее зависима от ввода информации врачем. В 1970-х, сеанс работы с MYCIN мог легко занять 30 минут и более — что составляет недопустимые потери времени для занятого врача клиники. Наибольшим достижением MYCIN была демонстрация мощи её подхода к представлению знаний и построению выводов. Позже было разработано множество экспертных систем, основанные на правилах. В 1980-х появились «оболочки» для экспертных систем (в том числе основанных на MYCIN, известная как E-MYCIN (разрабатываемая KEE)), что способствовало разработке экспертных систем во разнообразных прикладных областях. Главной трудностью, с которой столкнулись по время разработки MYCIN и последующих экспертных систем, было «извлечение» знаний из опыта людей-экспертов для формирования базы правил. Сейчас данными вопросами занимается инженерия знаний).