Interactive generation of new knowledge based on automatic means of logical inference
- Authors: Vassilyev S.N.1
-
Affiliations:
- V.A. Trapeznikov Institute of Control Sciences of the Russian Academy of Sciences
- Issue: Vol 13, No 1 (2023)
- Pages: 10-28
- Section: GENERAL ISSUES OF FORMALIZATION IN THE DESIGNING: ONTOLOGICAL ASPECTS
- URL: https://journals.ssau.ru/ontology/article/view/26975
- DOI: https://doi.org/10.18287/2223-9537-2023-13-1-10-28
- ID: 26975
Cite item
Full Text
Abstract
The work relates to the field of knowledge representation and algorithmization of their processing. To describe the subject of consideration by a set of statements and their processing, logical means of the first order type are used. Unlike the well-known achievements in the field of automatic proof (AP) in formal axiomatic theories, the automatic text synthesis of statements is complicated by the poor formalizability of the value of knowledge concept contained in the text. Based on the development of the calculus of positively-formed standardized formulas (pfs-formulas) the possibilities of analysis automation of the description of the subject matter and interactive generation of meaningful statements to improve this description are investigated. The proposed method of interactive knowledge generation integrates the capabilities of AP with algorithmized human-machine synthesis of new knowledge texts. AP in the calculus of pfs-formulas helps a person not only in the analysis of properties, but also in the choice of the required properties of the description of the subject matter. When the absence of a property desirable for a person in the analyzed knowledge is revealed by means of AP, the hypotheses is formed that logically guarantees the presence of the required property. Variants of hypotheses are automatically synthesized in a preliminary form, which are then refined interactively to improve the content of the generated text of new knowledge. The rules of synthesis are justified. Their application continues the inference in situations of inapplicability of the basic rule of inference in the calculus of pfs-formulas. The extension of calculus by the rules of synthesis transforms it as a first-order calculus of the deductive type into a means of deductive-abductive inference, which differs from the known works using abduction by the absence of a number of restrictions. Illustrative examples demonstrate the representation, analysis and generation of knowledge. These examples also show in interactive knowledge processing the importance of visualization of the processed text, provided by the large-block structure of pfs-formulas constructed from typical quantifiers. In conclusion, the results of the paper and possible directions for the development of the results are formulated.
Full Text
Введение
Представление и обработка знаний обычно сопровождаются оценкой свойств сформированной с использованием некоторого языка совокупности знаний, как описания некоторой предметной области (ПрО). В числе анализируемых свойств могут быть взаимная независимость или, наоборот, следование одних знаний из других, непротиворечивость и другие свойства. Обработка знаний, как элементов описания ПрО, включает компоновку состава с удалением одних и порождением новых. Данная работа посвящена методу порождения знаний с применением логических средств формализации и обоснования утверждений в языке, полном относительно выразительности языка исчисления предикатов (ИП) первого порядка.
Известны разные формальные аксиоматические теории [1] и средства логического вывода для автоматизации доказательства (АД) теорем, например, [2-8] и др. В данной работе для представления и обработки знаний используются логический язык L и исчисление J позитивно-образованных стандартизованных формул (пос-формул) [9, 10], хотя в метаязыке удобно использовать и традиционную терминологию ИП; далее ИП ‒ первого порядка [1] (собственные аксиомы теории первого порядка, если они есть, предполагаются в составе описания ПрО).
В отличие от АД, задача синтеза текстов новых знаний трудно разрешима с точки зрения автоматизации. В данной работе рассматривается порождение утверждений, которые не являются просто логическими следствиями известного знания, т.е. допускающими своё получение механической дедукцией следствий. Причина трудностей автоматизации синтеза текста нового знания ‒ в некорректности общей постановки этой задачи, и в первую очередь из-за трудности формализации интуитивных предпочтений специалиста в отношении ценности порождаемого знания. Не гарантируют этой ценности и такие, представимые синтаксически, критерии ценности теоремы, как высокая сложность (большая длина) доказательства или, наоборот, компактность текста теоремы (один из критериев элегантности), вхождение в тексты теоремы и её доказательства ключевых слов актуальной области исследований. С другой стороны, при использовании АД в интерактивном обучении человека уделяется больше внимания не только и не столько доказательству, как свидетельству корректности теоремы, сколько её понятности. Это может означать, например, что в задачах синтеза теорем для повышения ценности синтезируемого оно, возможно, должно быть структурировано с разбивкой на несколько утверждений (лемм и теорем) по критерию совокупной понятности. И это ‒ при том, что автоматически синтезировать тексты теорем, формально верных, не трудно (тем более, что в число таких теорем входят и простые логические следствия), что было продемонстрировано, например, в [11].
Сказанное подводит к целесообразности использования мер обеспечения содержательности синтезируемого уже в самой постановке задачи. Так, в контексте анализа знаний и конкретно в ситуации выяснения наличия некоторого свойства F анализируемой совокупности знаний, как некоторого описания ПрО, при отсутствии этого свойства может возникнуть задача формирования некоторого непротиворечивого условия H, гарантирующего наличие F, т.е. задача синтеза теоремы (здесь ‒ свойство, отличное от непротиворечивости, проверяемой просто средствами АД без обращения к синтезу ). Например, такая задача может возникнуть, когда выявлены одновременно непротиворечивость и недоказуемость или когда выясняемое свойство F состоит в следовании некоторых знаний из других, а H‒ условие, логически достаточное для наличия F. При этом важно то, что в отличие от общей постановки задачи порождения новых знаний, трудности которой были отмечены выше, теперь текст утверждения , как нового знания, наследует содержательность исходного текста F как части нового текста.
В данной работе на основе интерактивного подхода к проблеме порождения новых знаний предлагается метод синтеза теорем . В этом методе человек выбирает версию условия H в ответ на предлагаемые ему опции со стороны средств АД. В настоящее время, несмотря на достижения в области АД, интерактивность в доказательстве теорем тоже широко используется; причины ‒ не только в возможной недостаточности ресурсов (времени, памяти и др.), но и в полуразрешимости ИП и, возможно, в широте собственной аксиоматики, вызывающей неразрешимость теории, объемлющей ИП [1, 12-14].
В интерактивном режиме синтеза знаний важна наглядность текста в языке формализации. Используемый язык пос-формул, в силу их крупноблочности, как и крупноблочности средств обработки, облегчает восприятие текста человеком, по сравнению, например, с неестественной клаузальной формой представления и обработки знаний резолюционными решателями [5, 15]. Важно также то, что эвристическая структура знания, выраженная в естественном языке, сохраняется при переводе на язык пос-формул. В языке пос-формул формулы построены из ти́повых кванторов (ТК) при том, что в естественном языке можно видеть аналоги не обычных кванторов логического языка, а аналоги именно ТК. Действительно, в естественном языке квантификация предметных переменных (т.е. использование выражений, подобных фразам «для всех», «существует») сопровождается указанием некоторого условия, ограничивающего множество допустимых значений предметной переменной. Это условие в ти́повых кванторах именуется ти́повым условием. Такое частичное подобие пос-формул естественному языку и крупноблочность формульных преобразований в исчислении пос-формул повышают наглядность текста для восприятия и семантической оценки человеком [10, 16-18].
Понятие «ТК» введено в [19]. Частными случаями ТК являются ограниченные (специализированные) кванторы в формулировках свойств многоосновных алгебраических систем и моделей [20, 21]. Ти́повыми условиями здесь являются условия принадлежности значений кванторных переменных тому или иному множеству из некоторого семейства основных множеств. В языках многосортных логик эти множества, как сорта переменных, используются для повышения эффективности АД, проверки проектных ограничений и др. [22, 23]. Прямым обобщением ограниченных кванторов являются кванторы с ти́повыми условиями в форме принадлежности значений кванторных переменных так называемым ступеням [19], построенным из основных множеств с помощью операций декартового произведения и образования множества всех подмножеств. Дальнейшее обобщение кванторов со ступенями использовано при решении логико-алгебраических уравнений [24, 25].
Ти́пово-кванторный язык L пос-формул в так называемом стандартизованном виде (см. раздел 1) и соответствующее исчисление J были предложены автором совместно с А.К. Жерловым [9, 10]. Ти́пово-кванторное представление знаний автор использовал в предложенном им языке позитивно-образованных формул, но не стандартизованных. Автор ввёл этот язык, именуемый здесь как язык пон-формул для развития алгоритмов метода сравнения В.М. Матросова и синтеза теорем о сохранении свойств математических моделей [26-29]. Этот язык выше первого порядка и этим обеспечивалась представимость в нём, например, свойства устойчивости по Ляпунову. Язык пон-формул может быть и частично-формализованным ‒ до некоторой глубины структуры своих формул, а именно без формализации ти́повых условий.
Развиваемое здесь в языке L пос-формул исчисление J+ для синтеза теорем выходит за рамки чисто дедуктивного подхода, реализованного в исчислении [9, 10]. В отличие от двухместного правила резолюции [5], правило дедукции в J является одноместным, что снижает комбинаторность поиска выводов. Что касается систем АД не резолюционного типа, то типичными их недостатками являются многоместность и неединственность их правил вывода (см., например, [8]).
С логической точки зрения исчисление J+ является дедуктивно-абдуктивным, и вывод в нём с логической точки зрения достоверен, хотя синтезируемые гипотезы при обычной ограниченности описания ПрО могут быть лишь правдоподобными, почему и нужна их оценка человеком. Известны системы логического вывода, похожим образом ориентированные на задачи синтеза гипотез, не противоречащих теории и «объясняющих наблюдаемое», например, в стиле задач диагностики «причина-эффект» в первопорядковой логике [30]. В них в роли свойства F выступает логическое следование наблюдаемого факта из базовой совокупности знаний (теории), а H‒ условие этого следования как объяснение наблюдаемого. При этом в разработках по абдуктивному выводу, помимо или вместо привлечения эксперта, часто используется некоторое множество потенциально возможных вариантов эмпирических гипотез, предполагаемое априори заданным на основе имеющегося прошлого опыта. Из альтернативно синтезированных тем или иным способом гипотез выбирается гипотеза, принадлежащая этому множеству.
В известных работах по выводу с абдукцией формульное представление знаний часто бывает ограничено требованием хорновости [31], типичным для логического программирования [32, 33]. Ограничением другого типа часто выступает требование, чтобы знания теории представлялись эквивалентностями в словаре переменных-причин и переменных-эффектов (с возможной частичной упорядоченностью эквивалентностей между собой импликациями). Таковыми в пропозициональном случае являются эквивалентности переменных-причин дизъюнкциям элементарных конъюнкций, составленных из переменных-эффектов и их отрицаний [30, 34].
Программные разработки на базе предложенного в работе метода интерактивного синтеза новых знаний с участием эксперта могут нуждаться в совершенствовании с учётом опыта использования, например, при реализации метода в составе некоторой экспертной или оперативно-советующей системы в медицине, авиации, учебном процессе и других приложениях [35-37]. Это, например, может быть связано с возможными ситуациями сомнения или несогласия конечного пользователя (оператора, врача, пилота, учителя и т.п.) с синтезированным объяснением или рекомендацией системы даже при её способности объяснять и наблюдаемое, и свои решения. Аккумулирование таких случаев и объяснений пользователя, обладающего системным, холистическим взглядом на ПрО, с верификацией оснований для сомнений пользователя может быть полезным для совершенствования системы.
В разделе 1 данной работы вводятся основные понятия и формулируется постановка рассматриваемой задачи. В разделе 2 вводится исчисление дедуктивно-абдуктивного типа J+. Излагаются и обосновываются свойства его правил синтеза с точки зрения необходимости и достаточности синтезируемого. В разделе 3 приводятся примеры анализа свойств F описания ПрО и синтеза гипотез H как условий доказуемости F. В заключении формулируются итоги работы и задачи на будущее.
1 Основные понятия и постановка задачи
Язык пос-формул [10] построен на базе позитивных ТК, а именно: ТК всеобщности (ТКВ) и ТК существования (ТКС) . Здесь X={x1,…,xk} ‒ множество предметных переменных , а W ‒ ти́повое условие, накладываемое как на эти переменные, так и, может быть, на переменные, связанные другими ТК, в область действия которых в пос-формуле входит рассматриваемый ТК. ТК именуется позитивным, если ти́повое условие ‒ конъюнкт, т.е. конъюнкция атомов или пропозициональная константа t либо f (true и false, соответственно). Далее рассматриваемые ТК считаются позитивными.
Определение 1 (пос-формулы). Пусть , а через обозначен символ , если и символ если. Тогда:
1) ‒ -формула;
2) если -формулы, то ‒ -формула;
3) все -формулы являются поc-формулами; других поc-формул нет.
Отсутствие в синтаксисе поc-формул символа отрицания объясняет название формул. Язык L состоит из пос-формул. Подмножество языка L, состоящее из -формул, обозначается Существенное отличие языка L от других языков представления знаний состоит в сборке пос-формул только из ТК.
Семантика пос-формул F, , определяется [10] через семантику соответствующих им формул языка ИП. Представление пос-формулы F в языке ИП обозначается . Соответствие задаётся следующим отображением:
1) (при этомформулы);
2) (здесь формулы);
3) , где Ф‒ пусто, поэтому
(дизъюнкция набора Ф формул , пустого при , ложна);
4) (конъюнкция пустого набора Ф пос-формул истинна).
Таким образом, структура пос-формулы может ветвиться дизъюнктивно после ТКВ и конъюнктивно после ТКС, а ТКВ и ТКС могут входить в ветвь пос-формулы только поочерёдно. Далее считается, что обозначения кванторных переменных двух ТК, один из которых входит в область действия другого, не пересекаются. Метод трансляции формул языка ИП в формулы языка L описан, например, в [18]. Язык L полон [10] относительно выразительной силы языка ИП.
Обычные понятия логической эквивалентности, следования и другие будут пониматься в языке L как в языке ИП, так как L можно считать собственным подмножеством множества формул языка ИП. Представление формулы языка ИП в L обозначается . Если в метаязыке выражение построено из пос-формул как подформул с помощью некоторых из логических символов , то вместо пос-формул следует понимать их образы в языке ИП. Так, если из контекста ясно, что , то запись понимается как , т.е. как общезначимая, или истинная в любой интерпретации, формула, а в силу полноты ИП относительно выводимости это означает и выводимость в ИП.
Замечание 1. Язык позитивных формул [21, 38], как собственное подмножество языка ИП, не использует ТК и существенно у́же языка пос-формул и, тем более, пон-формул. Позитивные формулы в смысле [21, 38] используют только логические связки , и обычные кванторы, не используя отрицания и импликации. Позитивность пос-формул проявляется в двух смыслах: 1) структура допускает только - и -ветвления; 2) структура собрана из ТК, ти́повые условия которых суть конъюнкты без отрицаний атомов [9]. При переводе пос- или пон-формул в язык ИП проявляются импликации ТКВ. Это обеспечивает полноту языка пос-формул относительно выразительности языка ИП и, в том числе, подмножества его формул с отрицаниями. Язык пон-формул: а) позитивен в первом смысле, б) может быть более высокого порядка, чем первый порядок, в) может быть частично формализованным и г) предложен для решения логических уравнений, имеющих структуру теорем о сохранении свойств связанных математических моделей.
Если при символе Q пос-формулы кванторные переменные отсутствуют (k=0), то символ Q не удаляется для конкретизации смысла связки или , ассоциируемой с посылочным или утвердительным смыслом ти́пового условия W в ТКВ и ТКС соответственно. Если в пос-формуле кванторные переменные отсутствуют (при всех символах Q и во всех ти́повых условиях), то множество таких пос-формул может рассматриваться как подмножество пропозиционального языка, полное относительно выразительности пропозиционального языка.
Определение 2. Каноническим видом пос-формулы считается её представление с корневым ТКВ , т.е. в виде , где и ‒ непустое множество -формул, именуемых базовыми подформулами (БП).
В множестве канонического представления формулы выделена одна подформула как образец преобразований всех -формул из по описываемому ниже правилу вывода . Здесь ‒ подмножество прочих БП (возможно, пустое), строение которых аналогично следующему строению формулы G
(1)
Каждый ТКС, как узел структуры пос-формулы, смежный корню , является корневым для БП так же, как ТКС для Ф. Он именуется базой (фактов), а его конъюнкт (в ТКС это конъюнкт А) ‒ базовым конъюнктом. Узлы, дочерние базе, т.е. ТКВ (для ТКС это ТКВ ), называются вопросами к базе, а подформулы, находящиеся в области действия базы (для ТКС это подформулы ), ‒ закономерностями базы (они у некоторых баз могут отсутствовать, когда Пос-формулы, все БП которых не содержат ТКВ с ветвлением (т.е. ТКВ с дизъюнктивными ветвлениями), называются хорновскими, по аналогии с [31].
Отображение (частичное из множества Yi в множество X) именуется подстановкой (контексты употребления символа одновременно в теоретико-множественном и логическом смыслах исключают коллизии). Через обозначается результат замены в Bi переменных из множества Yi на некоторые переменные из X. Если , то отображение называется ответной подстановкой, а вопрос ‒ уместным вопросом.
Определение 3 (правило вывода ). Пусть пос-формула V отлична от и представлена в каноническом виде , где , G имеет вид (1), но т.е. в множество закономерностей Ф базы не пусто, и для некоторого , а . Тогда
где ‒ разыменование кванторных переменных, т.е. замена элементов множества на новые переменные из .
Правило является логически эквивалентным преобразованием [10]. В яыке L пос-формул с применением этого правила введено исчисление [9, 10], где формула ‒ признак завершения вывода. Она является противоречием, поскольку в исчислении J доказательство всякой теоремы F ведётся от противного, как, например, и в [5]: опровергается отрицание V = (¬ F)L доказываемого. Формула V из L называется выводимой в J (это записывается или ), если , т.е. на некотором шаге применения правила получается . Исчисление J полно относительно выводимости [10]: отрицание всякой теоремы в ИП, представленное пос-формулой в языке L, выводимо в исчислении J. Наоборот, если пос-формула выводима в исчислении J, то отрицание её образа в языке ИП ‒ теорема ИП, т.е. общезначимо. Простейший пример невыводимой формулы возникает в случае, когда какая-то БП не содержит закономерностей (). Необходимым условием опровержимости пос-формулы является наличие листового узла как потенциального «источника» проникновения в базу фактов атома f.
В случае наличия прикорневого ветвления структуры пос-формулы V, задача опровержения V ввиду дизъюнктивности ветвления сводится к независимым и аналогичным друг другу подзадачам опровержения своей БП. Проникновение в базовый конъюнкт константы f означает логическую эквивалентность базового конъюнкта и всей БП константе f; поэтому в случае единственности этой БП процесс опровержения завершён, а при неединственности она удаляется (это является логически эквивалентным преобразованием) с переходом к уместным вопросам других баз, и вывод по замыслу должен продолжаться до получения аналогичного эффекта во всех базах, если F была противоречивой.
Пусть F ‒ формула в языке ИП. Её дедуктивная проверка на доказуемость в исчислении состоит в опровержении пос-формулы , т.е. в выводе или в ИП.
2 Синтез гипотез
Пусть и в канонической форме , где G‒ выделенная БП вида (1), а ‒ множество прочих БП.
В исчислении вводится первый тип правил . Это определяемые ниже правила первичного преобразования пос-формул. Им будут соответствовать гипотезы H первичного типа. Правила расширяют множество закономерностей некоторой базы обрабатываемой пос-формулы гипотезой H, корневой узел которой является заведомо уместным вопросом. Поэтому в ситуации непродолжимости вывода в исчислении , т.е. неприменимости правила , применение правила заведомо продолжает вывод.
Определение 4 (правила первичного преобразования пос-формул). Правила ‒ это преобразования , где H. ‒ поc-формула, предполагаемая замкнутой (не содержащей свободных вхождений кванторных переменных), а преобразование в зависимости от H имеет вид:
а) , когда (при ); (2)
б) , когда (при ); (3)
в) когда (при ). (4)
Здесь верхний индекс означает разыменование в H кванторных переменных (для исключения их совпадения с переменными, входящими в корень и его дочерние узлы из G). При позитивности конъюнктов , вытекающей из определения пос-формул, гипотезы H непротиворечивы. Логические связи свойства F и гипотез H представлены в следующей теореме.
Теорема 1 (о связи свойства F и гипотез H первичного типа). Пусть F ‒ изучаемое свойство описания ПрО, а H ‒ гипотеза первичного типа, , где Тогда , где , т.е. . В частности:
1) если , то (условие H достаточно для F);
2) если , то (условия и необходимы для F).
Доказательство. Необходимо показать достаточность условия для F при любом . Пусть синтез гипотезы H выполнен применением правила к пос-формуле V, полученной из F -кратным применением правила , т.е. к формуле , где и . Тогда
,
а так как и не содержит вхождений переменной X, то
и поэтому . Это значит, что . Отсюда следует . С учётом этого и того, что при справедливо , получается утверждение 1) доказываемой теоремы.
Пусть теперь . Требуется показать необходимость соответствующих гипотез первичного типа и (см. (2) и (3)). Если , то , откуда очевидным образом следует .
Если же , то .
Из сравнения этого с условием видно, что . Теорема доказана.
Замечание 2. По определению (2) правила при , т.е. при пустом множестве Ф, формировалась гипотеза как условие противоречивости базового конъюнкта А. Подразумевается, что эта гипотеза без дальнейших преобразований включается в конъюнктивный набор гипотез, синтезированных по всем БП из , с отслеживанием непоявления гипотезы, обуславливающей и потому противоречащей . Далее в БП .
Замечание 3. При согласно (3) структура гипотезы нехорновская, т.е. содержит -ветвление: . Эксперту предлагается возможность корректировки и выбора вариантов гипотезы из множества , где . В общем случае эксперт может рассматривать и варианты, получаемые из удалением меньшего количества дизъюнктивно связанных ветвей, чем . Ниже рассматриваются гипотезы Hi вида (4), как более «естественные» для теорем , чем нехорновская гипотеза . В частности, при гипотезы Hi имеют вид , т.е. простых условий типа «если …, то …», не только без -ветвления, но и без квантора существования. Использование гипотез (4) предпочтительнее, чем вида (3), тем более при использовании правил в задачах с конструктивной семантикой [10, 36]. Финальный вид гипотез достигается применением в исчислении правил второго типа. Это правила преобразования -формул , именуемые правилами вторичного преобразования пос-формул, как частичные отображения Пос-формулы называются гипотезами вторичного типа.
Определение 5 (операции вторичного преобразования β пос-формул). Для всякого Hi вида (4) преобразование β(Hi) состоит в некоторой суперпозиции определяемых ниже операций , . Если ‒ формула Hi или общее обозначение результата применения предыдущих операций внутри преобразования β, то операциями преобразования являются:
1) операция O1 удаления некоторых атомов корневого конъюнкта C;
2) операция O2 удаления из листового конъюнкта D повторов, т.е. атомов, возможно, вошедших в корневой конъюнкт C на предыдущих операциях;
3) операция O3 подстановки ;
4) операция O4 удаления из множества Z1 кванторных переменных корневого узла всех независимых переменных, т.е. не входящих ;
5) если конъюнкты формулы имеют вид и , где т.е. атомы C1 и D не содержат переменных из , а не содержит переменных из , то , ,
Используемый далее для краткости термин «преобразование ПДУ» понимается как преобразование Перехода к Достаточному Условию. Т.е, если формула U1 получена из U2 преобразованием, обеспечивающим логическую импликацию , то это преобразование именуется как преобразование «перехода от U2 к достаточному условию U1». При этом U1 не слабее, чем U2, так как всякая логическая импликация включает и случай эквивалентности. В частности, для всякой формулы логически не слабее, чем .
Теорема 2 (о связи свойства F и гипотез вторичного типа). Если к гипотезе вида (4) применено преобразование , в виде той или иной суперпозиции некоторых операций из множества , , то , т.е. синтезированный текст ‒ теорема.
Доказательство. Требуется проверить, что каждая из операций преобразования β сопровождается ПДУ. Пусть ‒ гипотеза или результат предыдущих операций внутри преобразования β.
Применение операции O1 удаления из C1 некоторых атомов не сужает заданной типовым условием C1 области значений кванторных переменных множества Z1, и не слабее, чем V, что означает ПДУ. Операция O2 удаления повторов из конъюнкта D атомов, входящих в посылку C является логически эквивалентным преобразованием. Операция O3 подстановки в D вместо вхождений переменных множества Z2 соответствующих переменных из Z1‒ это снова ПДУ для V.
В связи с операциями O4 и O5 преобразования β следует отметить, что удаления независимых кванторов ‒ ти́повых и обычных ‒ различаются по результату. Например, пусть имеются две формулы , где обозначает отсутствие в формуле A свободных вхождений переменной , отчего обычный квантор и ТКВ именуются независимыми. После их удаления из U1 и U2 результат A соотносится с формулами U1 и U2 по разному: , , но U2 влечёт A лишь при дополнительном условии , т.е. .
В силу сказанного, операция O5, в отличие от операции O4, не является логически эквивалентным преобразованием. Так как и
то и поэтому обеспечивается ПДУ. При этом удаляется независимый ТКВ , что и потребовало конъюнктивного включения в гипотезу условия .
Таким образом, все операции преобразования β сопровождаются переходами к достаточным условиям и поэтому , где , т.е. , что и требовалось доказать.
На простых иллюстративных примерах можно рассмотреть представление знаний в языке и их обработку с интеграцией ролевых функций правил исчисления и эксперта в интерактивном анализе и синтезе знаний.
3 Примеры
Пусть предметом интереса человека является доступность самолётам высот тропосферы, как нижнего слоя атмосферы Земли, и стратосферы, как соседнего, более удалённого от планеты слоя. Предположим, что у человека-эксперта имеется предварительное описание предмета в форме некоторой совокупности V утверждений-знаний, возможно из разных источников этой ПрО. Описание является заготовкой к началу работы эксперта по интерактивному анализу этого описания с точки зрения свойств непротиворечивости, избыточности и других. Предполагается, что работа эксперта ведётся с применением исчисления для АД свойств и порождения новых знаний.
Пример 1 (проверка на непротиворечивость). Пусть описание предмета в естественном языке представлено совокупностью следующих утверждений:
«Отдельным самолётам доступны некоторые высоты стратосферы. Для всякой пары (самолёт, высота), связанной отношением доступности, следует, что и все более низкие высоты доступны этому самолёту. Существуют самолёты, которым доступны все тропосферные высоты, а также некоторые высоты cтратосферы».
Для логической формализации этого описания задействуются следующие предикаты:
(здесь означает «…тогда и только тогда, когда… », а обозначения предикатов ‒ от английских слов «Plane», «Troposphere», «Stratosphere», «Reachable», «Lower than»). В языке ИП (первого порядка) данное описание предмета рассмотрения примет вид
что в переводе на язык L пос-формул может быть записано в следующей канонической форме (с двумя -ветвлениями и тремя БП как базовыми закономерностями):
Для уменьшения потребности в разыменованиях кванторных переменных при применении правила (см. в разделе 1) необходимо исключать совпадение кванторных переменных не только в тех случаях, когда один ТК находится в области действия другого, но и в случаях, когда кванторные переменные входят в разные ветви. Поэтому далее используется представление с разыменованными кванторными переменными:
(5)
Пусть при следующих обозначениях для закономерностей:
(6)
Здесь и далее БП нумеруются сверху вниз (как далее и при нумерации корневых узлов из БП, т.е. вопросов).
Утверждение (5) непротиворечиво, и это свойство в общем случае устанавливается автоматически в пос-исчислении путём проверки того, что вывод не осуществим, т.е. формула не опровержима. Действительно, через три шага применения правила с пустыми ответными подстановками получается следующее:
Теперь только первый вопрос - уместный. Ответная подстановка приводит к формул
После второго ответа на тот же вопрос с подстановкой получается
Теперь первый вопрос больше неуместен, так как новых ответных подстановок в его конъюнкт нет. Остальные три вопроса тоже неуместны, поэтому вывод оказался в тупике непродолжимости, означающей, что в исчислении не выводимо , т.е. формула непротиворечива.
Следует заметить, что приведённое рассуждение ‒ лишь иллюстрация применения правила в исчислении ; в действительности в этом частном случае исходной формулы вида (5) непротиворечивость усматривается сразу, а именно по факту отсутствия в ни одного листового узла в виде ТКС . Стоит заметить, что этот признак не является достаточным: поc-формула может содержать ТКС , но не быть противоречивой и поэтому в таких случаях проверка невыводимости является обязательной как проверка попадания в ситуацию непродолжимости вывода, что и сделано выше.
Пример 2 (проверка следования одних утверждений из других, синтез условия следования). Например, для каждого утверждения из (см. (6)) может делаться проверка его логического следования из остальных. Если такое следование имеет место, то может выявляться минимальный набор утверждений, из которых следует рассматриваемое утверждение. Таких наборов может быть несколько. Результаты такой проверки на избыточность сообщаются эксперту.
Описание предмета рассмотрения избыточно, так как следует из минимального одноэлементного набора {}. Эксперт может удалить или исключить из подформулу . Эксперт, видя, что не следует из , может заинтересоваться, например, синтезом условия H, достаточного для , с тем, чтобы, если условие H будет лаконичнее, чем , то заменить на H.
Проверка свойства осуществляется автоматически как проверка выводимости из в исчислении . Формула F в языке L представима с одной БП :
(7)
Так как третья закономерность в (7) имеет -ветвление, то она нехорновского типа, и поэтому в дальнейшем БП расщепится на две БП. Пока же после ответа на тривиальный вопрос из (с пустой подстановкой ) получится
(8)
Теперь возможны ответы на оба вопроса.
При ответе на первый с ответной подстановкой получается
При ответе на вопрос с ответной подстановкой БП из расщепится: , где
(9)
(10)
В отличие от первой подзадачи, вторая (опровержения ) разрешается положительно за один шаг применения с ответной подстановкой , приводя к , что не достигается в первой подзадаче (опровержения ). Действительно, вопрос перестал быть уместным, так как, несмотря на пополнение базы атомом , ответной подстановки, отличной от уже использованной , не появилось. Поэтому в исчислении БП , а значит и в целом F неопровержимы, так как . Таким образом, F, как отрицание импликации , неопровержимо и не следует из При другом порядке ответа на вопросы из (8) результат обязан быть тем же.
Эксперта может интересовать, какого условия H не хватает для с тем, чтобы при лаконичности этого H заменить им «громоздкое» V3. В продолжение примера 1 для синтеза этого H применяется исчисление , . При выборе
(11)
В -формуле вида (9-10) содержатся четыре закономерности, из которых две последние кажутся перспективными для опровержения . Это
, , (12)
активизируемые на основе начальных гипотез H3 и H4 по правилам
Согласно гипотезе первичного типа H3:
. (13)
Действительно, в применении к (9) гипотеза H3 может позволить нарастить базу в атомом , задействуя вначале третью закономерность из (10), а далее, после попадания в базу атома , и четвёртую закономерность из (9) с опровержением . Это будет означать опровержимость и в целом сделанного предположения , которое логически эквивалентно . Можно проверить реализуемость синтеза требуемого условия для замещения . По правилу формируется расширение закономерностей в БП гипотезой (13):
.
После подстановки в (13) получается утверждение
,
означающее: «Для любой стратосферной высоты и любого самолёта, которому эта высота доступна, любая тропосферная высота ‒ ниже ». С позиции упрощения гипотезы эксперт заметит нецелесообразную ограничительность посылки и применит операцию удаления атомов . После этого квантор становится независимым и удаляется согласно . Получится гипотеза
, (14)
означающая, что «Тропосферные высоты ниже стратосферных» .
После подстановки база в (9) дополнится атомом , приведя к уместности третьего вопроса в (9). Ответная подстановка обеспечит попадание в базу из (9) атома и уместность вопроса четвёртой закономерности из (9). Ответ на него с пустой подстановкой приведёт к проникновению в базу из (9) константы f, т.е. к опровержению БП .
По теоремам 1 и 2 гипотеза (вторичного типа) вида (14) является достаточным условием доказуемости свойства . Поэтому в описании предмета рассмотрения (см. вида (6)) утверждение можно заменить на (14).
Пример 3 (синтез гипотезы, альтернативной гипотезе (14)). Из ранее выделенных в (12) двух закономерностей для синтеза гипотезы, достаточной для , можно выбрать четвёртую закономерность, для задействования которой в множестве усилений (точнее логических неослаблений) условия (11), получаемых разделением ветвей, по правилу выбрать гипотезу
(15)
Получится
Ответная подстановка с применением правила дополнит базу из атомом и с учётом закономерности из (см. (9)) приводит к желаемому опровержению БП , причём более коротким путём, чем в примере 2. Гипотеза первичного типа H4 в форме (15) означает: «Для любого самолёта и любой доступной ему стратосферной высоты любая тропосферная высота тоже доступна», или, что эквивалентно: «Для любой стратосферной высоты и любого самолёта, которому эта высота доступна, любая тропосферная высота тоже доступна».
Из операций преобразования применима только операция . Если эксперт операцией удалит атомы , то потом операцией удалится и квантор , становящийся независимым. Это приведёт к семантически более простой гипотезе вторичного типа
, (16)
означающей: «Самолётам все тропосферные высоты доступны».
Гипотеза (16) является примером гипотезы логически верной с точки зрения её достаточности для доказуемости свойства , но неверной при учёте знаний, не охваченных описанием предмета (V)L. Это так, поскольку разнообразие самолётов в описании (V)L не ограничено и, в частности, включает модели низковысотные, которым верхние высоты тропосферы недоступны. Эксперту придётся задуматься над содержанием используемого им понятия «Самолёт» и при определённой широте этого понятия отказаться от замещения утверждения в описании (V)L ПрО (см. (6)) условием (16) и вместо этого использовать ранее синтезированную гипотезу (14)
,
согласно которой «Тропосферные высоты ниже стратосферных».
Заключение
В работе исследованы возможности интерактивного синтеза гипотез как новых знаний на основе расширения исчисления позитивно-образованных стандартизованных формул (пос-формул), разработанного ранее для задач автоматизации логического вывода.
Предложенный метод синтеза новых знаний объединяет возможности анализа знаний на основе АД с алгоритмизированным человеко-машинным формированием текстов утверждений. При автоматическом выявлении в описании ПрО отсутствия свойства, желательного для человека, задействуется расширение исчисления дополнительными правилами, которые обеспечивают синтез условия-гипотезы, логически гарантирующей наличие требуемого свойства. На их основе варианты гипотетических условий синтезируются автоматически, но в предварительном виде. Для оценки их приемлемости с учётом знаний ПрО, не охваченных её описанием, и повышения содержательности дальнейший синтез выполняется интерактивно.
Обоснованы свойства правил синтеза. Их применение дополняет множество закономерностей, представленных в обрабатываемой пос-формуле, и гарантированно продолжает вывод в ситуациях неприменимости базового правила вывода в исчислении пос-формул.
Расширение первопорядкового исчисления пос-формул правилами синтеза преобразует его в исчисление дедуктивно-абдуктивного типа, свободное от ряда ограничений.
Рассмотрены примеры анализа знаний и синтеза условий наличия требуемых свойств в описании ПрО. Использование крупноблочного типово-кванторного представления знаний, свойственного языку пос-формул, обеспечивает наглядность обрабатываемого текста.
К перспективным направлениям дальнейшей работы относится анализ возможностей использования и развития полученных результатов:
- в области онтологий проектирования с порождением знаний шире, чем только в классе логических следствий известного, и с понижением, может быть поначалу, выразительности языка формализации для совместимости с другими разработками этой области;
- в задачах диагностики наблюдаемого с привлечением экспериментальных данных для поддержки экспертной оценки синтезируемых объяснений;
применительно к неклассическим логикам с семантикой конструктивности и немонотонности в приложениях компьютерных систем диагностики и поддержки принятия решений
About the authors
Stanislav N. Vassilyev
V.A. Trapeznikov Institute of Control Sciences of the Russian Academy of Sciences
Author for correspondence.
Email: vassilyev_sn@mail.ru
Scopus Author ID: 6603565134
ResearcherId: O-7577-2017
Doctor of Ph.D. , Chief Researcher , Academician of the RAS, Member of the Russian Association of Artificial Intelligence (AI)
Russian Federation, MoscowReferences
- Mendelson E. Introduction to mathematical logic. 6th edition. New York: CRC Press; 2015. 472 p.
- Gentzen G. Untersuchungen uber das logische schliessen. Mathematische Zeitschrift. 1935; 39: 176-210.
- Maslov SYu. An inverse method of establishing deducibility in the classical predicate calculus [In Russian]. Dokl. Akad. Nauk SSSR. 1964; 159(1): 17-20.
- Shanin NA, Davydov GV, Maslov SYu, Mints GE, e.a. The algorithm of machine search for natural logical inference in the calculus of statements [In Russian]. M.-L.: Science; 1965. 39 p.
- Robinson JA. A Machine-oriented logic based on the resolution principle. J. ACM. 1965; 12: 23-41.
- D’Agostino M, Gabbay DM, Hahnle R, Posegga J (eds.). Handbook of Tableau Methods. Dordrecht: Kluwer Aca-demic Publishers; 1999. 680 p.
- Kovács L, Voronkov A. First-order theorem proving and Vampire. In: Sharygina, N., Veith, H. (eds.). Proc. of the 25th Conf. on Computer Aided Verification, LNCS. Springer, Heidelberg, 2013; 8044: 1–35. doi: 10.1007/978-3-642-39799-8_1.
- Otten J. NanoCoP: a Non-clausal Connection Prover. Proc. of the Int. Joint Conference on Automated Reasoning. 2016: 302-312.
- Vassilyev SN, Zherlov AK. On calculi of type-quantifier formulas [In Russian]. Dokl. Akad. Nauk. 1995; 343(5): 583–585.
- Vassilyev SN, Zherlov AK, Fedosov EA, Fedunov BE. Intelligent Control of Dynamical Systems [In Russian]. Mos-cow: Fizmatlit Publ.; 2000. 352 p.
- Wang H. Toward mechanical mathematics. IBM J. Res. Develop. 1960; 4(1): 2-22.
- Godel K. Die Vollstandigkeit der Axiome des Logischen Funktionenkalkuls. Monatsh. Math. Phys. 1930; 37: 349-360.
- Turing AM. On Computable Numbers, with an Application to the Entscheidungsproblem // Proc. Lond. Math. Soc., Ser. 2. 1936; 42: 230-265; 1935; 43: 544-546.
- Church A. A Note on the Entscheidungsproblem. J. Symbolic Logic. 1936; 1: 40-41.
- Chang С.-L, Lee RC-T. Symbolic Logic and Mechanical Theorem Proving. N.-Y., San Francisco, London: Academic Press Inc., 1973. 358 p.
- Cherkashin EA. KVANT/1 Program System for Automated Theorem Proving. PhD Thesis [In Russian]. Irkutsk: IDSTU SO RAN; 1999. 16 p.
- Larionov A, Davydov A, Cherkashin E. The calculus of positively constructed formulas, its features, strategies and implementation. In: Proc. of the 36th Intern. Convention on Information and Communication Technology, Electronics and Microelectronics (2013, Opatija, Croatia). N.Y.: IEEE; 2013: 1023-1028.
- Davydov AV, Larionov AA, Cherkashin EA. The method for translating first-order formulas into positively construct-ed formulas [In Russian]. Software & Systems. 2019; 32(4): 556–564. doi: 10.15827/0236-235X.128.556-564.
- Bourbaki N. Theory of Sets. Paris: Hermann; 1968. 424 p.
- Mal’cev AI. Model correspondences [In Russian]. Izv. of the USSR Academy of Sciences. Mathematics. 1959; 23(3): 313-336.
- Mal’cev АI. Algebraic systems. Springer Verlag; 1973. 317 p.
- Walther C. Many-sorted unification. J. of the ACM. 1988; 35(1): 1–17.
- Palacz W, Grabska E, Slusarczyk G. Ontological Approach to Design Reasoning with the Use of Many-Sorted First Order Logic. In: Artificial Intelligence and Soft Computing: Proc. of the 15th Int. Conf. (Zakopane, Poland, 2016, June 12–16), Part II. 2016: 364–374. doi: 10.1007/978-3-319-39384-1_31.
- Nagul NV. The method of logical-algebraic equations in the dynamics of systems. S. P. Math. J. 2013; 24(4): 645–662. doi: 10.1090/S1061-0022-2013-01258-1.
- Nagul NV. Generating conditions for preserving the properties of controlled discrete event systems. Automation and Remote Control. 2016; 77(4): 672–686. doi: 10.1134/S0005117916040111.
- Matrosov VM, Anapolsky LYu, Vassilyev S.N. The comparison method in the mathematical theory of systems [In Russian]. Novosibirsk: Science; 1980. 481 p.
- Vassilyev SN. The comparison method in the analysis of systems. I-IV [In Russian]. Differential equations. 1981; 17(9):1562-1573; 1981;17(11):1945-1954; 1982;18(2):197-205; 1982;18(6):938-947.
- Vassilyev SN. Machine synthesis of mathematical theorems. J. Logic Program. 1990; 9(2–3): 235–266.
- Vassilyev SN. On the Implication of Properties of Related Systems: The Method for Obtaining Implication Conditions and Application Examples. J. of Computer and Systems Sciences International. 2020; 59(4): 479-493. doi: 10.1134/S1064230720040140.
- Kowalski R. History of Logic Programming. In: Computational Logic, D. Gabbay and J. Woods (eds.). Elsevier. 2014. P.523-569.
- Horn A. On sentences which are true on direct unions of algebras. J. Symbolic Logic. 1951; 16: 14-21.
- Calmerauer A, Kanoui H, Pasero R, Roussel P. Un Systeme de Communication Homme-Machineen Francais [In French]. Rapport, Groupe d’Intelligence Artificielle, Universite d’Aix-Marseille II, 1973.
- Kowalski R. Predicate Logic as a Programming Language. In: Proc. of the IFIP-74 Congress. 1974: 569-574.
- Poole D. Representing Diagnosis Knowledge. J. Annals of Mathematics and Artificial Intelligence. 1994; 11: 33-50.
- Kobrinskii BA. Images in Logical-and-Linguistic Artificial Intelligence. J. Biomedical Engineering and Medical Im-aging. 2019; 6(1): 1-8. doi: 10.14738/jbemi.61.61.61.
- Buzikov M, Galyaev A, Guryev Yu, Titov K, Yakushenko E, Vassilyev S. Intelligent Сontrol of Autonomous and An-thropocentric On-board Systems. Procedia Computer Science. 2019; 150: 10-18. doi: 10.1016/j.procs.2019.02.004.
- Kowalski R, Sadri F. Reactive computing as model generation. New Generat. Comput. 2015; 33: 33-67. doi: 10.1007/s00354-015-0103-z.
- Lindon RC. Properties preserved under homomorphism. Pacific J. Math. 1959; 9: 143-154.