КОНЦЕПЦИЯ МЕНТАЛЬНЫХ ПРОСТРАНСТВ КАК СПОСОБА ОРГАНИЗАЦИИ ПРАГМАТИЧЕСКИХ ЗНАЧЕНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ, ИСПОЛЬЗУЮЩИХ ЕЯ
А. Э. Шамаев
Санкт-Петербургский Государственный Морской Технический Университет
Ключевые слова: интеллектуальные системы, адаптация, обучение, знания, базы знаний, семантика, прагматика, онтология, ментальное пространство, логический вывод, статистические методы.
Для моделирования прагматических значений текста, как основного носителя знаний, предлагается использовать новый тип сущностей – ментальные пространства. Цель введения новой конструкции состоит в интеграции традиционных дискретных моделей представления знаний и непрерывных, статистических подходов, которые до сих пор остаются в значительной степени ортогональными друг другу. Ментальные пространства тесно связаны с такими понятиями как ассоциативное поле, семантическое поле, семантическое пространство, семантическая сеть, фрейм, образ.
- Введение
Одно из основных требований к любой интеллектуальной системе – достаточно широкие возможности адаптации к изменяющимся внешним условиям. Отсутствие адаптации означает, что предоставленная самой себе, система быстро перестанет быть адекватна текущей ситуации. Это верно не только для высокодинамичных систем, таких, как системы реального времени. Например, в случае систем машинного перевода, предметная область также будет подвержена изменениям, хотя и не столь быстрым. Кроме того, разные пользователи работают чаще всего с разными предметными областями, и желательно, чтобы система могла к ним адаптироваться. На сегодняшний день адаптация производится в основном вручную, за счет внешнего и явного изменения словарей или базы знаний.
Что нужно для того, чтобы система могла адаптироваться самостоятельно? Для этого система должна изначально обладать некоторым достаточно обширным объемом «базовых» знаний, который будет заведомо избыточным для решения узких конкретных задач. Но здесь возникают две серьезные проблемы.
Первая связана со сложностью формированием базы большого объема. Хотя, учитывая интенсивность, с которой сегодня разрабатываются различные онтологии и тезаурусы, острота этой проблемы должна несколько снизиться в ближайшем будущем. С другой стороны, онтологии, разработанные вручную, вряд ли покроют все потребности в этой области. Необходимо, чтобы система могла пополнять свои знания либо в диалоге с человеком, либо читая тексты. А это значит, что она должна воспринимать естественный язык. Для систем, основанных на знаниях, можно вообще в значительной степени отождествлять текст и базу знаний, учитывая следующие соображения:
- Текст несет в себе знания, чем, собственно, и интересен.
- Если говорить о структуре текста, о его семантике и прагматике, то нельзя считать текст просто последовательностью слов и предложений. Он становится структурно организованным подобно базам знаний.
- Любая обширная и достаточно универсальная база знаний будет содержать множество типов объектов и связей, что характерно для текстов.
- В принципе, смысл текста может быть представлен базой знаний (с некоторыми потерями), а база знаний может быть записана как текст (возможно, с некоторыми неточностями).
Вторая проблема состоит в том, что чем больше объем базы, тем медленнее, в целом, происходит вывод над этой базой. Для базы, содержащей миллионы и более фактов, скорость вывода становится критичной. Более того, по мере «приобретения опыта» система будет работать все медленнее и медленнее. Это резко контрастирует с обучением человека, который, при наличии, опыта принимает решения значительно быстрее. Здесь важно различать объем знаний как таковой (который можно сопоставить с объемом базы) и имеющийся опыт решения конкретных задач (который можно сопоставить с множеством выводов, произведенных системой в ответ на конкретные запросы к базе). Накопление опыта связано именно с решением конкретных задач. Тот круг задач, которые в принципе может решить специалист, значительно шире того круга задач, которые он решает эффективно. Этот принцип можно распространить и на базы знаний интеллектуальных систем. Пусть мы имеем систему с объемной и достаточно универсальной базой. Принципиально, она будет способна решать широкий круг задач, но с низкой эффективностью. Если она используется в конкретном коллективе и для решения конкретных задач, то она должна адаптироваться к решению этих задач так, чтобы решать их достаточно эффективно. При этом от такого обученного экземпляра не требуется эффективного решения всех остальных задач.
Таким образом, центральный вопрос состоит в том, как обеспечить обучение (адаптацию) системы. Здесь видится только одна возможность – интеграция «дискретных» подходов (разновидности логического вывода и вывода на семантических сетях и фреймах) с «непрерывными» (статистическими и нейросетевыми). Последние обладают ярко выраженными способностями к адаптации, отсеиванию шума, выделению информативных признаков. С другой стороны, использование статистических или нейросетевых подходов в чистом виде неприемлемо, поскольку большая часть знаний имеет исходно языковой и дискретный характер. В качестве выхода предлагается новый тип сущностей – «ментальные пространства».
Учитывая обширность концепции ментальных пространств и то, что она находится в стадии разработки, в докладе освещаются лишь самые основные и общие ее положения.
- Истоки концепции ментальных пространств
Значительная часть понятий и методов, лежащих в основе данной концепции, в том или ином виде существует и используется в разных областях, включая психологию мышления и решения задач, психосемантику, методики психологического тестирования, психолингвистику, компьютерную лингвистику, инженерию знаний, методы распознавания образов и статистический анализ данных.
В различных областях психологии давно подмечено, что одно из очень важных условий успешного решения задачи – возможность представить ее наглядно. Огромное количество различных рекомендаций по эффективному решению задач так или иначе сводится к формированию наглядного представления задачи. Реально это не что иное, как формирование пространства.
Почему использование пространств оказывается столь эффективным? По всей видимости, дело в том, что пространство определяет взаимное расположение не только отдельных элементов, но и групп элементов. Другими словами, в пространстве может быть введена метрика, которая обеспечивает упорядочивание элементов пространства. Наличие метрики позволяет значительно более эффективно организовать поиск. Не нужно производить перебор всех элементов в поисках подходящего. Имея на входе набор параметров, можно сразу адресоваться к нужной области и вести поиск только в ней.
Вообще говоря, пространство не только дает возможность организовать эффективный поиск, но и само по себе является моделью представления знаний. То, что знания имеют метрику, постоянно декларируется в инженерии знаний. До сих пор, однако, не предложено модели представления знаний, полноценно использующей метрику. Для этого есть несколько причин.
- Неоднозначность метрики.
В подавляющем большинстве случаев для пространства можно ввести несколько различных метрик. Нет критерия, позволяющего априори выбрать некий «единственно правильный» способ вычисления сходств/различий между элементами пространства. Выбирая же разные способы, можно получить существенно различные результаты. При этом мы теряем важнейшую характеристику любой правильно построенной логической системы – однозначность вывода.
В действительности, однако, все не столь драматично. Речь идет об отказе от двух явно или неявно используемых постулатов:
- существует единственно верное и одинаковое для всех (копий системы) представление конкретной задачи;
- правильно построенная система никогда не ошибается.
На деле, для любых нетривиальных задач (для которых, собственно, и нужны интеллектуальные системы), мы не можем гарантировать ни того, ни другого. Во-первых, хорошо известно, что для сложных проблем полезно иметь несколько моделей, а не ограничиваться одной. И в процессе разработки, экспериментирования, построения прототипов часто исследуются различные модели. Во-вторых, можно добиться идеальной работы системы на тестовом наборе задач, но нельзя гарантировать этого для неизвестных заранее данных. Оба постулата верны для идеализированных постановок задач и относятся скорее к системам с низкой степенью адаптируемости, набор знаний для которых жестко задается разработчиками.
- Неудобства обработки пространств на компьютерах обычной архитектуры.
Для человека, с его массовым параллелизмом обработки, оперирование с пространствами достаточно естественно. Для компьютера же с Фон-неймановской архитектурой это далеко не так. Любое пространство все равно должно представляться в одномерной памяти. Тем не менее, в рамках статистического анализа, распознавания образов и извлечения закономерностей разработан огромный арсенал методов, позволяющих относительно эффективно работать с пространствами на компьютерах обычной архитектуры.
- Историческое разделение методов, работающих с пространствами и методов, работающих со знаниями.
Исторически сложилось так, что эти две области мало пересекались, и поэтому обычно ставится задача выбора: или использование знаний и логического вывода (либо семантических сетей), или анализ статистических закономерностей. Сначала выбирается сам глобальный подход, а новые методы разрабатываются уже в рамках выбранного похода.
Ни одна из рассмотренных сложностей не является фатальной, что дает надежду на получение существенно новых результатов.
- Основные виды и особенности ментальных пространств (МПр)
Принципиально важным моментом относительно ментальных пространств является то, что они отражают представление о чем-то, а не полную точную модель. Такой объект как человек может характеризоваться сотнями различных параметров. Но это не мешает нам сформировать для конкретных целей общее представление о сходствах/различиях группы людей. Такое представление будет игнорировать многие детали, которые могут быть важными для других целей. Соответственно, мы можем построить пространство невысокой размерности, которое будет отражать это представление. Есть основания полагать, что практически достаточно двух- трехмерных пространств. Таким образом, можно держать в базе знаний исчерпывающую информацию, а в процессе обучения решению конкретных задач система будет строить пространство, отбирая только то, что важно для решения этих задач.
Различные виды МПр можно характеризовать такими основными параметрами как локальность-глобальность, классы их элементов, типы связей между элементами.
3.1. Ассоциативное МПр
Наиболее общий и самый простой вид МПр – это ассоциативное МПр. В простейшем случае оно содержит лишь ассоциативные связи типа элемент-элемент без какой-либо информации о классах элементов и типах связей. На основе сети таких связей возможно введение метрики (например, с помощью многомерного шкалирования – см. ниже) и превращение ассоциативной сети в пространство.
Уже на этом уровне можно провести разделение МПр по типу размещения в них элементов: модель «центр-периферия» и «равноправная» модель. В модели «центр-периферия» акцент делается на отношениях между одним «центральным» элементом и всеми остальными, ассоциирующимися с ним. Выделенный элемент размещается в «начале координат» такого пространства, а ассоциируемые с ним – вокруг него, на «периферии». Наиболее сильно связанные с ним элементы будут расположены ближе всего к нему, а наименее связанные – на наибольшем удалении. В «равноправной» модели выделенных элементов нет. Любой из рассматриваемых элементов может находиться в любом месте. Важно только их взаимное расположение.
3.2. МПр с ограничением на классы элементов
К ассоциативному МПр добавляется информация о классах элементов и вводятся ограничения на классы элементов, содержащихся в МПр. Здесь возможны два достаточно сильно различающихся варианта.
В первом случае мы допускаем элементы только одного класса. Тогда, поскольку все элементы МПр имеют один и тот же класс, различия между ними возможны только на уровне экземпляров – объектов. Такие МПр можно также называть однородными (относительно элементов). Они имеют близкое сходство с семантическими пространствами из психосемантики. Однородные пространства отражают традиционное восприятие сходств/различий объектов по значениям их характеристик (атрибутов, свойств). При этом предполагается, что сам набор атрибутов примерно одинаков и различия существуют лишь между значениями этих атрибутов. Типичный пример – описание какой-либо продукции, действующих лиц (персонажей), ситуаций и т.п. При необходимости поиска таких объектов с заданными ограничениями на значения их атрибутов наиболее эффективной будет комбинация пространства с базой знаний.
Второй случай ограничений на классы элементов подразумевает, что классы все же могут различаться, но только в определенных пределах. Допустим, мы хотим выявить общую структуру текста (или базы знаний) с целью составления аннотации. В принципе, мы можем поместить в пространство все слова текста, но более осмысленным будет использование, скажем, только существительных, которые лучше других частей речи отражают тематику текста. Сами эти слова могут иметь весьма разные наборы атрибутов, что будет влиять на их положение в пространстве.
3.3. Ментальные пространства с ограничениями на типы связей
Можно, наоборот, допускать любые возможные классы элементов, но ограничивать типы связей между ними. Наиболее общие и распространенные типы связей - это: антонимия, синонимия, часть-целое, класс-подклассы (общее-частное). В зависимости от свойств используемых связей пространства могут сильно различаться по структуре. Так для пространства со связями «часть-целое» характерна достаточно четкая иерархическая структура. Напротив, для пространства синонимов будет характерна сложная многокластерная структура.
3.4. Ментальные пространства с более сложными ограничениями
Наиболее интересные с практической точки зрения пространства обычно получаются при использовании более сложных ограничений на классы элементов и типы связей.
Один из видов таких ограничений – ограничения по тематике. Тема может быть представлена набором конкретных классов слов и типов связей между ними, отдельных важных экземпляров и более сложными их конфигурациями. Например, можно поставить задачу получить из какого-то объема новостной информации все высказывания, в которых идет речь о беспорядках, насилии, угрозах, опасностях и так далее. И затем построить пространство, позволяющее ориентироваться в этих высказываниях (с требованием, чтобы высказывания о похожих происшествиях оказались рядом).
Другой похожий пример – ограничения по стилистике текста.
3.5. Ментальные пространства типа «пространство-время»
Хотя формально данный тип пространств можно было бы отнести к пространствам с ограничениями на тип связей, он достаточно важен и интересен сам по себе. Это класс МПр, построенный по типу связей «пространство-время». Здесь подразумевается, что элементы объединяются на основе пространственно-временных соотношений и образуют некий континуум, длящийся во времени и пространстве, реальном или воображаемом. Характерными особенностями этого типа пространств являются непрерывность, потенциальная возможность достичь каждой точки и данность всего пространства сразу, как целого, как единой картины.
Наиболее глобальным МПр из этого класса является «пространство-время», «мир», «реальность» Характерными чертами здесь являются отсутствие границ пространства и наличие определенных «физических» законов. Примерами могут служить «реальный мир», «мир сказки о Золотой рыбке» или любого другого произведения, мир конкретного сновидения. Такое МПр содержит не столько физическую модель пространства-времени, сколько знания о том, что этот «мир» содержит и что для него характерно.
Противоположностью МПр «мир», с точки зрения масштаба, является ситуация. Ситуации представляют собой фрагменты или «кванты» МПр «мир», дополненные семантическими и прагматическими структурами.
Промежуточным между ситуацией и «миром» является МПр, которое можно назвать «пространством ситуаций». Пространство ситуаций может содержать потенциально неограниченное количество ситуаций разных типов, причем необязательно явно связанных друг с другом. Но само такое пространство принципиально ограничено и этим отличается от МПр «мир». Примеры – исторический период в конкретной стране, какие-то события в некотором городе и т.п. Можно было бы рассматривать эти МПр просто как подобласти МПр «мир», но дело в том, что многие подобные МПр (такие как страна), являются вполне самостоятельными сущностями и, с точки зрения прагматики, формируют вокруг себя свой специфический набор знаний.
3.6. Пространство употреблений
Весьма специфическим, но полезным для практических целей является еще один вид МПр – пространство употреблений. Суть его в следующем. Для некоторой выбранной сущности (из ряда: отдельное значение слова, слово, класс слов, высказываний или ситуаций) рассматриваются все ее употребления в некотором множестве текстов. При этом каждое такое употребление будет иметь свои смысловые нюансы, определяемые контекстом этого употребления и конкретными значениями атрибутов сущности. При сохранении общего смыслового ядра, характерного для данной сущности, какие-то употребления окажутся более сходными друг с другом, тогда как другие более различающимися. На основе этих сходств/различий и может быть построено пространство употреблений. Такое пространство во многом (прежде всего, структурно) похоже на пространство «объекты класса». Однако, здесь имеется очень существенное отличие. Употребления различаются не только конкретными значениями атрибутов сущности, но и контекстом употребления. Это не характерно для модели «класс – объекты класса». Если два объекта одного класса имеют одинаковые наборы атрибутов, то они идентичны.
Полезность пространств употреблений для разного вида поисковых систем достаточно очевидна. Но и для общих задач представления знаний и смысла текста этот вид пространств достаточно важен. Фактически, эти пространства могут быть расширением понятия класса, когда оно становится слишком ограничивающим. Можно было бы назвать их контекстно-нечеткими классами.
- Методы построения МПр
Для решения задач построения МПр различных видов можно с успехом использовать методы построения пространств и снижения размерности, известные в статистике. Один из наиболее привлекательных методов – неметрическое многомерное шкалирование (МШ). МШ позволяет строить конфигурацию точек в метрическом пространстве по матрице сходств/различий между объектами. Такой подход предъявляет минимальные требования к вычислению различий и позволяет использовать достаточно общие способы сравнения объектов. Учитывая то, что МШ эффективно лишь для относительно небольших групп объектов (до 1000), необходимо строить иерархию пространств вместо одного общего пространства. Построение иерархии полезно и по другим причинам. Оно позволяет лучше структурировать знания системы. Для этих целей могут использоваться различные методы кластерного анализа.
- Пример использования МПр
В заключение приведем пример конкретного типа пространств, полезных при аннотировании текстов. Суть аннотирования состоит в выделении из текста наиболее важной, наиболее существенной информации. В большинстве случаев можно считать, что наиболее важны для текста те объекты или события, которые чаще всего в нем упоминаются. И в качестве аннотации должны выступать наиболее частотные высказывания об этих событиях. Разумеется, для получения качественной аннотации нужно использовать не сами слова текста, а скорее семантические классы слов, что требует семантического анализа. Даже если сам семантический анализ уже произведен, составление аннотации не становится тривиальным. Во многих случаях важен также не сам текст аннотации, как конечный результат, а возможность быстро понять, о чем текст, что находится в центре внимания автора, что на периферии. Пространство идеально для этого подходит. Можно организовать процедуру, которая будет помещать в центр такого пространства наиболее частотные семантические классы, а на периферию – наименее частотные. При этом легко реализовать такой способ визуализации этого пространства, когда для каждого класса можно будет видеть связанные с ним высказывания в порядке убывания силы их связи с данным классом. Подобное пространство позволит очень быстро и с нужной степенью детализации познакомиться даже с достаточно объемным текстом.
Другой пример – задача сегментации текста. Здесь элементами пространства будут предложения, размещенные в соответствии со степенью связанности друг с другом.
Литература
- Айвазян С. А. и др. Прикладная статистика: классификация и снижение размерности. М.: Финансы и статистика, 1989. 607 с.
- Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. СПб.: Питер, 2001. 384 с.
- Джексон П. Введение в экспертные системы. М.: Издательский дом «Вильямс», 2001. 624 с.
- Дюк В. А. Компьютерная психодиагностика. СПб. Братство, 1994. 364 с.
- Петренко В.Ф. Психосемантика сознания. М.: Изд-во Моск. ун-та. 1988, 208 с.
- Пиотровский Р.Г. Лингвистический автомат и его речемыслительное обоснование. Минск.: Изд-во МГЛУ, 1999. 196 с.
- Терехина А. Ю. Анализ данных методами многомерного шкалирования. М.: Наука, 1986. 168 с.
- Some Ongoing KBS/Ontology Projects and Groups. http://www.cs.utexas.edu/users/mfkb/related.html.
Conception of mental spaces as the way of organizing of pragmatic values in the intelligent systems using the natural language
- Е. Shamaev
Keywords: intelligent systems, adaptation, learning, knowledge, knowledge bases, semantics, pragmatics, ontology, mental space, logical inference, statistical methods.
The new type of entities – Mental Spaces – is suggested for representation of pragmatics of a text (as the main medium of the knowledge). The goal is to integrate the traditional discrete models of knowledge representation with the continuous, statistical one. Moreover, in many cases it is possible to add a metric to a mental spaces. A metric is very important for human knowledge representation and high efficiency of operating on knowledge. It is intended that using of mental spaces allows to reduce considerably the search during the inference within knowledge bases. The paper describes the main types of mental spaces and some of approaches to building them. It also discuss generic features of system based on mental spaces.