Proceedings 2001

Contents

Нелингвистическая основа лингвистических систем

 

Григорьев В.А.

 

 

Уже одно название «Лингвистические системы» обязывает отнести обозначенные системы к разряду «интеллектуальных». Действительно, общение на естественном языке – один из важнейших признаков интеллекта [ 1 ].

Также не подлежит сомнению практическая значимость подобных систем [ 2, 3 ], чем обусловлена интенсивность работ в этом направлении [ 4, 5 ].

В то же время  нельзя однозначно утверждать, что решены фундаментальные проблемы построения основ интеллектуальных систем, в том числе лингвистических [ 6 ]. Основная трудность состоит в формализации интеллектуальных функций, которые система должна выполнять. Для «чисто» лингвистических систем эта проблема особенно остра, так как, с одной стороны, естественный язык человека в общем случае трудноформализуем, например, по сравнению с такой интеллектуальной функцией, как игра в шахматы. С другой стороны, отсутствуют невербальные обратные связи с внешней средой, помогающие системе доопределить условия ее работы, как это, например, имеет место в робототехнических системах.

В настоящей работе рассматривается вопрос о форме представления «интеллектуальной части» лингвистической системы. Предлагается интеллектуальные функции лингвистической системы интерпретировать в терминах знаков, регистрирующих конкретные ситуации в системе и вне ее. Такой подход имеет ряд преимуществ, в т.ч. снимает остроту проблемы формализации.

 

  1. Триединство в лингвистической системе

Любую лингвистическую систему можно представить как единство трех составляющих:

-        «интеллектуальной» части, содержащей функциональный смысл системы;

-        лингвистических конструкций, которые система использует для общения с пользователем;

-        алгоритма, который обеспечивает взаимодействие первых двух составляющих и реализацию их назначения.

Предложенное разделение лингвистической системы обычно не рассматривается, т.к. форма алгоритма содержит в себе и интеллектуальную часть системы и лингвистические конструкции общения с пользователем. Тем не менее, это деление существенно, если рассматривать вопрос о фундаментальной сущности таких систем.

            Интеллектуальная часть системы, как и лингвистические конструкции общения, отчасти неразрывна с алгоритмом, отчасти существует вне его как идеи, более содержательные, чем сам алгоритм. Очень часто интеллектуальная составляющая системы может быть выражена лингвистическими конструкциями. Триединство взаимопроникающих частей лингвистической системы показано на рис.1, где интеллектуальная часть обозначена основным своим элементом – понятием, выраженным фразой языка.

 

 

 

       
   
     
 

 

 

 

Контекст

 

                                                                                                

 

 

Система

 
   

 

                                 

                                       Рис. 1

 

С точки зрения разработчика самой ответственной частью лингвистической системы является интеллектуальная составляющая. Разработка этой части представляет основную проблему создания системы, т.к.  здесь осуществляется формализация действий системы, фиксируемая в алгоритме.

Естественный язык человека – это одна из форм формализации понятий. Она успешно используется людьми, т.к. то, что формализовано в используемых языковых конструкциях, доопределяется людьми невербальной составляющей воспринимаемых фраз.

Хорошо известно, что каждую отдельную фразу доопределяет ее контекст (в широком смысле). Поэтому, казалось бы, что при создании систем общения с человеком универсальным средством решения проблемы формализации является  уточнение фраз соответствующими контекстами. Для чисто лингвистических систем это означает, что контекст должен быть языковым. Но тогда доопределять надо и его, и, таким образом, мы не устраняем причину проблемы.

Каким же образом рационально выполнять формализацию интеллектуальной составляющей системы?

 

  1. Смысл и форма представления понятий

 

Чтобы ответить на поставленный вопрос остановимся на роли понятий в человеческом мышлении.

Хорошо известно, что слово является одной из основных форм выражения понятий, которое позволяет ими эффективно оперировать. Поэтому не случайно, что именно слова и стоящие за ними понятия кладутся в основу разрабатываемых лингвистических систем.

Тем не менее, большинство слов многозначны. То же можно сказать и о понятиях, которые представляются этими словами. Эта многозначность составляет одну из главных трудностей не только для разработчиков систем, но и для теории лингвистики как таковой: «То, что почти каждое слово имеет несколько значений…для теории языка  тут «залегает» огромная проблема …» [7].

Кроме полисемии к проблеме слова можно отнести и его усеченность по отношению к смыслу, который слово несет в себе.

Действительно, смысл, вкладываемый во фразу, часто содержит пространственно-временные свойства. В то время как лингвистические конструкции одномерно-линейны, а время представлено в них условно. Не всегда «море чувств» удается вместить в какую-либо фразу и т.д.

Каким же образом человек доопределяет смысл слов и уверенно справляется с отмеченными проблемами. На наш взгляд, выход здесь один. По всей видимости, основным элементом, на который ориентируется работа мышления, является не понятие, а ситуация, которая воспринимается человеком по многим признакам, в т.ч. невербальным. При этом под ситуацией мы понимаем не только ситуации в реальном мире пространства-времени, но и в ментальном мире мышления. Таковыми могут, например, быть конкретная система ценностей для определенных типов объектов, совокупность конкретных условий анализируемого процесса, конкретное состояние чувств и т.д.

Мышление, скорее всего, в первую очередь анализирует ситуации и оперирует их аналогами, и только во вторую очередь привлекает соответствующие понятия-слова (фразы), чтобы эти ситуации выразить во вне, доопределить внутри, обеспечить макровлияние извне и т.д. Таким образом, в предлагаемой интерпретации каждый шаг мышления связан, прежде всего, не с динамикой понятий, выраженных лингвистически, а с процессами регистрации различных ситуаций вовне и внутри мышления и с взаимодействием процедур таких регистраций.

Первичность ситуации по отношению к понятию делает последнее однозначным. При этом «не усекается» смысл ситуации, т.к. ситуация не формализуется, а регистрируется. Именно поэтому, как представляется, мышление столь эффективно в работе с понятиями, в том числе выраженными лингвистически.

 

  1. Знаковая составляющая лингвистической системы

 

Чтобы представленный выше механизм работал, необходимо

  • уметь регистрировать стереотипные ситуации,
  • уметь сводить текущую ситуацию к одной или нескольким стереотипным, например, методом аналогии,
  • обозначить каждую ситуацию как минимум одним знаком.

Последнее обстоятельство в свете обсуждаемой проблематики является особенно важным. Именно оно позволяет говорить о знаковой, но не лингвистической основе мышления человека.

Вернемся к вопросу о лингвистических системах. С рассмотренных позиций триединство лингвистической системы представим теперь следующим образом (см. рис.2).

       
   
     
 

 

 

 

 

Знак

 

                                                                                                      

 

 

Система

                                  

 

                                       Рис. 2

 

Отличие от рис.1 составляет то, что основу интеллектуальной составляющей лингвистической системы образует не слово-понятие (фраза-понятие), а регистрируемая ситуация. Причем на рис.1 роль ситуации в некотором смысле играет контекст, который доопределяет центр внимания – слово-понятие. На рис.2 наоборот, ситуация – центр внимания, а знак (который в плане сравнения рис.1 и рис.2 соответствует слову) играет вторую, вспомогательную роль.

Теперь остановимся не на смысловой, а на практической основе лингвистической системы – на алгоритме. Именно алгоритм «оживляет» систему.

Не подлежит сомнению, что природа алгоритма на уровне команд операционной системы, знаковая. Распознается код (знак), а затем следует выполнение операции. Этот принцип сохраняется и на других уровнях реализации алгоритма. Например, на самом высоком уровне оперирования словами естественного языка любой алгоритм воспринимает лингвистические конструкции через ряд признаков, которые могут иметь место или нет, т.е. через знаки. Таким образом, все алгоритмические лингвистические системы – знаковые, хотя сами лингвистические конструкции не являются знаковыми, поскольку за ними стоят понятия. 

Возникает естественный вопрос: «А разве слово не имеет знаковой природы?» Более того, именно знаковый аспект языка кладется в основу многих трактовок мышления [7,8]. Из-за ограниченного объема статьи дадим только краткий ответ.

В подобных работах «знаковая функция» слова понимается как ОБОЗНАЧЕНИЕ чего-либо, например, смысла, который это слово отражает. Однако слово ЗНАК имеет и другое значение: «Внешнее обнаружение, признак чего-нибудь.» [9]. Именно в этом смысле нами используется термин «знак», причем основной акцент составляет элемент РЕГИСТРАЦИИ внешнего.

Знак-обозначение подразумевает полное или частичное осмысление. Использование этого знака инициируется «изнутри».

Знак-регистрация сам по себе не подразумевает понимание регистрируемого «внешнего». Понимание этого «внешнего»  может происходить (а может и не происходить) уже после регистрации, реальной или мнимой.

Если в основе мышления (мысли) видеть знак-обозначение, то эта основа должна уже содержать мысль – смысл обозначения. И тогда мы должны признать, что в основе мысли – мысль, что лишает нас надежды найти конструктивные и содержательные результаты о природе мышления.

В то же время, если имеются гибкие и развитые средства знаковой регистрации самых различных ситуаций, то можно представить, что они могут быть использованы для конкретного построения адекватных реакций системы на те или иные события внутреннего и внешнего плана. Подобные непонятийные, нелингвистические механизмы скорее всего и лежат в основе мыслительных процессов.

Изложенные соображения согласуются с давно известной позицией о том, что природа смысла не является лингвистической [10]: «Развитие детской речи идет от слова к фразе, в то время как развитие смысла в детский высказываниях идет от целой фразы к отдельным словам. …В области функционирования развитой человеческой мысли … самое течение процесса мышления и речи не совпадают друг с другом. В отрицательной части этот тезис был известен давно, но экспериментаторам он стал доступен буквально несколько лет тому назад».

 

  1. Лингвистическая неформальная интеллектуальная система

 

Выявленная знаковая (нелингвистическая) сущность интеллектуальной составляющей системы говорит о том, что имеется возможность представить действия системы в виде знаков, причем не обозначающих, а регистрирующих. Такая интерпретация функций системы, с одной стороны, кардинально упростит «смысловую нагрузку» на алгоритм, а с другой стороны, повысит уровень надежности системы. Все это позволит кардинально повысить качество выполнения системой заданий и уровень их сложности. Действительно, оперировать знаками гораздо легче, чем словами, а реализовать действия системы в «узком диапазоне» конкретной ситуации куда проще, чем искать ответ в самом общем случае.

Проблемой в такой системе становится обработка «нетиповых» ситуаций, что означает введение в систему логических элементов, позволяющих сводить одну ситуацию к другой, усложнять ситуации за счет их объединения, характеризовать ситуации знаковыми процессами и т.д.

В работах [1, 2] предложена общая структура для решения подобных задач, названная неформальной интеллектуальной системой. Идея состоит в том, чтобы каждую ответную реакцию на воздействие внешней среды строить на основе стереотипных процедур, в избытке содержащихся в системе. Стереотипы «поведения» системы могут усложняться по мере ее функционирования, что означает развитие логических свойств. Сложные стереотипы, названные логиторами, составляют интеллектуальную основу системы. Простые стереотипы, названные резонами, аккумулируют в себе акты простейшего взаимодействия элементов системы друг с другом и с внешней средой (пользователем). Резоны – исходный материал для построения логиторов. Кроме того, логиторы могут объединяться друг с другом.

Применительно к лингвистическим системам логиторно-резонный подход может, например, означать, что каждый логитор соответствует конкретной ситуации и содержит в себе знаки и знаковые последовательности, указывающие на специфические признаки ситуации. Сюда же могут быть «вплетены» фразы естественного языка, отражающие те или иные аспекты свойств ситуации. «Знаковая часть» логитора  - гибкое средство его усложнение (усовершенствования) и взаимодействия с другими логиторами. «Лингвистическая часть» - буфер между логитором и пользователем.

Из представленного самого общего описания лингвистической неформальной интеллектуальной системы можно увидеть, что проблема формализации «поведения» системы перестает быть краеугольной. Действительно, элементы формализации используются на уровне элементарных свойств и действий системы. Свои глобальные свойства система приобретает в процессе обучения пользователем, формируя по ситуации сложные ответные реакции из того набора стереотипов, которые она имеет. В эти условиях эффективность создаваемой системы зависит прежде всего от

-        квалификации разработчика, который должен обеспечить актуальный выбор стереотипных ситуаций и большое их многообразие,

-        опыта и умения пользователя-разработчика, обучающего систему.

 

ЛИТЕРАТУРА
           
  1. Искусственный интеллект: В 3 кн. Кн. 1. Системы общения и экспертные системы. Справочник /Под ред. Э.В.Попова. – М.: Радио и связь, 1990.
  2. Brandow R., Mitz K., Rau L.F. Automatic condensation of electronic publications by sentence selection// Information processing and management. – 1995. – Vol. 31. – No. 5. – p. 675-685.
  3. Харламов А.А., Ермаков А.Е., Кузнецов Д.М. Text Analyst – комплексный нейросетевой анализатор текстовой информации // Вестник МГУ. Серия Приборостроение.-1998.-№ 1. – с.101-108, 129.
  4. Поляков В.Н. Синтез формальных моделей языка и смысла как проблема семантической обработки естественного языка // Новости искусственного интеллекта. – 1997. - № 1. – с. 6-63.
  5. Гаврилова Т.А. Состояние и перспективы разработки баз знаний интеллектуальных систем // Новости искусственного интеллекта. – 1996. - № 1. – с. 5-43.
  6. Масевич А.Ц., Захаров В.П. Качество информационного продукта автоматизированных библиотечных систем // Материалы 3-й Международной конференции «Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества. Крым-96", Форос, 1 – 9 июня 1996г. – Ялта, 1996. – Т. 1. – с. 178-181.
  7. Лосев А.Ф. Знак. Символ. Миф. – М.: Изд-во МГУ. – 1982.
  8. Кондаков Н.И. Логический словарь-справочник. – М.: Наука. – 1975.
  9. Ожегов С.И. Словарь русского языка. М.: Русский язык. – 1986.
  10. Выготский Л.С. Развитие высших психических функций. Из неопубликованных трудов. – М.: Академия педагогических наук, РСФСР. – 1960.
  11. Григорьев В.А. Стереотипы и фантазия в интеллектуальных системах. Часть I // НТИ Сер. 2. – 1999. - № 7. – с. 10 – 27.
  12. Григорьев В.А. Стереотипы и фантазия в интеллектуальных системах. Часть II // НТИ Сер. 2. – 2000. - № 1. – с. 12 – 20.