Когнитивный потенциал естественных языков агглютинативного типа в интеллектуальных технологиях

Обложка

Цитировать

Полный текст

Аннотация

Описан подход к разработке новых интеллектуальных технологий на основе исследования когнитивного потенциала и семиотического моделирования лексико-грамматических структур агглютинативных языков (на примере татарского языка). Проведена классификация когнитивных лексико-грамматических структур, определяющих информационную технологичность языка. На конкретных примерах показаны возможности татарского языка для компактного представления знаний, оперирования с нечёткой информацией, раскрыты такие важные свойства, как регулярность, естественная и конструктивная сложность, рекурсия, глубокий морфологический эллипсис, функциональное разнообразие и семантическая многовалентность аффиксов. Предложенный подход, основанный на семиотических моделях агглютинативного языка и применении децентрализованной системы технологических средств вербализации и контекстного распознавания значений элементов языка, может позволить получать эффективные решения для создания интеллектуальных инструментов накопления и обработки знаний. Работы в этом направлении создают перспективу построения когнитивно-коммуникативной системы искусственного интеллекта на базе универсального языка общения систем искусственного интеллекта между собой и с человеком.

Полный текст

Введение

В исследовании естественных языков (ЕЯ) можно выделить три аспекта: когнитивный, коммуникативный и технологический [1]. Когнитивный аспект – это характеристика ЕЯ с точки зрения возможностей описания модели мира, представления знаний, организации и отображения процессов мышления. Коммуникативный аспект отражает потенциал ЕЯ для кодирования, приёма и передачи, семиотической обработки информации, организации диалога. Технологический аспект определяет формальный и концептуальный потенциалы ЕЯ для реализации средств эффективной обработки, адекватного описания и компактного хранения информации на данном языке, создания эргономичных технических средств, учитывающих специфику языка (например, частотность букв при разработке клавиатуры), а также для разработки интеллектуального программного инструментария, включая операционные системы. В основе искусственных языков и систем программирования лежат глубинные структуры (ментальность) ЕЯ и, таким образом, эти системы реализуют описательный и вычислительный потенциал соответствующего ЕЯ.

Опыт авторов в области разработок и использования инфокоммуникационных технологий позволяет отметить, что современные средства накопления и обработки знаний неэффективны и не справляются с такими задачами, как поиск и отбор информации в распределённых базах данных, извлечение знаний, семантический анализ текстовой информации. Причиной их неинтеллектуальности является главным образом то, что создаются они с использованием относительно примитивных искусственных языков программирования, представляющих собой подмножество флективно-аналитических языков или искусственных структур, созданных на основе ЕЯ. Морфосинтаксические структуры этих ЕЯ больше ориентированы на реализацию коммуникативных, а не когнитивных функций.

Другая причина неинтеллектуальности систем обработки ЕЯ связана с организацией их моделей на основе формальных систем, практически игнорирующих семантику, в частности, порождающих грамматик [2], что создаёт фундаментальные проблемы: монотонность результатов логического вывода и пассивность инструментов логико-семантического анализа информации. В работе [3] такая организация моделей ЕЯ названа глобальным подходом к исследованию ЕЯ. Эти методы мало подходят для описания агглютинативных языков в целом и татарского языка в частности, поскольку не позволяют эффективно описать важные когнитивные особенности языков этого типа. Например, таких, как рекурсивно-параметрические конструкции, фрактальность лексико-грамматических структур, многовалентность и проактивность корневых и аффиксальных морфем и др.

Основной задачей фундаментальных исследований когнитивного потенциала ЕЯ агглютинативного типа для создания интеллектуальных технологий является разработка и использование семиотических моделей лексико-грамматических конструкций тюркских языков, как формальной основы интеллектуальных технологий, а также лексического корпуса, как лингвистической базы данных. Среди важных признаков интеллектуальности систем принятия решений выделяются такие свойства, как активность знаний, т.е. первичность анализа данных и вторичность принятия решения; возможность оперировать нечёткой информацией, семантически управляемой контекстом, и исполнять нечёткие команды.

В предлагаемом подходе используются языковые инструменты обработки информации, разработанные с учётом свойства проактивности морфем агглютинативных языков. По функциональности такие инструменты являются агентами, подобно агентам в многоагентных системах. Эти инструменты менее автономны, привязаны к контексту и функционируют в тесной связи между собой в соответствии с условиями, сформированными координирующими модулями. Такие модули, разрабатываемые на основе семиотических моделей Поспелова-Полякова [4, 5], обеспечивают целостность и полноту использования доступной информации на каждом этапе функционирования системы обработки информации.

В данной работе на конкретных примерах показывается перспективность исследования в этих целях татарского языка как языка агглютинативного типа, обладающего такими важными свойствами, как регулярность, рекурсия, активность знаний и др.

1. Классификация когнитивных лексико-грамматических структур

Исследование возможностей ЕЯ для разработки языков ИИ входят в число базовых проблем в области построения интеллектуальных систем (ИС) [1]. Особенно важными являются исследования когнитивного потенциала ЕЯ исходя из того, что любой ЕЯ обладает необходимым лексико-грамматическим потенциалом для реализации базовых когнитивных функций, присутствие которых в системах интеллектуальной обработки информации в настоящее время становится критически востребованной. Такие задачи, как: компьютерная обработка больших массивов ЕЯ-текстов; разработка онтологий в условиях нечёткости данных и динамичности пространства; представление и обработка разнородных и динамических графов знаний; ЕЯ-диалог с ИС; создание больших банков информации на основе ЕЯ; разработка языков-посредников в многоязычной информационной среде, базирующихся на развитых лингвистических моделях, - приобретают особую актуальность в связи с развитием глобальных компьютерных сетей, формированием больших объёмов распределённых данных, и необходимостью создания объяснительного ИИ.

Разработка нового поколения программного инструментария включает:

  • исследование грамматических (морфологических, синтаксических, семантических, прагматических) конструкций в различных ЕЯ в целях создания на их базе языков ИИ нового поколения;
  • разработку языка-посредника на основе подмножеств и конструкций языков с определёнными свойствами, позволяющими адекватно и сжато описывать контекст и быстро обрабатывать тексты на ЕЯ.

Для ИС обработки знаний важны следующие характеристики:

  • время обработки;
  • объём памяти для хранения информации;
  • компактность хранения и передачи смысла;
  • возможность кодирования и обработки нечеткой информации;
  • активность знаний.

Первые три характеристики описывают эффективность, а последние – интеллектуальность систем. Татарский язык, являясь одним из тюркских языков, имеет богатую, сложную, регулярную морфологию, обладает потенциалом, позволяющим эффективно кодировать и компактно хранить информацию, а также реализовывать на уровне аффиксальных морфем такие явления, как рекурсия и нечёткость [6].

В объектно-предикативной модели мира именные группы, как правило, обозначают объект или объекты, в то время как действие, процессы, отношения между объектами и группами объектов описываются глагольной группой. Выделяются когнитивные механизмы, реализуемые в рамках именной и глагольной групп, соответственно. Кроме того, структура текста, которая определяется синтаксическими закономерностями языка, служит одним из когнитивных механизмов языка, управляющим в тексте такой важной характеристикой, как активность знаний, естественным образом реализуя логическую схему «анализ-действие».

2. Морфология татарского языка

Татарская морфология является регулярной, почти автоматной [6-8] и в то же время имеет естественную сложность, которая заключается в следующем.

  1. Возможность аффиксального преобразования словоформы с одного типа в другой путём присоединения определённых аффиксальных морфем справа (праволинейная грамматика). Присоединяясь к словоформе, специальный аффикс-переключатель меняет («переключает») слово с одного типа на другой, например, превращает именную словоформу в глагольную или в форму прилагательного, и наоборот (уй-уй+ла: мысль-думай; кара-кара+у-карау+чы: наблюдай-наблюдение-наблюдатель). Здесь и далее знак «+» - это условный разделитель слова и аффикса-переключателя. В тексте слитное написание: уйла - думай.
  2. Морфологическое (синтетическое) задание признаков модальности, настроения, эмоционально-личностного отношения к ситуации, объекту или процессу, описываемых данной словоформой (кояш-кояш+тай: солнце-словно солнце; алды-алды+мыни: взял-неужели взял).
  3. Контекстное разнообразие значений аффикса. В татарском языке порядка 90 словоизменительных аффиксальных морфем. Большинство из них имеют несколько значений, т.е. используются для кодирования в тексте нескольких, иногда до 20 и более, различных контекстных значений (смыслов). Например, аффикс –дан/–тан, обозначаемый как аффикс исходного падежа: бакча+дан чыга (выходит из сада), используется также для кодирования других контекстных смыслов: корыч+тан каты (крепче стали: сравнение), кояш+тан аста (ниже солнца: точка отсчёта), укытучы+дан сора (спроси у учителя: адресат) и т.п.

Именная группа, как правило, кодирует некую семантическую субъектно-объектную ситуацию, а глагольная группа – контекстные отношения над этой ситуацией. Возможность перехода от именной формы к глагольной и, наоборот, через присоединение соответствующих аффиксов позволяет описывать одновременно в пределах одной словоформы как сложную ролевую ситуацию, так и контекстные отношения между семантическими ролями. Тем самым обеспечивается компактность описания и хранения информации. Синтетический (аффиксальный) способ словоизменения обеспечивает кодирование в рамках одной словоформы некоторого значения, описываемого на флективно-аналитических языках (например, на английском) несколькими словосочетаниями или предложениями.

Сложность татарской морфологии конструктивная, т.к. аффиксальная морфема однозначно выделяется в последовательности аффиксов в словоформе, и её значение практически однозначно определяется в лексико-грамматическом контексте. Морфология татарского языка в большой степени регулярна, близка к автоматной, с небольшим количеством исключений из правил, не меняющих смысла, что обеспечивает минимизацию ёмкостных и временных функций при обработке текстов на татарском языке, упрощает анализ структуры и значения словоформы.

Важное свойство татарской морфологии - это фиксированная позиция, «жёсткое» размещение аффиксов в последовательности аффиксальных морфем. Это означает, что одна и та же схема сочетания морфем (морфотактика) присуща почти всем именным и глагольным группам. Это даёт возможность по одной и той же схеме (автоматно) образовывать словоформы с одинаковыми глубинными значениями аффиксов. Например: кул, куллар, кулларым, кулларыма – (рука, руки, мои руки, моим рукам); бакча, бакчалар, бакчаларым, бакчаларыма – (сад, сады, мои сады, моим садам).

Разные именные корневые морфемы кул (рука), бакча (сад) имеют одни и те же последовательности аффиксальных морфем с идентичными значениями. Приведённые парадигмы описываются следующими схемами: Х(Имя сущ.), Х(Имя сущ.)+лар(афф.мн.), Х(Имя сущ.)+лар(афф.мн.)+ым (афф. притяж., 1-е л., ед.ч.), Х(Имя сущ.)+лар(афф.мн.)+ым(афф. притяж., 1-е л., ед.ч.).+ а (афф. падежн., дат. падеж).

Позиции аффиксальных морфем, составляющих словоформу, неизменны относительно друг друга. Таким образом, можно определить следующие когнитивные механизмы татарского языка: регулярность и естественная сложность морфологии; фиксированность позиций соответствующих типов аффиксальных морфем. Эти механизмы универсальны, т.е. работают на всех словах, входящих в соответствующие классы лексем (части речи).

3. Морфологический эллипсис

Следующая возможность в татарской морфологии, которая может быть отнесена к когнитивному механизму (компактность), называется морфологическим эллипсисом [9] - это возможность пропуска последовательности аффиксов при однородных именных словоформах с сохранением её в последней словоформе. В понятии морфологический эллипсис последовательность пропускаемых аффиксов может быть сколь угодно длинной (теоретически не ограничена). Т.е. возможен вывод любой последовательности аффиксов, общих для однородных членов, вправо за последовательность однородных членов и присоединение их к последнему справа однородному члену. Например:

Иишек алды тавыкларга, казларга, сарыкларга тулы = ишек алды тавык, каз, сарыкларга тулы (Двор полон кур, гусей, овец).

Мин кырларыбызга, урманнарыбызга, елагларыбызга шатланам = Мин кыр, урман, елгаларыбызга шатланам (Я радуюсь нашим полям, лесам, рекам).

4. Морфологическая рекурсия

Одним из важных и мощных когнитивных механизмов в татарском языке является механизм рекурсии [10] - это возможность циклического порождения нового значения путём последовательного применения одной и той же «формулы», т.е. повторного присоединения одного и того же аффикса. Такими свойствами обладают аффиксальные морфемы –ДАгЫ1 (локатив2) и –нЫкЫ (притяжательность), которые можно назвать также аффиксами неопределённости, т.е. аффиксами, придающими неопределённость множеству сущностей, связанных с лексемой, к которой присоединяется аффикс рекурсии.

Например, пусть задана лексема ком (песок). Присоединение аффикса –дагы порождает множество новых сущностей. Например: комдагы {таш-камень, эз-след, агач-дерево, кеше-человек, кош-птица, баз-яма, ... все что угодно, любой возможный объект на песке}. Присоединение аффикса –нЫкЫ вносит определённость в предыдущую лексему, “заставляя” словоформу-лексему –комдагы-на песке заполнить постпозицию одной из сущностей (путём выбора, контекстным или явным, одного объекта из множества). Например, эта сущность - человек. Одновременно присоединение рекурсивного аффикса -нЫкЫ порождает множество новых объектов, принадлежащих человеку или свойств, присущих человеку, образуя неопределённость, которая заполняется контекстно или явно при присоединении следующего рекурсивного аффикса. Для данного случая это: ком-ДАгЫ (на песке) (кеше-человек)-нЫкЫ (голова, рука, шаг, взгляд, часы и т.п., принадлежащие или присущие этому человеку, который на/в песке).

По такой формуле возможно образование словоформы практически неограниченной длины. Такие длинные последовательности морфем в нормальной речи (при коммуникации между людьми, в текстах) практически не используются. Это связано с проблемами глубины памяти человека, удобства общения между людьми. Подобное словоизменение является совершенно корректным для грамматики татарского языка, и словоформа, образованная присоединением любой последовательности, гипотетически всегда имеет смысл. Конкретное значение приобретается при «погружении» словоформы в определённый контекст.

Пример со следующей словоформой: бакчаныкындагыныкыныкындагы, которая однозначно раскладывается на составляющие: бакча-сад (имя сущ.) +ныкы (притяж.)+ндагы (локатив2)+ныкы(притяж.)+ныкы(притяж.)+ндагы (локатив2).

Значение данной словоформы таково: «нечто/некто, которое находится на/в нечто/некто, которое само принадлежит нечто/некто, которое само принадлежит нечто/некто, которое само находится на/в нечто/некто, которое принадлежит саду».

Эксплицитно задавая параметры после каждой морфемы, можно получить контекстную определённость словоформы. В реальных случаях такие параметры задаются имплицитно, наполняясь конкретным значением в зависимости от контекста речи.

Пример. Пусть после каждого аффикса неопределённости стоят параметры: бакча+ныкы(x0)+ндагы(x1)+ныкы(x2)+ныкы(x3)+ндагы(x4)+ныкы(х5), где xi – контекстные объекты, т.е. объекты, которые либо приобретают конкретное значение из контекста, либо их задаёт пользователь (i = 1,…4). Тогда, придавая значения параметрам: x0 = «яблоня», x1 = «ветка», x2 = «птичка», x3 = «крыло», x4 = «перо», можно получить следующее контекстное значение: «нечто (значение х5, придаваемое параметру последним аффиксом, осталось неопределённым) на пере, что принадлежит крылу, что принадлежит птичке, что на ветке, что принадлежит яблоне». Пример показывает, что применение рекурсивных аффиксов приводит к сжатию информации и существенной экономии памяти.

5. Когнитивные механизмы при описании действий

Поверхностное лексическое описание предикатов (действий, отношений), как правило, осуществляется глагольными группами [11, 12]. Свойства регулярности и конструктивной сложности морфологии и фиксированности позиций соответствующих типов аффиксальных морфем в татарском языке присущи также и глагольным группам. В дополнение к когнитивным механизмам, выделенным на основе именных словоформ, можно рассмотреть следующие естественные когнитивные механизмы, проявляющиеся в глагольных словоформах.

5.1. Возможность рекурсивно задавать нечёткие команды
и описывать нечёткие действия

Данное свойство кодируется глагольными аффиксами – ГАлА и - штЫр, занимающими позицию залога, т.е. сразу же после глагольной основы. Пример с глаголом кара (смотри, 2-е лицо, ед.ч., повел. накл.).

караштыр (смотри/поглядывай  время от времени); кара (смотри)+штыр (время от времени);

караштыргала (смотри время от времени, время от времени – т.е. реже); кара (смотри)+штыр (время от времени)+гала (время от времени);

караштыргалаштыргалаштыр… (смотри время от времени, время от времени, время от времени – и ещё реже…); кара (смотри, корень, 2-е лицо, ед.ч., повел.накл.)+штыр (время от времени-изредка)+гала (время от времени - ещё реже)+штыр (ещё реже)+гала(ещё реже)+штыр (ещё реже)…

Насколько редко требуется смотреть/поглядывать - определяется из контекста ситуации.

5.2. Возможность одной словоформой задавать объектно-предикативные сценарии, ролевые ситуации

Реализация данного свойства обеспечивается рядом специальных глагольных аффиксов, занимающих также залоговую позицию: -н, -Ыш, -т, -ДЫр, -ТЫр.

Изменения ролевой ситуации при присоединении соответствующих аффиксов можно рассмотреть на примере с глагольной словоформой кара (смотри).

Участники действия: субъект S, объект-предмет Ok, где k ≥ 1.

Для словоформы кара (смотри) ролевая ситуация следующая: S воздействие на Ok.

Присоединение аффиксов -н, -Ыш, -т, -ДЫр приводит к изменениям.

  1. -н: каран – кара+н (оглядывайся).
    Ролевая ситуация: S воздействие S.
  2. -Ыш: караш – кара+ш (помогай смотреть-ухаживать/ смотри-ухаживай вместе).
    Участники действия: субъект S, объект-актор Ai,j, объект-предмет Ok, где i – номер группы объекта-актора, i ≥ 1; j – число участников в группе i, j ≥ 1.
    Ролевая ситуация: S воздействие (помощь) Ai,j  и (S & Ai,j) воздействие (бросить) Ok.
  3. -т, -ДЫр: карат – кара+т (сделай так, чтобы смотрел/смотрели-ухаживал/ухаживали)
    Ролевая ситуация: S воздействие Ai,j  -> Ai,j воздействие (смотреть) Ok.  Здесь стрелка -> означает импликацию. караттыр – кара+т+тыр (сделай так, чтобы сделали так, чтобы смотрели).
    Ролевая ситуация: S воздействие Ai,j -> Ai,j  воздействие Al,m -> Al,m воздействие  (смотреть) Ok. караттырт - кара+т+тыр+т (сделай так, чтобы сделали так, чтобы сделали так, чтобы смотрели).
    Ролевая ситуация: S воздействие Ai,j  -> Ai,j воздействие Al,m -> Al,m  воздействие As,t -> As,t воздействие  (смотреть) Ok.

По такой формуле, подставляя новые определённые аффиксы, можно создавать всё новые и новые ролевые ситуации и описывать процессы на лексическом уровне. Например, добавление аффикса –Ыл к последней полученной словоформе: караттыртыл превращает сам субъект в объект-предмет, объект воздействия, т.е. S = Ok.

Получается следующая ролевая ситуация: S воздействие Ai,j  -> Ai,j  воздействие Al,m -> Al,m  воздействие As,t -> As,t воздействие (бросить) S, т.е. воздействие на самого же инициатора-субъекта действия (бросить) через 4 промежуточных объекта-агента (или группы объектов-агентов).

6. Активность знаний

Известно, что английские предложения строятся по схеме S-V-O (subject-verb-object: субъект-глагол-объект) [13-15], а татарские - по схеме: S-O-V. Т.е. англичанин, если говорит, например, о намерении сходить в кино, сначала скажет, пойдёт или не пойдет, и только после этого выдаст информацию – куда, какое, зачем, с кем, когда и т.д. (“We’ll go to the cinema “Attila” with my friends tomorrow”). Здесь действие управляет ситуацией. После того, как высказано однозначно намерение субъекта We’ll go - мы пойдем, дальнейшая информация становится пассивной, практически не влияет на выбор способа действия или усложняет его. В тексте на татарском языке сначала даётся информация и её анализ, и только после этого определяется действие. («Без дуслар белән иртәгә буласы “Аттила” киносына барабыз/бармыйбыз» – Мы с друзьями на завтрашний фильм «Аттила» пойдём/не пойдём).

В ИС это называется активностью знаний, что служит одним из важных признаков интеллектуальности системы. Для подобных систем естественным и основополагающим является стиль размышления: анализ-действие, размышление-цели-алгоритмы, а не командный стиль: действие-анализ, алгоритм-цель, как это реализовано в современных технологиях, основанных на структуре английского языка. Т.е. в тюркских языках сначала анализируется, обрабатывается информация, а затем осуществляется действие: подбирается соответствующая адекватная модель представления знаний или выбираются соответствующие алгоритмы и схемы реализации, эффективность которых во многом определяется корректностью и полнотой анализа информации. Это можно назвать событийным программированием.

Такие возможности татарского языка позволяют ставить задачу разработки программ накопления и извлечения знаний в глобальных компьютерных сетях.

Заключение

Как показывают исследования [6, 16-18], тюркские языки, и в частности татарский язык, как агглютинативный язык, обладающий регулярной морфологией и контекстно разрешаемой конструктивной сложностью, являются эффективным инструментом для создания ИС обработки информации. В силу малых значений показателей временных и ёмкостных оценочных функций для генерации и анализа татарских словоформ (за счёт регулярности) достигается эффективность при накоплении и обработке информации на татарском языке. Компактность передачи смысла текста на поверхностном, лексическом уровне объясняется возможностями языка синтетически, т.е. словоформой, кодировать смысл, который для других языков (английский, русский) формируется аналитически (несколькими предложениями). Агглютинативность языка, алгоритмические закономерности, минимальность исключений, жёсткость синтаксиса позволяют ставить задачу о построении языка промежуточной трансляции, т.е. языка-посредника на базе татарского языка.

Исследование когнитивных лексико-грамматических структур описания, запоминания, хранения, обработки и передачи информации ЕЯ способствует созданию ИС и технологий обработки информации. Представляют интерес ЕЯ агглютинативного типа, обладающие естественными когнитивными технологическими механизмами, которые позволяют на поверхностном уровне эксплицитно вербализовать, фиксировать и отображать стереотипы, когнитивные модели и механизмы, описывающие ситуации и процессы в модели мира [17, 18]. На примере татарского языка показано, что ЕЯ агглютинативного типа обладают когнитивным потенциалом, позволяющим описывать сложные информационные системы обработки знаний. Дальнейшее развитие и применение на практике предлагаемого подхода и принципов исследования лексико-грамматического потенциала ЕЯ позволит создать новые технологии и когнитивные модели обработки знаний и принятия решений в ИС.

 

1 Здесь и далее заглавные буквы в аффиксальных морфемах обозначают вариативность символов в соответствующих позициях согласно закону сингармонизма.

×

Об авторах

Джавдет Шевкетович Сулейманов

Институт прикладной семиотики, Академия наук Республики Татарстан

Email: dvdt.slt@gmail.com
Scopus Author ID: 6603474810
ResearcherId: B-4793-2014

1955 г. рождения. Окончил механико-математический факультет Казанского государственного университета в 1977 г., к.т.н. (1985), д.т.н. (2000). Научный руководитель Института прикладной семиотики Академии наук Республики Татарстан (АН РТ), академик АН РТ, профессор. Заслуженный деятель науки РТ, член Российской ассоциации искусственного интеллекта (РАИИ). В списке научных трудов более 300 работ в области прикладной семиотики, компьютерной и когнитивной лингвистики, искусственного интеллекта, электронной и  социальной педагогики.

Россия, Казань

Ринат Абрекович Гильмуллин

Институт прикладной семиотики, Академия наук Республики Татарстан

Автор, ответственный за переписку.
Email: rinatgilmullin@gmail.com
ORCID iD: 0000-0002-8520-8921
Scopus Author ID: 57079235700

1975 г. рождения. Окончил Казанский государственный университет в 1997 г., к.ф.-м.н. (2010). Директор Института прикладной семиотики АН РТ. В списке научных трудов около 50 работ.

Россия, Казань

Айрат Рафизович Гатиатуллин

Институт прикладной семиотики, Академия наук Республики Татарстан

Email: ayrat.gatiatullin@gmail.com
ORCID iD: 0000-0003-3063-8147
Scopus Author ID: 56500678000

1972 г. рождения. Окончил Казанский государственный университет в 1994 г., к.т.н. (2002). Ведущий научный сотрудник Института прикладной семиотики АН РТ. В списке научных трудов более 60 работ.

Россия, Казань

Николай Аркадиевич Прокопьев

Институт прикладной семиотики, Академия наук Республики Татарстан

Email: nikolai.prokopyev@gmail.com
ORCID iD: 0000-0003-0066-7465
Scopus Author ID: 57190803409
ResearcherId: S-3829-2016

1992 г. рождения. Окончил Институт вычислительной математики и информационных технологий Казанского Федерального университета в 2015 году. Научный сотрудник Института прикладной семиотики АН РТ. В списке научных трудов около 40 работ.

Россия, Казань

Список литературы

  1. Сулейманов Д.Ш. К вопросу исследования технологического аспекта естественных языков // Обработка текста и когнитивные технологии: Труды XI Междунар. науч. конф. (7–14 сентября 2009, Констанца). Казань: Изд-во Казанского университета., 2010. С.232-245.
  2. Chomsky N. Syntactic Structures. The Hague: Mouton, 1957. 117 p.
  3. Поспелов Д.А., Осипов Г.С. Прикладная семиотика. http://raii.org/library/ainews/1999/1/ OSPOS.ZIP.
  4. Pospelov D. Situational Control: Theory and Practice. Columbus OH: Batelle Memorial Institute, 1986.
  5. Поляков В.Н. Проблемы представления, приобретения и использования знаний в свете обработки естественного языка // Когнитивно-семиотические аспекты моделирования в гуманитарной сфере. Казань: Изд-во Академии наук РТ, 2017. С.145-163.
  6. Suleymanov D.S. Natural Cognitive Mechanisms in the Tatar language // In the Collection of the Vienna Proceedings of the Twentieth European Meeting in Cybernetics and Systems Research. Ed. by Robert Trappel. Vienna, Austria, 6-9 April, 2010. P.210-213.
  7. Гузев В.Г. О некоторых экзотических особенностях тюркских языков («тюркские чудеса») // Актуальные проблемы мировой политики. СПб.: Изд-во С.-Петерб. ун-та, 2020. Вып.10. С.231-245.
  8. Щербак А.М. О морфологической структуре слов в тюркских языках // Морфологическая структура слова в языках различных типов. 1963. С.267-270.
  9. Лекант П.А. Эллипсис как проблема синтаксиса и фразеологии // Ученые записки МОПИ им. Н.К. Крупской. 1966. Т.160, Вып.11. С.210-224.
  10. Лодатко Е.А. Рекурсивные лингвистические структуры // Теоретические и прикладные проблемы русской филологии: Научно-метод. сборник. Славянск: СГПУ, 2004. Вып. XII. С.86-95.
  11. Fillmore C.J. Frame Semantics and the Nature of Language // In Annals of the New York Academy of Sciences: Conference on the Origin and Development of Language and Speech. 1976, Vol. 280. P.20-32.
  12. Осипов Г.С., Смирнов И.В., Тихомиров И.А. Реляционно-ситуационный метод поиска и анализа текстов и его приложения // Искусственный интеллект и принятие решений. 2008. № 2. С.3-10.
  13. Givon T. Syntax: An introduction. John Benjamins Publishing Co., 2001. 500 p.
  14. Тестелец Я.Г. Введение в общий синтаксис. М.: Издательство РГГУ, 2001. 805 c.
  15. Гринберг Дж. Некоторые грамматические универсалии, преимущественно касающиеся порядка значимых элементов // Новое в лингвистике. Языковые универсалии. 1970. Вып. 5. С. 114-162.
  16. Gatiatullin A., Suleymanov D., Prokopyev N., Khakimov B. About Turkic Morpheme Portal // In Proceedings of the Computational Models in Language and Speech Workshop (CMLS 2020). Kazan, November 12-13, 2020. P.226-243.
  17. Oflazer K., Sarachlar M. Turkish Natural Language Processing // Theory and Applications of Natural Language Processing. Series ed. J. Hirshberg, E. Hovy, M. Jhonson. Springer International Publishing AG, part of Springer Nature 2018. 357 p.
  18. Tantug A.G., Adali E. Machine Translation Between Turkic Languages // Turkish Natural Language Processing. Theory and Applications of Natural Language Processing. Series ed. J. Hirshberg, E. Hovy, M. Jhonson. Springer International Publishing AG, part of Springer Nature 2018. P.237-255.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Сулейманов Д.Ш., Гильмуллин Р.А., Гатиатуллин А.Р., Прокопьев Н.А., 2024

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ФС 77 - 70157 от 16.06.2017.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах