Учебная работа. Реферат: Компьютерная лингвистика как прикладная лингвистическая дисциплина
Тема работы: Компьютерная лингвистика как прикладная лингвистическая дисциплина
Содержание
1. Компьютерная лингвистика как прикладная лингвистическая дисциплина
2. Когнитивный инструментарий компьютерной лингвистики
3. Некие направления компьютерной лингвистики
4. Гипертекстовые технологии представления текста
Литература
1. Компьютерная лингвистика как прикладная лингвистическая дисциплина
Под термином «компьютерная лингвистика» (computational linguistics) обычно понимается широкая область использования компьютерных инструментов — программ, компьютерных технологий организации и обработки данных — для моделирования функционирования языка в тех либо других критериях, ситуациях, проблемных областях, также сфера внедрения компьютерных моделей языка не только лишь в лингвистике, да и в смежных с ней дисциплинах. Фактически, лишь в крайнем случае идет речь о прикладной лингвистике в серьезном смысле, так как компьютерное моделирование языка может рассматриваться и как сфера приложения теории программирования (computer science) в области лингвистики. Тем не наименее общая практика такая, что сфера компьютерной лингвистики обхватывает фактически все, что соединено с внедрением компов в языкознании: «термин «компьютерная лингвистика» задает общую ориентацию на внедрение компов для решения различных научных и практических задач, связанных с языком, никак не ограничивая методы решения этих задач».
Институциональный нюанс компьютерной лингвистики
. Как особенное научное направление компьютерная лингвистика оформилась в 60-е гг. Поток публикаций в данной для нас области весьма велик. Не считая направленных на определенную тематику сборников, в США
2. Когнитивный инструментарий компьютерной лингвистики
Компьютерная лингвистика как особенная прикладная дисциплина выделяется до этого всего по инструменту — другими словами по использованию компьютерных средств обработки языковых данных. Так как компьютерные программки, моделирующие те либо другие нюансы функционирования языка, могут применять самые различные средства программирования, то о общем метаязыке гласить как бы не приходится. Но это не так. Есть общие принципы компьютерного моделирования мышления, которые так либо по другому реализуются в хоть какой компьютерной модели. В базе этого языка лежит теория познаний, разработанная в искусственном уме и образующая принципиальный раздел когнитивной науки.
Главный тезис теории познаний говорит, что мышление — это процесс обработки и порождения познаний. «Познания» либо «познание» считается неопределяемой группой. В качестве «микропроцессора», обрабатывающего познания, выступает когнитивная система человека. В эпистемологии и когнитивной науке различают два главных вида познаний — декларативные («познание что») и процедурные («познание как»2)). Декларативные познания представляются обычно в виде совокупы пропозиций, утверждений о чем-либо. Обычным примером декларативных познаний можно считать толкования слов в обыденных толковых словарях. к примеру, чашечка] — ‘маленький сосуд для питья округленной формы, обычно с ручкой, из фарфора, фаянса и т.п. ‘ [MAC]. Декларативные познания поддаются процедуре верификации в определениях «правдаложь». Процедурные познания представляются как последовательность (перечень) операций, действий, которые следует выполнить. Это некая общая инструкция о действиях в некой ситуации. Соответствующий пример процедурных познаний — аннотации по использованию бытовыми устройствами.
В отличие от декларативных познаний, процедурные познания нереально верифицировать как настоящие либо неверные. Их можно оценивать лишь по успешности-неуспешности метода.
Большая часть понятий когнитивного инвентаря компьютерной лингвистики омонимично: они сразу обозначают некие настоящие сути когнитивной системы человека и методы представления этих сущностей на неких метаязыках. Другими словами, элементы метаязыка имеют онтологический и инструментальный нюанс. Онтологически разделение декларативных и процедурных познаний соответствует разным типам познаний когнитивной системы человека. Так, познания о определенных предметах, объектах реальности в большей степени декларативны, а многофункциональные возможности человека к хождению, бегу, вождению машинки реализуются в когнитивной системе как процедурные познания. Инструментально познание (как онтологически процедурное, так и декларативное) можно представить как совокупа дескрипций, описаний и как метод, аннотацию. Другими словами, онтологически декларативное познание о объекте реальности «стол» можно представить процедурно как совокупа инструкций, алгоритмов по его созданию, сборке (= креативный нюанс процедурного познания) либо как метод его обычного использования (= многофункциональный нюанс процедурного познания). В первом случае это быть может управление для начинающего столяра, а во 2-м — описание способностей офисного стола. Правильно и оборотное: онтологически процедурное познание можно представить декларативно.
Просит отдельного обсуждения, всякое ли онтологически декларативное познание представимо как процедурное, а всякое онтологически процедурное — как декларативное. Исследователи сходятся в том, что всякое декларативное познание в принципе можно представить процедурно, хотя это может оказаться для когнитивной системы весьма неэкономным. Оборотное навряд ли справедливо. Дело в том, что декларативное познание значительно наиболее эксплицитно, оно легче осознается человеком, чем процедурное. В противоположность декларативному познанию, процедурное познание в большей степени имплицитно. Так, языковая способность, будучи процедурным познанием, укрыта от человека, не осознается им. Попытка эксплицировать механизмы функционирования языка приводит к нефункциональности. Спецам в области лексической семантики понятно, к примеру, что долгая семантическая интроспекция, нужная для исследования плана содержания слова, приводит к тому, что исследователь отчасти теряет способность к различению правильных и некорректных употреблений анализируемого слова. Можно привести и остальные примеры. Понятно, что исходя из убеждений механики тело человека является сложнейшей системой 2-ух взаимодействующих маятников.
В теории познаний для исследования и представления познания употребляются разные структуры познаний — фреймы, сценарии, планы. Согласно М. Минскому, «фрейм — это структура данных, созданная для представления стереотипной ситуации» [Минский 1978, с.254]. Наиболее развернуто можно сказать, что фрейм является концептуальной структурой для декларативного представления познаний о типизированной тематически единой ситуации, содержащей слоты, связанные меж собой определенными семантическими отношениями. В целях наглядности фрейм нередко представляют в виде таблицы, строчки которой образуют слоты. Любой разъем имеет свое имя и содержание (см. табл.1).
Таблица 1
Фрагмент фрейма «стол» в табличном представлении
Имя слота
Содержание слота
количество ножек
четыре, может быть больше, минимум три
материал
дерево, пластмасса, стекло
поверхность
прямоугольник, овал, круг, квадрат
наличие тумб
факультативно
функции
обеденный, журнальный, рабочий и пр.
и т.д.
Зависимо от определенной задачки структуризация фрейма быть может значительно наиболее сложной; фрейм может включать вложенные подфреймы и отсылки к остальным фреймам.
Заместо таблицы нередко употребляется предикатная форма представления. В этом случае фрейм имеет форму предиката либо функции с аргументами. Есть и остальные методы представления фрейма. к примеру, он может представляться в виде кортежа последующего вида: { (имя фрейма) (имя слота)) (значение слота,),…, (имя слотап
) (значение слотал
) }.
Обычно таковой вид имеют фреймы в языках представлениях познаний.
Как и остальные когнитивные группы компьютерной лингвистики, понятие фрейма омонимично. Онтологически — это часть когнитивной системы человека, и в этом смысле фрейм можно сравнить с таковыми понятиями как человека — семантические сети и схемы. «Схемы, — пишет он, — представляют собой организованные пакеты познания, собранные для репрезентации отдельных самостоятельных единиц познания. Моя схема для Сэма может содержать информацию, описывающую его физические индивидуальности, его активность и личные черты. Эта схема соотносится с иными схемами, которые обрисовывают другие его стороны» [Норман 1998, с.359]. Если же брать инструментальную сторону группы фрейма, то это структура для декларативного представления познаний. В имеющихся системах ИИ фреймы могут создавать сложные структуры познаний; системы фреймов допускают иерархию — один фрейм быть может частью другого фрейма.
По содержанию понятие фрейма весьма близко группы толкования. Вправду, разъем — аналог валентности, наполнение слота — аналог актанта. Основное отличие меж ними состоит в том, что истолкование содержит лишь лингвистически релевантную информацию о плане содержания слова, а фрейм, во-1-х, не непременно привязан к слову, и, во-2-х, включает всю релевантную для данной проблемной ситуации информацию, в том числе и экстралингвистическую (познания о мире) 3).
Сценарий представляет собой концептуальную структуру для процедурного представления познаний о стереотипной ситуации либо стереотипном поведении. Элементами сценария являются шаги метода либо аннотации. Обычно молвят о «сценарии посещения ресторана», «сценарии покупки» и т.п.
Вначале фрейм также употреблялся для процедурного представления (ср. термин «процедурный фрейм»), но на данный момент в этом смысле почаще употребляется термин «сценарий». Сценарий можно представить не только лишь в виде метода, да и в виде сети, верхушкам которой соответствуют некие ситуации, а дугам — связи меж ситуациями. вместе с понятием сценария, некие исследователи завлекают для компьютерного моделирования ума категорию скрипта. По Р. Шенку, скрипт — это некая принятая, общеизвестная последовательность причинных связей [Schank 1981]. к примеру, осознание диалога
На улице льет как из ведра.
Все равно придется выходить в магазин: в доме есть нечего — вчера гости все подмели.
основывается на неэксплицированных семантических связях типа ‘если идет дождик, на улицу выходить не нужно, так как можно захворать’. Эти связи сформировывают скрипт, который и употребляется носителями языка для осознания речевого и неречевого поведения друг друга.
В итоге внедрения сценария к определенной проблемной ситуации формируется план
). План употребляется для процедурного представления познаний о вероятных действиях, ведущих к достижению определенной цели. План соотносит цель с последовательностью действий.
В общем случае план включает последовательность процедур, переводящих изначальное состояние системы в конечное и ведущих к достижению определенной подцели и цели. В системах ИИ план возникает в итоге планирования либо планирующей деятель соответственного модуля — модуля планирования. В базе процесса планирования может лежать адаптация данных 1-го либо нескольких сценариев, активизированных тестирующими процедурами, для разрешения проблемной ситуации. Выполнение плана делается экзекутивным модулем, управляющим когнитивными процедурами и физическими действиями системы. В простом случае план в умственной системе представляет собой ординарную последовательность операций; в наиболее сложных версиях план связывается с определенным субъектом, его ресурсами, способностями, целями, с подробной информацией о проблемной ситуации и т.д. Появление плана происходит в процессе коммуникации меж моделью мира, часть которой образуют сценарии, планирующим модулем и экзекутивным модулем.
В отличие от сценария, план связан с определенной ситуацией, определенным исполнителем и преследует достижение определенной цели. Выбор плана регулируется ресурсами исполнителя. Выполнимость плана — непременное условие его порождения в когнитивной системе, а к сценарию черта выполнимости неприложима.
Очередное принципиальное понятие — модель мира. Под моделью мира обычно понимается совокупа определенным образом организованных познаний о мире, характерных когнитивной системе либо ее компьютерной модели. В несколько наиболее общем виде о модели мира молвят как о части когнитивной системы, хранящей познания о устройстве мира, его закономерностях и пр. В другом осознании модель мира связывается с плодами осознания текста либо — наиболее обширно — дискурса. В процессе осознания дискурса строится его ментальная модель, которая является результатом взаимодействия плана содержания текста и познаний о мире, характерных данному субъекту [Джонсон-Лэрд 1988, с.237 и далее]. 1-ое и 2-ое осознание нередко соединяются воединыжды. Это приемлимо для исследователей-лингвистов, работающих в рамках когнитивной лингвистики и когнитивной науки.
Тесновато соединено с группой фрейма понятие сцены. Категория сцены в большей степени употребляется в литературе как обозначение концептуальной структуры для декларативного представления актуализованных в речевом акте и выделенных языковыми средствами (лексемами, синтаксическими конструкциями, грамматическими категориями и пр) ситуаций и их частей5). Будучи связана с языковыми формами, сцена нередко актуализуется определенным словом либо выражением. В грамматиках сюжетов (см. ниже) сцена стает как часть эпизода либо повествования. Соответствующие примеры сцен — совокупа кубиков, с которыми работает система ИИ, пространство деяния в рассказе и участники деяния и т.д. В искусственном уме сцены употребляются в системах определения образов, также в программках, нацеленных на исследование (анализ, описание) проблемных ситуаций. Понятие сцены получило обширное распространение в теоретической лингвистике, также логике, а именно в ситуационной семантике, в какой
3. Некие направления компьютерной лингвистики
Обратимся к тем областям компьютерной лингвистики, которые конкретно соединены с оптимизацией когнитивной функции языка. Ниже в качестве примера рассматриваются три сферы компьютерного моделирования, в каких употребляются познания о функционировании языковой системы: моделирование общения, моделирование структуры сюжета и гипертекстовые технологии представления текста.
Моделирование общения. В узеньком смысле проблематика компьютерной лингвистики нередко связывается с моделированием общения, а именно, с обеспечением общения человека с ЭВМ на естественном либо ограниченном естественном языке. Это относится к оптимизации языка как средства общения. Вообщем, компьютерные модели общения нередко употребляются для исследования самого процесса общения. Остановимся подробнее на опыте сотворения и использования конкретно таковых моделей.
исследование уже накопившегося опыта эксплуатации компьютерных систем, требовавших обеспечения взаимодействия с ЭВМ на естественном языке, позволило исследователям заного посмотреть на функции и структуру естественной коммуникации. В центр внимания попали вопросцы, которые ранее были на периферии теории диалога, дискурс-анализа и теории коммуникации. Что обеспечивает естественность общения? Каковы условия связности беседы? Когда общение оказывается удачным? В которых вариантах появляются коммуникативные беды и можно ли их избежать? Какие стратегии общения употребляют участники коммуникативного взаимодействия при достижении собственных коммуникативных целей? Это далековато не исчерпающий перечень теоретических заморочек, обнаружившихся в связи с функционированием компьютерных моделей общения.
одной из более увлекательных компьютерных моделей диалога, вызвавшей оживленные теоретические дискуссии, была программка Джозефа Вейценбаума «Элиза», 1-ый вариант которой возник в 1966 г. Вначале «Элиза» создавалась как игрушка, как учебный эталон программы-имитатора, целью которой является не моделирование мышления в четком смысле, а моделирование речевого поведения. программка поддерживала разговор с собеседником в настоящем масштабе времени, но при ее разработке были применены ограниченные программистские ресурсы, лингвистический анализ и синтез также были сведены к минимуму. Тем не наименее программка работала настолько удачно, что практически опровергла узнаваемый тест Тьюринга на создание искусственного ума. Как понятно, Тьюринг заместо софистицированного обсуждения философского вопросца о том, может ли машинка мыслить, предложил игровую задачку последующего типа. Пусть есть три участника: мужик Л, дама В и спрашивающий С. Спрашивающий не понимает, кто мужик, а кто — дама. Задавая вопросцы участникам игры, С должен попробовать найти, кто является мужиком, а кто — дамой, при всем этом участник пробует мистифицировать спрашивающего, выдавая ему не неверную, но искаженную информацию, а участник В — напротив, стремится посодействовать С. Понятно, что общение происходит не впрямую, а через телетайп либо при помощи записок, отпечатанных на пишущей машине. Что произойдет, если в качестве А будет выступать система ИИ? Будет ли спрашивающий ошибаться настолько же нередко? [Turing 1950, р.434]. Наиболее обычный вариант этого теста сводится к тому, что несколько участников дискутируют с неким остальным участником X. неувязка построения искусственного ума решена, если большая часть участников не сумеет установить, с кем они дискутируют — с человеком либо машинкой.
программка «Элиза» была применена группой исследователей во главе с М. Макгайром для исследования структуры диалога и особенностей естественноязыковой коммуникации [McGuire 1971]. В проводившемся опыте с «Элизой» дискутировали в течение часа 24 испытуемых. общение происходило при помощи телетайпа. За время беседы любой участник ввел от 10 до 65 реплик и получил на их ответы. По окончании 15 участников (62%) были убеждены, что им отвечал человек, 5 испытуемых (21%) нашли определенные колебания и только четыре участников (17%) были полностью убеждены, что общались с ЭВМ . С лингвистической точки зрения методы программки «Элиза» включают минимум лингвистической инфы. Во-1-х, это комплекс главных слов, которые актуализуют некие устойчивые коммуникативные формулы (шаблоны), во-2-х, способность относительно нетрудно трансформировать предыдущее выражение.
Любопытно, что значимая направленная на определенную тематику ограниченность коммуникации и существенное количество ошибок и некорректностей в ответе (порядка 19% неточных либо выпадающих из контекста реплик «Элизы» в упоминавшемся опыте М. Макгайра), не помешали испытуемым признать напарника по коммуникации человеком. Дело тут совершенно не в патологической глупости испытуемых. Это проявление важной индивидуальности коммуникации на естественном языке: естественноязыковой дискурс весьма терпим по отношению к сбоям и ошибкам — он избыточен и помехоустойчив. Высказывания «Элизы», выпадавшие из обычного общения, испытуемые просто разъясняли обыкновенными сбоями в осознании собственной предыдущей высказывания, не полностью нормальными критериями общения, шутливым настроением напарника. Устойчивость естественного дискурса разъясняется также возможностями человека к интерпретации речевых действий: человек, принимающий роль участника диалога, ведет себя подходящим образом. Имея установку на общение, он стремится включать в коммуникацию все то, что по форме припоминает речевой акт, реплику. Другими словами, он склонен наделять смыслом то, что нередко смысла не имеет. В этом случае испытуемые сами порождают смысл диалога, сами обеспечивают его связность, сами приписывают партнеру коммуникативные интенции.
2-ой принципиальный вывод опыта: испытуемые достаточно стремительно воспринимали решение о том, кто перед ними — комп либо человек.22 участника из 24 уяснили себе ситуацию не наиболее, чем за 5 обменов репликами, и дальше не меняли собственного решения. Определение ролей в коммуникации относится к метауровню общения, так как это составляет одну из предпосылок удачной коммуникации, предохраняющей общение от бессчетных коммуникативных неудач.
Понятно, что определение ролей участников почти во всем описывает выбор стратегии коммуникативного поведения. Вправду, лучше сходу найти, с кем мы разговариваем по телефону — с давнешним другом либо бюрократом налоговой инспекции. Выяснение того, кем является собеседник — машинкой либо человеком, также относится к метауровню общения, и испытуемые старались установить ролевые свойства напарника как можно ранее.
Это свойство естественноязыковой коммуникации можно именовать принципом приоритета метакоммуникативных характеристик ситуации общения.
Третье принципиальное следствие из опыта М. Макгайра соединено с существованием разных типов коммуникативного взаимодействия меж людьми. Успешное взаимодействие меж человеком и программкой типа «Элиза» может быть лишь в ситуации, когда происходит так называемое «ассоциативное общение«, при котором высказывания диалога соединены не столько логическими отношениями типа «причина-следствие», «посылка-заключение», а ассоциациями. Ассоциативное общение не имеет определенной направленности; само поддержание беседы может служить ее оправданием. Собеседники не преследуют цели решить какую-то делему либо выработать единую точку зрения на некий вопросец. В систематизации Р. Якобсона для коммуникации такового типа предложен термин «фатическое общение» [Якобсон 1975]. Заметим, что беседа врача-психиатра с пациентом по форме также имеет вид фатического общения, хотя и преследует полностью определенные цели сбора данных о заболевании пациента и следующем вербальном и невербальном действии на его человека и их взаимодействия с окружающей средой) — системное свойство высокоорганизованной материи для заслуги целебного эффекта. «Элиза» не смогла бы удачно имитировать общение в коммуникативной ситуации, нареченной М. Макгайром «решение задач», так как она не способна осознать проблемную ситуацию, другими словами выстроить модель мира дискурса, найти кандидатуры выхода из задачи, избрать одну из альтернатив и т.д. одна из обычных стратегий «ухода от недопонимания», реализованная в программке «Элиза» — смена темы беседы. Разумеется, что таковая стратегия ведения беседы навряд ли приведет к успеху при совместном поиске решения задачи.
В конце концов, 4-ый вывод можно сконструировать как неуниверсальность правил коммуникативного взаимодействия. Он касается самих закономерностей общения на естественном языке. Любой тип коммуникации обслуживается своим набором относительно обычных правил, обеспечивающих связность дискурса, его осмысленность для участников. Типология видов общения задается надлежащими наборами правил. Из тестов М. Макгайра с программкой «Элиза» следует, что не считая ассоциативного (= фатического) метода общения, выделяется еще «решение задач», «задавание вопросцев» и «уточнение осознания». С лингвистической точки зрения эти типы, быстрее всего, неоднородны, пересекаются и даже находятся на различных уровнях дискурса. Так, «уточнение осознания» относится к метауровню коммуникации, «задавание вопросцев» быть может частью стратегии «решение задач» и «уточнения осознания» и т.д. Значительно, что компьютерный исследование структуры сюжета относится к проблематике структурного литературоведения (в широком смысле), психологии творчества и культурологии. Имеющиеся компьютерные программки моделирования сюжета основываются на 3-х базисных формализмах представления сюжета — морфологическом и синтаксическом направлениях представления сюжета, также на когнитивном подходе.
«Морфология» сюжета
. Идеи о морфологическом устройстве структуры сюжета всходят к известным работам В.Я. Проппа о российской магической притче [Пропп 1928; Пропп 1986]. Пропп увидел, что при богатстве персонажей и событий магической сказки количество функций персонажей ограничено: «Неизменными, устойчивыми элементами сказки служат функции работающих лиц, независимо от того, кем и как они производятся. Они образуют главные составные части сказки» [Пропп 1928, с.31]. К числу базисных относятся, к примеру, последующие функции:
отлучение персонажа сказки из дома;
запрет герою на действие;
нарушение запрета;
получение вредителем инфы о жертве;
обман жертвы вредителем;
невольное пособничество жертвы вредителю и т.д.
Идеи Проппа легли в базу компьютерной программки TALE, моделирующей порождение сюжета сказки. В базу метода программки TALE положена последовательность функций персонажей сказки. Практически функции Проппа задавали огромное количество типизированных ситуаций, упорядоченных на базе анализа эмпирического материала. способности сцепления разных ситуаций в правилах порождения определялись обычной последовательностью функций — в том виде, в каком это удается установить из текстов сказок. В программке обычные последовательности функций описывались как типовые сценарии встреч персонажей.
В предстоящем система была усложнена за счет введения модели мира сказки, география которого состоит из обыденного мира, промежного (среднего) мира и другого мира [Гаазе-Рапопорт, Поспелов, Семенова 1984]. Любой мир состоит из локусов, связанных меж собой определенными отношениями. дела связывают не только лишь локусы снутри всякого мира, да и локусы разных миров. Обыденный мир состоит из последующих локусов: пространство проживания героя (локус 1), пространство получения задания (локус Г), пространство дарения магических предметов, помогающих выполнить задание. 1-ый локус и локус штришок нередко совпадают (ср. сказки о Падчерице и злой Мачехе). К обыкновенному миру относятся также локусы 3 (их быть может много), в каких преодолеваются препятствия при помощи магических предметов. количество препятствий, обычно, совпадает с количеством магических предметов. Опосля преодоления препятствий герой оказывается в промежном мире, стражем которого является Баба-Яга. Средний мир отделяет мир героев от мира антигероев. Функции Бабы-Яги различаются — она может выступать как дарительница инфы либо еще одного магического средства, а может выступать на стороне антигероев (к примеру, при акценте на людоедском поведении Бабы-Яги). другой мир включает пространство обитания антигероя (локус 5), пространство битвы меж героем и антигероем (локус 6) и, в конце концов, локус 7 — пространство заслуги либо цели, которой достигает герой. Локусы соединены отношениями перехода, которые представляют вероятные последовательности развертывания сюжета.
Измененная версия программки TALE имеет последующую блок-схему [Гаазе-Рапопорт, Поспелов, Семенова 1984, с.52]:
Блок-схема программки TALE
Работа программки начинается с первого блока, в каком выбирается тип сюжета сказки и ее персонажи. тут же формируется экспозиция сказки (setting). Во 2-м блоке хранятся описания, связанные с персонажами, а в четвертом — неизменные свойства персонажей. Описания даются во фреймоподобных структурах представления познаний. При помощи второго и третьего блоков формируются мотивы и поступки персонажей. 3-ий блок задает последовательность движения персонажей по локусам. В крайнем (шестом) блоке происходит сборка порожденных фрагментов сказки.
Блок-схема измененного варианта программки TALE указывает, что чисто «морфологического» подхода к структуре сюжета сказки очевидно недостаточно. «Морфемы» сказочного сюжета должны не только лишь определенным образом сочетаться меж собой, да и иметь специальные ограничения на сочетаемость. Фиксация 1-го обычного порядка следования функций персонажей магической сказки значительно ограничивает имеющиеся способности сочетаемости. Наиболее адекватное решение данной для нас задачи дает синтаксический подход к структуре сюжета.
«Синтаксис» сюжета
. Теоретическую базу синтаксического подхода к сюжету текста составили «сюжетные грамматики» (story grammars). Сюжетные грамматики возникли посреди 70-х гг. в итоге переноса мыслях порождающей грамматики Н. Хомского на описание макроструктуры текста. Если важными составляющими синтаксической структуры в порождающей грамматике были глагольные и именные группы, то в большинстве сюжетных грамматик в качестве базисных выделялись экспозиция (setting), событие и эпизод. В теории сюжетных грамматик обширно дискуссировались условия минимальности: ограничения, определявшие статус последовательности из частей сюжета как обычный сюжет. Оказалось, но, что чисто лингвистическими способами это создать нереально. Почти все ограничения носят социокультурный нрав. Сюжетные грамматики, значительно различаясь набором категорий в дереве порождения, допускали очень ограниченный набор правил модификации нарративной структуры. В подавляющем большинстве случаев эти правила взяты из той же порождающей грамматики. Потенциал варьирования структуры сюжета обеспечивается сначала трансформациями передвижения и опущения. к примеру, текст признания правонарушителя, фиксирующий настоящую последовательность развертывания событий в злодеянии, можно при помощи перестановок и опущений конвертировать в детективный сюжет: {правонарушитель → план → орудие убийства → пространство → убийство → обнаружение трупа → поиски правонарушителя} → {обнаружение трупа → обнаружение орудия убийства → поиски правонарушителя}.
Внедрение сюжетных грамматик в компьютерном моделировании оказалось не полностью удачным. Синтактический компонент сюжета, описываемый грамматиками, отражает чисто наружные индивидуальности текста. Не удается найти операциональные аспекты выделения разных составляющих сюжета.
Главный вывод дискуссии о недочетах сюжетных грамматик свелся к необходимости описания сюжета в рамках структуры целесообразной деятель, другими словами с привлечением категорий «цель», «неувязка«, «план» и т.д. Другими словами, метаязыка, учитывающего лишь наружные индивидуальности сюжета, очевидно недостаточно. нужно воззвание к когнитивным состояниям персонажей.
Когнитивный подход к сюжету. Сначала 80-х гг. одной из учениц Р. Шенка — В. Ленерт — в рамках работ по созданию компьютерного генератора сюжетов был предложен уникальный формализм аффективных сюжетных единиц (АСЕ — Affective Plot Units), оказавшийся массивным средством представления структуры сюжета [Lehnert 1982]. При том, что он был вначале разработан для системы ИИ, этот формализм употреблялся в чисто теоретических исследовательских работах. Суть подхода Ленерт заключалась в том, что сюжет описывался как поочередная смена когнитивно-эмоциональных (аффективных) состояний персонажей. Тем в центре внимания формализма Ленерт стоят не наружные составляющие сюжета — экспозиция, событие, эпизод, Мораль — а его содержательные свойства. Тут формализм Ленерт частично оказывается возвращением к идеям Проппа.
Любая аффективная сюжетная единица представляет собой бинарное отношение, связывающее некие действия, оцениваемые персонажами положительно (+) либо негативно (-), и когнитивно-эмоциональные состояния персонажей (в разных композициях — событие & состояние; событие & событие и т.д.). Бинарное отношение не однородно. Всего выделяется 5 типов бинарных отношений, специфицируемых в каждой аффективной сюжетной единице. Бинарное отношение быть может мотивацией (обозначение — т), актуализацией (а), прекращением 1-го деяния остальным (t), эквивалентностью (е), также аффективной каузальной связью меж персонажами. Любая аффективная сюжетная единица получает заглавие, к примеру, УСПЕХ, НЕУДАЧА, УПОРСТВО, проблема и т.д.
4. Гипертекстовые технологии представления текста
Парадокс гипертекста можно дискуссировать с нескольких точек зрения. С одной стороны, это особенный метод представления, организации текста, с иной — новейший вид текста, противопоставленный по почти всем своим свойствам обыкновенному тексту, сформированному в гутенберговской традиции книгопечатания. И, в конце концов, это новейший метод, инструмент и новенькая разработка осознания текста.
Теоретические основания гипертекста
. Почти все исследователи разглядывают создание гипертекста как начало новейшей информационной эры, противопоставленной эпохе книгопечатания. Линейность письма, снаружи отражающая линейность речи, оказывается базовой группой, ограничивающей мышление человека и осознание текста. Мир смысла нелинеен, потому сжатие смысловой инфы в линейном речевом отрезке просит использования особых «коммуникативных упаковок» — членение на тему и рему, разделение плана содержания выражения на эксплицитные (утверждение, пропозиция, фокус) и имплицитные (пресуппозиция, следствие, импликатура дискурса) слои. Отказ от линейности текста и в процессе его представления читателю (чтения и осознания), и в процессе синтеза, по воззрению теоретиков, содействовал бы «освобождению» мышления и даже появлению его новейших форм.
Прототипический текст — это монолог. Меж тем почти все языковеды (и посреди их М. Бахтин и Л. Якубинский) указывали на вторичность монолога по сопоставлению с диалогом. гипертекст с данной для нас точки зрения дозволяет убрать искусственную монологичность текста.
Обыденный текст, обычно, имеет создателя. гипертекст создателя в классическом осознании не имеет — у него огромное количество создателей, при этом для повсевременно изменяющегося гипертекста авторский коллектив также повсевременно изменяется. Изменение статуса создателя меняет и статус читателя: в гипертекстовой системе осознание нередко сопровождается конфигурацией компонент гипертекста либо, как минимум, выбором пути просмотра, что снова-таки акт творческий, авторский.
Множественность авторства имеет и очередное следствие: в гипертексте представлено много точек зрения на делему, а в обыкновенном тексте — лишь одна. Конкретно потому гипертекст наиболее беспристрастен и наиболее толерантен к читателю, чем традиционный текст.
Гипертекстовые технологии разрешают просто соединять разные виды инфы — обыденный текст, набросок, график, таблицу, схему, звук и движущееся изображение. Как обычный текст, так и гипертекст — феномены, порожденные новенькими технологиями. В первом случае разработка дозволила просто тиражировать и распространять познания самых разных типов, а во 2-м — компьютерные технологии дали возможность поменять сам наружный вид текста и его структуру. Разнородность гипертекста — это 1-ое технологическое свойство гипертекста, технологическое в том смысле, что оно конкретно следует из применяемой компьютерной технологии. 2-ое технологическое свойство гипертекста — его нелинейность. гипертекст не имеет обычной, обыкновенной последовательности чтения. Остальные характеристики гипертекста в той либо другой степени являются следствиями из этих 2-ух технологических параметров.
Суммировать различия текста и гипертекста можно последующим образом:
конечность, законченность обычного текста vs. бесконечность, незаконченность, открытость гипертекста;
линейность текста vs. нелинейность гипертекста;
четкое авторство текста vs. отсутствие авторства (в классическом осознании) у гипертекста;
снятие противопоставления меж создателем и читателем;
субъективность, односторонность обыденного текста vs. объективность, многосторонность гипертекста;
однородность обыденного текста vs. неоднородность гипертекста.
Составляющие гипертекста.
Структурно гипертекст быть может представлен как граф, в узлах которого находятся классические тексты либо их фрагменты, изображения, таблицы, видеоролики и т.д. Узлы соединены различными отношениями, типы которых задаются разрабами программного обеспечения гипертекста либо самим читателем. дела задают потенциальные способности передвижения либо навигации
по гипертексту. дела могут быть однонаправленными либо двунаправленными. Соответственно, двунаправленные стрелки разрешают двигаться юзеру в обе стороны, а однонаправленные — лишь в одну. Цепочка узлов, через которые проходит читатель во время просмотра компонент текста, образует путь либо маршрут.
Элементы типологии гипертекста.
1-ое противопоставление относится к структуре гипертекста. гипертекст быть может иерархическим либо сетевым. Иерархическое — древовидное — строение гипертекста значительно ограничивает способности перехода меж его компонентами. В таком гипертексте дела меж компонентами напоминают структуру тезауруса, основанного на родо-видовых связях. Иерархический гипертекст не реализует всех способностей технологии гипертекста. В среде разрабов гипертекстовых систем он не пользуется популярностью (хотя и достаточно нередко реализуется в работающих системах).
2-ое противопоставление охарактеризовывает не саму структуру гипертекста, а способности программного обеспечения. Тут различаются обыкновенные и сложные
гипертексты. Примером обычного программного обеспечения гипертекста может служить электрическое оглавление документа, которое дозволяет перейти к хоть какой части оглавления, минуя шаг просмотра всего текста. К обычному гипертексту относится и система, которая дает возможность просматривать отсылки к литературе, находящиеся в тексте, не обращаясь конкретно к списку литературы. Сложные гипертексты владеют богатой системой переходов меж компонентами гипертекста, в их отсутствует гипертекст и является сложным гипертекстом.
По способу существования гипертекста выделяются статические и динамические гипертексты. Статический гипертекст не изменяется в процессе использования; в нем юзер может фиксировать свои комменты, но они не меняют существо дела. Для динамического гипертекста изменение является обычной формой существования. Обычно динамические гипертексты работают там, где нужно повсевременно рассматривать поток инфы, другими словами в информационных службах различного рода. Гипертекстовой является, к примеру, Аризонская информационная система (AAIS), которая каждый месяц дополняется на 300-500 рефератов за месяц.
дела меж элементами гипертекста могут вначале фиксироваться создателями, а могут порождаться каждый раз, когда происходит воззвание юзера к гипертексту. В первом случае идет речь о гипертекстах твердой структуры, а во 2-м — о гипертекстах мягенькой структуры. Твердая структура технологически полностью понятна. Разработка организации мягенькой структуры обязана основываться на семантическом анализе близости документов (либо остальных источников инфы) друг к другу. Это нетривиальная задачка компьютерной лингвистики. В истинное время обширно всераспространено внедрение технологий мягенькой структуры на главных словах. Переход от 1-го узла к другому в сети гипертекста осуществляется в итоге поиска главных слов. Так как набор главных слов всякий раз может различаться, всякий раз изменяется и структура гипертекста. Твердость либо мягкость архитектуры гипертекста зависит и от количества инфы, которая в нем содержится. Если узлов в сети гипертекста порядка одной-трех тыщ, то почаще всего употребляется твердая архитектура, если же количество узлов добивается нескольких 10-ов тыщ либо даже миллионов единиц, то мягенькая структура оказывается наиболее предпочтительной, так как шифровка твердых связей отбирает очень много времени. Заметим, что структура Веба нередко работает как гипертекст мягенькой архитектуры.
Разработка построения гипертекстовых систем не делает различий меж текстовой и нетекстовой информацией. Меж тем включение зрительной и звуковой инфы (видеороликов, картин, фото, звукозаписей и т.п.) просит существенного конфигурации интерфейса с юзером и наиболее сильной программной и компьютерной поддержки. Такие системы получили заглавие гипермедиа либо мультимедиа. Наглядность мультимедийных систем предназначила их обширное внедрение в обучении, в разработке компьютерных вариантов энциклопедий. Известны, к примеру, отлично выполненные CD-ромы с мультимедийными системами по детским энциклопедиям издательства «Дорлинг Киндерсли».
Некие гипертекстовые системы.
Технологически в базе гипертекста лежат компьютерные программки, которые поддерживают последующие базисные функции:
обеспечение резвого просмотра информационного массива (браузинг);
обработка ссылочных отношений (воззвание и вызов фрагмента текста либо иной инфы, на которую делается отсылка);
навигация по гипертексту, текста как результата движения по гипертексту;
дополнение гипертекста новейшей информацией;
введение новейших отношений в структуру гипертекста (для систем с твердой структурой).
Программные оболочки гипертекста, обычно, всепригодны. Они могут употребляться в разных областях для сотворения тематически различных гипертекстов. Таковы, к примеру, оболочка ZOG и разработанная на ее базе промышленная гипертекстовая система KMS (институт Карнеги-Меллон, США
Литература
1. Баранов А.Н. Группы искусственного ума в лингвистической семантике. Фреймы и сценарии. М., 1987.
2. Городецкий Б.Ю. Компьютерная лингвистика: моделирование языкового общения // Новое в забугорной лингвистике. Вып. XXIV. Компьютерная лингвистика. М., 1989. С.5-31.
3. Войскунский А.Е. Моделирование мышления // Речевое общение: задачи и перспективы. М., 1983. С.16-60.
4. Олкер X.Р. Чудесные сказки, катастрофы и методы изложение мировой истории // Язык и моделирование общественного взаимодействия. М., 1987. С.408-440.
5. Поспелов Д.А. Ситуационное управление. Теория и практика. М., 1986. С.71-83; 99-106.
6. Субботин М.М. гипертекст. Новенькая форма письменной коммуникации // ВИНИТИ. Сер. Информатика. Т.18. М., 1994.
]]>