Меню Закрыть

Основные принципы формализации содержания казахского текста — А. К. Жубанов

Название:Основные принципы формализации содержания казахского текста
Автор:Аскар Кудайбергенулы Жубанов
Жанр:Казахское языкознание
Издательство:9965-13-426-Х
Год:2002
ISBN:9965-13-426-Х
Язык книги:Русский
VK
Facebook
Telegram
WhatsApp
OK
Twitter

Перейти на страницу:

Страница - 21


Глава пятая. Основное статическое содержание текста и его формальное описание

5.1. Статика и динамика содержания текста

Исследование текстов, проведенных в различных аспектах, ха­рактеризует текст как многоплановое образование. Такое утвержде­ние обосновано на том факте, что в любом тексте можно обнаружить социальное и индивидуальное, детерминированное и случайное, глу­бинное и поверхностное, а также языковое и речевое [237, с.43]. К таким же противоречивым явлениям относится наличие в текстах статических и динамическких аспектов, которые следует понимать в смысле “покой” и “движение” [70, с. 19]. Текст в процессе его по­рождения, восприятия и понимания считается находящимся в дви­жении или динамическом состоянии. В остальных случаях текст, как последовательность лексических единиц, как результат, продукт речемыслительной деятельности, нужно полагать, находится в ста­тическом состоянии или в состоянии покоя [70, с.19; 209, с.31].

Известно, что в процессе воспроизведении предложений, преж­де всего, запоминаются такие сведения о предложении, как инфор­мация об его семантическом содержании и синтаксической структу­ре. Причем, семантический аспект в процессе воспроизведения всег­да предшествует синтаксическому [175, с.89].

В последнее время лингвисты стали больше применять термины “словарь” и “синтаксис” по отношению к тексту, констатируя о том, что каждый текст должен иметь свой словарь и свой синтаксис [153, с.123; 152, с.141; 237, с.56]. С учетом того, что терминам “словарь" и “синтаксис” исследователи придают разный смысл, мы будем при­держиваться такой точки зрения, когда под словарем понимается слова "содержание” или “несомые слова” вместе с “несущими” или служебными словами [237, с.44].

. Таким образом, с нашей точки зрения, статику текста следует понимать как слова “содержания”, которые служат в тексте отраже­нием некоторого множества предметов, явлений, фактов реальной действительности, а динамику - как синтаксис, отражающий отношения между элементами указанного множества. Эти отношения устанавливаются автором текста в зависимости от целевой установки, типа текста, речевого опыта и других факторов. О том, что в тексте наличествуют статический и динамический аспекты, в указанном нами смысле, подтверждают результаты экспериментов по анализу процесса понимания текста (182, с. 120].

Рассмотрим эти две составляющие текста подробнее с точки зрения его организации как единого целого.

Как мы уже упоминали, в тексте отражаются различные ситуа­ции окружающей действительности. Элементы этой ситуации вос­принимаются человеком в условиях некоторой вероятности. Такой процесс зависит от многих факторов, связанных с жизненным и язы­ковым опытом воспринимающего индивида [54, с.81; 70, с.40]. В ре­зультате происходит отбор узловых элементов системы референтов при развертывании содержания, который является очень существен­ным в процессе построения текста. Эту узловые элементы дают воз­можность устанавливать порядок дальнейшего отбора из подмно­жества связанных с ним референтов последующих элементов, необ­ходимых для построения текста [209, с.70-71]. Если учесть при этом, что. референтами в тексте служат различные имена, то построение формальной структуры содержания текста это и есть формальная структура линейной последовательности материальных знаков, т.е. слов [209, с.28].

| Пронизывающими весь текст на всей его протяженности и от­ражающими его смысловое единство являются так называемые “опорные слова”. Эти слова в лингвистических источниках встречаются в различной терминологии: “ключевые слова”, “смысловые вехи”, “топики”, “дескрипторы”, “ядра”, “фокальные точки” и т.д. Роль “опорных слов” в тексте, характеризующих смыс­ловое единство, показала во многих исследовательских работах по смысловой организации текста [4, с. 15; 189, с.28; 248, с.35; 280, с. 102; 315, с. 1-8; 329]. В этой литературе имеются довольно интересные по­пытки формального представления смысла текста через такие опор­ные слова и словосочетания, связанные с построением различного- рода графов. Однако, как утверждают авторы подобных построений, такая формальная связь не позволяет полностью решить задачу по­строения графа денотативной структуры, соответствующего всему тексту. Эго объясняется тем, чnо окончательная связь всех его вер­шин, представляющих текст, осуществляется на содержательном уровне с привлечением информации, не содержащейся в тексте (209, с. 149-150].

Дифференцированный анализ “опорных слов” показывает, что в их структуре существует определенная иерархия [160, с. 1-5; 182, с.123], а именно часть таких “опорных слов” является “главными”, “важными словами”, “номенклатурными дескрипторами", “ключевыми словами”, “выступающими точками” всего содержания текста [57, с.201; 160; 182, с.123; 189, с.28; 209, с. 147; 248, с.35|. Мож­но полагать, что эти слова, определяя главный, предмет сообщения, представляют собой как-бы свернутый замысел текста. Следует отме­тить и наличие в тексте контекстуальных синонимов, т е. таких слов, когда один и тот же референт может выражаться синонимическими словами [182, с. 138]. Из-за линейности означающего текста контек­стуальные слова распределяются в тексте в разных абзацах.

Проблема смысловой организации абзаца является в целом се­мантико-синтаксической [152, с.137], в тоже время синтаксические особенности этой единицы плана содержания не могут быть поняты без детального проникновения в ее лексическую структуру. В абзацах отражаются те связи и отношения, которые зафиксированы у глав­ных и второстепенных референтов текста с другими, менее значимыми элементами ситуации: различные типы действий и со­стояний ГОС и ВОС, различные места действий, время действий, це­ли, причины действий и состояний и т.п. [208, с.53-54; 307, с. 108].

Второй тип составляющих текста - динамика текста, которая характеризует отношения между объектами реальной действитель­ности, зафиксированные в конкретной ситуации, описанной в тексте. Здесь речь идет о фиксации тех событий (процессов, действий, со­стояний), которые происходят с референтами [161, с.324|, имена ко­торых представлены в тексте опорными словами.

Известно, что членение действительности на фрагменты прово­дится не произвольно, а в соответствии с социально отработтанными моделями сформировавшимися в ходе длительного исторического развития человечества [305, с.42]. Это может быть объяснено ограниченнстью оперативной памяти человека и невозможностью полно­го охвата событий. И поэтому человеческое сознание в процессе по­знания вычленяет некоторый фрагмент событий, что позволит после­довательно рассмотреть различные признаки одного предмета при подведении каждого из них под общую категорию, известную ранее и зафиксированную в сознании [305, с.41 ].

Ученые самых различных направлений отмечают, что в процес­се человеческого познания наиболее важные и часто повторяющиеся отношения реальной действительности закрепляются в форме син­таксических структур. Такие синтаксические структуры есть не что иное, как некоторые устоявшиеся, отложившиеся в памяти ло­гические образования, отразившиеся в человеческом мышлении ти­пические связи и отношения объективной действительности {5, с. 103-104]. Другими словами, это есть речевые шаблоны-высказывания или “логические слепки” с действительности. Причем набор таких шаблонов относительно невелик и специфичен для текстов одного автора или одной достаточно узкой предметной области [261, с.297]. Исследования последних лет позволяют допустить, что и абзац пись­менного текста также является “логическим слепком” с действитель­ности [225]. Это подтверждают не только лингвистические исследо­вания, но и эксперименты психологов и психолингвистов [269, с. 156].

5.2. Способы выделения опорных и ключевых слов текста

 Проблема выделения основного и факультативного содержания  текста является одной из важных в инженерной лингвистике. Из множества существующих способов выделения главных опорных слов  (ГОС) наиболее перспективным нам представляется метод, использо­ванный в работах [187, с.82-89; 125, с.75-94]. В указанных работах предлагаются два формальных критерия отделения ГОС, т.е. в его основе лежит идея о том, что такая наиболее значимая единица текс­та должна иметь, во-первых, наибольшую частоту встречаемости в тексте, во-вторых, встречаться в наибольшем количестве абзацев та­кого текста. Как показывают результаты подобных исследований, та­кими опорными словами, как правило, являются имена, отражающие главные действующие лица или главные предметы таких типов текс­та, как описание, повествование или рассуждение.

Выделенные из анализируемого текста главные опорные слова в процессе развертывания содержания становятся своеобразным цен­тром, вокруг которого формируются другие элементы как состав­ляющие микроситуации. Такими составляющими обычно служат сле­дующие классы слов: глаголы, прилагательные, наречия и т.п. [208, с.53].

В зависимости от ситуации, главные референты (им соответ­ствуют ГОС) могут быть взаимосвязаны с другими референтами, относительно важными для рассматриваемой ситуации. Как правило, последние являются центром некоторых микроситуаций по отноше­нию к общей ситуации [209]. В исследовательской практике слова, соответствующие относительно важным референтам, называют вто­ростепенными опорными словами (ВОС) [126, с. 177-178]. Естествен­но, что ВОС по частотности стоят ниже, чем ГОС, т.е. всречаются с меньшей частотой в тексте, чем ГОС и охватывают меньшее число абзацев. Все остальные слова текста, не относящиеся к ГОС и ВОС, мы назвали прочими словами, т.е. сокращенно ПС.

- Выделенные экспериментальным путем ГОС и ВОС текста оформляются в специальную таблицу основного статического содер­жания (ТОСС).   .

Известно, что, формируя содержание текста, автор проводит от­бор конкретных слов и их распределение по тексту. Причем, это .осуществляется таким образом, чтобы потенциальный получатель текста мог сформировать в своем сознании то же представление об описываемом фрагменте ситуации, которое вложил в текст автор. От­бор конкретных слов и включение их в различные типы сочетаний проводятся автором в зависимости от темы текста, т.е. “о ком (чем) будет текст”. Под темой мы будем понимать понятийное ядро текста, передающее содержание текста в сжатом и абстрактном виде, в фор­ме смыслового комплекса, выраженного словесными средствами и состоящего из имен главных действующих лиц и предикатов. Иными словами, тема - это совокупность определенных слов (и слово­сочетаний), отражающая наиболее существенные составляющие опи­сываемой в тексте ситуации и наиболее важные отношения между этими составляющими [281, с.336]. Это как раз то инвариантное, что содержится в тексте и одинаково выделяется и автором текста, и основной массой воспринимающих текст. Наличие таких инвариант­ных смысловых единиц подтверждается и психолингвистическими экспериментами по смысловому анализу и синтезу текстов раз­личными испытуемыми [51; 126, с.174].

Интуитивно ясно, что каждый текст представляет собой единое смысловое целое потому, что в нем, во всех его частях говорится “об одном и том же”, т.е. на всем протяжении текста действуют одни и те же субъекты и объекты, что события в относительно небольшом законченном тексте происходят в какое-то ограниченное время и в фиксированном числе мест. Но для передачи описываемой ситуации с индивидуальной точки зрения автора, с индивидуальными целями и намерениями такие составляющие могут быть неравноценны для автора. Эта неравноценность приводит к тому, что часть из них дей­ствует в большинстве микроситуаций описываемой единой ситуации, другие, же - лишь в некоторых из них. Это приводит к тому, что сре- ди имен текстов, представляющих упомянутые составляющие, имеет­ся определенная иерархия, соотносимая с иерарихой соответствую­щих денотатов 1182, с. 123; 208, с.55|.

Прежде всего, каждая ситуация передается в тексте конкрет­ным автором. Именно его жизненный опыт, его восприятие мира отражены в тексте. Именно автор определяет динамику текста, явля­юсь "эго" всего текста [266, с.332]. Поэтому имена текста, отра­жающие личность самого автора, будут являться для нас главными опорными словами текста (независимо от частоты употребления). К этой группе слов мы отнесем и те слова текста, которые передают: 1) главные действующие лица; 2) главные объекты действия; 3) основные места действия; 4) времена действия.

Как правило, эти слова имеют в тексте наибольшую частоту употребления и используются в большем числе фрагментов (абзацев) текста, образуя соответствующие “изотопические цепочки”, "тематические прогрессии”, “номинативные цепи”, “рекуррентные [цепи”, “семантические изотопии”, “имплицитные референции”, “лексико-тематические линии”, “нанизывания” и т.п. [4, с. 14; 144, с.121; 199, с. 19; 237, с.49]. Основная особенность таких последова­тельностей лексических единиц текста заключается в том, что они имеют в тексте одну и ту же предметную соотнесенность. В таком раду могут присутствовать и полные словарные синонимы, и контек­стуальные синонимы, и ассоциативные замены, и, наконец, замены местоименные {4, с.15; 173, с.23-25]. В нашу задачу не входит деталь­ный анализ способов всех возможных замен в указанных семан­тических цепочках. Будем считать, что представленные четыре спо­соба являются способами денотативного отождествления имен.

Существует достаточно большое число способов определения “степени важности” для содержания текста того или иного имени или именного словосочетания [41, с.235-236; 126, с.176]. Их можно разделить на; 1) анкетные; 2) структурные; 3) словарные; 4) частотные; 5) синтаксические; 6) диалоговые.

Все эти методы имеют один существенный недостаток: они не исходят из текста как единой связной единицы. Например, с по­мощью структурных методов выделяются опорные слова на основе их вхождения в заголовок, первое предложение или нескольких отдель­ных предложений. Частотные методы исходят из частоты встречаемости слов в тексте. При таком подходе по существу учитывается не смысл текста, а свойства плана его выражения (126, с. 176]. Определенные недостатки существенны и для других способов поиска опорных слов текста.


Перейти на страницу: