Основные принципы формализации содержания казахского текста — А. К. Жубанов
Название: | Основные принципы формализации содержания казахского текста |
Автор: | Аскар Кудайбергенулы Жубанов |
Жанр: | Казахское языкознание |
Издательство: | 9965-13-426-Х |
Год: | 2002 |
ISBN: | 9965-13-426-Х |
Язык книги: | Русский |
Страница - 21
Глава пятая. Основное статическое содержание текста и его формальное описание
5.1. Статика и динамика содержания текста
Исследование текстов, проведенных в различных аспектах, характеризует текст как многоплановое образование. Такое утверждение обосновано на том факте, что в любом тексте можно обнаружить социальное и индивидуальное, детерминированное и случайное, глубинное и поверхностное, а также языковое и речевое [237, с.43]. К таким же противоречивым явлениям относится наличие в текстах статических и динамическких аспектов, которые следует понимать в смысле “покой” и “движение” [70, с. 19]. Текст в процессе его порождения, восприятия и понимания считается находящимся в движении или динамическом состоянии. В остальных случаях текст, как последовательность лексических единиц, как результат, продукт речемыслительной деятельности, нужно полагать, находится в статическом состоянии или в состоянии покоя [70, с.19; 209, с.31].
Известно, что в процессе воспроизведении предложений, прежде всего, запоминаются такие сведения о предложении, как информация об его семантическом содержании и синтаксической структуре. Причем, семантический аспект в процессе воспроизведения всегда предшествует синтаксическому [175, с.89].
В последнее время лингвисты стали больше применять термины “словарь” и “синтаксис” по отношению к тексту, констатируя о том, что каждый текст должен иметь свой словарь и свой синтаксис [153, с.123; 152, с.141; 237, с.56]. С учетом того, что терминам “словарь" и “синтаксис” исследователи придают разный смысл, мы будем придерживаться такой точки зрения, когда под словарем понимается слова "содержание” или “несомые слова” вместе с “несущими” или служебными словами [237, с.44].
. Таким образом, с нашей точки зрения, статику текста следует понимать как слова “содержания”, которые служат в тексте отражением некоторого множества предметов, явлений, фактов реальной действительности, а динамику - как синтаксис, отражающий отношения между элементами указанного множества. Эти отношения устанавливаются автором текста в зависимости от целевой установки, типа текста, речевого опыта и других факторов. О том, что в тексте наличествуют статический и динамический аспекты, в указанном нами смысле, подтверждают результаты экспериментов по анализу процесса понимания текста (182, с. 120].
Рассмотрим эти две составляющие текста подробнее с точки зрения его организации как единого целого.
Как мы уже упоминали, в тексте отражаются различные ситуации окружающей действительности. Элементы этой ситуации воспринимаются человеком в условиях некоторой вероятности. Такой процесс зависит от многих факторов, связанных с жизненным и языковым опытом воспринимающего индивида [54, с.81; 70, с.40]. В результате происходит отбор узловых элементов системы референтов при развертывании содержания, который является очень существенным в процессе построения текста. Эту узловые элементы дают возможность устанавливать порядок дальнейшего отбора из подмножества связанных с ним референтов последующих элементов, необходимых для построения текста [209, с.70-71]. Если учесть при этом, что. референтами в тексте служат различные имена, то построение формальной структуры содержания текста это и есть формальная структура линейной последовательности материальных знаков, т.е. слов [209, с.28].
| Пронизывающими весь текст на всей его протяженности и отражающими его смысловое единство являются так называемые “опорные слова”. Эти слова в лингвистических источниках встречаются в различной терминологии: “ключевые слова”, “смысловые вехи”, “топики”, “дескрипторы”, “ядра”, “фокальные точки” и т.д. Роль “опорных слов” в тексте, характеризующих смысловое единство, показала во многих исследовательских работах по смысловой организации текста [4, с. 15; 189, с.28; 248, с.35; 280, с. 102; 315, с. 1-8; 329]. В этой литературе имеются довольно интересные попытки формального представления смысла текста через такие опорные слова и словосочетания, связанные с построением различного- рода графов. Однако, как утверждают авторы подобных построений, такая формальная связь не позволяет полностью решить задачу построения графа денотативной структуры, соответствующего всему тексту. Эго объясняется тем, чnо окончательная связь всех его вершин, представляющих текст, осуществляется на содержательном уровне с привлечением информации, не содержащейся в тексте (209, с. 149-150].
Дифференцированный анализ “опорных слов” показывает, что в их структуре существует определенная иерархия [160, с. 1-5; 182, с.123], а именно часть таких “опорных слов” является “главными”, “важными словами”, “номенклатурными дескрипторами", “ключевыми словами”, “выступающими точками” всего содержания текста [57, с.201; 160; 182, с.123; 189, с.28; 209, с. 147; 248, с.35|. Можно полагать, что эти слова, определяя главный, предмет сообщения, представляют собой как-бы свернутый замысел текста. Следует отметить и наличие в тексте контекстуальных синонимов, т е. таких слов, когда один и тот же референт может выражаться синонимическими словами [182, с. 138]. Из-за линейности означающего текста контекстуальные слова распределяются в тексте в разных абзацах.
Проблема смысловой организации абзаца является в целом семантико-синтаксической [152, с.137], в тоже время синтаксические особенности этой единицы плана содержания не могут быть поняты без детального проникновения в ее лексическую структуру. В абзацах отражаются те связи и отношения, которые зафиксированы у главных и второстепенных референтов текста с другими, менее значимыми элементами ситуации: различные типы действий и состояний ГОС и ВОС, различные места действий, время действий, цели, причины действий и состояний и т.п. [208, с.53-54; 307, с. 108].
Второй тип составляющих текста - динамика текста, которая характеризует отношения между объектами реальной действительности, зафиксированные в конкретной ситуации, описанной в тексте. Здесь речь идет о фиксации тех событий (процессов, действий, состояний), которые происходят с референтами [161, с.324|, имена которых представлены в тексте опорными словами.
Известно, что членение действительности на фрагменты проводится не произвольно, а в соответствии с социально отработтанными моделями сформировавшимися в ходе длительного исторического развития человечества [305, с.42]. Это может быть объяснено ограниченнстью оперативной памяти человека и невозможностью полного охвата событий. И поэтому человеческое сознание в процессе познания вычленяет некоторый фрагмент событий, что позволит последовательно рассмотреть различные признаки одного предмета при подведении каждого из них под общую категорию, известную ранее и зафиксированную в сознании [305, с.41 ].
Ученые самых различных направлений отмечают, что в процессе человеческого познания наиболее важные и часто повторяющиеся отношения реальной действительности закрепляются в форме синтаксических структур. Такие синтаксические структуры есть не что иное, как некоторые устоявшиеся, отложившиеся в памяти логические образования, отразившиеся в человеческом мышлении типические связи и отношения объективной действительности {5, с. 103-104]. Другими словами, это есть речевые шаблоны-высказывания или “логические слепки” с действительности. Причем набор таких шаблонов относительно невелик и специфичен для текстов одного автора или одной достаточно узкой предметной области [261, с.297]. Исследования последних лет позволяют допустить, что и абзац письменного текста также является “логическим слепком” с действительности [225]. Это подтверждают не только лингвистические исследования, но и эксперименты психологов и психолингвистов [269, с. 156].
5.2. Способы выделения опорных и ключевых слов текста
Проблема выделения основного и факультативного содержания текста является одной из важных в инженерной лингвистике. Из множества существующих способов выделения главных опорных слов (ГОС) наиболее перспективным нам представляется метод, использованный в работах [187, с.82-89; 125, с.75-94]. В указанных работах предлагаются два формальных критерия отделения ГОС, т.е. в его основе лежит идея о том, что такая наиболее значимая единица текста должна иметь, во-первых, наибольшую частоту встречаемости в тексте, во-вторых, встречаться в наибольшем количестве абзацев такого текста. Как показывают результаты подобных исследований, такими опорными словами, как правило, являются имена, отражающие главные действующие лица или главные предметы таких типов текста, как описание, повествование или рассуждение.
Выделенные из анализируемого текста главные опорные слова в процессе развертывания содержания становятся своеобразным центром, вокруг которого формируются другие элементы как составляющие микроситуации. Такими составляющими обычно служат следующие классы слов: глаголы, прилагательные, наречия и т.п. [208, с.53].
В зависимости от ситуации, главные референты (им соответствуют ГОС) могут быть взаимосвязаны с другими референтами, относительно важными для рассматриваемой ситуации. Как правило, последние являются центром некоторых микроситуаций по отношению к общей ситуации [209]. В исследовательской практике слова, соответствующие относительно важным референтам, называют второстепенными опорными словами (ВОС) [126, с. 177-178]. Естественно, что ВОС по частотности стоят ниже, чем ГОС, т.е. всречаются с меньшей частотой в тексте, чем ГОС и охватывают меньшее число абзацев. Все остальные слова текста, не относящиеся к ГОС и ВОС, мы назвали прочими словами, т.е. сокращенно ПС.
- Выделенные экспериментальным путем ГОС и ВОС текста оформляются в специальную таблицу основного статического содержания (ТОСС). .
Известно, что, формируя содержание текста, автор проводит отбор конкретных слов и их распределение по тексту. Причем, это .осуществляется таким образом, чтобы потенциальный получатель текста мог сформировать в своем сознании то же представление об описываемом фрагменте ситуации, которое вложил в текст автор. Отбор конкретных слов и включение их в различные типы сочетаний проводятся автором в зависимости от темы текста, т.е. “о ком (чем) будет текст”. Под темой мы будем понимать понятийное ядро текста, передающее содержание текста в сжатом и абстрактном виде, в форме смыслового комплекса, выраженного словесными средствами и состоящего из имен главных действующих лиц и предикатов. Иными словами, тема - это совокупность определенных слов (и словосочетаний), отражающая наиболее существенные составляющие описываемой в тексте ситуации и наиболее важные отношения между этими составляющими [281, с.336]. Это как раз то инвариантное, что содержится в тексте и одинаково выделяется и автором текста, и основной массой воспринимающих текст. Наличие таких инвариантных смысловых единиц подтверждается и психолингвистическими экспериментами по смысловому анализу и синтезу текстов различными испытуемыми [51; 126, с.174].
Интуитивно ясно, что каждый текст представляет собой единое смысловое целое потому, что в нем, во всех его частях говорится “об одном и том же”, т.е. на всем протяжении текста действуют одни и те же субъекты и объекты, что события в относительно небольшом законченном тексте происходят в какое-то ограниченное время и в фиксированном числе мест. Но для передачи описываемой ситуации с индивидуальной точки зрения автора, с индивидуальными целями и намерениями такие составляющие могут быть неравноценны для автора. Эта неравноценность приводит к тому, что часть из них действует в большинстве микроситуаций описываемой единой ситуации, другие, же - лишь в некоторых из них. Это приводит к тому, что сре- ди имен текстов, представляющих упомянутые составляющие, имеется определенная иерархия, соотносимая с иерарихой соответствующих денотатов 1182, с. 123; 208, с.55|.
Прежде всего, каждая ситуация передается в тексте конкретным автором. Именно его жизненный опыт, его восприятие мира отражены в тексте. Именно автор определяет динамику текста, являюсь "эго" всего текста [266, с.332]. Поэтому имена текста, отражающие личность самого автора, будут являться для нас главными опорными словами текста (независимо от частоты употребления). К этой группе слов мы отнесем и те слова текста, которые передают: 1) главные действующие лица; 2) главные объекты действия; 3) основные места действия; 4) времена действия.
Как правило, эти слова имеют в тексте наибольшую частоту употребления и используются в большем числе фрагментов (абзацев) текста, образуя соответствующие “изотопические цепочки”, "тематические прогрессии”, “номинативные цепи”, “рекуррентные [цепи”, “семантические изотопии”, “имплицитные референции”, “лексико-тематические линии”, “нанизывания” и т.п. [4, с. 14; 144, с.121; 199, с. 19; 237, с.49]. Основная особенность таких последовательностей лексических единиц текста заключается в том, что они имеют в тексте одну и ту же предметную соотнесенность. В таком раду могут присутствовать и полные словарные синонимы, и контекстуальные синонимы, и ассоциативные замены, и, наконец, замены местоименные {4, с.15; 173, с.23-25]. В нашу задачу не входит детальный анализ способов всех возможных замен в указанных семантических цепочках. Будем считать, что представленные четыре способа являются способами денотативного отождествления имен.
Существует достаточно большое число способов определения “степени важности” для содержания текста того или иного имени или именного словосочетания [41, с.235-236; 126, с.176]. Их можно разделить на; 1) анкетные; 2) структурные; 3) словарные; 4) частотные; 5) синтаксические; 6) диалоговые.
Все эти методы имеют один существенный недостаток: они не исходят из текста как единой связной единицы. Например, с помощью структурных методов выделяются опорные слова на основе их вхождения в заголовок, первое предложение или нескольких отдельных предложений. Частотные методы исходят из частоты встречаемости слов в тексте. При таком подходе по существу учитывается не смысл текста, а свойства плана его выражения (126, с. 176]. Определенные недостатки существенны и для других способов поиска опорных слов текста.