Основные принципы формализации содержания казахского текста — А. К. Жубанов — Страница 21

Нажмите ESC, чтобы закрыть

Поделиться
VK Telegram WhatsApp Facebook
Ещё
Одноклассники X / Twitter Email
Онлайн-чтение

Основные принципы формализации содержания казахского текста — А. К. Жубанов

Название
Основные принципы формализации содержания казахского текста
Автор
А. К. Жубанов
Жанр
Казахское языкознание
Издательство
9965-13-426-Х
Год
2002
ISBN
9965-13-426-Х
Язык книги
Русский
Страница 21 из 26 81% прочитано
Содержание книги
  1. Предисловие
  2. 1.1. Язык, речь. Основные функции и единицы
  3. Текст как основной объект современной лингвистики
  4. Текст и его единицы как знаки
  5. 1.4. Предложение как речевой знак
  6. 1.5. Сверхфразовое единство и абзац как знаки
  7. 1.6. Текст как знак
  8. 2.1. Индивидуальный словарь носителя языка и его роль в восприятии и понимании текста
  9. 2.2. Лексико-морфологическая характеристика компьютерного словаря казахского языка
  10. 2.3. Автоматический словарь казахского языка(АСКЯ)
  11. 2.3.1. Формальное описание словарной статьи
  12. 2.3.3. Структура автоматического словаря казахского языка
  13. 2.4. Синтез казахских словоформ-существительных для АСКЯ
  14. 2.5. Об алгоритме программы - синтез Именных словоформ казахского языка
  15. 2.6. Синтез казахских глагольных словоформ для АСКЯ
  16. 3.1. Принципы семантической классификации лексики казахского языка
  17. 3.2. Семантическая классификация имен существительных (зат есім)
  18. 3.3. Семантическая классификация глаголов казахского языка (етістік)
  19. 3.3.1. Знаковое значение глагольных лексем
  20. 3.3.2. Тематические и лексико-семантические классы казахских глаголов
  21. 3.4. Семантические классы причастий (есімше) и деепричастий (көсемше) казахского языка
  22. 3.5. Семантические классы прилагательных (сын есім) казахского языка
  23. 3.6. Семантическая классификация наречий (үстеу)
  24. 3.7. Семантическая классификация местоимении (есімдік)
  25. 4.1. Роль и специфика абзацев в общей структуре текста
  26. 4.2. Сверхфразовая стереотипичность и абзац
  27. 4.3. Функционально-смысловая классификация казахского текста
  28. 4.4. Классификация абзацев казахского текста по их предметно-логическому содержанию
  29. 4.5. Особенности абзацев научно-популярного текста по их предметно-логическому содержанию
  30. 4.6. Особенности абзацев публицистического текста по их предметно-логическому содержанию
  31. 4.7. Особенности абзацев художественного текста по их предметно-логическому содержанию
  32. 5.1. Статика и динамика содержания текста
  33. 5.2. Способы выделения опорных и ключевых слов текста
  34. 5.3. Способ выделения опорных слов казахского текста
  35. 5.4. Выделение опорных слов в трех анализируемых типах текстов
  36. 5.5. Построение таблицы основного статического содержания текста
  37. 5.6. Средства связи в предложении, между предложениями в абзаце и между абзацами
  38. 5.7. О семантико-синтаксическом языке для записи формул предложения, абзаца и текста
  39. Заключение
  40. ПРИЛОЖЕНИЯ
Страница 21 из 26

Глава пятая. Основное статическое содержание текста и его формальное описание

5.1. Статика и динамика содержания текста

Исследование текстов, проведенных в различных аспектах, ха­рактеризует текст как многоплановое образование. Такое утвержде­ние обосновано на том факте, что в любом тексте можно обнаружить социальное и индивидуальное, детерминированное и случайное, глу­бинное и поверхностное, а также языковое и речевое [237, с.43]. К таким же противоречивым явлениям относится наличие в текстах статических и динамическких аспектов, которые следует понимать в смысле “покой” и “движение” [70, с. 19]. Текст в процессе его по­рождения, восприятия и понимания считается находящимся в дви­жении или динамическом состоянии. В остальных случаях текст, как последовательность лексических единиц, как результат, продукт речемыслительной деятельности, нужно полагать, находится в ста­тическом состоянии или в состоянии покоя [70, с.19; 209, с.31].

Известно, что в процессе воспроизведении предложений, преж­де всего, запоминаются такие сведения о предложении, как инфор­мация об его семантическом содержании и синтаксической структу­ре. Причем, семантический аспект в процессе воспроизведения всег­да предшествует синтаксическому [175, с.89].

В последнее время лингвисты стали больше применять термины “словарь” и “синтаксис” по отношению к тексту, констатируя о том, что каждый текст должен иметь свой словарь и свой синтаксис [153, с.123; 152, с.141; 237, с.56]. С учетом того, что терминам “словарь» и “синтаксис” исследователи придают разный смысл, мы будем при­держиваться такой точки зрения, когда под словарем понимается слова «содержание” или “несомые слова” вместе с “несущими” или служебными словами [237, с.44].

. Таким образом, с нашей точки зрения, статику текста следует понимать как слова “содержания”, которые служат в тексте отраже­нием некоторого множества предметов, явлений, фактов реальной действительности, а динамику — как синтаксис, отражающий отношения между элементами указанного множества. Эти отношения устанавливаются автором текста в зависимости от целевой установки, типа текста, речевого опыта и других факторов. О том, что в тексте наличествуют статический и динамический аспекты, в указанном нами смысле, подтверждают результаты экспериментов по анализу процесса понимания текста (182, с. 120].

Рассмотрим эти две составляющие текста подробнее с точки зрения его организации как единого целого.

Как мы уже упоминали, в тексте отражаются различные ситуа­ции окружающей действительности. Элементы этой ситуации вос­принимаются человеком в условиях некоторой вероятности. Такой процесс зависит от многих факторов, связанных с жизненным и язы­ковым опытом воспринимающего индивида [54, с.81; 70, с.40]. В ре­зультате происходит отбор узловых элементов системы референтов при развертывании содержания, который является очень существен­ным в процессе построения текста. Эту узловые элементы дают воз­можность устанавливать порядок дальнейшего отбора из подмно­жества связанных с ним референтов последующих элементов, необ­ходимых для построения текста [209, с.70-71]. Если учесть при этом, что. референтами в тексте служат различные имена, то построение формальной структуры содержания текста это и есть формальная структура линейной последовательности материальных знаков, т.е. слов [209, с.28].

| Пронизывающими весь текст на всей его протяженности и от­ражающими его смысловое единство являются так называемые “опорные слова”. Эти слова в лингвистических источниках встречаются в различной терминологии: “ключевые слова”, “смысловые вехи”, “топики”, “дескрипторы”, “ядра”, “фокальные точки” и т.д. Роль “опорных слов” в тексте, характеризующих смыс­ловое единство, показала во многих исследовательских работах по смысловой организации текста [4, с. 15; 189, с.28; 248, с.35; 280, с. 102; 315, с. 1-8; 329]. В этой литературе имеются довольно интересные по­пытки формального представления смысла текста через такие опор­ные слова и словосочетания, связанные с построением различного- рода графов. Однако, как утверждают авторы подобных построений, такая формальная связь не позволяет полностью решить задачу по­строения графа денотативной структуры, соответствующего всему тексту. Эго объясняется тем, чnо окончательная связь всех его вер­шин, представляющих текст, осуществляется на содержательном уровне с привлечением информации, не содержащейся в тексте (209, с. 149-150].

Дифференцированный анализ “опорных слов” показывает, что в их структуре существует определенная иерархия [160, с. 1-5; 182, с.123], а именно часть таких “опорных слов” является “главными”, “важными словами”, “номенклатурными дескрипторами», “ключевыми словами”, “выступающими точками” всего содержания текста [57, с.201; 160; 182, с.123; 189, с.28; 209, с. 147; 248, с.35|. Мож­но полагать, что эти слова, определяя главный, предмет сообщения, представляют собой как-бы свернутый замысел текста. Следует отме­тить и наличие в тексте контекстуальных синонимов, т е. таких слов, когда один и тот же референт может выражаться синонимическими словами [182, с. 138]. Из-за линейности означающего текста контек­стуальные слова распределяются в тексте в разных абзацах.

Проблема смысловой организации абзаца является в целом се­мантико-синтаксической [152, с.137], в тоже время синтаксические особенности этой единицы плана содержания не могут быть поняты без детального проникновения в ее лексическую структуру. В абзацах отражаются те связи и отношения, которые зафиксированы у глав­ных и второстепенных референтов текста с другими, менее значимыми элементами ситуации: различные типы действий и со­стояний ГОС и ВОС, различные места действий, время действий, це­ли, причины действий и состояний и т.п. [208, с.53-54; 307, с. 108].

Второй тип составляющих текста — динамика текста, которая характеризует отношения между объектами реальной действитель­ности, зафиксированные в конкретной ситуации, описанной в тексте. Здесь речь идет о фиксации тех событий (процессов, действий, со­стояний), которые происходят с референтами [161, с.324|, имена ко­торых представлены в тексте опорными словами.

Известно, что членение действительности на фрагменты прово­дится не произвольно, а в соответствии с социально отработтанными моделями сформировавшимися в ходе длительного исторического развития человечества [305, с.42]. Это может быть объяснено ограниченнстью оперативной памяти человека и невозможностью полно­го охвата событий. И поэтому человеческое сознание в процессе по­знания вычленяет некоторый фрагмент событий, что позволит после­довательно рассмотреть различные признаки одного предмета при подведении каждого из них под общую категорию, известную ранее и зафиксированную в сознании [305, с.41 ].

Ученые самых различных направлений отмечают, что в процес­се человеческого познания наиболее важные и часто повторяющиеся отношения реальной действительности закрепляются в форме син­таксических структур. Такие синтаксические структуры есть не что иное, как некоторые устоявшиеся, отложившиеся в памяти ло­гические образования, отразившиеся в человеческом мышлении ти­пические связи и отношения объективной действительности {5, с. 103-104]. Другими словами, это есть речевые шаблоны-высказывания или “логические слепки” с действительности. Причем набор таких шаблонов относительно невелик и специфичен для текстов одного автора или одной достаточно узкой предметной области [261, с.297]. Исследования последних лет позволяют допустить, что и абзац пись­менного текста также является “логическим слепком” с действитель­ности [225]. Это подтверждают не только лингвистические исследо­вания, но и эксперименты психологов и психолингвистов [269, с. 156].

5.2. Способы выделения опорных и ключевых слов текста

 Проблема выделения основного и факультативного содержания  текста является одной из важных в инженерной лингвистике. Из множества существующих способов выделения главных опорных слов  (ГОС) наиболее перспективным нам представляется метод, использо­ванный в работах [187, с.82-89; 125, с.75-94]. В указанных работах предлагаются два формальных критерия отделения ГОС, т.е. в его основе лежит идея о том, что такая наиболее значимая единица текс­та должна иметь, во-первых, наибольшую частоту встречаемости в тексте, во-вторых, встречаться в наибольшем количестве абзацев та­кого текста. Как показывают результаты подобных исследований, та­кими опорными словами, как правило, являются имена, отражающие главные действующие лица или главные предметы таких типов текс­та, как описание, повествование или рассуждение.

Выделенные из анализируемого текста главные опорные слова в процессе развертывания содержания становятся своеобразным цен­тром, вокруг которого формируются другие элементы как состав­ляющие микроситуации. Такими составляющими обычно служат сле­дующие классы слов: глаголы, прилагательные, наречия и т.п. [208, с.53].

В зависимости от ситуации, главные референты (им соответ­ствуют ГОС) могут быть взаимосвязаны с другими референтами, относительно важными для рассматриваемой ситуации. Как правило, последние являются центром некоторых микроситуаций по отноше­нию к общей ситуации [209]. В исследовательской практике слова, соответствующие относительно важным референтам, называют вто­ростепенными опорными словами (ВОС) [126, с. 177-178]. Естествен­но, что ВОС по частотности стоят ниже, чем ГОС, т.е. всречаются с меньшей частотой в тексте, чем ГОС и охватывают меньшее число абзацев. Все остальные слова текста, не относящиеся к ГОС и ВОС, мы назвали прочими словами, т.е. сокращенно ПС.

— Выделенные экспериментальным путем ГОС и ВОС текста оформляются в специальную таблицу основного статического содер­жания (ТОСС).   .

Известно, что, формируя содержание текста, автор проводит от­бор конкретных слов и их распределение по тексту. Причем, это .осуществляется таким образом, чтобы потенциальный получатель текста мог сформировать в своем сознании то же представление об описываемом фрагменте ситуации, которое вложил в текст автор. От­бор конкретных слов и включение их в различные типы сочетаний проводятся автором в зависимости от темы текста, т.е. “о ком (чем) будет текст”. Под темой мы будем понимать понятийное ядро текста, передающее содержание текста в сжатом и абстрактном виде, в фор­ме смыслового комплекса, выраженного словесными средствами и состоящего из имен главных действующих лиц и предикатов. Иными словами, тема — это совокупность определенных слов (и слово­сочетаний), отражающая наиболее существенные составляющие опи­сываемой в тексте ситуации и наиболее важные отношения между этими составляющими [281, с.336]. Это как раз то инвариантное, что содержится в тексте и одинаково выделяется и автором текста, и основной массой воспринимающих текст. Наличие таких инвариант­ных смысловых единиц подтверждается и психолингвистическими экспериментами по смысловому анализу и синтезу текстов раз­личными испытуемыми [51; 126, с.174].

Интуитивно ясно, что каждый текст представляет собой единое смысловое целое потому, что в нем, во всех его частях говорится “об одном и том же”, т.е. на всем протяжении текста действуют одни и те же субъекты и объекты, что события в относительно небольшом законченном тексте происходят в какое-то ограниченное время и в фиксированном числе мест. Но для передачи описываемой ситуации с индивидуальной точки зрения автора, с индивидуальными целями и намерениями такие составляющие могут быть неравноценны для автора. Эта неравноценность приводит к тому, что часть из них дей­ствует в большинстве микроситуаций описываемой единой ситуации, другие, же — лишь в некоторых из них. Это приводит к тому, что сре- ди имен текстов, представляющих упомянутые составляющие, имеет­ся определенная иерархия, соотносимая с иерарихой соответствую­щих денотатов 1182, с. 123; 208, с.55|.

Прежде всего, каждая ситуация передается в тексте конкрет­ным автором. Именно его жизненный опыт, его восприятие мира отражены в тексте. Именно автор определяет динамику текста, явля­юсь «эго» всего текста [266, с.332]. Поэтому имена текста, отра­жающие личность самого автора, будут являться для нас главными опорными словами текста (независимо от частоты употребления). К этой группе слов мы отнесем и те слова текста, которые передают: 1) главные действующие лица; 2) главные объекты действия; 3) основные места действия; 4) времена действия.

Как правило, эти слова имеют в тексте наибольшую частоту употребления и используются в большем числе фрагментов (абзацев) текста, образуя соответствующие “изотопические цепочки”, «тематические прогрессии”, “номинативные цепи”, “рекуррентные [цепи”, “семантические изотопии”, “имплицитные референции”, “лексико-тематические линии”, “нанизывания” и т.п. [4, с. 14; 144, с.121; 199, с. 19; 237, с.49]. Основная особенность таких последова­тельностей лексических единиц текста заключается в том, что они имеют в тексте одну и ту же предметную соотнесенность. В таком раду могут присутствовать и полные словарные синонимы, и контек­стуальные синонимы, и ассоциативные замены, и, наконец, замены местоименные {4, с.15; 173, с.23-25]. В нашу задачу не входит деталь­ный анализ способов всех возможных замен в указанных семан­тических цепочках. Будем считать, что представленные четыре спо­соба являются способами денотативного отождествления имен.

Существует достаточно большое число способов определения “степени важности” для содержания текста того или иного имени или именного словосочетания [41, с.235-236; 126, с.176]. Их можно разделить на; 1) анкетные; 2) структурные; 3) словарные; 4) частотные; 5) синтаксические; 6) диалоговые.

Все эти методы имеют один существенный недостаток: они не исходят из текста как единой связной единицы. Например, с по­мощью структурных методов выделяются опорные слова на основе их вхождения в заголовок, первое предложение или нескольких отдель­ных предложений. Частотные методы исходят из частоты встречаемости слов в тексте. При таком подходе по существу учитывается не смысл текста, а свойства плана его выражения (126, с. 176]. Определенные недостатки существенны и для других способов поиска опорных слов текста.