Основные принципы формализации содержания казахского текста — А. К. Жубанов — Страница 10

Нажмите ESC, чтобы закрыть

Поделиться
VK Telegram WhatsApp Facebook
Ещё
Одноклассники X / Twitter Email
Онлайн-чтение

Основные принципы формализации содержания казахского текста — А. К. Жубанов

Название
Основные принципы формализации содержания казахского текста
Автор
А. К. Жубанов
Жанр
Казахское языкознание
Издательство
9965-13-426-Х
Год
2002
ISBN
9965-13-426-Х
Язык книги
Русский
Страница 10 из 26 38% прочитано
Содержание книги
  1. Предисловие
  2. 1.1. Язык, речь. Основные функции и единицы
  3. Текст как основной объект современной лингвистики
  4. Текст и его единицы как знаки
  5. 1.4. Предложение как речевой знак
  6. 1.5. Сверхфразовое единство и абзац как знаки
  7. 1.6. Текст как знак
  8. 2.1. Индивидуальный словарь носителя языка и его роль в восприятии и понимании текста
  9. 2.2. Лексико-морфологическая характеристика компьютерного словаря казахского языка
  10. 2.3. Автоматический словарь казахского языка(АСКЯ)
  11. 2.3.1. Формальное описание словарной статьи
  12. 2.3.3. Структура автоматического словаря казахского языка
  13. 2.4. Синтез казахских словоформ-существительных для АСКЯ
  14. 2.5. Об алгоритме программы - синтез Именных словоформ казахского языка
  15. 2.6. Синтез казахских глагольных словоформ для АСКЯ
  16. 3.1. Принципы семантической классификации лексики казахского языка
  17. 3.2. Семантическая классификация имен существительных (зат есім)
  18. 3.3. Семантическая классификация глаголов казахского языка (етістік)
  19. 3.3.1. Знаковое значение глагольных лексем
  20. 3.3.2. Тематические и лексико-семантические классы казахских глаголов
  21. 3.4. Семантические классы причастий (есімше) и деепричастий (көсемше) казахского языка
  22. 3.5. Семантические классы прилагательных (сын есім) казахского языка
  23. 3.6. Семантическая классификация наречий (үстеу)
  24. 3.7. Семантическая классификация местоимении (есімдік)
  25. 4.1. Роль и специфика абзацев в общей структуре текста
  26. 4.2. Сверхфразовая стереотипичность и абзац
  27. 4.3. Функционально-смысловая классификация казахского текста
  28. 4.4. Классификация абзацев казахского текста по их предметно-логическому содержанию
  29. 4.5. Особенности абзацев научно-популярного текста по их предметно-логическому содержанию
  30. 4.6. Особенности абзацев публицистического текста по их предметно-логическому содержанию
  31. 4.7. Особенности абзацев художественного текста по их предметно-логическому содержанию
  32. 5.1. Статика и динамика содержания текста
  33. 5.2. Способы выделения опорных и ключевых слов текста
  34. 5.3. Способ выделения опорных слов казахского текста
  35. 5.4. Выделение опорных слов в трех анализируемых типах текстов
  36. 5.5. Построение таблицы основного статического содержания текста
  37. 5.6. Средства связи в предложении, между предложениями в абзаце и между абзацами
  38. 5.7. О семантико-синтаксическом языке для записи формул предложения, абзаца и текста
  39. Заключение
  40. ПРИЛОЖЕНИЯ
Страница 10 из 26

2.3.3. Структура автоматического словаря казахского языка

С учетом того, что “слово” любого языка по своей природе яв­ляется сложным лексико-грамматическим единством, необходимо проводить разделение слов на определенные структурные группы или типы, согласно выбранному для каждого случая принципу классифи­кации.

Наш принцип создания автоматического словаря казахского языка’ (АСКЯ) преследует частный случай и не претендует быть универ­сальным словарем, охватывающим все случаи исследовательской практики. В основе нашего АСКЯ лежит алфавитный словарь слов- основ казахского языка, где к каждому слову представлена линг­вистическая информация — словарная статья, которая представляет собой отдельные зоны (области памяти), в которых записана условно принятая нами кодовая информация о некоторых .морфологических, фонетических, семантических, синтаксических и других признаках (параметрах) рассматриваемого слова. Слово-основу, в данном случае, следует понимать как звуковой комплекс с определенным значением, представляющий собой корневые и производные (аффиксальные) слова, относящиеся к определенному классу слов казахского языка. Слово-основа и есть основная лингвистическая единица АСКЯ, к которой приписана соответствующая словарная статья, состоящая из лингвистической (и энциклопедической) информации, записываемой в виде формально принятых нами кодов в указанном номере зон. Количество зон для каждой единицы словаря будет зависеть от максимального количества “досье” к данному слова. Причем каждая зона с одним и тем же номером должна иметь информацию одного и того же типа (содержания). Например, зона сообщает информацию о принадлежности рассматриваемого слова определенному классу слов: существительное, глагол, прилагательное и т.д. При этом некоторые зоны для отдельных слов “временно” могут иметь “нулевую” (пустую) информацию до тех пор, пока его со держание окончательно не выяснится. Это даст возможность постоянно редактировать и расширять объем “досье” к слову.

Схематически АСКЯ имеет следующий вид:

В случае, когда содержание информации для данной зоны “компактное”, в смысле занимаемого объема памяти, то его можно поместить в соответствующем выделенном номере зоны. Если жесткая информация о слове требует дополнительного объема памяти (чем выделено) или же она еще не существует в готовом виде, то та кая зона должна иметь соответствующую команду, отсылающую и выполнение задания по поиску или созданию такой информации Например, при синтезировании всевозможных словоформ для данного слова-основы или же при снабжении данного слова контекстных примерами из разных иллюстрационно-текстовых источников. Этот факт говорит о том, что “досье” к слову в автоматическом словаре может быть не всегда доступным потребителю непосредственно т.е. оно не всегда известно в готовом виде. В таких случаях должен быть указан путь достижения цели (алгоритм). Иначе говоря, в этом случае необходимо провести соответствующее исследование по заранее указанному алгоритму и формировать требуемую информации для данной зоны.

Таким образом, АСКЯ должен как бы обладать “пониманием” известных языковых законов, т. е. по возможности в АСКЯ должны быть смоделированы синхронные и диахронные языковые процессы, которые представлены в динамике, позволяющие функционировать отношения единиц, уровней, подсистем и т.д. Следовательно, авто­матический словарь казахского языка (АСКЯ) должен существовать в компьютере не как готовая книга-словарь, а как научная лаборато­рия, банк научных знаний об объекте (в данном случае, о казахском слове). В перспективе АСКЯ должен стать не только хранилищем знаний о языке, но и представлять собой “разумный”, специализиро­ванный банк знаний, способный предложить решение или нацелить исследователя на определенное решение.

По нашей версии, порядок расположения информации, т.е. ин­формация в соответствующих номерах зон, может быть произволь­ным, но стандартным для всех единиц словаря.

Содержание словарной статьи в АСКЯ в начальных номерах зон, по предлагаемой нами версии, должно выглядить так, как это изложено ниже:

Зона 1. Слово из автоматического словаря принадлежит к одно­му из ниже перечисленных классов слов:

Зона 5. Слово из автоматического словаря относится к соответ­ствующему семантическому классу.

В третьей главе нами проведено исследование по семантической классификации знаменательных классов слов казахского языка (существительное, глагол, прилагательное, наречие и местоимение). В табл. 3-10 указанной главы показаны содержания (примеры) семан­тических классов и подклассов указанных частей речи, а также условные компьютерные коды соответствующих подклассов. Данные этих таблиц позволят заполнить “зону 5” словарной статьи для соот­ветствующей лексемы АСКЯ.

Таким образом, все изложенное по первым пяти зонам на при­мере парного слова “эке-шеше ” в АСКЯ будет иметь следующий вид:

Ввиду того, что порядок расположения информации в словарной статье может быть произвольным, то далее, по усмотрению создателя АСКЯ, можно продолжить все предполагаемые лингвистические и энциклопедические информации в их кодовых значениях и помещать в предназначенных для них зонах словарной статьи.            .

Раскодирование информации в понятном для лингвиста (или для любого интересующего словарем) виде и поиск необходимой ин- фомации в словарной базе и др., как мы уже отмечали, — дело спе­циалистов по созданию компьютерного АСКЯ.