Проблемы формализации структуры словарной статьи "Словаря русского языка XVIII века" при подготовке электронного издания

Егоров, И. М.; Мольков, Г. А.

Вход в систему

Детальная информация

	Таблица	Карточка	RUSMARC

Название:	Проблемы формализации структуры словарной статьи "Словаря русского языка XVIII века" при подготовке электронного издания // Terra Linguistica. – 2023. – С. 19-27
Авторы:	Егоров И. М.; Мольков Г. А.
Выходные сведения:	2023
Коллекция:	Общая коллекция
Тематика:	Языкознание; Прикладное языкознание; словари русского языка; словарные статьи; формализация структуры словарей; электронные издания; электронная лексикография; модели данных (языкознание); электронные версии словарей; dictionaries of russian language; dictionary entries; formalization of structure of dictionaries; electronic publications; electronic lexicography; data models (linguistics); electronic versions of dictionaries
УДК:	81'33
ББК:	81.1
Тип документа:	Статья, доклад
Тип файла:	PDF
Язык:	Русский
DOI:	10.18721/JHSS.14302
Права доступа:	Свободный доступ из сети Интернет (чтение, печать, копирование)
Ключ записи:	RU\SPSTU\edoc\72632

Разрешенные действия: Прочитать Загрузить (290 Кб)

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В статье рассмотрены результаты ручной обработки и классификации структурных элементов "Словаря русского языка XVIII века" на материале выпущенных на сегодняшний день 22 выпусков. Цель этой работы - адаптация к нормальной структуре данных всего разнообразия приемов и особенностей оформления статей данного словаря и в дальнейшем - подготовка электронной версии словаря, основанной на базе данных. Основной сложностью, выявленной в ходе анализа структурных особенностей словаря, стал вопрос о допустимой степени отклонений от бумажного канона при адаптации к электронному формату данных. При классификации было выделено два типа структур - типовые и единичные. Предлагается их формализация с помощью трехуровневой системы компонентов: базовых, подчиненных базовому и простых элементов двух типов - сложной типовой структуры (блоки компонентов) и первичных. Типовые структуры передаются при такой системе полностью, а относительно единичных принимается дополнительное решение. Сохраняются особенности бумажной версии словаря, которые не влияют на структуру данных - в тех случаях, когда определенный элемент меняет (сужает или расширяет) сферу применения в пределах одного блока компонентов. Если же нетипичное (редкое) использование элемента выходит за пределы блока, в структуру базы данных необходимо добавлять новый компонент, который в перспективе не будет востребован. В такой ситуации невостребованный элемент словарных статей предполагается устранять из оригинального текста и приводить его в соответствие с общим для словаря метаязыковым узусом.

This article discusses the results of manual processing and classification of the structural elements of the "Dictionary of the Russian language of the 18th century" obtained from its 22 issues published so far. The purpose of this work is to accommodate the manifold repertory of metalinguistic techniques and design features characteristic of the aforementioned dictionary to a unified data structure frame, which could significantly facilitate the preparation of its database-driven digital version. The core difficulty of the task discovered during our analysis of the dictionary structure is the fact that there is no obvious way to determine the limit of deviations from the printed version acceptable for the digital edition. In our taxonomy we distinguish two types of structures, namely generic and unique ones. They can be formally represented by a three-level system of components: (1) the basic ones, (2) those subordinate to the basic ones, and (3) simple items of two types: (3.1) primary elements or (3.2) complex typical structures (component blocks). In this system, the generic structures are preserved entirely and without exception, whereas the unique ones can be included or left out by an additional decision. The particular features of the paper version which do not affect the data structure are preserved in cases where the scope of a certain element is narrowed or expanded within one component block. In fact, if any atypical or rare use of an element exceeded the boundaries of a block and it were nevertheless decided to preserve this element, it would be necessary to expand the data structure with a new component useless outside this idiosyncratic case. In such situations, we propose to eliminate the unclaimed elements of dictionary entries from the original text in order to adjust it to the standard metalanguage of the dictionary.

Права на использование объекта хранения

	Место доступа		Группа пользователей		Действие
	Локальная сеть ИБК СПбПУ		Все
	Интернет		Все

Входит в состав

Terra Linguistica. — Санкт-Петербург: СПбПУ, 2022-. — Электрон. журнал. — Периодичность: 4 раза в год. — Свободный доступ из сети Интернет (чтение, печать, копирование).

Terra Linguistica. — Санкт-Петербург: СПбПУ, 2022-. Т. 14, № 3, 2023. — 1 файл (2,99 Мб). — Свободный доступ из сети Интернет (чтение, печать, копирование). — <URL:http://elib.spbstu.ru/dl/2/j24-18.pdf>.

Статистика использования

Количество обращений: 62
За последние 30 дней: 13
Подробная статистика