Searching for multicomponent terms in comparable scientific corpora

Beliaeva, L. N.; Kamshilova, O. N.

Вход в систему

Детальная информация

	Таблица	Карточка	RUSMARC

Название:	Searching for multicomponent terms in comparable scientific corpora // Общество. Коммуникация. Образование. – 2021. – С. 118-124
Авторы:	Beliaeva L. N.; Kamshilova O. N.
Выходные сведения:	2021
Коллекция:	Общая коллекция
Тематика:	Языкознание; Прикладное языкознание; scientific texts; multicomponent terms; comparable text corpora; lexicography; terminological nominal groups; machine translations; english; научные тексты; многокомпонентные термины; сопоставимые корпуса текстов; лексикография; терминологические именные группы; машинные переводы; английский язык
УДК:	81'33
ББК:	81.1
Тип документа:	Статья, доклад
Тип файла:	PDF
Язык:	Английский
DOI:	10.18721/JHSS.12209
Права доступа:	Свободный доступ из сети Интернет (чтение, печать, копирование)
Ключ записи:	RU\SPSTU\edoc\67062

Разрешенные действия: Прочитать Загрузить (209 Кб)

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

The paper suggests the use of full-text parallel/comparable corpora with a "built-in" part of machine translation (MT) results for term extraction, harmonization and translation, since analysis and comparison of these texts will assure the possibility to identify terminological units for dictionary entries. We focus on the complicated and non-parallel structure of English multicomponent terminological noun phrases (NPs), their variants and modifications within the same text, which determine the need for a three-part text corpus, including parallel/comparable texts and their MT translation. The research has proved that multicomponent terminological NPs are not only specific for a scientific text, but they demonstrate ambiguous dependency relations, caused by their syntactic compression, which normally is the result of a sentence or of another NP convolution. These modifications are results of a number of standard procedures described in the paper.

В статье предлагается использование полнотекстовых сопоставимых корпусов научных текстов со встроенной частью в виде выровненных результатов машинного перевода (МП). Такой корпус предназначен для решения задач извлечения, гармонизации и перевода терминологии, поскольку анализ и сравнение этих текстов позволяет идентифицировать терминологические единицы для формирования словарных статей. Особое внимание уделяется сложным и непараллельным структурам английских многокомпонентных терминологических именных групп, их вариантов и модификаций в рамках одного текста, что определяет необходимость трехчастного корпуса текстов, включающего параллельные/сопоставимые тексты и их машинный перевод. Исследование подтвердило, что многокомпонентные терминологические именные группы не только характерны для научных текстов, но демонстрируют многозначные отношения зависимостей, вызванные их синтаксической компрессией, что как правило является результатом свертки предложения или именной группы. Эти модификации в свою очередь являются результатом стандартных процедур, описанных в статье.

Права на использование объекта хранения

	Место доступа		Группа пользователей		Действие
	Локальная сеть ИБК СПбПУ		Все
	Интернет		Все

Входит в состав

Общество. Коммуникация. Образование = Society. Communication. Education. — Санкт-Петербург: СПбПУ, 2020-. — Электрон. журнал. — Периодичность: 4 раза в год. — Свободный доступ из сети Интернет (чтение, печать, копирование).

Общество. Коммуникация. Образование = Society. Communication. Education. — Санкт-Петербург: СПбПУ, 2020-. Т. 12, № 2, 2021. — 1 файл (3,79 Мб). — Свободный доступ из сети Интернет (чтение, печать, копирование). — <URL:http://elib.spbstu.ru/dl/2/j21-370.pdf>.

Статистика использования

Количество обращений: 218
За последние 30 дней: 10
Подробная статистика