Details

Title: Searching for multicomponent terms in comparable scientific corpora // Общество. Коммуникация. Образование. – 2021 Т. 12, № 2
Creators: Beliaeva L. N.; Kamshilova O. N.
Imprint: 2021
Collection: Общая коллекция
Subjects: Языкознание; Прикладное языкознание; scientific texts; multicomponent terms; comparable text corpora; lexicography; terminological nominal groups; machine translations; english; научные тексты; многокомпонентные термины; сопоставимые корпуса текстов; лексикография; терминологические именные группы; машинные переводы; английский язык
UDC: 81'33
LBC: 81.1
Document type: Article, report
File type: PDF
Language: English
DOI: 10.18721/JHSS.12209
Rights: Свободный доступ из сети Интернет (чтение, печать, копирование)
Additionally: New arrival

Allowed Actions: Read Download (209 Kb)

Group: Anonymous

Network: Internet

Annotation

The paper suggests the use of full-text parallel/comparable corpora with a "built-in" part of machine translation (MT) results for term extraction, harmonization and translation, since analysis and comparison of these texts will assure the possibility to identify terminological units for dictionary entries. We focus on the complicated and non-parallel structure of English multicomponent terminological noun phrases (NPs), their variants and modifications within the same text, which determine the need for a three-part text corpus, including parallel/comparable texts and their MT translation. The research has proved that multicomponent terminological NPs are not only specific for a scientific text, but they demonstrate ambiguous dependency relations, caused by their syntactic compression, which normally is the result of a sentence or of another NP convolution. These modifications are results of a number of standard procedures described in the paper.

В статье предлагается использование полнотекстовых сопоставимых корпусов научных текстов со встроенной частью в виде выровненных результатов машинного перевода (МП). Такой корпус предназначен для решения задач извлечения, гармонизации и перевода терминологии, поскольку анализ и сравнение этих текстов позволяет идентифицировать терминологические единицы для формирования словарных статей. Особое внимание уделяется сложным и непараллельным структурам английских многокомпонентных терминологических именных групп, их вариантов и модификаций в рамках одного текста, что определяет необходимость трехчастного корпуса текстов, включающего параллельные/сопоставимые тексты и их машинный перевод. Исследование подтвердило, что многокомпонентные терминологические именные группы не только характерны для научных текстов, но демонстрируют многозначные отношения зависимостей, вызванные их синтаксической компрессией, что как правило является результатом свертки предложения или именной группы. Эти модификации в свою очередь являются результатом стандартных процедур, описанных в статье.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
-> Internet All Read Print Download

Usage statistics

stat Access count: 37
Last 30 days: 4
Detailed usage statistics