Детальная информация

Название: Выбор терминологических экстракторов для выявления номинаций понятий языковой политики в текстах официальных документов Европейского Союза // Общество. Коммуникация. Образование. – 2021. – С. 60-80
Авторы: Гацук Е. Ю.
Выходные сведения: 2021
Коллекция: Общая коллекция
Тематика: Языкознание; Прикладное языкознание; языковая политика; номинации понятий (лингвистика); терминологические экстракторы; официальные документы; тексты официальных документов; обработка текстов; таксономические методы; language policy; concept nominations (linguistics); terminological extractors; official documents; texts of official documents; text processing; taxonomic methods
УДК: 81'33
ББК: 81.1
Тип документа: Статья, доклад
Тип файла: PDF
Язык: Русский
DOI: 10.18721/JHSS.12405
Права доступа: Свободный доступ из сети Интернет (чтение, печать, копирование)
Ключ записи: RU\SPSTU\edoc\68086

Разрешенные действия: Прочитать Загрузить (364 Кб)

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Инвентаризация терминологии реализуется, как правило, в автоматизированном режиме с использованием специализированного программного обеспечения. Многообразие терминологических экстракторов требует разработки критериев, позволяющих осуществлять их выбор для решения конкретных исследовательских задач. Цель данной статьи – осуществить сопоставительный анализ терминологических экстракторов с точки зрения их доступности и результативности извлечения потенциальных терминов из специального текста для решения конкретной исследовательской задачи, а именно инвентаризации номинаций понятий языковой политики из текстов официальных документов Европейского Союза. В качестве методологической базы использован комплекс современных научных методов: таксономический, объяснительное описание, обобщение, сопоставительный анализ. Осуществлено сопоставление 4 свободно доступных терминологических экстракторов, рекомендованных для работы отделом по координации терминологии Европейского союза TermCoord, и 1 программного инструмента, выбранного на основании сведений об его эффективности, представленных в научных публикациях. Анализ критериев, заявленных разработчиками анализируемого программного обеспечения, позволил выделить 5 таксонов для сопоставления терминологических экстракторов. Таксономический анализ позволил выявить оптимальные по критериям инструменты: онлайн-экстрактор OneClick Terms и инструмент корпусного запроса Sketch Engine, которые затем были сопоставлены с точки зрения их результативности в решении исследовательской задачи. Для проверки терминологических экстракторов на эффективность результаты их работы были сопоставлены со списком терминов, извлеченных вручную, что затем позволило применить критерии полноты и точности, традиционно используемые в информационном поиске, для сравнения результативности экстракторов. С учетом конкретной исследовательской задачи наиболее важной характеристикой является полнота, и по этому показателю оптимальным экстрактором оказался инструмент корпусного запроса Sketch Engine. Таким образом, в данной статье представлен комплексный подход к определению эффективности терминологических экстракторов не с точки зрения извлечения терминов, отражающих понятия определенной предметной области, а с точки зрения их результативности для решения конкретной исследовательской задачи.

Term extractors are automatic tools that help identify term candidates in a corpus. The diversity of term extractors requires the development of criteria that allow their selection for specific research tasks. The purpose of this article is to carry out a comparative analysis of term extractors in terms of their accessibility and effectiveness when extracting term candidates from the corpora to solve a specific research problem, namely the inventory of nominations of language policy concepts from the texts of official documents of the European Union. The study is based on a set of modern scientific methods, namely taxonomic method, explanatory description, generalization, comparative analysis. The study analyses 5 term extractors, namely, AntConc, fivefilters.org, OneClick Terms, TerMine, Terminology Extraction and corpus query tool Sketch Engine. The taxonomic analysis identified the optimal tools according to the criteria: the online extractor OneClick Terms and the corpus query tool Sketch Engine. These tools were then compared in terms of solving the research problem mentioned above. In order to test the term extractors in terms of their effectiveness, the results were compared with a list of manually extracted terms, which then allowed the application of the criteria of completeness and accuracy traditionally used in information retrieval to compare the performance of the extractors. Given the specific research objective of the term inventory, completeness was the most important characteristic and in this respect the corpus query tool Sketch Engine proved to be the optimal extractor. Thus, this paper presents a comprehensive approach to determining the effectiveness of terminological extractors not in terms of extracting terms that reflect the concepts of a particular subject area, but in terms of their effectiveness for solving a specific research problem.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
-> Интернет Все Прочитать Печать Загрузить

Статистика использования

stat Количество обращений: 175
За последние 30 дней: 6
Подробная статистика