Details

Title Именованные сущности в немецкоязычной прессе: корпусный и экспертный анализ // Terra Linguistica. – 2025. – Т. 16, № 4. — С. 59-73
Creators Корышев М. В. ; Хохлова М. В.
Imprint 2025
Collection Общая коллекция
Subjects Языкознание ; Прикладное языкознание ; именованные сущности ; немецкоязычная пресса ; корпусный анализ (лингвистика) ; имена собственные ; новостные тексты ; антропонимы ; топонимы ; named entities ; German-language press ; corpus analysis (linguistics) ; proper names ; news texts ; anthroponyms ; toponyms
UDC 81'33
LBC 81.1
Document type Article, report
Language Russian
DOI 10.18721/JHSS.16404
Rights Свободный доступ из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key RU\SPSTU\edoc\78205
Record create date 2/4/2026

Allowed Actions

Read Download (0.5 Mb)

Group Anonymous
Network Internet

Анализ имен собственных, упоминаемых в новостных текстах, представляет отдельный исследовательский интерес, поскольку позволяет косвенным образом определить затрагиваемые в изданиях темы. В статье представлены результаты анализа автоматической процедуры по извлечению именованных сущностей на материале немецкоязычной прессы. Исследование было проведено на материале как общегерманских изданий, нацеленных на широкий охват аудитории, так и региональных и локальных газет, ориентированных на более узкую аудиторию федеральных земель Германии. Работа осуществлялась в два этапа: в ходе первого этапа при помощи инструмента Stanza из текстов каждого издания, а также из всей коллекции статей в целом были извлечены сущности, принадлежащие к одной из трех категорий (антропонимы, эргонимы и топонимы), далее для первых 50 частотных единиц были построены семантические сети, отражающие отношения между ними. На следующем этапе работы упомянутые имена собственные были подвергнуты экспертному анализу с последующей кластеризацией, позволившей, во-первых, выделить дополнительные темы, которые не были выявлены на предыдущем шаге при помощи автоматической процедуры, а во-вторых, осуществить глубинный анализ. Результаты показывают превалирование привнесенных в медийное поле тематик, связанных с современной концепцией политического образования, в материалах общегерманской прессы, в то время как локальная тематика по большей части сконцентрировала на местной повестке. Автоматическое выделение именованных сущностей может рассматриваться как необходимый этап для последующего дискурсивного анализа, при этом полученный материал нуждается в дополнительной экспертной оценке.

The analysis of proper names mentioned in news texts is of particular research interest, as it allows for indirect identification of the topics covered in the publications. This article presents the results of an analysis of an automatic procedure for extracting named entities using material from the German-language press. The study was conducted on both national German publications aimed at a broad audience and regional and local newspapers aimed at a narrower audience in the federal states of Germany. The work was conducted in two stages: during the first stage, entities belonging to one of three categories (anthroponyms, ergonyms, and toponyms) were extracted from the texts of each publication, as well as from the entire article collection, using the Stanza tool. Semantic networks reflecting the relationships between these entities were then constructed for the first 50 frequent lexemes. In the next stage of the work, the aforementioned proper names were subjected to expert analysis and subsequent clustering, which allowed, firstly, the identification of additional themes not identified in the previous step using the automated procedure, and secondly, the implementation of an in-depth analysis. The results show the prevalence of themes introduced into the media field related to the modern concept of political education in national press materials, while local themes were largely concentrated on the local agenda. Automatic identification of named entities can be considered a necessary step for subsequent discourse analysis, although the resulting material requires additional expert evaluation.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet All

Access count: 17 
Last 30 days: 17

Detailed usage statistics