Details

Title: Научный и технический текст и Информация 4.0: ключевые задачи при создании структурированного контента // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. Сер.: Гуманитарные и общественные науки: научное издание. – 2019. – Т. 10, № 2
Creators: Беляева Л. Н.; Чернявская В. Е.
Imprint: Санкт-Петербург: Изд-во Политехн. ун-та, 2019
Collection: Общая коллекция
Subjects: Языкознание; Прикладное языкознание; научные тексты; технические тексты; Информация 4.0; текстовые структуры; структурированный контент (языкознание); контент-анализ; scientific texts; technical texts; Information 4.0; text structures; structured content (linguistics); content analysis
UDC: 81'33
LBC: 81.1
Document type: Article, report
File type: PDF
Language: Russian
DOI: 10.18721/JHSS.10205
Rights: Свободный доступ из сети Интернет (чтение, печать, копирование)
Record key: RU\SPSTU\edoc\62170

Allowed Actions: Read Download (216 Kb)

Group: Anonymous

Network: Internet

Annotation

В статье рассмотрена методологическая значимость формализации лингвистического знания в связи с новыми, технически обусловленными возможностями извлечения информации из текстов в научной и технической коммуникации. Анализируются возможности лингвистического инструментария, решающего задачу автоматического профилирования информации. Теоретические основы анализа заданы выводами современной лингвистики текста, стилистики научного текста, учитываются заключения прикладной лингвистики в части инженерии знаний, т. е. методов и средств извлечения, представления, структурирования и использования знаний. Для оценки соответствия создаваемых текстов ключевым требованиям структурированного контента проанализировано 128 научных статей, представленных в рецензируемый российский журнал "Известия РГПУ им. А. И. Герцена" в 2010–2016 гг. Исследованный массив включает работы, выбранные по таблице случайных чисел из общего массива независимо от решения экспертов об их публикации и соответствующие гуманитарным наукам по направлениям языкознание и лингвистика, история, культурология, философия, экономика и юриспруденция. Результаты исследования выборки показывают, что актуальные требования к представлению информации в текстах авторами не соблюдаются, компетенции в области академического письма в условиях Информации 4.0 не сформированы вполне.

The paper discusses issues of formalization of linguistic knowledge in the framework providing strategic value for information. This is focused in the concept of Information 4.0. This concept reveals that information can be presented and visualized as a cloud of "information molecules". The information molecules can be accessed directly, assembled, and changed by different users in various formats, integrated with data, other information systems, and products. Information 4.0 examines the form, production, interaction and curation of information components. The underlying assumption of the paper is that information and knowledge are represented and transferred as a text. Thereafter the text structure is the result of information transfer and the starting point of information mining and extraction. The paper reflects that Information 4.0 demands new approaches in how we work on content. New research directions and applied tasks to be solved are seen in advancing from procedures formalizing text semantics to procedures providing machine-readable automatic information structuring and text production. The methodological focus is not on the ready text structures but on linguistic tools and operations explaining how to produce texts according to given models and content. Thereafter in the framework of Information 4.0 the focus is not on the basic model of the typical publication structure IMRED, but on the notion of structured content authoring and productivist approach to the text. Based on a corpus-assisted analysis of current papers of Russian authors in social sciences and humanities the research shows typical faults in the authors’ key words.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
-> Internet All Read Print Download

Usage statistics

stat Access count: 282
Last 30 days: 11
Detailed usage statistics