Details

Title: Метод кластерного анализа гетерогенных данных с использованием положений нечеткой логики // Известия высших учебных заведений. Электроника: научно-технический журнал. – 2023. – С. 537-546
Creators: Шевнина Ю. С.; Гагарина Л. Г.; Конюхов Е. В.; Харитонова А. Д.
Imprint: 2023
Collection: Общая коллекция
Subjects: Вычислительная техника; Манипулирование данными; Математика; Математическая логика; гетерогенные данные; кластерный анализ данных; нечеткая логика (математика); нечеткие множества; функции принадлежности (математика); математическое моделирование; классификационные признаки; heterogeneous data; cluster data analysis; fuzzy logic (mathematics); fuzzy sets; membership functions (mathematics); mathematical modeling; classification features
UDC: 004.62; 510.6
LBC: 32.973-018.2; 22.12
Document type: Article, report
File type: Other
Language: Russian
DOI: 10.24151/1561-5405-2023-28-4-537-546
Rights: Доступ по паролю из сети Интернет (чтение)
Record key: RU\SPSTU\edoc\71723

Allowed Actions: View

Annotation

Гетерогенными являются данные различных форматов, собранные из разных источников. Такие данные, как правило, неполные и неточные, что затрудняет их обработку и кластеризацию. В работе представлен метод кластерного анализа гетерогенных данных с использованием положений нечеткой логики. Приведены математические модели представления кандидата на вакантную должность, которые характеризуются гетерогенными данными. Для разработки математических моделей использован аппарат алгебраических систем. Подробно описан способ определения функции принадлежности нечетких множеств с использованием вероятностного подхода как наиболее эффективного при работе с гетерогенными данными. Приведен пример формирования базы логических правил для выделения классификационных признаков в множестве гетерогенных данных кадрового резерва производственного предприятия. Выделенные классификационные признаки позволяют реализовать дальнейшую точную и эффективную проверку, а также оценить сведения о кандидатах на вакантную должность. Предлагаемый метод кластерного анализа гетерогенных данных может применяться, например, в социально-экономических, технических, биологических системах, предполагающих использование неполных и неточных данных.

Heterogeneous data are those of various formats and collected from various sources. Such data usually are incomplete and inaccurate, which makes them difficult to process and cluster. In this work, a method for cluster analysis of heterogeneous data using the provisions of fuzzy logic is presented. The simulation models for representing a candidate for a vacant position, which is characterized by heterogeneous data, are provided. The apparatus of algebraic systems has been used to develop simulation models. A method for determining the membership function of fuzzy sets using a probabilistic approach as the most effective when working with heterogeneous data, is described in detail. An example is given of the formation of a base of logical rules for selection of classification features in a set of heterogeneous data of the personnel reserve of a manufacturing enterprise. The selected classification features allow for further accurate and efficient verification and evaluation of information about candidates for a vacant position. The proposed method of cluster analysis of heterogeneous data can be applied in various subject areas that involve the use of incomplete and inaccurate data, for example, socio-economic, technical, and biological systems.

Usage statistics

stat Access count: 8
Last 30 days: 1
Detailed usage statistics