Таблица | Карточка | RUSMARC | |
Аннотация
Гетерогенными являются данные различных форматов, собранные из разных источников. Такие данные, как правило, неполные и неточные, что затрудняет их обработку и кластеризацию. В работе представлен метод кластерного анализа гетерогенных данных с использованием положений нечеткой логики. Приведены математические модели представления кандидата на вакантную должность, которые характеризуются гетерогенными данными. Для разработки математических моделей использован аппарат алгебраических систем. Подробно описан способ определения функции принадлежности нечетких множеств с использованием вероятностного подхода как наиболее эффективного при работе с гетерогенными данными. Приведен пример формирования базы логических правил для выделения классификационных признаков в множестве гетерогенных данных кадрового резерва производственного предприятия. Выделенные классификационные признаки позволяют реализовать дальнейшую точную и эффективную проверку, а также оценить сведения о кандидатах на вакантную должность. Предлагаемый метод кластерного анализа гетерогенных данных может применяться, например, в социально-экономических, технических, биологических системах, предполагающих использование неполных и неточных данных.
Heterogeneous data are those of various formats and collected from various sources. Such data usually are incomplete and inaccurate, which makes them difficult to process and cluster. In this work, a method for cluster analysis of heterogeneous data using the provisions of fuzzy logic is presented. The simulation models for representing a candidate for a vacant position, which is characterized by heterogeneous data, are provided. The apparatus of algebraic systems has been used to develop simulation models. A method for determining the membership function of fuzzy sets using a probabilistic approach as the most effective when working with heterogeneous data, is described in detail. An example is given of the formation of a base of logical rules for selection of classification features in a set of heterogeneous data of the personnel reserve of a manufacturing enterprise. The selected classification features allow for further accurate and efficient verification and evaluation of information about candidates for a vacant position. The proposed method of cluster analysis of heterogeneous data can be applied in various subject areas that involve the use of incomplete and inaccurate data, for example, socio-economic, technical, and biological systems.
Входит в состав
Статистика использования
Количество обращений: 11
За последние 30 дней: 2 Подробная статистика |