Table | Card | RUSMARC | |
Allowed Actions: –
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group: Anonymous Network: Internet |
Annotation
Данная работа посвящена анализу текстовых записей первичных осмотров пациентов психиатрической клиники с помощью методов интеллектуального анализа данных. Задачи, которые решались в ходе исследования: 1. Изучение особенности обработки естественного языка с практической реализацией на языке программирования R. 2. Классификация текстовых заключений психиатрических осмотров пациентов в соответствии с диагнозами. 3. Определение близости текстов. 4. Сравнение методов и оценка моделей машинного обучения. Были применены следующие методы для определения близости текстов: TF-IDF векторизация текстов с вычислением косинусной близости, скрытый семантический анализ с вычислением косинусной близости, скрытое размещение Дирихле с вычислением расхождения Дженсена-Шеннона. Была проведена классификация текстов первичных осмотров в соответствии с кодами международной классификации болезней. Итоговые модели построены следующими алгоритмами: метод опорных векторов с радиальным ядром, метод градиентного бустинга, метод случайного леса.
The given work is devoted to the initial medical checkup texts analysis in a psychiatric clinic using data mining methods. The research set the following goals: 1. Studying the features of natural language processing with practical implementation in programming language R. 2. Initial medical checkup texts classification in accordance with diagnoses. 3. Determination of the similarity of texts. 4. Comparison of methods and evaluation of machine learning models. The following methods were used to determine the similarity of texts: TF-IDF vectorization with the calculation of cosine similarity, latent semantic analysis with the calculation of cosine similarity, latent Dirichlet allocation with the calculation of the Jensen-Shannon divergence. A texts classification of Initial medical checkup was carried out in accordance with the codes of the international classification of diseases, tenth revision. The resulting models are built with the following algorithms: support vector machine with a radial kernel, gradient boosting method, and random forest method.
Document access rights
Network | User group | Action | ||||
---|---|---|---|---|---|---|
ILC SPbPU Local Network | All | |||||
Internet | Authorized users SPbPU | |||||
Internet | Anonymous |
Usage statistics
Access count: 43
Last 30 days: 2 Detailed usage statistics |