Детальная информация
Название | Определение фенотипа колоний плюрипотентных стволовых клеток человека по динамическим данным морфологии методами машинного обучения: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_04 «Биоинформатика» |
---|---|
Авторы | Кац Софья Витальевна |
Научный руководитель | Гурский Виталий Валериевич |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | плюрипотентные стволовые клетки ; машинное обучение ; динамическая морфология ; классификация фенотипов ; бинарная классификация ; pluripotent stem cells ; machine learning ; dynamic morphology ; phenotype classification ; binary classification |
Тип документа | Выпускная квалификационная работа бакалавра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Бакалавриат |
Код специальности ФГОС | 01.03.02 |
Группа специальностей ФГОС | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-3166 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\37055 |
Дата создания записи | 28.08.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
Цель работы — разработка эффективной модели машинного обучения для классификации колоний плюрипотентных стволовых клеток человека на основе анализа динамики морфологических параметров колоний. В качестве данных использовались значения морфологических параметров колоний для двух клеточных линий (H9 и CaSR), полученные из изображений колоний на интервалах в 63 часа и 11 часов соответственно. Колонии были разделены по фенотипу («хорошие» и «плохие») согласно экспертной оценке. В работе построены классификаторы колоний по фенотипу на основе морфологических параметров с фиксированного времени (статические данные) и из временного окна разной ширины (динамические данные). Рассмотрены три метода машинного обучения, применяемые для бинарной классификации, — методы логистической регрессии, случайного леса и градиентного бустинга. Метод градиентного бустинга продемонстрировал наилучшую точность классификации для клеточной линии H9: 85,8% на динамических данных. Для статических данных показано сильное падение точности классификации при тестировании на временах, отличных от времени обучения. Для динамических данных исследован характер зависимости точности классификации от ширины временного окна обучения и расположения этого окна на временной шкале. Классификация на данных клеточной линии CaSR показала существенно более низкую точность (61%). Исследование показало, что использование динамических данных о морфологии колоний повышает качество классификации колоний по фенотипу, но при оптимальном выборе временного окна для обучения. Рассмотренный подход может быть использован для разработки или улучшения систем автоматизированного мониторинга качества клеточных культур.
The aim of this study is the development of an effective machine learning model for classifying human pluripotent stem cell colonies based on the analysis of morphological parameter dynamics. The data used consisted of morphological parameter values for two cell lines (H9 and CaSR), obtained from colony images captured at 63-hour and 11-hour intervals, respectively. The colonies were classified by phenotype ("good" and "bad") according to expert evaluation. The study involved constructing colony phenotype classifiers using morphological parameters from both static data (fixed time points) and dynamic data (time windows of varying durations). Three machine learning methods for binary classification were examined: logistic regression, random forest, and gradient boosting. The gradient boosting method demonstrated the highest classification accuracy for the H9 cell line, achieving 85.8% accuracy on dynamic data. For static data, a significant drop in classification accuracy was observed when testing on the time points different from those used in training. For dynamic data, the relationship between classification accuracy and both the width of the training time window and its position along the timeline was investigated. Classification performed on data from the CaSR cell line showed lower accuracy (61%). The research demonstrated that using dynamic data on colony morphology improves phenotype classification accuracy, provided an optimal training time window is selected. The approach presented in this study could be applied to develop or enhance automated systems for monitoring cell culture quality.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0