Использование Томиты-парсера для идентификации веб приложений: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем»

Борисов, Андрей Алексеевич

Детальная информация

Название	Использование Томиты-парсера для идентификации веб приложений: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем»
Авторы	Борисов Андрей Алексеевич
Научный руководитель	Коноплев Артем Станиславович
Организация	Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения	Санкт-Петербург, 2020
Коллекция	Выпускные квалификационные работы ; Общая коллекция
Тематика	фингерпринтинг ; идентификация веб-приложений ; исследование методов идентификации веб-приложений ; средства идентификации веб-приложений ; Томита-парсер ; fingerprinting ; Web Application Identity ; Web Application Identity Research ; Web Application Identity Tools ; Tomita-parser
Тип документа	Выпускная квалификационная работа бакалавра
Тип файла	PDF
Язык	Русский
Уровень высшего образования	Бакалавриат
Код специальности ФГОС	10.03.01
Группа специальностей ФГОС	100000 - Информационная безопасность
DOI	10.18720/SPBPU/3/2020/vr/vr20-5206
Права доступа	Доступ по паролю из сети Интернет (чтение)
Ключ записи	ru\spstu\vkr\27045
Дата создания записи	25.03.2024

Разрешенные действия

–

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа	Анонимные пользователи
Сеть	Интернет

Данная работа посвящена исследованию существующих методов идентификации веб-приложений. Всего было выделено 4 основных метода идентификации: сбор баннеров сервера, ручной анализ системы, активное и пассивное исследование реализации протоколов, исследование технических характеристик системы и проверка данных HTML. Разработан метод автоматизации ручного анализа проверки данных HTML. Кроме того, в ходе работы был разработан прототип системы обнаружения приложений и плагинов, использующихся на веб-сервере. Разработанный прототип был основан на инструменте Томита-парсер. В работе представлено подробное описание работы парсера и всех необходимых вспомогательных компонентов. На языке программирования Python была разработана оболочка для проведения более эффективного анализа кода HTML-страницы, делающая код более удобочитаемым для парсера. Кроме того, была произведена оценка эффективности разработанного метода, создана выборка сайтов, на основе которых проверялась корректность работы программы. Произведена оценка скорости работы парсера в зависимости от размера словаря и от размера исследуемого кода. Произведены расчеты статистических ошибок первого и второго рода. В результате были проанализированы методы идентификации веб-приложений, предложены методы для автоматизации анализа кода HTML-страницы. Разработан эффективный инструмент, способный распознавать используемые HTTP-сервера, плагины и системы управления содержимым.

This work is devoted to the study of existing methods of identifying web applications. In total, 4 main methods of identification have been identified: gathering server banners, manual analysis of the system, active and passive study of protocol implementation, study of system specifications and HTML data verification. The method of automating manual analysis of HTML data verification was developed. Besides, in the course of the work was developed a prototype of the system to detect applications and plug-ins used on the web server. The developed prototype was based on Tomita-Parser tool. The work provides a detailed description of the parser and all necessary auxiliary components. In Python programming language, a shell was developed for more efficient HTML page code analysis, making the code more readable for the parser. Besides, the efficiency of the developed method was estimated, a sample of sites was created on the basis of which the correctness of the program work was checked. The speed of the parser's work was estimated depending on the size of the dictionary and the size of the code under study. Calculations of statistical errors of the first and second types are performed. As the result, web-application identification methods were analyzed, methods for automating HTML-page code analysis were offered. An effective tool capable of recognizing HTTP servers, plugins and content management systems in use was developed.

Место доступа	Группа пользователей	Действие
Локальная сеть ИБК СПбПУ	Все
Интернет	Авторизованные пользователи СПбПУ
Интернет	Анонимные пользователи

Количество обращений: 1
За последние 30 дней: 0

Подробная статистика