Details

Title: Разработка веб-сервиса по парсингу банковских выписок в формате PDF: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика» ; образовательная программа 09.03.03_03 «Интеллектуальные инфокоммуникационные технологии»
Creators: Васильев Вячеслав Дмитриевич
Scientific adviser: Резединова Евгения Юрьевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2022
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: открытый банкинг; парсинг pdf; Python; Django; API-агрегация; open banking; pdf parsing; API-aggregation
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 09.03.03
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2022/vr/vr23-1829
Rights: Доступ по паролю из сети Интернет (чтение)
Record key: ru\spstu\vkr\22946

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Объектом исследования выпускной квалификационной работы является автоматизированное извлечение (парсинг) данных из банковских выписок в формате PDF. Предмет исследования - веб-сервис по парсингу банковских выписок. Цель работы - разработка веб-сервиса по парсингу банковских выписок в формате PDF. В данной работе рассмотрены понятия открытого банкинга, API-агрегации, проведен анализ актуальности парсинга PDF выписок в сравнении с другими существующими способами агрегации банковских данных. Изложен процесс проектирования и разработки веб-сервиса, позволяющего извлекать банковские данные пользователя из файлов в формате PDF. Описан выбор подходящих инструментов для задачи парсинга PDF файлов и разработана программная реализация на примере двух российских банков. Разработанное решение может быть использовано пользователями, имеющими несколько счетов в различных банках, для построения персональной финансовой аналитики, а так же компаниями для автоматизации проверки дохода своих клиентов, что может помочь в принятии бизнес-решений.

The object of the research of the graduate qualification work is the automated extraction (parsing) of data from bank statements in the PDF format. The subject of the research is a web service for parsing bank statements. The aim of the work is to develop a web service for parsing bank statements in PDF format. This paper discusses the concepts of open banking, API aggregation, analyzes the relevance of parsing PDF statements in comparison with other existing methods of banking data aggregation. The process of designing and developing a web service that allows you to extract user banking data from PDF files is outlined. The choice of suitable tools for the task of parsing PDF files is described and a software implementation is developed using the example of two Russian banks. The developed solution can be used by users who have several accounts in different banks to build personal financial analytics, as well as by companies to automate the verification of their clients income, which can help in making business decisions.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
Internet Authorized users SPbPU Read
-> Internet Anonymous

Table of Contents

  • Разработка веб-сервиса по парсингу банковских выписок в формате PDF
    • Введение
    • 1. Обзор существующих способов агрегации банковских данных
    • 2. Проектирование сервиса по парсингу PDF выписок
    • 3. Разработка, тестирование и апробация сервиса по парсингу PDF выписок
    • Заключение
    • Список сокращений и условных обозначений
    • Список использованных источников
    • Приложение 1. Схема базы данных (ER-модель)
    • Приложение 2. Пример JSON финансовых данных о клиенте
    • Приложение 3. OpenAPI документация
    • Приложение 4. Исходный код программы
    • Приложение 5. Диаграмма классов для парсинга

Usage statistics

stat Access count: 0
Last 30 days: 0
Detailed usage statistics