Детальная информация

Название: Разработка интеллектуальной системы на базе LLM c использованием метода RAG для извлечения контекстной информации из текстовых документов: выпускная квалификационная работа бакалавра: направление 02.03.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.03.03_01 «Интеллектуальные информационные системы и обработка данных»
Авторы: Сухов Артем Сергеевич
Научный руководитель: Веремьев Виктор Леонтьевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения: Санкт-Петербург, 2024
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: интеллектуальные системы; большие языковые модели; дополненная генерация; обработка естественного языка; машинное обучение; генерация текста; intelligent systems; large language models; retrieval-augmented generation; natural language processing; machine learning; text generation
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 02.03.03
Группа специальностей ФГОС: 020000 - Компьютерные и информационные науки
DOI: 10.18720/SPBPU/3/2024/vr/vr24-2624
Права доступа: Доступ по паролю из сети Интернет (чтение)
Дополнительно: Новинка
Ключ записи: ru\spstu\vkr\30306

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В данной работе изложена сущность подхода к созданию и экспериментальному исследованию эффективности интеллектуальной системы на основе метода дополненной генерации (Retrieval-Augmented Generation, RAG) для извлечения контекстной информации из текстовых документов. Рассмотрены основные аспекты области обработки естественного языка (Natural Language Processing, NLP) и особенности больших языковых моделей (Large Language Models, LLM). Выявлены как достижения, так и ограничения современных LLM, включая их склонность к генерации недостоверной информации и трудности с обработкой узкоспециализированных запросов. Предложена и спроектирована архитектура интеллектуальной системы на основе метода RAG. Разработана конкретная интеллектуальная система на языке Python с использованием моделей Gemini AI. Определены гиперпараметры, позволяющие адаптировать систему под различные сценарии использования. Протестировано общее быстродействие системы. Исследована скорость работы API моделей при варьировании размера входных данных. Проведено автоматическое тестирование системы на синтетических и узкоспециализированных данных. Выполнена статистическая обработка полученных результатов и изложены выводы применимости метода RAG для повышения качества и релевантности ответов LLM при решении задач извлечения информации из текстовых документов.

This work presents the essence of the approach to creating and experimentally studying the effectiveness of an intelligent system based on the Retrieval-Augmented Generation (RAG) method for extracting contextual information from text documents. The main aspects of Natural Language Processing (NLP) and the features of Large Language Models (LLM) are examined. Both the achievements and limitations of modern LLMs are identified, including their tendency to generate inaccurate information and difficulties in handling specialized queries. The architecture of an intelligent system based on the RAG method is proposed and designed. A specific intelligent system is developed in Python using Gemini AI models. Hyperparameters are defined to adapt the system for various usage scenarios. The overall performance of the system is tested, and the speed of the models API operation is studied with varying input data sizes. Automated testing of the system on synthetic and specialized data is conducted. Statistical processing of the obtained results is performed, and conclusions are drawn regarding the applicability of the RAG method to improve the quality and relevance of LLM responses in tasks of extracting information from text documents.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать
Интернет Авторизованные пользователи СПбПУ Прочитать
-> Интернет Анонимные пользователи

Оглавление

  • cfed4142c57e15f1379c7172476bf10a7456777653279d340931db4afd6c9d26.pdf
      • Введение
      • 1. Исследование предметной области
      • 2. Проектирование интеллектуальной системы на основе большой языковой модели и метода дополненной генерации
      • 3. Программная реализация интеллектуальной системы
      • 4. Тестирование и апробация
      • Заключение
      • Список сокращений и условных обозначений
      • Словарь терминов
      • Список использованных источников
      • Приложение 1. Архитектура трансформера
      • Приложение 2. Программный код интеллектуальной системы на основе LLM и метода RAG
      • Приложение 3. Программный код для автоматического сравнения интеллектуальной системы с классической LLM через косинусное расстояние
  • ecaba7257a1364fcc939b5fb12536544755e74870eafa8d506e3979524e0a285.pdf
  • cfed4142c57e15f1379c7172476bf10a7456777653279d340931db4afd6c9d26.pdf
      • Введение
      • 1. Исследование предметной области
      • 2. Проектирование интеллектуальной системы на основе большой языковой модели и метода дополненной генерации
      • 3. Программная реализация интеллектуальной системы
      • 4. Тестирование и апробация
      • Заключение
      • Список сокращений и условных обозначений
      • Словарь терминов
      • Список использованных источников
      • Приложение 1. Архитектура трансформера
      • Приложение 2. Программный код интеллектуальной системы на основе LLM и метода RAG
      • Приложение 3. Программный код для автоматического сравнения интеллектуальной системы с классической LLM через косинусное расстояние

Статистика использования

stat Количество обращений: 0
За последние 30 дней: 0
Подробная статистика