Таблица | Карточка | RUSMARC | |
Разрешенные действия: –
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа: Анонимные пользователи Сеть: Интернет |
Аннотация
Тема выпускной квалификационной работы: Система идентификации и нормализации упоминаний даты и времени в текстах на русском языке Целью работы является создание программной системы для извлечения из текста выражений, описывающих дату, время и длительность временного интервала Решение задачи идентификации и нормализации выражений даты и времени делится на две части. В первой части с помощью библиотеки Duckling извлекаются и нормализуются потенциальные временные выражения. Для этого был разработан набор правил, который был записан на языке программирования Haskell для извлечения даты и времени из текстов на русском языке. Во второй части список найденных кандидатов обрабатывается, чтобы скорректировать неверно нормализованные значения, разрешить неоднозначность и преобразовать найденные значения в выходной формат, соответствующий стандарту TimeML. Эти алгоритмы реализованы на языке Python. В результате система успешно идентифицирует упоминания даты, времени и длительности для достаточно большого подмножества русского языка и умеет разрешать некоторые случаи неоднозначности.
The subject of the graduate qualification work is “A system for identification and normalization of temporal expressions in Russian texts.” In this work, I present a software system for identification and normalization of date and time expression in texts written in Russian. In this work, I present a software system for identification and normalization of date and time expression in texts written in Russian. The processing has two stages. At the first state, candidate expressions are detected and normalized using the Duckling library. I extended Duckling by creating a new set of rules implemented Haskell. At the second stage, candidate expressions are filtered and corrected based on their context, and then converted to the TimeML annotation language. I implemented the second state in Python. As a result, the system successfully identifies several types of date and time expressions commonly used in Russian texts and resolves some common cases of ambiguity.
Права на использование объекта хранения
Место доступа | Группа пользователей | Действие | ||||
---|---|---|---|---|---|---|
Локальная сеть ИБК СПбПУ | Все | |||||
Интернет | Авторизованные пользователи СПбПУ | |||||
Интернет | Анонимные пользователи |
Статистика использования
Количество обращений: 6
За последние 30 дней: 0 Подробная статистика |