Санкт-Петербург повысил скорость поиска по цифровым архивам в десятки раз
Решение «Умный архив», разработанное «Санкт-Петербургским информационно-аналитическим центром», повысило эффективность работы с архивными документами. Время поиска информации сократилось в несколько раз благодаря новой функции автоматического распознавания текста. Новый нейросетевой инструмент доступен для поиска по более чем 7 млн электронных образов документов из архива города.
В задачи проекта «Умный архив» по внедрению технологии искусственного интеллекта в систему хранения и обработки архивных данных, входит повышение доступности документов государственных архивов. На данный момент на интернет-портале «Архивы Санкт-Петербурга» представлено несколько миллионов архивных документов и электронных образов. Разработчики сделали работу с порталом более удобной за счет сокращения времени на поиск нужной информации и расширения поисковых возможностей в целом.
Созданные и обученные нейросети расширили список функций портала. В него добавились возможности оптического распознавания текста, извлечения адресной информации и именованных сущностей, автоматического получение географических координат адресов с привязкой к карте. Кроме того, сервис в скором времени предоставит возможность автоматически формировать справочники, отображать рекомендованные документы и пополнять единый поисковой индекс на основе извлеченной информации.
Благодаря автоматическому распознаванию текста и возможности поиска по содержимому, пользователи могут получить необходимую информацию значительно быстрее. Например, если на просмотр документа постранично может уйти 30 минут, то решение позволяет найти информацию в 60 раз быстрее – примерно за 30 секунд.
В результате обновления платформы вырос общий уровень удовлетворенности горожан работой портала — 92% оценили работу «Архивов Санкт-Петербурга» на «хорошо» и «отлично». Объем оказываемых порталом услуг увеличился — количество пользователей выросло с 1,8 до 2,5 тыс. человек в сутки. При этом нагрузка на сотрудников архива снизилась за счет возможности посетителям самостоятельно искать данные по тексту.
В перспективе «Санкт-Петербургский информационно-аналитический центр» планирует добавить на платформу «Умный архив» возможности распознавания рукописного текста, продолжать работу по повышению качества поисковых механизмов и обучению нейросетей, внедрить рекомендательную систему на основе поведенческой модели пользователей.
«Цифровые сервисы Санкт-Петербурга постоянно и качественно меняются. Это замечают и жители города, и высоко оценивает экспертное сообщество. Так, платформа “Умный архив” стала лучшим инновационным проектом на XI Всероссийском конкурсе региональной информатизации “ПРОФ-ИТ”. Уверен, что практика Петербурга в работе с цифровыми документами может быть масштабирована и взята на вооружение многими регионами нашей страны», — прокомментировал Станислав Казарин, вице-губернатор Санкт-Петербурга.
«Технологии искусственного интеллекта помогают оптимизировать работу с документами и открывают серьезные перспективы для архивной службы. Нейросети позволят нам сократить трудозатраты на некоторые виды работ, при этом сделают их быстрее человека. Теперь с помощью платформы пользователи смогут быстро находить нужные документы, используя различные поисковые запросы», — отметил Петр Тищенко, председатель Архивного комитета Санкт-Петербурга.