Интеллектуальные сервисы Directum Ario 2022.3
Напомним,
что интеллектуальные сервисы Directum Ario поддерживают работу на операционных
системах Альт Сервер и Astra Linux, которые входят в единый
реестр российского ПО. Иностранные разработчики систем с
искусственным интеллектом покидают российский рынок, поэтому сейчас важно
обеспечить импортонезависимость. Сервисы Directum Ario дают такую возможность.
Они легко заменяют аналогичные зарубежные технологии и встраиваются в
информационную систему любого класса (ERP, CRM, ECM, BPM и др.).
Сервисы
Directum Ario продолжают активно развиваться, чтобы сохранить стабильность
ваших бизнес-процессов. В версии 2022.3 появилась удобная разметка фактов
многоугольником, большая контролируемость процесса обработки многостраничных
документов и другое.
Извлекаемые факты:
- Переобучена базовая модель для входящих писем. Теперь из писем извлекается 26 фактов. Добавлены телефон, адрес электронной почты и сайт организации.
- В AVIA изменен порядок разметки геометрической фигурой «Многоугольник». Его удобно использовать для разметки нестандартных фактов, например, личных подписей в паспортах. Ранее он создавался с помощью опорных точек, каждую из которых нужно было проставлять отдельно. Теперь для рисования многоугольника и произвольной фигуры достаточно безотрывно обвести область разметки.
Оптимизация этапов обработки:
- Устранены зависания при обработке документов, в которых больше 100 страниц. Чтобы процесс не прерывался на многостраничных документах, добавлен параметр, в котором задается лимит на количество страниц. При его превышении обработка документа завершится, но без извлечения текстового слоя, классификации и извлечения фактов. В прикладную систему такой документ попадает как простой. Верификатору придется вручную указать тип документа и заполнить поля его карточки фактами, но другие документы в очереди попадут на обработку быстрее.
- Появилась возможность отключить выравнивание ориентации страниц. Ранее механизм выравнивания мог некорректно поворачивать страницы в специфических документах. Например, в документах с чертежами, фотографиями или страницами с небольшим количеством текста. Теперь автоматическое выравнивание таких документов можно отключить в конфигурационном файле сервиса Directum Text Extractor Service.
Хранение данных:
- Пересмотрены требования к системе хранения данных. Теперь при расчете требуемой памяти учитывается среднее количество страниц в документе. Например, ранее для 5000 обрабатываемых документов требовалось 60 ГБ, а теперь – 120 ГБ = 5000 шт * 4 МБ * 2 стр * 3 дн. Объем, полученный по новой формуле, позволяет повысить качество распознавания текста при работе сервисов на базе Linux.
- Изменена логика, по которой сохраняются результаты обучения моделей. Ранее результаты могли пропасть, если после обучения сервис Directum Fact Extractor Learn Service не смог сразу подключиться к RabbitMQ. Теперь они сохранятся в кэше самого сервиса в течение периода, который задается в параметре worker_cache_lifetime. Таким образом, при восстановлении подключения к RabbitMQ не придется вновь запускать обучение.
***
Подробнее об этих и других новинках читайте в документе Изменения Directum Ario, а также в документации к сервисам.
Демодоступ - лучший способ лично протестировать обновленную версию Directum Ario. Обращайтесь к нашим менеджерам или заполняйте форму обратной связи для получения пробной версии или бесплатной консультации.
Вернуться к списку новостей
Заявка на бесплатный демо-доступ Directum Ario 2022.3