Мобильное приложение для распознавания счетов-фактур

Приложение разработано для платформ Android и iOS. Используя камеру и технологию оптического распознавания символов, оно преобразует информацию из счетов-фактур в цифровой формат.
Каждый выставленный счет содержит данные, важные для различных приложений бухгалтерского учета, планирования ресурсов и бизнес-аналитики.


Сегодня счета-фактуры приходят в цифровых форматах, таких как файлы PDF или отсканированные изображения. Чтобы получить данные цифровых счетов-фактур и оптимизировать рабочий процесс, компании используют автоматизированное программное обеспечение для обработки счетов.


Такое ПО берет на вооружение технологии машинного обучения, в частности, оптическое распознавание символов (OCR) для определения и извлечения полей данных из документа.

Запрос

Компании-поставщику решений для розничной торговли требовалось мобильное приложение, которое могло бы распознавать и извлекать данные счетов из PDF-файлов или изображений и передавать их в финансовые программы или корпоративные приложения.


Компания искала подрядчика с опытом разработок в области машинного обучения и искусственного интеллекта.

Решение

Наша разработка должна была извлекать не только метаданные, такие как дата, номер и сумма счета-фактуры, но также позиции или их описание, включенные в счет.

Мы рассматривали два варианта реализации технологии OCR - интеграцию Google Vision API либо использование библиотеки Tesseract.

Использование платформы Google Vision API представлялось, без сомнения, лучшим выбором, но со временем ее использование могло стать довольно затратным для заказчика.

Tesseract же является бесплатной библиотекой с открытым исходным кодом. Мы выбрали Tesseract, так как у нас был положительный опыт работы с этой библиотекой и мы хотели минимизировать стоимость владения приложением для нашего клиента.

Самой сложной задачей было обучение библиотеки для того, чтобы добиться высокой точности распознавания.
Специалист KEDR Solutions в процессе тестирования приложения на различных мобильных устройствах
Выполненные работы

  • Предварительная обработка изображений – очистка от шумов и артефактов, повышение контрастности
  • Интеграция библиотеки Tesseract
  • Анализ результатов
  • Обучение библиотеки с использованием более 10 000 бумажных счетов и документов
      Использованные технологии
      • Для взаимодействия между мобильными приложениями и облаком применялся архитектурный стиль интерфейса REST API.
      • Библиотека OpenCV использовалась для предварительной обработки изображений - устранения перекосов, удаления артефактов сканирования и шума, а также для бинаризации.
      • Для применения технологии OCR была выбрана библиотека Tesseract.
      • Приложение под Android было разработано на языке Java.
      • Приложение под iOS было разработано на языке Objective-C.

      Итоги

      Команда КЕДР Solutions разработала мобильные приложения, использующие технологию оптического распознавания символов, для платформ Android и iOS.

      С помощью камеры приложение считывает информацию из товарных чеков и счетов-фактур поставщиков - например, сведения о товарных позициях и их стоимости - и преобразует эти данные в пригодный для использования формат.

      Это позволяет оптимизировать работу с кипами бумажных счетов.
      Счет-фактура в бумажном варианте и его данные в мобильном приложении
      Инвойс в бумажном варианте и его данные в приложении
      Точность извлечения данных:
      90%

      Документы для обучения:
      10,000