Машиночитаемый документ
- Машиночитаемый документ
-
«…2.3.3.1. Под машиночитаемым документом понимается документ, пригодный для автоматического считывания содержащейся в нем информации…»
Источник:
«Государственная система документационного обеспечения управления. Основные положения. Общие требования к документам и службам документационного обеспечения» (одобрена коллегией Главархива СССР от 27.04.1988, Приказ Главархива СССР от 23.05.1988 N 33) (вместе с «Правилами заполнения основных реквизитов регистрационно-контрольных форм (РКФ)», «Примерным положением о службе документационного обеспечения управления»)
Официальная терминология.
.
2012.
Смотреть что такое «Машиночитаемый документ» в других словарях:
-
МАШИНОЧИТАЕМЫЙ ДОКУМЕНТ — согласно параграфу 2.3.3.1 ГСДОУ, – документ, пригодный для автоматического считывания содержащейся в нем информации … Делопроизводство и архивное дело в терминах и определениях
-
машиночитаемый текст — делопр. документ, использование которого требует применения специально предназначенных технических средств … Краткий словарь терминов из области делопроизводства
-
Система автоматизации документооборота — Для улучшения этой статьи желательно?: Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное. Система ав … Википедия
-
СЭД — Система автоматизации документооборота, система электронного документооборота организационно техническая система, обеспечивающая процесс создания, управления доступом и распространения электронных документов в компьютерных сетях, а также… … Википедия
-
Электронный документооборот — Система автоматизации документооборота, система электронного документооборота организационно техническая система, обеспечивающая процесс создания, управления доступом и распространения электронных документов в компьютерных сетях, а также… … Википедия
-
Электронная — 8. Электронная вычислительная машина ЭВМ Electronic computer Вычислительная машина, основные функциональные устройства которой выполнены на электронных компонентах Источник: ГОСТ 15971 90: Системы обработки информации. Термины и определения ориги … Словарь-справочник терминов нормативно-технической документации
-
электронная копия — 4.15 электронная копия (electronic copy): Компьютерный диск или другой машиночитаемый носитель информации, содержащий файл или файлы, с которого(ых) может быть распечатан документ. Источник: ГОСТ Р ИСО/МЭК 15910 2002: Информационн … Словарь-справочник терминов нормативно-технической документации
-
ГОСТ 7.76-96: Система стандартов по информации, библиотечному и издательскому делу. Комплектование фонда документов. Библиографирование. Каталогизация. Термины и определения — Терминология ГОСТ 7.76 96: Система стандартов по информации, библиотечному и издательскому делу. Комплектование фонда документов. Библиографирование. Каталогизация. Термины и определения оригинал документа: 7.2.16 автор: Лицо, создавшее… … Словарь-справочник терминов нормативно-технической документации
-
ГОСТ Р ИСО/МЭК 15910-2002: Информационная технология. Процесс создания документации пользователя программного средства — Терминология ГОСТ Р ИСО/МЭК 15910 2002: Информационная технология. Процесс создания документации пользователя программного средства оригинал документа: 4.16 n штрих (en dash): Штрих, имеющий такую же ширину, как и строчная буква «n». Определения… … Словарь-справочник терминов нормативно-технической документации
-
Р 50.1.048-2004: Информационно-телекоммуникационные игровые системы. Термины и определения — Терминология Р 50.1.048 2004: Информационно телекоммуникационные игровые системы. Термины и определения: 2.3.25 адаптивное сопровождение: Изменение программного продукта после поставки, обеспечивающее его работоспособное состояние в измененных… … Словарь-справочник терминов нормативно-технической документации
Smart Document Engine
— российская система автоматического анализа и распознавания документов для десктопных, серверных и мобильных платформ.
Smart Document Engine – это программный инструмент для бизнеса и разработчиков, обеспечивающий высокоточное и высокоскоростное распознавание текстовых и иных данных первичных, деловых, уставных, бухгалтерских, налоговых, нотариальных, юридических, страховых и банковских документов, а также типовых анкет и форм строгой отчетности.
Наукоемкая технология оптического распознавания символов GreenOCR®, разработанная нашими учеными, позволяет точно распознавать текст любых документов на более чем 100 языках, включая кириллицу, латиницу, арабский, персидский, урду, японский, китайский, корейский и другие. GreenOCR® обеспечивает высокую точность распознавания печатного текста (OCR), рукопечатного и рукописного заполнения полей (ICR), а также распознавание меток и чекбоксов (OMR). Смотреть спецификацию
При использовании Smart Document Engine НЕ требуется выполнять дополнительных действий, связанных с получением согласия субъекта на обработку его персональных данных (юридическое заключение).
Легкая интеграция без нарушения привычных процессов
Smart Document Engine является уникальным инструментом, позволяющими гибко интегрировать распознавание документов в текущую деятельность компании. Программа легко и удобно встраивается в уже существующие бизнес-процессы, не нарушая привычного опыта использования. Решение доступно для интеграции с различными информационными системами, например, ECM, CRM, RPA, 1С, АБС и т.д.
Скорость
Оригинальный целочисленный конвейер обработки изображений, включающий 8- и 4-битные глубокие нейросетевые архитектуры, позволяет использовать интеллектуальное распознавание документов даже на бюджетных телефонах за счет максимального использования имеющихся аппаратных ресурсов.
Точность
Мы создали новое поколение технологий OCR, преодолевшее рубеж качества традиционных подходов за счет использования наших последних достижений в вычислительном интеллекте и глубоком обучении. Точность распознавания реквизитов документов доходит до 99.5% без участия человека.
Производительность
Высочайшая производительность достигается за счет комбинирования алгоритмов компьютерного зрения и глубокого обучения компактных нейронных сетей. Полный цикл от определения типа до распознавания всех реквизитов занимает от 2 секунд для страницы документа формата А4. Демо-версия доступна для загрузок.
Удобство
Наши передовые алгоритмы сами обнаруживают документ на кадре, автоматически определяют тип документа, находят реквизиты и распознают их. Система устойчива к различным геометрическим искажениям, шумам, перепадам освещения, дефектам печати и низкому разрешению. Загрузите демо-версию продукта и проверьте удобство технологии
Поддержка Российских платформ
Smart Document Engine — первая система распознавания документов которая нативно (без эмуляции) поддерживает Российские аппаратные платформы “Эльбрус”, “КОМДИВ” и “Байкал”, что позволяет использовать продукт в зонах максимальной ответственности и защищенности. Система Smart Document Engine обеспечивает беспрецедентный уровень безопасности обработки данных и защиту от санкционных рисков.
Многоплатформеность
Smart Document Engine поддерживает широкий класс операционных систем, включая специализированные операционные системы, предназначенные для работы с персональными данными: ОС Эльбрус, РЕД ОС, ОС Атликс, Astra Linux, Cent OS, Ubuntu, Red Hat Enterprise Linux, SUSE Linux Enterprise Server, Arch Linux и другие дистрибутивы Linux, MS Windows, macOS, ОС Аврора, iOS, Android, Sailfish Mobile OS.
Как поставляется данное программное обеспечение
С помощью Smart Document Engine SDK вы сможете добавить функциональность глубокого анализа и распознавания документов как в ваши инфраструктурные решения для автоматизации back office, так и в мобильные приложения, для максимального упрощения удаленного автоматического ввода документов.
Программа Smart Document Engine поставляется в виде автономного SDK (software development kit), содержащего все необходимые прекомпилированные библиотеки, документацию программного интерфейса и примеры интеграции для различных языков программирования. Для разработчиков подготовлен простой, но многофункциональный API (application programming interface), который позволяет внедрить распознавание документов в решения с использованием языков C++, C#, Java, Python и Objective-C для широкого круга операционных систем: iOS, Android, Linux, Windows, MacOS, в том числе Sailfish Mobile, МОС “Аврора”, ОС Эльбрус, РЕД ОС, Astra Linux, и другие. Обеспечивается поддержка следующих аппаратных платформ: x86_64, ARM v7, v8 (Aarch32, Aarch64), MIPS, Эльбрус. Имеется возможность настройки и подключения к популярным фреймворкам RPA и продуктам 1С по запросу.
Документы, распознаваемые “из коробки” включают в себя свидетельство о постановке на налоговый учет гражданина РФ (ИНН), справка о доходах физического лица установленного образца (ранее 2-НДФЛ), платежное поручение (форма 0401060), бухгалтерский баланс (форма 0710001), отчет о финансовых результатах (форма 0710002), заявления на выдачу загранпаспорта, форма АДИ-РЕГ, титульный лист устава, сертификат самозанятого, выписка ЕГРЮЛ, товарная накладная (ТОРГ-12), форма УПД, счет-фактура и другая первичка.
Наши клиенты
Тинькофф Банк
Smart Engines поставляет мобильные и серверные решения по распознаванию документов Тинькофф Банку
Альфа-Банк
Альфа-Банк распознает документы клиентов в мобильном приложении с помощью Smart ID Engine
Банк «Открытие»
Банк «Открытие» увеличит продажи кредитных продуктов за счет внедрения технологии распознавания документов Smart Engines на сайте
Газпромбанк
Газпромбанк внедрил решение Smart Engines на основе искусственного интеллекта для распознавания QR-кодов
Результат есть, а как оно там распознаётся, никто и не представляет. Решили на пальцах, паспорте и алгоритмах Dbrain рассказать, как происходит волшебство. Хотя «Вжух» нам тоже нравится.
В месяц мы распознаем более 500 тыс. паспортов для разных клиентов и их нужд. Банки хотят знать кому дают кредит или оформляют счёт. Крупным компаниям нужно быстро нанимать новых сотрудников.
Dbrain тот самый пластырь, шоколадное мороженое или таблетка, которая снимает боль с процессов, связанных с извлечением данных. Нашим клиентам достаточно запросить у человека скан или фотографию документа, дальше за работу возьмутся нейросети. За секунды они распознают тип документа, выравнивают его, находят поля и преобразуют изображение в цифровую информацию.
Ключ к успеху: ИИ + люди
Мы уже писали, что искусственный интеллект хорошо и быстро учится, если у него есть обратная связь от людей. Алгоритмы Dbrain верно распознают до 92% всех документов. Часто этой точности хватает. Но когда нужен максимум, алгоритмам помогают верификаторы, тогда точность приближается к 100%, а у сетей появляется возможность обучаться на своих ошибках.
Мы используем технологию human-in-the-loop для исправления ошибок ИИ. Это достаточно сложный механизм, где алгоритму необходимо определить, что он мог ошибиться, передать ответ на людей, а после взять эти данные и использовать в дообучении. Мы часто используем для этой задачи людей из публичной платформы Яндекс.Толока, а значит, нам важно не передать туда никаких персональных данных. В целом, интересная задача.
Алексей Хахунов
Этапы и алгоритмы
1. Классификация документа
На входе: документ с любым количеством страниц
Внутри происходит несколько процессов:
- Сначала изображение считывается.
- Дальше детектор ищет и выделяет на входящем изображении области, похожие на документы и вырезает их. Каждой области присваивает тип: главный разворот паспорта России, водительское удостоверение образца 2011 года, СНИЛС и так далее. И если на фото одновременно сняты паспорт, водительское удостоверение и СНИЛС, система вырежет три отдельных картинки и распознает каждую.
- Отдельная «голова» алгоритма отвечает за определение угла поворота отзеркаливания, чтобы на выходе отдать ровный, правильно ориентированный документ.
На выходе: массив изображений разделенных по типам документов с восстановленной ориентацией
2. Поиск структуры: полей, таблиц, печатей и подписей
На входе: кроп документа и его тип
Fieldnet — сервис, объединяющий в себе набор однотипных нейросетей, способных определять структуру документа: поля, специальные отметки, таблицы и тд. Он предсказывает пиксельные маски на полях документа, ориентируясь на окружающий контекст в документе. Здесь одно из важных отличий от подхода с использованием шаблонов — даже если поле перемещается в разных версиях документа, алгоритм его найдет.
Например, в паспорте отдельно вырезаются фамилия, место рождения, серия, номер и остальные поля. Сетка долго тренировалась, и она точно знает, что у документа в определённых местах должна быть такая-то информация. Поэтому она ищет на документе не просто текст, а информацию вот в этом уголочке, потому что тут обычно имя человека. После этого она вырезает каждое из полей с изображения. Получаются прямоугольные маски полей, которые идут дальше.
На выходе: вырезанные поля
3. Все виды OCR
На входе: кропы полей
Наша гордость — OCR. Это движки для перевода изображений в машиночитаемый язык. На визуале показали только 3, на самом деле их больше 10. Одни умеют читать слова просто по символам, другие знают много информации про язык и могут исправить ошибки людей, а последние и вовсе читают текст целыми строками.
В 2022 году у нас появился алгоритм, который способен читать рукописный текст на русском языке с качеством, близким к печатному.
На выходе: машиночитаемый текст
4. Сервисы антифрода
На входе: все данные от предыдущих алгоритмов и само изображение
Проверка источника изображения, наличие фотошопа, распознавание лиц и базы данных. Почему этот этап важен, писали здесь.
А вот несколько примеров того, что сеть пометит как отредактированный документ:
- Текст набран поверх «пустой» картинки паспорта и шрифт не совпадает с оригиналом.
- Шумы части изображения не совпадают с шумами самого изображения. Например, на фото, сделанное на один тип камеры наложили кусок с фото, сделанного на другую камеру.
- Не совпадает степень jpeg сжатия части изображения. Аналогично, когда вставляют части из другого изображения, количество и степень jpeg-сжатий может отличаться от того изображения, куда вставляют.
- На изображении виден сплайсинг — это когда, например, цифру из серии поменяли на цифру из номера паспорта.
На выходе: вероятность подделки документа
5. Верификаторы
На входе: кропы полей + названия документов и полей
Дополнительный модуль верификации результатов распознавания и ручного ввода сложных случаев. Доступен как в облачной, так и в локальной версии. В качестве платформы разметки используется Яндекс.Толока.
На выходе: содержимое полей документов + ответ консенсуса
Вот так на самом деле выглядит распознавание документов в Dbrain, которое вы получаете за несколько секунд. А теперь ещё два важных пункта: скорость — за сколько алгоритмы справляются с паспортом и безопасность — где хранятся данные, которые вытащили нейросети.
Скорость распознавания
Никто не любит ждать. Клиенты компаний, когда загружают документы. Компании, когда поток клиентов огромный, а обработка документов занимает по 10 минут.
Хуже медленного распознавания может быть только медленное и неточное распознавание. Легко представить себе ситуацию, когда клиент ждет 15 минут подтверждения кредита на технику в магазине, а потом получает отказ из-за того, что система не распознала фамилию из-за блика на фото или не справилась с почерком в поле с адресом регистрации.
Наши сервисы справлялись с документами за 3 секунды, но в 2023 все поменялось, и время уменьшилось до 300 мс, про это мы расскажем позже.
Безопасность
По правилам безопасности, банки и другие финансовые организации не могут передавать данные клиентов третьим лицам и сторонним сервисам. Это значит, что любое решение для распознавания должно быть интегрировано в контур банка и располагаться на внутренних серверах.
Мы написали нашу платформу с нуля, не используем открытое программное обеспечение или сторонние решения. Поэтому нас удобно и быстро можно интегрировать в сервисы финансовых компаний.
Кроме того, мы не сохраняем изображения документов на устройстве, оно сразу отправляется на сервер банка. Благодаря этому, банки могут спокойно доставлять карты: курьер никому не передаст фотографии клиентских паспортов — у него их просто нет.
А что по кейсам
Решили, что текста и так много получилось, поэтому кейсы клиентов опишем в следующей статье. Спасибо за ваше время и внимание