Это серверное решение для пакетной оцифровки, преобразования и маршрутизации документов. Результат обработки — файл популярного формата с текстом и графикой, который затем можно открыть, отредактировать привычным и удобным способом
либо использовать как источник данных для бизнес-систем. Как такая система оптического распознавания помогает эффективно решать бизнес-задачи?
#1
Добро пожаловать!
Регистрация нового постояльца отеля может быть довольно утомительной и отнимает время как у посетителя, так и у персонала. Данные паспорта вручную вносятся в базу данных, что само по себе дело небыстрое: все-таки информации
достаточно много, ее нужно правильно внести в соответствующие поля ПО учета и регистрации посетителей, проверить, не допущены ли ошибки. Надо отсканировать и сам документ.
В ряде случаев посетителю нужно еще сперва дождаться своей очереди. То есть на каждого гостя тратится довольно приличное количество времени.
Через 15 минут
Для уставшего с дороги человека даже несколько лишних минут ожидания — причина стресса и раздражения. И оно нередко выплескивается на персонал или замешкавшегося у стойки регистрации посетителя. Возникший конфликт еще больше замедляет
весь процесс, в него вовлекаются другие ожидающие. Администратор вместо того, чтобы поскорее завершить обслуживание одного и переключиться на следующего в очереди, вынужден реагировать на недовольство. В такой нервной обстановке
возрастает вероятность ошибок при внесении паспортных данных. В дальнейшем это может привести к другим конфликтным ситуациям.
Чем все закончится
В итоге страдает имидж отеля. Первые впечатления гостя — негативные, отель получает низкие оценки, плохие отзывы в интернете, теряет клиентов, которые запомнят не высокий уровень сервиса, а эти томительные минуты ожидания и скандал на
ресепшене.
Что делать?
Между тем, весь этот процесс можно и нужно автоматизировать, и в этом нет ничего сложного: документ сканируется на любом МФУ, а дальше все происходит автоматически: изображение сохраняется в сетевой папке и обрабатывается системой
оптического распознавания в соответствии с заданным сценанием. Формируется XML-документ, куда в удобном для дальнейшей машинной обработки виде вставляется извлеченный текст. Как только этот файл создан, данные из него считываются и
заносятся в специальное ПО регистрации и учета посетителей. Все, задача решена.
Через 15 минут 30 секунд
Посетитель зарегистрирован, вся информация записана в соответствующие базы данных и дополнительно сохранена в виде файлов в персональной папке посетителя.
Сколько времени все это может занять? Меньше минуты. Абсолютно точно, что никто не успеет соскучиться за стойкой регистрации и учинить скандал. Какова вероятность ошибки и неприятных последствий? Нулевая. Сколько рабочего времени
персонала будет сэкономлено за день? В неделю? В месяц? Ответ очевиден. А какое впечатление такой технологичный и молниеносный check in произведет на вашего клиента? Самое благоприятное.
Преимущества
Сканирование с зональным распознаванием — одна из наиболее простых и популярных задач, которые способна решать Umango, а паспорт — это как раз документ с заранее известным расположением элементов. То есть это не какой-то сложный кейс,
требующий серьезных программно-аппаратных решений, значительных инвестиций, временных затрат и привлечения большого числа специалистов. Он не нарушит привычный ритм всех бизнес-процессов и очень быстро окупится.
Реализация
Как происходит внедрение такой технологии? Первый шаг — интервьюирование всех участников бизнес-процесса. Оно позволяет составить представление о том, как все устроено и какова будет архитектура решения. По своему смыслу это
аналог аудита в сфере управляемых услуг печати: решаются те же задачи.
Техническая часть включает в себя демо-тестирование, собственно внедрение, настройку и последующий саппорт системы. Информационная поддержка предусматривает консультирование IT-специалистов и программу обучения персонала.
Сроки исполнения и стоимость
Пилотный проект может быть полностью реализован в течение двух недель силами всего двух участников — одного инженера и одного представителя бизнеса. Стоимость проекта на один отель: 1000€ за лицензию и 700€ провайдеру решения за
работу.
Что дальше?
В дальнейшем готовое технологическое решение может быть масштабировано на всю сеть отелей. Собственно, это реальный кейс и заказчик намерен именно так и поступить. Бюджет — 10 000€.
#2
Это нереально
Необходимость оцифровки больших объемов документации с последующим формированием упорядоченного электронного архива — это, пожалуй, одно из главных препятствий на пути к преимуществам электронного документооборота. В некоторых случаях
даже сама мысль о таких сложных и масштабных мероприятиях способна повергнуть в уныние кого угодно, особенно руководителя компании. Но на самом деле не так страшен черт, как его малюют.
Думаете, у вас все плохо?
На реальном примере компании-поставщика электроэнергии мы покажем, как с помощью Umango можно комфортно и быстро организовать все эти процессы даже на предприятии, где в каждом из 6 региональных подразделений ежечасно сканируется
примерно 2000 страниц, а за месяц таких документов создается порядка 2.5 млн! И при этом все они важны, нужны и подлежат дальнейшему учету и хранению.
No problem
Несмотря на такие пугающие масштабы, с точки зрения технической реализации процесс преобразования документов в электронный формат в данном случае предельно прост, незатейлив и даже несколько скучен — это обычная оцифровка без
зонального распознавания с последующей конвертацией в PDF. То есть речь идет о базовом функционале, который доступен с лицензией Essentials, как и возможность автоматически формировать и наполнять готовыми файлами многоуровневые
каталоги.
Таким образом, даже самое недорогое решение Umango способно в полном объеме удовлетворять наиболее приоритетные потребности заказчика, который намеревается перейти к электронному документообороту.
Г - гибкость
Интервьюирование показало, что стандартная архитектура решения на основе одного центрального сервера в данном случае не сможет обеспечить надлежащее удобство, скорость обработки и каталогизации такого количества документов, поэтому
все структурные подразделения компании получили собственный сервер. Каждый такой сервер способен параллельно обрабатывать 4 различных источника документов.
Таким образом была решена еще одна важная задача проекта — оперативность пополнения электронного архива: так, например, было критически важно, чтобы платежные документы клиентов-физлиц сразу же после сканирования были доступны в
центральном офисе.
Сделаем это по-быстрому
Проект был реализован за три месяца при участии двух инженеров и четырех представителей предприятия. При этом большую часть времени заняли закупочные процедуры, подготовка серверов на стороне провайдера решения и настройка
маршрутизации. Поэтому никаких неудобств, связанных с трудным и длительным переходом на новую бизнес-модель, не было.
Понравилось
Заказчик оценил простоту, удобство и экономические выгоды решения, убедился в его эффективности, намерен расширить проект и готов инвестировать в него 100 000€. В частности, особый интерес вызывает зональное распознавание и те
многообещающие перспективы, которые открываются с внедрением этой технологии.
#3
Смеркалось
Конец рабочего дня. Исполнив свой офисный долг, работники компании N коротко прощаются с засидевшимися коллегами и энергично покидают офис, устремляясь к свободе, отдыху, ужину, семье и т.д. Один за другим отделы пустеют и погружаются
в сумрак до следующего утра. Стихают разговоры, телефонные звонки, никто больше не стучит печатями по документам.
Становится так тихо, что слышно, как где-то дальше по коридору в одном из отделов работает сканер, доносятся какие-то странные звуки. Свет горит. Что там происходит-то?
Тлен…
А тааам… вручную сканируются кипы исходящих документов. Соревнуясь в усердии с МФУ, кто-то продолжает трудиться и подкармливает послушный аппарат листами бумаги, которых за день набралось около 500.
МФУ хоть в целом и молодец, но, к сожалению, не понимает, где у документа верх, где низ, а где оборотная сторона; где кончается один документ и начинается другой, а где просто пустой лист бумаги. И поэтому к нему приставлен его личный
помощник-человек. Тандем человека и машины.
…и безысходность
Это унылое полотно окрашивается в совсем уж траурные тона, если иметь ввиду, что файлы сканов затем еще предстоит рассортировать по множеству папок, подпапок и, возможно, даже подподпапок. Тоже вручную, разумеется. 500 штук.
И тут уж будьте уверены, что рано или поздно какой-нибудь файлик окажется не в той папке-подпапке, где ему положено быть. То есть на горизонте маячит уже вторая часть этого Марлезонского балета, где наступают какие-то драматические
последствия, все силы отдела брошены на поиск пропавшего документа, тучи сгущаются и т.д. Для краткости мы не будем ее здесь в красках живописать.
Вот такую мрачную картину еще совсем недавно можно было наблюдать у одного дистрибьютора алкогольной продукции. А потом руководству компании все это окончательно надоело и было принято мудрое решение все-таки потратить 4000€ на
систему оптического распознавания Umango, чтобы наконец занять своего сотрудника чем-то более подобающим его интеллектуальным возможностям.
Но как?!
Как сделать так, чтобы все было как надо? Чтобы засунул всю стопку документов в сканер без предварительной сортировки и утомительного раскладывания по разновидностям, переворачивания лицевой стороной и вот этого вот всего, и получил
на выходе упорядоченный и структурированный электронный архив. И легкомысленно пошел домой ровно в 19:00, как все нормальные люди.
Рецепт успеха
Нужно добавить QR-код на каждый документ. А всю остальную работу выполнит Umango. Она поймет, как ориентирован документ, где, когда и кем он был создан, какая информация в нем содержится, где он начинается и заканчивается, как его
правильно назвать, и, наконец, куда его нужно отнести и положить. Бережно и аккуратно — счет-фактурка к счет-фактурке, накладная к накладной… и чтобы документик в папочке, папочка в подпапочке, красиво, единообразно, без нелепых
опечаток — все как шеф любит. То есть, как видите, при таком сценарии вторая часть Марлезонского балета — та, где документ пропал и все плохо, просто не состоится.
Кстати
С технической точки зрения речь идет о самом простом типе зонального распознавания, Umango способна решать и куда более замысловатые задачки.
Весь проект был реализован за 4 месяца, 3 из которых заняло внедрение заказчиком QR-кодов в своей системе электронного документооборота, месяц потребовался на обкатку решения от Umango. В нем приняли непосредственное участие один
инженер и два человека со стороны заказчика. В данном случае на три источника сканов понадобилась всего одна лицензия Professional.
#4
Усложним задачу
А здесь у нас еще один дистрибьютор алкоголя, но у него все несколько сложнее и интереснее. Да и сам он заметно крупнее своего коллеги из предыдущего кейса: в день сканируется уже не 500, а 5000 документов. Процесс
автоматизирован, используется решение от ABBYY и система электронного документооборота от отечественного разработчика.
Матчасть
Общий принцип работы вам уже знаком по первому кейсу. Давайте освежим эти знания: документ сканируется, изображение попадает в сетевую папку, где анализируется системой оптического распознавания. Результат в виде файла (в данном
случае в формате XML, удобном для машинной обработки) сохраняется в другую папку и служит источником данных для других программ, в частности, для СЭД, которая считывает информацию из этих файлов и дальше может как-то оперировать ей,
например, занести в БД.
То есть OCR должна:
корректно распознать информацию,
конвертировать ее в электронный вид и затем
представить в подходящем для дальнейших задач формате.
А в чем соль?
Главное отличие четвертого кейса от предыдущих заключается в особенностях технической реализации первого этапа работы системы оптического распознавания. Это уже не чтение нескольких строк с разворота паспорта, как в первом случае —
здесь анализируются пространные многостраничные счета-фактуры и товарные накладные по форме Торг-12, которые могут содержать очень большое количество информации. И не все эти данные представляют интерес.
«А вроде это уже было, — скажете вы. Ну как же, вот, второй кейс, там же то же самое — большие документы, счет-фактуры и вот это все». Нет, это другое. Во втором кейсе результаты не использовались для дальнейшей машинной обработки: на
выходе мы получали структурированный электронный архив, состоящий из обычных PDF-файлов. Зональное распознавание в этом случае не требуется.
Поэтому четвертый кейс — это такая усложненная комбинированная версия первых двух. Сложность главным образом заключается в том, чтобы из всего этого объемного массива данных извлечь только конкретную целевую информацию. Для решения
этой задачи применяется смарт-поиск по ключевым словам и сочетаниям символов на основе регулярных выражений.
Регулярно выражаясь
Регулярные выражения — это такой шаблон с помощью которого можно определить местоположение искомых данных на странице. По сути, это инструкция для программы, содержащая правила поиска. Применительно к нашему кейсу это может быть нечто
вроде «ищи вот такие слова / словосочетания / символы / комбинацию символов, прочти данные, следующие за ними, но не все, а только те, что предшествуют вот этим словам / символам / их комбинациям». Это мощный инструмент поиска и
трансформации данных, широко применяемый в программировании.
Мультипаспорт
Поскольку информации много, а нужные сведения располагаются в разных частях документа или даже на разных его страницах, требуется мультизональное распознавание. Сначала определяются области, где содержатся искомые данные и для каждой
такой зоны прописываются свои правила поиска. Сложность состоит в том, чтобы написать универсальные и безошибочные правила для каждой области. Требуется многократное тестирование и оценка результата.
Дорогая Эбби…
И все эти задачи уже успешно решает продукт от ABBYY, который стоит у заказчика. «Так причем здесь Umango?» – спросите вы.
ABBYY дорогая. И по сравнению с Umango она не просто несколько дороговата, она дороже в разы. И чем больший объем документов обрабатывается, тем более внушительна эта разница. Она может быть и пяти-, и даже десятикратной. Кроме того,
за ABBYY нужно платить постоянно.
…прости, но мы должны расстаться
Umango делает все то же самое, не ждет от вас очередного ежегодного взноса и позволяет обрабатывать неограниченное количество документов в месяц. При этом Umango — это серверное решение, а значит установка лицензии для каждого
конечного пользователя не нужна.
В данном случае альтернативное решение на Umango обойдется заказчику всего 12 000€. За три года экономия от перехода на Umango составит более 35 000€. Неплохо, правда?
Это незавершенный кейс, проект предполагается реализовать за 4 месяца. Непосредственные участники — один инженер, один программист, два специалиста со стороны заказчика.
Так что же такое Umango?
Umango — это простое, удобное, доступное и гибкое решение, которое при минимальных затратах способно значительно повысить эффективность ключевых бизнес-процессов в вашей компании.