Что такое Umango?

umango

Это серверное решение для пакетной оцифровки, преобразования и маршрутизации документов. Результат обработки — файл популярного формата с текстом и графикой, который затем можно открыть, отредактировать привычным и удобным способом либо использовать как источник данных для бизнес-систем. Как такая система оптического распознавания помогает эффективно решать бизнес-задачи?

#1

Добро пожаловать!

queue

Регистрация нового постояльца отеля может быть довольно утомительной и отнимает время как у посетителя, так и у персонала. Данные паспорта вручную вносятся в базу данных, что само по себе дело небыстрое: все-таки информации достаточно много, ее нужно правильно внести в соответствующие поля ПО учета и регистрации посетителей, проверить, не допущены ли ошибки. Надо отсканировать и сам документ.

red-eyes

В ряде случаев посетителю нужно еще сперва дождаться своей очереди. То есть на каждого гостя тратится довольно приличное количество времени.

Через 15 минут

werevolf

Для уставшего с дороги человека даже несколько лишних минут ожидания — причина стресса и раздражения. И оно нередко выплескивается на персонал или замешкавшегося у стойки регистрации посетителя. Возникший конфликт еще больше замедляет весь процесс, в него вовлекаются другие ожидающие. Администратор вместо того, чтобы поскорее завершить обслуживание одного и переключиться на следующего в очереди, вынужден реагировать на недовольство. В такой нервной обстановке возрастает вероятность ошибок при внесении паспортных данных. В дальнейшем это может привести к другим конфликтным ситуациям.

Чем все закончится

dislike

В итоге страдает имидж отеля. Первые впечатления гостя — негативные, отель получает низкие оценки, плохие отзывы в интернете, теряет клиентов, которые запомнят не высокий уровень сервиса, а эти томительные минуты ожидания и скандал на ресепшене.

Что делать?

what_to_do

Между тем, весь этот процесс можно и нужно автоматизировать, и в этом нет ничего сложного: документ сканируется на любом МФУ, а дальше все происходит автоматически: изображение сохраняется в сетевой папке и обрабатывается системой оптического распознавания в соответствии с заданным сценанием. Формируется XML-документ, куда в удобном для дальнейшей машинной обработки виде вставляется извлеченный текст. Как только этот файл создан, данные из него считываются и заносятся в специальное ПО регистрации и учета посетителей. Все, задача решена.

Через 15 минут 30 секунд

doggy

Посетитель зарегистрирован, вся информация записана в соответствующие базы данных и дополнительно сохранена в виде файлов в персональной папке посетителя.

not_bad

Сколько времени все это может занять? Меньше минуты. Абсолютно точно, что никто не успеет соскучиться за стойкой регистрации и учинить скандал. Какова вероятность ошибки и неприятных последствий? Нулевая. Сколько рабочего времени персонала будет сэкономлено за день? В неделю? В месяц? Ответ очевиден. А какое впечатление такой технологичный и молниеносный check in произведет на вашего клиента? Самое благоприятное.

Преимущества

cool

Сканирование с зональным распознаванием — одна из наиболее простых и популярных задач, которые способна решать Umango, а паспорт — это как раз документ с заранее известным расположением элементов. То есть это не какой-то сложный кейс, требующий серьезных программно-аппаратных решений, значительных инвестиций, временных затрат и привлечения большого числа специалистов. Он не нарушит привычный ритм всех бизнес-процессов и очень быстро окупится.

Реализация

Как происходит внедрение такой технологии? Первый шаг — интервьюирование всех участников бизнес-процесса. Оно позволяет составить представление о том, как все устроено и какова будет архитектура решения. По своему смыслу это аналог аудита в сфере управляемых услуг печати: решаются те же задачи.

Техническая часть включает в себя демо-тестирование, собственно внедрение, настройку и последующий саппорт системы. Информационная поддержка предусматривает консультирование IT-специалистов и программу обучения персонала.

Сроки исполнения и стоимость

two_guys

Пилотный проект может быть полностью реализован в течение двух недель силами всего двух участников — одного инженера и одного представителя бизнеса. Стоимость проекта на один отель: 1000€ за лицензию и 700€ провайдеру решения за работу.

Что дальше?

smith

В дальнейшем готовое технологическое решение может быть масштабировано на всю сеть отелей. Собственно, это реальный кейс и заказчик намерен именно так и поступить. Бюджет — 10 000€.

#2

Это нереально

mcconaughey

Необходимость оцифровки больших объемов документации с последующим формированием упорядоченного электронного архива — это, пожалуй, одно из главных препятствий на пути к преимуществам электронного документооборота. В некоторых случаях даже сама мысль о таких сложных и масштабных мероприятиях способна повергнуть в уныние кого угодно, особенно руководителя компании. Но на самом деле не так страшен черт, как его малюют.

Думаете, у вас все плохо?

wonka

На реальном примере компании-поставщика электроэнергии мы покажем, как с помощью Umango можно комфортно и быстро организовать все эти процессы даже на предприятии, где в каждом из 6 региональных подразделений ежечасно сканируется примерно 2000 страниц, а за месяц таких документов создается порядка 2.5 млн! И при этом все они важны, нужны и подлежат дальнейшему учету и хранению.

No problem

no_problem

Несмотря на такие пугающие масштабы, с точки зрения технической реализации процесс преобразования документов в электронный формат в данном случае предельно прост, незатейлив и даже несколько скучен — это обычная оцифровка без зонального распознавания с последующей конвертацией в PDF. То есть речь идет о базовом функционале, который доступен с лицензией Essentials, как и возможность автоматически формировать и наполнять готовыми файлами многоуровневые каталоги.

soprano

Таким образом, даже самое недорогое решение Umango способно в полном объеме удовлетворять наиболее приоритетные потребности заказчика, который намеревается перейти к электронному документообороту.

Г - гибкость

Интервьюирование показало, что стандартная архитектура решения на основе одного центрального сервера в данном случае не сможет обеспечить надлежащее удобство, скорость обработки и каталогизации такого количества документов, поэтому все структурные подразделения компании получили собственный сервер. Каждый такой сервер способен параллельно обрабатывать 4 различных источника документов.

Таким образом была решена еще одна важная задача проекта — оперативность пополнения электронного архива: так, например, было критически важно, чтобы платежные документы клиентов-физлиц сразу же после сканирования были доступны в центральном офисе.

Сделаем это по-быстрому

flash

Проект был реализован за три месяца при участии двух инженеров и четырех представителей предприятия. При этом большую часть времени заняли закупочные процедуры, подготовка серверов на стороне провайдера решения и настройка маршрутизации. Поэтому никаких неудобств, связанных с трудным и длительным переходом на новую бизнес-модель, не было.

Понравилось

yakubovich

Заказчик оценил простоту, удобство и экономические выгоды решения, убедился в его эффективности, намерен расширить проект и готов инвестировать в него 100 000€. В частности, особый интерес вызывает зональное распознавание и те многообещающие перспективы, которые открываются с внедрением этой технологии.

#3

Смеркалось

dicaprio

Конец рабочего дня. Исполнив свой офисный долг, работники компании N коротко прощаются с засидевшимися коллегами и энергично покидают офис, устремляясь к свободе, отдыху, ужину, семье и т.д. Один за другим отделы пустеют и погружаются в сумрак до следующего утра. Стихают разговоры, телефонные звонки, никто больше не стучит печатями по документам.

corridor

Становится так тихо, что слышно, как где-то дальше по коридору в одном из отделов работает сканер, доносятся какие-то странные звуки. Свет горит. Что там происходит-то?

Тлен…

samson

А тааам… вручную сканируются кипы исходящих документов. Соревнуясь в усердии с МФУ, кто-то продолжает трудиться и подкармливает послушный аппарат листами бумаги, которых за день набралось около 500.

terminator

МФУ хоть в целом и молодец, но, к сожалению, не понимает, где у документа верх, где низ, а где оборотная сторона; где кончается один документ и начинается другой, а где просто пустой лист бумаги. И поэтому к нему приставлен его личный помощник-человек. Тандем человека и машины.

…и безысходность

hopelessness

Это унылое полотно окрашивается в совсем уж траурные тона, если иметь ввиду, что файлы сканов затем еще предстоит рассортировать по множеству папок, подпапок и, возможно, даже подподпапок. Тоже вручную, разумеется. 500 штук.

И тут уж будьте уверены, что рано или поздно какой-нибудь файлик окажется не в той папке-подпапке, где ему положено быть. То есть на горизонте маячит уже вторая часть этого Марлезонского балета, где наступают какие-то драматические последствия, все силы отдела брошены на поиск пропавшего документа, тучи сгущаются и т.д. Для краткости мы не будем ее здесь в красках живописать.

deadwood

Вот такую мрачную картину еще совсем недавно можно было наблюдать у одного дистрибьютора алкогольной продукции. А потом руководству компании все это окончательно надоело и было принято мудрое решение все-таки потратить 4000€ на систему оптического распознавания Umango, чтобы наконец занять своего сотрудника чем-то более подобающим его интеллектуальным возможностям.

Но как?!

watson

Как сделать так, чтобы все было как надо? Чтобы засунул всю стопку документов в сканер без предварительной сортировки и утомительного раскладывания по разновидностям, переворачивания лицевой стороной и вот этого вот всего, и получил на выходе упорядоченный и структурированный электронный архив. И легкомысленно пошел домой ровно в 19:00, как все нормальные люди.

Рецепт успеха

recipe

Нужно добавить QR-код на каждый документ. А всю остальную работу выполнит Umango. Она поймет, как ориентирован документ, где, когда и кем он был создан, какая информация в нем содержится, где он начинается и заканчивается, как его правильно назвать, и, наконец, куда его нужно отнести и положить. Бережно и аккуратно — счет-фактурка к счет-фактурке, накладная к накладной… и чтобы документик в папочке, папочка в подпапочке, красиво, единообразно, без нелепых опечаток — все как шеф любит. То есть, как видите, при таком сценарии вторая часть Марлезонского балета — та, где документ пропал и все плохо, просто не состоится.

Кстати

leon

С технической точки зрения речь идет о самом простом типе зонального распознавания, Umango способна решать и куда более замысловатые задачки.

Весь проект был реализован за 4 месяца, 3 из которых заняло внедрение заказчиком QR-кодов в своей системе электронного документооборота, месяц потребовался на обкатку решения от Umango. В нем приняли непосредственное участие один инженер и два человека со стороны заказчика. В данном случае на три источника сканов понадобилась всего одна лицензия Professional.

#4

Усложним задачу

boardwalk_empire

А здесь у нас еще один дистрибьютор алкоголя, но у него все несколько сложнее и интереснее. Да и сам он заметно крупнее своего коллеги из предыдущего кейса: в день сканируется уже не 500, а 5000 документов. Процесс автоматизирован, используется решение от ABBYY и система электронного документооборота от отечественного разработчика.

Матчасть

bastrikin

Общий принцип работы вам уже знаком по первому кейсу. Давайте освежим эти знания: документ сканируется, изображение попадает в сетевую папку, где анализируется системой оптического распознавания. Результат в виде файла (в данном случае в формате XML, удобном для машинной обработки) сохраняется в другую папку и служит источником данных для других программ, в частности, для СЭД, которая считывает информацию из этих файлов и дальше может как-то оперировать ей, например, занести в БД.

То есть OCR должна:

А в чем соль?

salt

Главное отличие четвертого кейса от предыдущих заключается в особенностях технической реализации первого этапа работы системы оптического распознавания. Это уже не чтение нескольких строк с разворота паспорта, как в первом случае — здесь анализируются пространные многостраничные счета-фактуры и товарные накладные по форме Торг-12, которые могут содержать очень большое количество информации. И не все эти данные представляют интерес.

simpsons_already_did_it

«А вроде это уже было, — скажете вы. Ну как же, вот, второй кейс, там же то же самое — большие документы, счет-фактуры и вот это все». Нет, это другое. Во втором кейсе результаты не использовались для дальнейшей машинной обработки: на выходе мы получали структурированный электронный архив, состоящий из обычных PDF-файлов. Зональное распознавание в этом случае не требуется.

gold

Поэтому четвертый кейс — это такая усложненная комбинированная версия первых двух. Сложность главным образом заключается в том, чтобы из всего этого объемного массива данных извлечь только конкретную целевую информацию. Для решения этой задачи применяется смарт-поиск по ключевым словам и сочетаниям символов на основе регулярных выражений.

Регулярно выражаясь

explicit

Регулярные выражения — это такой шаблон с помощью которого можно определить местоположение искомых данных на странице. По сути, это инструкция для программы, содержащая правила поиска. Применительно к нашему кейсу это может быть нечто вроде «ищи вот такие слова / словосочетания / символы / комбинацию символов, прочти данные, следующие за ними, но не все, а только те, что предшествуют вот этим словам / символам / их комбинациям». Это мощный инструмент поиска и трансформации данных, широко применяемый в программировании.

Мультипаспорт

multipassport

Поскольку информации много, а нужные сведения располагаются в разных частях документа или даже на разных его страницах, требуется мультизональное распознавание. Сначала определяются области, где содержатся искомые данные и для каждой такой зоны прописываются свои правила поиска. Сложность состоит в том, чтобы написать универсальные и безошибочные правила для каждой области. Требуется многократное тестирование и оценка результата.

Дорогая Эбби…

dear_abby

И все эти задачи уже успешно решает продукт от ABBYY, который стоит у заказчика. «Так причем здесь Umango?» – спросите вы.

ABBYY дорогая. И по сравнению с Umango она не просто несколько дороговата, она дороже в разы. И чем больший объем документов обрабатывается, тем более внушительна эта разница. Она может быть и пяти-, и даже десятикратной. Кроме того, за ABBYY нужно платить постоянно.

…прости, но мы должны расстаться

tom_cruise

Umango делает все то же самое, не ждет от вас очередного ежегодного взноса и позволяет обрабатывать неограниченное количество документов в месяц. При этом Umango — это серверное решение, а значит установка лицензии для каждого конечного пользователя не нужна.

wow

В данном случае альтернативное решение на Umango обойдется заказчику всего 12 000€. За три года экономия от перехода на Umango составит более 35 000€. Неплохо, правда?

Это незавершенный кейс, проект предполагается реализовать за 4 месяца. Непосредственные участники — один инженер, один программист, два специалиста со стороны заказчика.

Так что же такое Umango?

sensei

Umango — это простое, удобное, доступное и гибкое решение, которое при минимальных затратах способно значительно повысить эффективность ключевых бизнес-процессов в вашей компании.