Мировая премьера от Cognitive Technologies

25 июля 2012 года компания Cognitive Technologies представила новый продукт для сканирования, сжатия и отправки документов по электронной почте – Compressimo. За прошедшие двенадцать лет с момента выпуска системы распознавания CuneiForm, это второй программный продукт компании, предназначенный для массового пользователя.

Первое впечатление от работы Compressimo - волшебство: в сканер закладывается старый документ, залитый кофе и забрызганный чернилами, а на экране компьютера появляется чистый текст, распознанный без единой ошибки, а сам документ выглядит, как новый. И это еще не все. Размер файла такого документа очень компактен, что удобно как для его архивирования, так и для пересылки по электронной почте, при этом изображение сохраняет высокое качество, лучше, чем на бумажном аналоге.

По словам разработчиков, такой результат достигается благодаря использованию новых алгоритмов анализа и обработки изображений. То есть в Compressimo реализована идея возможности выделения на изображении документа его структурных компонентов: текста, иллюстраций, графики, декоративных  элементов. Каждый такой компонент – слой – с помощью соответствующего алгоритма сжимается, становясь более компактным без потери информации. При этом текст на изображении распознается и «запоминается» для того, чтобы в дальнейшем была возможность выполнять поиск и обработку информации. Анализ цветовой насыщенности документа аналогичен тому, как это делает человек, а не машина. То есть, распознавание построено по биологической модели. Каждый цвет – это отдельный слой. Подготовленные слои затем совмещаются, в результате чего получается «читабельный документ» - одностраничный или многостраничный файл в формате PDF/A, с которым удобно и просто производить любые необходимые действия.

В новом продукте реализован некий аналог экспертной системы, которая умеет «понимать» тип и структуру документа и автоматически подбирает наиболее подходящий режим обработки. Изображение автоматически разделяется на слои после удаления искажений и помех. Оптимальный для каждого слоя алгоритм сжатия система выбирает самостоятельно. В Compressimo предусмотрена возможность распознавания текста на 23-х языках при помощи встроенного и доработанного ядра OCR-системы CuneiForm.

По словам разработчиков, данная технология позволяет снизить объем оцифрованных документов в среднем до двадцати раз. Например, одна страница накладной ТОРГ-12 или счета-фактуры при сохранении в формате JPEG (разрешение 300 dpi, цветной режим сканирования, jpeg-компрессия отключена) будет иметь объем файла 2,42 МБ. Это среднее значение. На практике размер итогового файла зависит от марки и модели сканирующего устройства, а также от программного продукта, используемого при сканировании. Сжатие того же документа (накладная или счет-фактура) с помощью Compressimo даст файл объемом 96 Кб при аналогичном (в некоторых случаях лучшем) качестве результата.

Система Compressimo базируется на ключевой технологии Cognitive PDF/A, представленной Cognitive Technologies в апреле 2011 года. Разработчиками было затрачено на разработку этой технологии три года – около 45 тысяч человеко-часов. Технология Cognitive PDF/A уже год, как представлена и пользуется спросом на мировом рынке.

 Представители компании Cognitive Technologies отметили, что мировой рынок продуктов, подобных Compressimo, находится в стадии формировании. Президент Cognitive Technologies Ольга Ускова полагает, что в ближайшие два-три года объем этого рынка в мире может составить до 20 миллиардов долларов, а его российский сегмент – до 1 миллиарда долларов.

Правоту таких оценок подтверждает увеличивающаяся потребность хранения огромной массы  документов. В мире сегодня, в среднем, сканируется более трех триллионов страниц документов в год. Это количество продолжает расти даже при всех, используемых системах электронного документооборота.

До сих пор основными проблемами при работе с оцифрованными документами является их громоздкость, если качество оцифровки высокое, либо, наоборот, неважное качество, если документ является файлом меньшим «по весу». В первом случае быстро заполняется дисковое пространство, с громоздкими оцифрованными документами неудобно работать и дорого хранить, а при их передачи по сетям связи генерируется значительный трафик. Еще одна проблема - зачастую неудовлетворительное качество исходного изображения, которое получается в результате некачественной печати, попадания на документ капель чернил, следов маркера и т.д.

Преимущества нового продукта в том, что, во-первых, он прост в освоении и эксплуатации: все операции производятся нажатием двух-трех клавиш. Во-вторых, результирующий PDF/A документ, созданный в Compressimo, полностью соответствует стандарту ISO 19005-1:2005. Третье – цена, которая составляет 799 рублей за одно рабочее место. И, конечно, технологические новшества, о которых мы сказали выше.

Сейчас Compressimo можно скачать с сайта компании. За месяц, прошедший с начала выхода продукта на рынок, зафиксировано около двух тысяч скачиваний в сутки по миру. В России в сутки продукт скачивается 60-70 раз.

Компания Cognitive Technologies планирует на базе технологий, реализованных в продукте  Compressimo, разработать конвертацию в формат PDF/A с полнотекстовым распознаванием фотографий документов, сделанных на iPhone 4S.

Автор: Елена Шашенкова (info@mskit.ru)

Рубрики: Интеграция, ПО, Web

Ключевые слова: лицензионное программное обеспечение, поставка программного обеспечения, программное обеспечение, программное обеспечение виды программного обеспечения, программное обеспечение продажа, разработка программного обеспечения, разработки , разработка программ, soft, программы soft, Cognitive

наверх
 
 
     

А знаете ли Вы что?

     
 

MSKIT.RU: последние новости Москвы и Центра

19.11.2020 Рынок онлайн-торговли нацелился на рекорды

17.11.2020 3 кита рынка смартфонов эпохи коронавируса

13.11.2020 ВТБ развивает онлайн

10.11.2020 Selectel запускает бесплатную защиту от DDoS-атак

30.10.2020 Опыт применения СЭД/ECM-решений ЭОС в условиях ковид-ограничений представлен на заседании комитета АПКИТ

30.10.2020 ПСС ГРАЙТЕК обсудила актуальные вопросы цифровизации на 100+ Forum Russia

29.10.2020 МТС привез ЦОД в Ленобласть

22.10.2020 Рынок СЭД: от спокойных лет к активной трансформации

NNIT.RU: последние новости Нижнего Новгорода

19.11.2020 Рынок онлайн-торговли нацелился на рекорды

17.11.2020 3 кита рынка смартфонов эпохи коронавируса

13.11.2020 ВТБ развивает онлайн

10.11.2020 Selectel запускает бесплатную защиту от DDoS-атак

30.10.2020 Опыт применения СЭД/ECM-решений ЭОС в условиях ковид-ограничений представлен на заседании комитета АПКИТ

30.10.2020 ПСС ГРАЙТЕК обсудила актуальные вопросы цифровизации на 100+ Forum Russia

29.10.2020 МТС привез ЦОД в Ленобласть

22.10.2020 Рынок СЭД: от спокойных лет к активной трансформации

ITSZ.RU: последние новости Петербурга

19.11.2020 Петербуржцы в онлайн-шопинге предпочитают локальные и зарубежные магазины

17.11.2020 3 кита рынка смартфонов эпохи коронавируса

13.11.2020 ВТБ развивает онлайн

10.11.2020 Selectel запускает бесплатную защиту от DDoS-атак

30.10.2020 Опыт применения СЭД/ECM-решений ЭОС в условиях ковид-ограничений представлен на заседании комитета АПКИТ

30.10.2020 ПСС ГРАЙТЕК обсудила актуальные вопросы цифровизации на 100+ Forum Russia

29.10.2020 МТС привез ЦОД в Ленобласть

22.10.2020 Рынок СЭД: от спокойных лет к активной трансформации