产品资讯PRODUCT PAPERS

长微博图片云端ocr识别——特殊图片ocr鼻祖

 

        2015年北京文通科技公司出品的长微博图片识别技术备受瞩目,人民网、方正舆情、军犬舆情等做大数据分析的公司都很关心这个程序什么时候可以推向市场,其实这个技术一直在做优化,并已经在众多国家政府机关单位里秘密集成运行,只是不为大多数人所知,他们主要的用途是帮助机关单位了解大众都在追什么热点、了解什么政治方面的焦点、了解什么经济时事。

        下图中,我们可以看到三个识别样例,左侧都是常规的长微博图片;在右侧是图片内容的识别结果;在左侧的缩略图中我们虽然看不清具体的内容,但是可以看到密密麻麻的彩色图片背景上都被定位出了文字的位置。

来,我们看看下面这两张局部放大的图!

        这个图片里面我们不难看出左侧的文字都有黑色的噪点干扰,这种干扰对于大多数传统的ocr技术是致命伤,是很难抓取到里面的文字信息的。而上图中右侧的识别结果,基本上都正确。所以这个技术就目前来讲是非常有意义的。在过去这种类型的干扰图片都是信息抓取的盲点,是一种信息孤岛,因为大部分的数据分析抓取程序都是将他们过滤掉的,这些信息就被人们看完之后就丢失掉了。

        值得高兴的是,这个功能也是会有“公有云”和“私有云”两个版本,“公有云”是免费测试使用的!私有云的长微博云ocr识别功能有windows、Linux两个系统版本,无论用户使用何种方式进行挂接集成都可以达到很好的使用效果!

 

技术支持:

        联系:任先生
        电话:150 1037 2383
        邮箱:renfy@wintone.com.cn

2016年4月8日