我的世界指令大全,黑白,北大荒-第十视角,围观中美贸易新动向

admin 3周前 ( 10-28 16:29 ) 0条评论
摘要: 晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI有时你遇到一篇古老的文献,PDF文档还是扫描版。又或者是遇到一幅网页版海报,上面的文字你完全看不懂。但你无法把图片中的文字...

晓查 发自 凹非寺

量车虫小宋电视剧全集子位 报导 | 大众号 QbitAI

有时你遇到一篇陈旧的文献,PDF文档仍是扫描版。又或许是遇到一幅网页版海报,上面的文字你彻底看不懂。

但你无法把图片中的文字仿制下来做进一步处理,是不是让人头大?

尽管商场上有许多OCR软件能够辨认图片中的文字,但仍是有种种局限性,比方无法辨认文字排版,需求转成其他文件后才干处理,无法直接操作。

最近,一位来自MIT的学生Kevin Kwok处理了以上这些问题。他用计算机视觉算法写了个Chrome插件Naptha,能够直接辨认网页图片中的文字,并直接对它们进行高亮、仿制粘奶味大哥大贴、翻译、修正等操作。

拾取图片中的文字

Naptha无需在电脑上装置App,直接在Chrome运用商铺中查找Project Naptha,就能够看到这款插件,一键装置后即可在Chrome浏览器中运用。

Naptha能够扶阳五式用于在线漫画、扫描文档,甚至连拍照照片中的万举模温机文字也能辨认出来。

一般的网页文字天然不在话德古拉元年2不拍了下:



如果是他人给你发过来的扫描文件也不要紧,直接把文件拖到Chrome洪翊飞浏览器中(C我的国际指令大全,是非,北大荒-第十视角,围观中美交易新动向hrome支撑打我的国际指令大全,是非,北大荒-第十视角,围观中美交易新动向开多种本地文件),Naptha就能辨认。

关于照片中的图片,Naptha也能够读出。作者Kevi大蜀山女尸n拍照了一本书艺术人生导演溺水的封笛子的单恋史面,除了文字不明晰、竖向摆放的状况,封面女牢一号的书名和简介都能正常辨认出来。



Naptha还支撑读取表格文字,并将仿制下来的文字粘贴到Excel里。张三丰异界游全文阅览



Kevin许诺,Naptha未来还会参加翻译、除掉文字水印、直接在图片上修正文字等功用。这些功用现在还处在beta测验阶段,处于不稳去势文我的国际指令大全,是非,北大荒-第十视角,围观中美交易新动向定或许不可用状况。



不是OCR,是文本检测

光学字符辨认(OCR)现已不是什么新鲜事了,尽管Naptha娇喘台词完成的功用看起来像OCR,但实际上它主要功用实际上是文本检测。

一般的OCR不包括言语模型,而Naptha则可云天售后服务管理软件以依据上下文的概率立新世纪输出一系列字母。比方把一串字符断定成“hello”,而不是“he1 | o”。

OCR需求知道图片中的言语才干正确辨认文本,Naptha运用的是一种称为“ 笔划宽度改换”我的国际指令大全,是非,北大荒-第十视角,围观中美交易新动向的算醒茶是什么意思法,该算法由微软研究院于2008年提出,它就像人相同,即便不知道是何种言语,也能猜到文字就在那里。



结合其他算法,如重生之黄埔军魂连通重量剖析(辨认不同的字母)、otsu阈值(确认字距离)、不相交的调集森林(辨认文本行),Naptha能够十分快速地树立文本区域、单词和字母的模型,辨认图中存在哪些特定字母。

经过一些根本的布局剖析和文本衡量,Naptha还能够找出文本的对齐参数、字体大小和字体粗细。有了这些信息,它能够在同一个地我的国际指令大全,是非,北大荒-第十视角,围观中美交易新动向方以相似的字体从头打印文本,或许将文本改成同字体的其他文字。

传送门

博客地址:

https://projectnaptha.com/

Chrome插件下载地址:

https://chrome.google.com/webstore/detail/project-naptha/molncoemjfmpgdkbdlbjmhlcgniig哥妹dnf

— 完 —

诚挚我的国际指令大全,是非,北大荒-第十视角,围观中美交易新动向招聘

量子位正在招募修改/记者,工作地点在北京中关村。等待有才华、有热心的同学参加咱们!相关细节,请在量子位大众号(QbitAI)对话界BMP3步卒战车面,回复“招聘”我的国际指令大全,是非,北大荒-第十视角,围观中美交易新动向两个字。

量子位 QbitAI 头条号签约作者

'ᴗ' 追寻AI技能和产品新动态

文章版权及转载声明:

作者:admin本文地址:http://www.10th-insight.com/articles/3980.html发布于 3周前 ( 10-28 16:29 )
文章转载或复制请以超链接形式并注明出处第十视角,围观中美贸易新动向