网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

谷歌新AI技术InkSight:超越OCR,精准识别手写文字

2024-11-05来源:ITBEAR编辑:瑞雪

Google Research近日推出了一项革新的人工智能技术——InkSight系统,该技术能够直接识别并转换手写文字图片中的信息,省去了传统转换方式中的中间环节。

与传统的光学字符识别(OCR)技术相比,InkSight在处理模糊、低光照或背景复杂的手写文本时,展现出更高的识别准确率。这一技术模仿了人类学习阅读的过程,通过不断重写来深入“理解”文字的外观和意义,从而提高了识别的精准度。

实验结果显示,人们在阅读由InkSight生成的文本时,识别准确率高达87%,且其中三分之二的输出与真实手写难以区分。

这项技术对于那些喜欢手写记录的人来说,无疑是一大福音。今后,他们只需拍照上传手写笔记,即可轻松转换为可搜索和编辑的数字文本。即便是字迹难以辨认的潦草手写,InkSight也能精准转换,生成清晰、准确的文本。

InkSight技术在文化遗产保护领域也大有可为。它能够将珍贵的手写文献数字化,为历史研究提供便利,同时也有助于保护和传承那些数字化程度较低的语言和文化。

谷歌并非手写识别AI领域的唯一探索者。亚马逊的Kindle Scribe以及Goodnotes等应用也在该领域取得了显著进展,共同推动着手写识别技术的发展。

阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13