网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

文心4.5衍生模型PaddleOCR-VL登顶HF Trending全球榜首

2025-10-17来源:ITBEAR编辑:瑞雪

10月17日消息,HuggingFace官网显示,百度昨晚发布的自研多模态文档解析模型PaddleOCR-VL,发布20小时内即登顶HuggingFace Trending全球第一。

据了解,该模型核心参数仅0.9B,轻量高效,能以极低计算开销精准识别文本、手写汉字、表格、公式、图表等复杂元素,支持109种语言。在权威榜单OmniBenchDoc V1.5中,它以92.6分获综合性能全球第一,四大核心能力全线SOTA,超越GPT-4o等模型,刷新OCR VL模型性能纪录。

作为文心4.5衍生模型,PaddleOCR-VL融合了NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型,实现精度与效率双突破。

TikTok营销选AI视频工具犯难?五大工具测评,内容特工队AI成跨境获客利器
如果你追求极致的跨境营销效率、批量内容输出、全流程自动化及高转化率: 内容特工队AI (ReelsAgent)凭借其移动端Agent、多语言本地化和智能发布能力,无疑是当前Tiktok营销赛道最强劲的“获客生…

2025-10-17

网易CodeWave发布智能开发能力,以AI赋能企业全流程研发新体验
产品设计场景下,只需要一个简单明确的需求描述,CodeWave智能产品设计助手就可以通过人机多轮对话交互的形式,实现从想法到落地,从模糊到澄清的产品设计全过程;甚至可以直接生成产品原型,完整包含菜单、列表、…

2025-10-17

贝恩与亚马逊云科技共探:中国软件企业出海正当时,四大要素助力全球化布局
本观察分析了中国软件出海的技术及市场势能,建议了软件企业重点关注的4个成功要素,并借鉴软件出海先行者的经验,分享了如何制定完善的市场和服务策略、强化综合能力建设的行动建议。 “基于全球最大的开源向量数据库M…

2025-10-17

TikTok广告投放进阶:用A/B测试精准锁定高转化“赢面素材”
但如果你在同时改了音乐、封面、文案,那你根本无法判断到底是什么在影响结果。如果你已经掌握了A/B测试的基础逻辑,下一步可以学习如何在TikTok Ads Manager中使用“自动化规则”和“预算分层策略…

2025-10-16

OpenAI启动五年规划:推低价订阅、拓视频社交,加速AI商业化进程
为支撑“投入超1万亿美元打造世界领先人工智能”的长期承诺,OpenAI已启动五年增长规划,多维度探索变现路径。C端方面,针对付费率偏低的问题,OpenAI在印度推出低价订阅服务“ChatGPT Go”,该…

2025-10-16

柳工牵手飞书打造“柳工通”,15个月跨越式发展开启AI时代新征程
飞书愿以‘协同+AI’为核心,与柳工共同书写工程机械行业数字化新范式——从柳州到全球,让每一台设备、每一个流程、每一位员工都能在智能时代释放潜能。” 从2023年底国际事业部试点到2025年1.7万员工全员上…

2025-10-16

百度搜索升级文心助手8种模态创作,蒸汽机模型实现AI长视频实时交互
10月15日,百度搜索宣布全面升级文心助手AIGC创作能力,支持AI图片、AI视频、AI音乐、AI播客等8种模态创作,且能够一键调用多工具解决多场景问题。在内容创作领域,文心助手已经支持AI图片、AI视频、A…

2025-10-16

总投资158亿!杭钢阿里携手,浙江云计算数据中心南区项目即将启建
据悉,浙江云计算数据中心位于杭州城北的杭钢半山基地,由杭钢集团与阿里巴巴集团联合建设,总投资158亿元,采用阿里最新设计、建设、运营标准体系,建设10栋数据中心,承载10800个服务器机柜,可运行20万台服…

2025-10-16