百度千帆Qianfan-OCR模型发布：4B参数实现文档智能解析，多项评测成绩领先-网界

百度千帆近日宣布推出全新端到端文档智能模型Qianfan-OCR，该模型采用统一的视觉语言架构，以40亿参数规模实现了文档解析、版面分析、文字识别与语义理解的一体化融合。在多项权威评测中，该模型展现出显著优势，标志着文档智能技术从多阶段流程向统一模型架构的跨越式发展。

在核心基准测试中，Qianfan-OCR表现尤为亮眼。在OmniDocBench v1.5评测中以93.12分位居端到端模型榜首，OCRBench评测成绩显著超越同规模通用视觉语言模型和专用OCR模型。在关键信息提取（KIE）领域，该模型在多个公开榜单总分上力压Google Gemini 3-Pro等国际商用模型，展现出强大的技术竞争力。

针对图表理解等复杂场景，Qianfan-OCR在ChartQA、ChartBench等6项国际权威评测中斩获5项最佳成绩。其独特的结构理解与多模态推理能力，能够精准解析包含复杂表格、混合图表的文档内容，在金融报表、科研论文等场景中具有显著应用价值。

传统OCR系统普遍采用"检测-识别-大模型"三段式架构，这种串联处理方式容易导致误差累积，且在文本分块提取过程中会破坏原始文档的空间结构与视觉上下文。例如复杂表格的行列关系、图表的坐标对应等关键信息，在传统流程中往往出现理解偏差。

Qianfan-OCR通过底层架构创新，构建了端到端的视觉语言模型。该模型直接从文档图像生成结构化输出，完整保留视觉信息与空间关系，实现从像素到语义的直接映射。这种技术路径不仅提升了处理效率，更在结构理解与推理任务中达到更高精度，有效解决了传统方案的固有缺陷。

目前，Qianfan-OCR已在百度千帆平台全面开放，同时通过HuggingFace开源模型权重。开发者与企业用户可自由调用该模型，应用于金融、医疗、教育等领域的文档智能化处理，推动行业数字化转型进程。

雷军宣布小米拥抱AI时代，SU7新车发布，续航升级且配色丰富

2026-03-20

iPhone16Pro升级iOS26.4RC实测：信号续航双提升，流畅音质更出色

很多人会关心信号问题，那我们就先从网络信号来看看实际表现吧，凌晨更新后，早上就去地铁上进行了一番体验，大部分时间信号都是3格左右，偶尔能到满格，在1小时的通勤时间里，玩了半小时王者荣耀，延迟大多都控制在50毫…

2026-03-19

华为畅享90系列官宣配色！多款机型设计亮眼，3月23日将亮相新品发布会

截至目前，华为终端已接连官宣了数款华为畅享90系列的配色。其中，华为畅享90 ProMax将提供飞天青、晨曦金、雪域白、曜金黑四种配色，后置镜组采用经典的星环对称设计；华为畅享90 Plus则提供包括星海…

2026-03-19

雷军披露小米汽车成绩单：SU7热销38.1万台，5年400亿投入获市场认可

2026-03-19

舒淇苏炳添亮相小米发布会携手代言新一代SU7 赠麦花束盼大卖

2026-03-19

杰理科技冲刺北交所IPO：四实控人掌控超八成表决权女董事长履历亮眼

2026-03-19

黄仁勋GTC 2026发声：AI非就业威胁，而是驱动社会繁荣新引擎

2026-03-19

vivo X300 Ultra视频拍摄再突破：全焦段4K 120fps助力专业创作新体验

2026-03-19

王腾建议手机厂商“停发新机”转战AI，是破局良策还是理想空谈？

“完全停发新机”在短期内不切实际，但他指出的方向：优化存量用户体验、全力拥抱AI智能体（如OpenClaw），无疑是正确的，也是所有厂商正在努力的方向。更现实的路径是，在持续推出有竞争力的新硬件的同时，加速向…

2026-03-19