网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

紫东太初4.0多模态推理大模型发布,实现细粒度思考迈向新阶段

2025-10-05来源:快讯编辑:瑞雪

由中国科学院自动化研究所与武汉人工智能研究院共同研发的紫东太初4.0多模态推理大模型正式亮相。这款自2021年首次面世后,历经四次技术迭代的智能系统,已从基础文本处理能力升级为具备复杂场景深度推理能力的多模态平台,标志着人工智能向"类人思考"方向迈出关键一步。

据项目负责人王金桥介绍,最新版本突破了传统模型单一模态的局限,通过构建"视觉-语言-动作"的跨模态理解框架,实现了对动态场景的实时解析。在医疗场景中,当用户提出"预约呼吸科门诊"的语音指令时,系统不仅能识别语义需求,还能结合症状描述自动匹配科室分类,并完成挂号平台的操作流程。这种"感知-理解-执行"的闭环能力,使其在180分钟长视频内容分析中,可精准定位关键片段并生成结构化摘要。

技术层面,紫东太初4.0创新性地引入"细粒度语义解析"机制,使模型在处理多模态数据时,能像人类一样建立多层次关联。例如在自动驾驶测试中,系统通过摄像头捕捉的实时画面,结合语音指令中的空间方位信息,可准确执行"打开右侧车窗"等物理操作。这种突破性进展源于团队研发的动态注意力分配算法,使模型能根据任务复杂度自动调整认知资源分配。

目前该技术已在多个领域展开产业化应用:在智慧医疗领域,为三甲医院提供智能导诊和影像分析服务;在具身智能领域,与新能源汽车企业合作开发车载交互系统;在低空经济领域,为无人机物流提供实时路径规划和环境感知支持。研发团队透露,其定制化解决方案已覆盖城市交通管理、工业质检等20余个细分场景,形成从算法研发到场景落地的完整技术链条。

百度世界大会发布文心大模型5.0 多项能力达全球领先水平
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-15

李彦宏2025百度世界大会发声:AI跨越临界点,百度成果引领产业新变革
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

百度智能云发布新芯与超节点,持续布局AI算力助力企业AI能力内化
百度智能云今年已经点亮了昆仑芯三万卡集群,可同时支撑多个千亿参数大模型训练,打造了国产AI算力集群的一大里程碑。未来,百度智能云将持续优化软硬件协同效果,通过百舸AI计算平台,将昆仑芯单一集群的规模从三万卡进…

2025-11-13

李彦宏2025百度世界大会发声:AI迈向效果涌现 产业构建倒金字塔生态
11月13日举办的2025百度世界大会上,百度创始人李彦宏围绕 AI 技术发展阶段与产业生态发表观点,指出 AI正从技术演示走向实际应用,产业结构也在发生根本性转变。 在 AI 产业结构层面,李彦宏表示该领…

2025-11-13

AI从“智能涌现”迈向“效果涌现”,李彦宏:百度引领AI产业结构新变革
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-13