网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

微算法科技推出QoS感知技术,赋能边缘大模型自适应拆分与智能推理

2025-11-05来源:快讯编辑:瑞雪

在人工智能与边缘计算深度融合的背景下,企业正加速探索大型基础模型(LFM)在边缘场景中的高效部署方案。面对多接入边缘计算(MEC)环境中资源受限、网络动态波动及节点异构性等挑战,传统集中式或静态推理模式已难以满足多维度性能需求。近日,微算法科技(NASDAQ:MLGO)宣布推出自主研发的“基于QoS感知的边缘大模型自适应拆分推理编排技术”,通过动态资源调度与模型重构机制,为LFM边缘部署提供智能化解决方案。

该技术的核心在于构建QoS感知驱动的动态编排系统,整合实时资源监测、异构节点协同及模型自适应重构能力。系统通过轻量级感知模块持续采集边缘节点的计算资源、网络带宽、能耗及隐私等级等指标,并基于加权评分模型动态生成推理路径与模型分区策略。与传统静态部署不同,该方案支持LFM推理任务在不同节点间智能迁移,在保证服务质量的同时优化系统负载平衡。

在模型拆分策略上,系统采用运行时容量分析机制替代开发阶段静态切片。通过图神经网络预测模块,系统可预判各节点未来负载趋势,并结合当前QoS目标(如最大容忍时延、隐私优先级)动态重构模型结构。拆分粒度可细化至Transformer的Attention头、卷积网络的残差模块或多模态子处理器,实现分布式推理的极致灵活性。例如,在车联网场景中,系统可根据车辆节点实时算力动态调整模型分区,确保低时延推理需求。

针对MEC架构中节点故障与通信中断问题,技术引入冗余容错与分布式恢复机制。推理任务拆分后,系统通过软冗余复制与边缘缓存实现子任务备份,即使部分节点失效仍可无缝恢复推理流程。编排控制器采用分层调度架构,上层统一制定跨区域调度策略,下层边缘控制器负责节点级资源分配与路由优化,支持跨地域、跨网络的灵活部署。

为提升系统适应性,技术融合了运行时学习机制,通过持续分析历史调度数据优化策略库。在智慧城市、工业协同等动态场景中,该能力使平台调度命中率提升30%以上,同时减少25%的无谓迁移开销。针对生成式AI模型的边缘部署,系统特别优化了文本生成、图像合成等任务的拆分逻辑,通过上下文感知拆分点与共享计算复用,显著降低重复计算成本。

技术实现流程涵盖四大关键环节:边缘感知模块实时上传节点资源与QoS数据;模型拆分模块基于结构图生成候选策略;调度优化器综合资源消耗、执行时间、隐私风险等因子计算最优路径;执行层部署子模型并反馈执行质量以迭代优化策略。整个生命周期形成闭环控制,确保推理效率与服务质量持续优化。

微算法科技计划将该技术整合至自研边缘智能平台,结合边云协同、联邦学习及安全推理模块,构建完整的边缘AI生态。针对多模态协同生成、LFM连续学习等复杂场景,研发团队将持续迭代QoS感知机制,推动边缘计算向更智能、高效的方向演进。这项突破不仅为行业提供了可扩展的技术范式,更使LFM从云端走向边缘,成为实时响应的智能引擎。

百度世界大会发布文心大模型5.0 多项能力达全球领先水平
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-15

李彦宏2025百度世界大会发声:AI跨越临界点,百度成果引领产业新变革
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

百度智能云发布新芯与超节点,持续布局AI算力助力企业AI能力内化
百度智能云今年已经点亮了昆仑芯三万卡集群,可同时支撑多个千亿参数大模型训练,打造了国产AI算力集群的一大里程碑。未来,百度智能云将持续优化软硬件协同效果,通过百舸AI计算平台,将昆仑芯单一集群的规模从三万卡进…

2025-11-13

李彦宏2025百度世界大会发声:AI迈向效果涌现 产业构建倒金字塔生态
11月13日举办的2025百度世界大会上,百度创始人李彦宏围绕 AI 技术发展阶段与产业生态发表观点,指出 AI正从技术演示走向实际应用,产业结构也在发生根本性转变。 在 AI 产业结构层面,李彦宏表示该领…

2025-11-13

AI从“智能涌现”迈向“效果涌现”,李彦宏:百度引领AI产业结构新变革
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-13