网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

苹果再出手,300亿参数AI大模型MM1.5来了!

2024-10-13来源:ITBEAR编辑:瑞雪

苹果公司近期为其多模态大模型MM推出了1.5版本,新版本在延续前代MM1数据驱动训练原则的基础上,着重研究了混合不同类型数据对模型性能的影响。相关模型文档已在Hugging Face上发布,并附有论文链接。

MM1.5版本提供了10亿至300亿多种参数规模的选择,具备图像识别和自然语言推理能力。苹果的研发团队在新版本中改进了数据混合策略,显著增强了模型在多文本图像理解、视觉引用与定位以及多图像推理方面的表现。

根据参考论文,苹果在MM1.5的持续预训练阶段引入了高质量的OCR数据和合成图像描述,大幅提升了模型对富含文本内容的图像的理解能力。研究团队还在监督式微调阶段分析了不同数据类型对模型性能的影响,并优化了视觉指令微调数据的混合方式,使模型实现了更高的效率,即便是小规模的模型(10亿、30亿参数版本)也能展现出优秀的性能。

苹果公司此次还推出了MM1.5-Video模型,专门用于视频理解,以及MM1.5-UI模型,专注于移动设备用户界面的理解。MM1.5-UI模型未来有望成为iOS背后的“苹果牌”AI,它能够处理各种视觉引用与定位任务,总结屏幕上的功能,或者通过对话与用户进行交互。

ChatWave微信AI客户管理系统:客户行为预测功能解析与准确度探究
本文将深入探讨ChatWave这一先进的微信AI机器人客户管理系统,分析其是否支持客户行为预测以及预测的准确度如何。ChatWave能够自动收集和分析这些数据,生成个性化的客户画像,从而预测客户的未来行为。 …

2025-10-22

ChatGPT Atlas浏览器问世:AI深度融合让网页浏览变身智能助手
ChatGPT Atlas的一大亮点是其“浏览器记忆”功能,这一创新能够让AI记住用户的浏览历史、对话细节以及交互内容。对于家庭用户,Atlas支持家长监督功能,父母可以为未成年人账户关闭记忆和代理模式,确…

2025-10-22

天猫精灵全屋智能四川八店同启:AI赋能空间进化,共筑智慧生活新范式
2025年10月18日,一场关于“未来生活”的展示在西南盛大开启——天猫精灵全屋智能于四川同时落地8家门店,覆盖成都、泸州、广元、都江堰等核心城市。 为加速AI与美学的融合,天猫精灵全屋智能9月24日在云栖大…

2025-10-22

IDC:中国AI基础设施市场爆发式增长,阿里云第一
10月22日,国际数据机构IDC最新报告《中国智算云基础设施市场(AI IaaS)(2025上半年)跟踪》显示,2025年上半年,中国AI基础设施服务市场同比增长122.4%,达到198.7亿。其中,阿里云占比24.7%稳居第一,并在GenAI IaaS(生成式AI基础设施)和Other AI IaaS(经典AI基础设施)

2025-10-22

从荷叶到纳米涂层:雨伞配件借力互联网开启传统工具新篇章
现代社会的伞具呈现出前所未有的多元化发展。这些创新不仅提升了使用体验,更让伞具成为都市生活中独特的时尚配饰。当气象大数据精准预测每朵雨云的轨迹,当物联网让千万把雨伞形成互助网络,我们看到的不仅是工具的升级,…

2025-10-22

2025企业级AI大模型落地:现状剖析、挑战洞察与可信系统构建路径
除了以自主知识产权为代表的DeepSeek模型在央国企中展现出强劲的部署势头外,由头部科技企业推出的通用大模型,如百度的“文心一言”和阿里巴巴的“通义千问”,也凭借其强大的技术底座、完善的云服务生态以及在各自…

2025-10-22