网界科技
网络资讯 产业经济 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

2024中国开源开发者报告:大模型时代下的创新与挑战

2025-01-23来源:数说编辑:瑞雪

近期,一份名为《2024中国开源开发者报告》的详尽研究吸引了业界的广泛关注。该报告由OSCHINA与Gitee联合发布,深入剖析了中国开源开发者生态的现状与未来趋势,尤其聚焦于开源大模型的发展。

报告显示,截至2024年,Gitee平台的总用户数已达到1350万,新增用户数为150万,总仓库数增至3600万,新增500万,同时开源组织数量也攀升至40万。在编程语言方面,Java、Javascript、Python依旧占据主导地位,而Typescript则展现出迅猛的增长势头。在开源许可证的使用上,MIT和Apache-2.0最为常见,木兰宽松许可证第二版也逐渐受到业界认可。

在技术层面,中国开源模型已逐渐从跟随者转变为引领者,在全球评测中取得了亮眼成绩,如智谱、阿里巴巴、深度求索等公司的开源模型备受瞩目。开源生态日益繁荣,相关政策也在积极推动合规创新。随着端上模型的兴起,推理扩展法则的潜力得到释放,模型向多元化和应用细分方向发展。尽管开源模型在技术上可能并非最先进,但通过构建开发者生态,它们在竞争中占据了显著优势。

然而,开源大模型的发展也面临着诸多挑战,如“算力墙”、数据质量、版权、偏见以及被操控的风险等。为应对这些挑战,业界正在积极探索智能体作为下一代“明星产品”,同时合成数据驱动的新产业链也在逐步形成。多模态融合成为发展趋势,业界也在通过基于知识图谱的方案来克服RAG方法的不足。未来,基于知识图谱与大语言模型的垂域推理应用和开源项目预计将不断涌现。

在AI编程领域,AI编程助手的应用日益广泛,显著提高了代码生成和评审等任务的效率。然而,当前AI编程仍面临领域知识理解和原生IDE支持不足等瓶颈。未来,业界有望通过自底向上重构工具链、适配大模型以及全系统异构协同推理等方式,进一步释放其他硬件算力,为AI编程带来新的发展机遇。

整体来看,中国在开源大模型领域的技术创新和生态建设方面取得了显著成果。尽管面临诸多挑战,但随着技术的不断进步和政策的逐步完善,开源数据和算法将在推动AI技术持续发展中发挥更加重要的作用。可以预见,未来中国开源大模型的发展将更加多元化和细分化,为AI技术的广泛应用奠定坚实基础。