网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

智谱清言App新功能上线,CogView3-Plus文生图模型有何亮点?

2024-10-14来源:ITBEAR编辑:瑞雪

智谱技术团队今日宣布,其研发的文生图模型CogView3及CogView3-Plus-3B已正式开源,并已在“智谱清言”App中上线。据团队介绍,CogView3是一款基于级联扩散技术的text2img模型,其生成过程分为三个阶段:首先生成512x512像素的低分辨率图像,随后通过中继扩散过程实现2倍超分辨率,生成1024x1024像素的图像,最后再次迭代生成2048x2048像素的高分辨率图像。

在实际应用中,CogView3的表现尤为出色。据官方数据显示,在人工评估中,其性能比目前最先进的开源文本到图像扩散模型SDXL高出77.0%,同时,其推理时间仅为SDXL的约十分之一。CogView3-Plus模型在CogView3的基础上引入了最新的DiT框架,进一步提升了整体性能。该模型采用了Zero-SNR扩散噪声调度,并引入了文本-图像联合注意力机制,有效降低了训练和推理成本。

CogView3-Plus模型使用的VAE潜在维度为16,相较于常用的MMDiT结构,它在保持模型基本能力的同时,实现了成本的有效控制。这两款模型的开源,无疑将为文本到图像的生成领域带来新的突破。

用户可以通过以下链接访问CogView3及CogView3-Plus-3B的开源仓库:

开源仓库地址:https://github.com/THUDM/CogView3

Plus 开源模型仓库:https://huggingface.co/THUDM/CogView3-Plus-3B https://modelscope.cn/models/ZhipuAI/CogView3-Plus-3B

春节前中端机怎么选?红米K80至尊版性价比碾压,新机还值得等吗?
价格其实相比上一代都大幅上涨,虽说这是没办法的事,毕竟内存和存储芯片涨幅太凶了,厂商也是要赚钱的。就算红米Turbo Max发布了也不好使,唯一能看的9000大电池其实也就那样,不少细节估计都不如红米K80…

2026-01-24

中国电信引领AI标准建设:以算网融合筑基 驱动智算产业高质量发展
如,中国电信联合中兴通讯等伙伴发布《智能云网操作系统技术白皮书》,剖析云网难题与解决方案;发布《云网融合2035技术白皮书》,明确AI驱动云网融合的阶段规划,提出“融智”核心发展方向;同时,牵头TM Foru…

2026-01-24

马斯克预言引热议:AI与机器人时代何时到来?丰裕社会如何实现?
在他的设想中,强迫人工智能说谎是危险的,因为这会破坏其对世界的基本理解;而好奇心则能让人工智能认为人类比无生命的物体更有研究价值,从而在潜在冲突中“选择”保留人类。 在我的书中,我提出了一个与当前主流讨论略有…

2026-01-23

京东旗下公司全资持股 云南昆融信息科技新公司正式成立
松果财经讯,天眼查工商信息显示,近日,云南昆融信息科技有限公司成立,法定代表人为季圣哲,注册资本100万人民币,经营范围含数据处理服务、信息技术咨询服务、信息咨询服务、大数据服务、互联网数据服务、网络与信息安…

2026-01-23

机器人ETF嘉实(159526)开盘微涨,重仓股多数飘红,科大讯飞领涨
来源:新浪基金∞工作室 1月23日,机器人ETF嘉实(159526)开盘涨0.06%,报1.625元。机器人ETF嘉实(159526)重仓股方面,科大讯飞开盘涨0.96%,汇川技术涨0.29%,拓普集团涨0.…

2026-01-23

“苕萝卜”成新宠?萝卜快跑关联公司申请注册多枚相关商标待审
天眼查知识产权信息显示,近日,萝卜快跑关联公司萝卜运力(北京)科技有限公司申请注册多枚“苕萝卜”商标,国际分类为教育娱乐、网站服务、科学仪器等,当前商标状态均为等待实质审查。 据悉,由于萝卜快跑在比较复杂的路…

2026-01-23