近期,字节跳动旗下火山引擎于杭州成功举办AI创新巡展,会上,火山引擎总裁谭待隆重揭晓了豆包1.5深度思考模型这一最新研发成果。
豆包1.5深度思考模型在多个领域展现出了卓越的能力,特别是在数学、编程、科学推理等专业范畴,以及创意写作等通用任务中,其表现尤为亮眼。该模型采用了先进的MoE架构,总参数高达200B,但激活参数仅为20B,相较于业界同类模型,其参数规模降低了50%,从而在推理成本上具备了显著优势。
谭待在演讲中深入阐述了豆包1.5深度思考模型的各项强大功能。他指出,该模型能够与视觉理解技术紧密结合,为用户提供多样化的服务。例如,用户可以通过照片分析地貌特征,或在旅行时利用该模型辅助点餐,甚至在企业项目管理中,豆包1.5也能帮助绘制流程图。
火山引擎还对豆包文生图模型进行了全面升级,推出了3.0版本。新版本在文字排版上更加美观,图片生成能力更为精细,且支持直接输出2K分辨率的图片,为用户带来了更为出色的使用体验。
值得注意的是,豆包新模型在视频搜索领域也实现了突破。用户只需输入搜索问题,模型便能在视频中精准定位并提取出相应答案,极大地提升了视频搜索的效率和准确性。
谭待还透露,豆包大模型的使用量正持续高速增长。截至2025年3月,豆包大模型的日均tokens使用量已超过12.7万亿,与发布之初相比,增长了惊人的106倍。这一数据不仅彰显了豆包大模型的强大吸引力,也预示着AI技术在未来具有广阔的发展前景。