网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

京东开源JoyAI-Image-Edit模型:攻克空间难题,赋能多元领域AI应用升级

2026-04-08来源:快讯编辑:瑞雪

京东探索研究院近日宣布,其自主研发的图像编辑模型JoyAI-Image-Edit正式开源,成为全球首个深度融合空间智能技术的开源模型。该模型突破传统AI图像处理仅限于平面修改的局限,实现了三维空间重塑能力,其核心推理代码已完全开放,开发者可直接用于各类应用开发。

传统图像模型常因空间逻辑混乱导致物体变形、光影错乱等问题,而JoyAI-Image-Edit通过构建完整的空间理解体系,从相机坐标变换、物体几何控制到多视角一致性维护,系统性解决了这些行业痛点。实验数据显示,该模型在物体移动精度、空间布局合理性等关键指标上已达到国际领先水平,编辑后的图像能自然呈现遮挡关系与光影变化,即使进行视角切换或物体重组,场景结构依然保持高度真实。

该模型的创新性体现在三大核心能力:其一,支持通过自然语言精准控制相机视角,用户可指定偏航角、俯仰角等参数生成新视角图像;其二,具备空间漫游功能,能连续生成逻辑连贯的多视角图像序列,模拟三维场景中的移动观察效果;其三,可对特定物体进行位移、缩放等操作,同时自动调整周边环境的光影与遮挡关系,确保整体场景的物理合理性。这些能力使模型在处理复杂空间任务时表现出色,例如在电商场景中可快速生成多角度商品展示图,在创意设计领域能实现虚拟场景的自由编辑。

除空间编辑突破外,JoyAI-Image-Edit还兼容15类通用图像处理功能,涵盖物体替换、风格迁移、细节优化等高频需求。通过将空间智能与通用编辑能力深度融合,该模型在长文本渲染、多视角一致性生成等复杂任务中展现出显著优势,可满足全场景创作需求。例如在3D模型重建领域,模型能根据单张图片自动推断物体空间结构,生成多视角一致的三维模型;在具身智能视觉感知方面,其空间理解能力为机器人环境感知提供了关键技术支撑。

目前,该模型已开放代码与预训练权重,支持商业与学术用途。其开源特性将加速空间智能技术在电商、设计、机器人等领域的落地应用,特别是为具身智能研发提供了低成本、高效率的视觉处理解决方案。随着开发者社区的参与,JoyAI-Image-Edit有望推动AI图像技术向更复杂的空间场景延伸,重新定义智能图像处理的标准与边界。

智能网联汽车ETF鹏华(159872)4月7日微跌,规模份额变动引关注
规模方面,截止4月3日,智能网联汽车ETF鹏华(159872)最新份额为5879.97万份,最新规模为5468.38万元。回顾2025年12月31日,智能网联汽车ETF鹏华(159872)份额为5529.97…

2026-04-08

天开和平园大模型备案服务中心成立 助力20余家企业模型合规上线
奔牛云链主要从事互联网物流的大模型研发,去年7月入驻天开和平园模创社区。 在模创社区,像奔牛云链这样的大模型企业,已经聚集了20多家。为此,模创社区将大模型备案服务中心落地园区,不仅给企业申报进行前期指导,…

2026-04-08

福田汽车4月7日平稳收官,近5日获主力青睐净流入超七千万
2016年10月10日公告,公司在北京与百度签署战略合作协议,双方将就车联网、大数据、智能汽车和无人驾驶展开全面合作,共同打造面向未来的智能互联网商用汽车。区间今日近3日近5日近10日近20日主力净流入-17…

2026-04-08