网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

哈工大SUMMIT模型:融合物理特性,破解SAR成像难题创SOTA佳绩

2025-12-24来源:快讯编辑:瑞雪

合成孔径雷达(SAR)因其独特的主动式微波成像机制,在遥感领域占据重要地位。然而,传统视觉模型多基于光学图像开发,难以直接适配SAR图像的特殊性质。哈工大团队近日提出名为SUMMIT的SAR基础模型,通过融合多辅助任务的自监督学习框架,在分类、检测和分割等任务中取得突破性进展,相关论文发表于国际学术期刊。

SAR图像的生成依赖于回波矢量叠加,导致其存在斑点噪声和几何畸变等光学图像中不存在的特性。SAR图像为单通道幅度信息,目标表征主要依赖强散射点和边缘结构,而非光学图像中的颜色与纹理。这些差异使得直接迁移光学模型至SAR领域效果不佳,且现有SAR预训练数据集规模有限、质量参差不齐,进一步限制了模型性能。

针对上述挑战,研究团队以视觉Transformer(ViT)的掩码自编码器(MAE)架构为基础,创新性地引入辅助任务协调模块(ATCM)。该模块将三个物理驱动的自监督任务——自监督去噪、边缘特征增强和散射点特征提取——无缝集成至预训练流程。例如,在去噪任务中,模型通过对数变换和模拟高斯噪声注入,学习从含噪数据中恢复纯净信号;在散射点提取任务中,利用Harris角点检测定位强后向散射中心,强化模型对目标关键结构的感知能力。

实验结果表明,SUMMIT在多个主流数据集上显著优于传统方法。在目标检测任务中,模型在SARDet-100K数据集上的平均精度(mAP)较直接微调的ViTDet提升至少5%,尤其在港口和停机坪等密集场景下,能有效区分重叠目标,减少漏检与误检。目标分类任务中,模型在MSTAR数据集上展现卓越的小样本学习能力:仅使用30%训练数据时准确率达98.39%,全量数据下准确率高达99.89%,超越ResNet和Swin-Transformer等主流模型。

通过注意力热力图分析可进一步验证模型对SAR物理机制的理解。对比普通ViT模型,SUMMIT的注意力高度集中在目标的强散射中心(如舰船甲板、飞机机身),而非受斑点噪声干扰的背景区域。这一特性表明,辅助任务的设计成功引导模型聚焦于信号本质,而非噪声干扰。

该研究证明,在垂直领域AI开发中,领域知识的深度融合至关重要。单纯依赖数据规模难以解决SAR等复杂物理背景下的视觉问题,唯有将散射机制、噪声分布等物理特性嵌入模型设计,才能实现真正意义上的性能突破。目前,团队已开源相关代码,为SAR遥感领域的智能化发展提供新工具。

谷歌“黑科技”来袭:Gemini 3 Flash凭何以小搏大超越Pro?
然而,Gemini 3 Flash的出现打破了这一线性逻辑,它不仅在成本和速度上保持了「Flash」系列的轻量级特征,更在多项关键基准测试中,尤其是涉及复杂推理和超长上下文的任务上,击败了前一代甚至当代的「…

2025-12-24

淘宝闪购关联公司于上海成立新网络科技企业 注册资本达100万
雷达财经讯,天眼查工商信息显示,近日,上海同成汇网络科技有限公司成立,法定代表人为张玮宇,注册资本100万人民币,经营范围包括软件开发、电子产品销售、互联网销售、国内贸易代理、餐饮管理等。股东信息显示,该公司…

2025-12-23

MEET2026智能未来大会揭晓榜单 万联摩尔凭产业优势获年度杰出产品奖
据了解,「万联摩尔」的核心突破在于“融合产业动态图谱的结构化思考技术”,具备产业数据覆盖全、产业痛点理解深、产业问题回答准的三大优势,实现从“能对话”到“懂产业、能决策”的关键跨越,当前已为用户提供行业资讯…

2025-12-23