网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

天翼云数据库新突破!创新性Taste框架,研究界瞩目!

2024-10-16来源:ITBEAR编辑:瑞雪

近日,一篇题为《Taste: Towards Practical Deep Learning-based Approaches for Semantic Type Detection in the Cloud》的论文在国际知名数据库会议EDBT上获得长文收录,该论文由天翼云数据库团队、中国电信云计算研究院与深圳北理莫斯科大学联合完成。EDBT作为数据库领域的顶级学术会议,已连续举办27届,其近五年平均录取率仅为20.8%。此次收录标志着天翼云的科技创新实力再次获得业界与学术界的双重认可。

该论文聚焦于数据管理系统中的语义类型检测问题,并在此领域实现了检测性能和安全性方面的突破。语义类型,如人名、地址、身份证号等,对于人类理解数据和辅助数据管理系统提供关键服务具有重要作用。然而,现有技术每次检测均需扫描数据列内容,导致I/O和网络开销大、检测效率低,且可能对云用户业务产生不利影响。

针对这些不足,论文创新性地提出了两阶段语义类型检测框架(Taste)。该框架首先利用数据源的元数据进行初步快速的语义类型检测,减少对数据源的扫描;第二阶段则按需进行,结合列内容与元数据完成更精确的检测。这一创新不仅提升了检测效率,还增强了系统的鲁棒性,同时提供了更高的数据隐私保护。

论文还设计了一种新颖的非对称双塔检测模型(ADTD),通过多任务学习支持Taste的两阶段检测。该模型分为metadata塔和Content塔,前者编码元数据特征,后者结合元数据信息编码列内容特征。在训练过程中,两个阶段的输出结合进行多任务学习,使模型一次训练即可应用于两阶段推理。

实验表明,Taste框架在执行效率、准确性、降低数据列扫描侵入性等方面表现优异,并展现出云端大规模部署的潜力。目前,Taste框架已在天翼云数据管理服务(DMS)中落地,助力客户进行高效、灵活的语义类型检测,实现更加快捷且智能化的敏感数据识别,显著提升云端数据管理的安全性和稳定性。

天翼云作为云服务国家队,始终坚持核心技术自主攻关,以科技创新引领产业发展。未来,天翼云将继续推进数据库等云计算技术攻关,筑牢国云智算底座,为企业充分释放数据价值提供有力支撑。

阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13