攀登不止,华为数据库论文入选SIGMOD 2024,技术创新再谱新篇

news/2024/9/22 10:05:49

本文分享自华为云社区《攀登不止,华为数据库论文入选SIGMOD 2024,技术创新再谱新篇》,作者:GaussDB 数据库。

6月9日-14日,2024年数据管理国际会议SIGMOD(ACM SIGMOD/PODS International Conference on Management of Data)在智利首都圣地亚哥召开。SIGMOD与ICDE、VLDB并称数据库领域三大顶会,是数据管理领域的最高水平学术会议。
继ICDE 17篇论文入选后,华为多篇论文再次入选SIGMOD 2024, 顶会入选论文已超过100篇。下面节选数据库领域的两篇代表性论文进行分享:

论文一:Robustness of Updatable Learning-based Index Advisors

该论文详细探讨了学习型索引推荐(Learning-based Index Advisors, IA)在面对投毒攻击时的鲁棒性问题。在这种攻击中,攻击者通过向系统输入恶意数据来扰乱IA的学习过程。

论文的核心贡献在于提出了一个名为PIPA的框架,它包括两个主要阶段:

探测阶段:在这一阶段,系统会通过特定的工作负载来探测IA的行为,从而估计其对不同索引的偏好。这是通过观察IA对探测工作负载的响应来实现的,目的是识别出IA可能被投毒攻击影响的脆弱点。

注入阶段:在这一阶段,系统会尝试通过注入特定的工作负载来欺骗IA,使其降低对top索引的排名,同时提升中等排名的索引。这样做的目的是为了测试IA在受到投毒攻击时的反应能力和恢复能力。

综合这两个阶段,PIPA框架能够有效地对IA进行测试,即使在IA经过微调后,也能够捕获其对投毒攻击的敏感性。SIGMOD评委组认为,这项研究的意义不仅提高了IA的安全性,还增强了其在实际应用中的可靠性,为未来的学习型索引推荐提供了重要的参考,特别是应用在云数据库场景中。

论文二:ESTELLE: An Efficient and Cost-effective Cloud Log Engine

该论文是由电子科技大学和华为云数据库创新LAB团队联合攻关发表,提出了一个低成本的云原生日志引擎,解决了海量日志场景下现有解决方案成本较高的问题。

1. 本文提出了一个名为ESTELLE的低成本云原生日志引擎,可以高性能、低开销的写入、存储及查询日志

2. 本文介绍了一种可插拔的日志索引框架,基于ESTELLE-BF和近似倒排索引实现,可以低成本的写入生产,并可以实现高性能的日志全文检索、AND查询及渐进式聚合分析

3. 本文在真实的开源日志数据集上进行试验,证明了ESTELLE在不同日志场景中较高的单核写入能力、较低的存储成本及良好的查询性能

综上,本文提出了一个高性能、低成本的云原生日志引擎ESTELLE,可以在海量写入、低频查询场景下,通过较低的成本,实现较好的日志引擎能力。

此次论文的入选,既是华为在数据库领域持续创新、研发投入的成果,也是华为长期坚持产、学、研、用深度融合的体现。华为通过与全球顶尖学术机构合作,持续推出各类研究计划和人才培养方案,共同攻克数据库难题。

未来,华为将继续加大数据库技术领域的投入,在数据库领域持续创新,将论文理论转化成应用落地,为客户提供创新且有竞争力的数据库产品和服务,推动数据库技术的进步与发展。

cke_56436.png

HDC 2024,6月21日-23日,东莞松山湖,期待与您相见!

更多详情请关注官网:

中文:https://developer.huawei.com/home/hdc

英文:https://developer.huawei.com/home/en/hdc

点击关注,第一时间了解华为云新鲜技术~

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hjln.cn/news/46769.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

Rust性能分析之测试及火焰图,附(lru,lfu,arc)测试

好的测试用例及性能测试是对一个库的稳定及优秀的重要标准,尽量的覆盖全的单元测试,能及早的发现bug,使程序更稳定。性能测试,在编写代码后,单元测试及性能测试是重要的验收点,好的性能测试可以让我们提前发现程序中存在的问题。 测试用例 在Rust中,测试通常有两部分,一…

FreeRTOS简单内核实现7 阻塞链表

增加阻塞链表和溢出阻塞链表,完善 RTOS 内核调度流程0、思考与回答 0.1、思考一 如何处理进入阻塞状态的任务? 为了让 RTOS 支持多优先级,我们创建了多个就绪链表(数组形式),用每一个就绪链表表示一个优先级,对于阻塞状态的任务显然要从就绪链表中移除,但是阻塞状态的任…

危急值上报及闭环管理全解析

什么是危急值制度? 危急值制度是指对提示患者处于生命危急状态的检查、检验结果建立复核、报告、记录等管理机制,以保障患者安全的制度。 管理体系(组织体系+制度建设+管理要素+宣教培训) 针对管理体系中的组织体系、制度建设、管理要素、宣教培训多为线下的制度、流程建立。…

手术分级管理制度

01手术分级管理体系 ● 医院手术分级管理实行院、科两级负责制 ● 医院医疗技术临床应用管理委员会总体负责全院手术分级管理工作,日常工作由医务办公室负责组织、协调,主要职责包括: (一)制定手术分级管理制度规范,定期检查提出改进要求 (二)审定手术分级管理目录,定…

总体估计中的相关公式 | 高一使用

总体估计中的相关公式和相关性质前言 相关公式 【人教 2019 A 版 \(P_{215}\) 练习 2】 数据 \(x_1\),\(x_2\), \(\cdots\), \(x_n\) 的方差为 \(s_x^2\), 数据 \(y_1\), \(y_2\), \(\cdots\), \(y_n\) 的方差为 \(s_y^2\), \(a\)、 \(b\) 为常数. 证明: (1) . 如果 \(…

LangChain结合LLM做私有化文档搜索

我们知道LLM(大语言模型)的底模是基于已经过期的公开数据训练出来的,对于新的知识或者私有化的数据LLM一般无法作答,此时LLM会出现“幻觉”。针对“幻觉”问题,一般的解决方案是采用RAG做检索增强。我们知道LLM(大语言模型)的底模是基于已经过期的公开数据训练出来的,对…

深入分析四层/七层网关

1 简要介绍 随着云计算、大数据和物联网技术的迅猛发展,网络通信的复杂性和需求日益增加。在这种背景下,网关技术作为网络通信中的重要组成部分,扮演着关键的角色。 作为连接不同网络或协议的桥梁,四层网关和七层网关是两种常见且重要的类型。本文将对这两种网关进行深入分…