阿里云李飞飞:带你了解PolarDB的过去、今天和明天

2024-01-18 15:48:44来源:威易网作者:

阿里云数据库产品事业部负责人李飞飞在PolarDB开发者大会上做了主题发言,带大家了解PolarDB的发展历史。

1月17日,阿里云PolarDB开发者大会在京举办,中国首款自研云原生数据库PolarDB发布“三层分离”新版本,基于智能决策实现查询性能10倍提升、节省50%成本。

阿里云数据库产品事业部负责人李飞飞在PolarDB开发者大会上做了主题发言,带大家了解PolarDB的发展历史。

以下是李飞飞的发言实录,以飨网友——

尊敬的开发者,尊敬的客户,大家好。

非常高兴今天能够在北京与大家相聚,参加首届的PolarDB开发者大会。再次感谢大家在百忙之中抽出时间莅临现场,以及在线上聆听峰会的各位这个领域的开发者、客户,我们互相学习、共同成长。

今天的开场借此机会介绍一下PolarDB的发展历史,它的过去、今天和明天。
\ 
阿里云数据库产品事业部负责人李飞飞

PolarDB实际上是在阿里集团内部业务面临去IOE,以及业务互联网化带来的请求波峰、波谷剧烈变化的背景下诞生的云原生数据库。实际上在早期我们通过将传统的开源数据库直接搬到云上,也就是所谓的Cloud-Hosted(云托管) Database Function的方式,来解决电商业务的突发峰值波峰波谷变化的挑战。但是很快的我们发现仅仅做Cloud-Hosted的方式,是无法完全解决今天业务随着互联网化、随着业务波峰波谷的剧烈变化带来的朝夕需求变化的挑战的。

所以我们就是就开始了研发PolarDB,后来就将PolarDB对外进行商业化。从2017年开始正式的公测到2018年上线以来,一路以来PolarDB经历了商业化、全面的云原生化、Serverless,再到今天像云原生和智能化纵深发展的阶段。

第一部分就是我刚才讲到的,从Cloud-Hosted(云托管) Database走向全面自研云原生数据库,基于存储计算分离架构,以及物理同步复制技术,来解决我们所面临的弹性、高可用、可拓展等等一系列问题。我们推出了100%兼容MySQL以及100%兼容PG的版本,这是我们发展的第一阶段。

PolarDB如果关注数据库领域的,大家就会知道PolarDB实际上是在中国首个自研云原生数据库。从PolarDB诞生那一刹那起,中国的包括阿里云在内的数据库发展就进入了新的赛道和时代,就是以云原生为核心代表的云原生数据库的快速发展。

云原生数据库带来的关键性能和体验提升,主要体现在以下几个方面:一是一体化的数据处理能力,二是极致的稳定性,三是友好的用户体验,四是对TCO的大幅提升,基于弹性高可用的能力,五是极致弹性所带来的云原生数据库使用的便利。

实际在集团内部的电商业务对PolarDB提出了世界级的技术挑战,比如在天猫双11峰值零点第一秒的瞬间,交易峰值有145倍的激增。PolarDB在天猫双11交易峰值记录的TPS达到了1.4亿个TPS的峰值。订单的峰值到了58.3万笔/秒,PolarDB发展到今天也承载了阿里巴巴集团内部非常丰富的不同场景的业务,从电商、本地生活、高德地图等等一系列关键的应用。

进入第二阶段PolarDB到今天为止,它所具备的一些关键能力。比如说它将云原生和分布式能力结合推出分布式版本,比如说PolarDB的开源、全面的拥抱Serverless技术。像云原生的纵深发展,我们在去年的云栖大会推出了PolarDB Always On这个版本。

我们实际上从数据库的技术和产品形态来讲,PolarDB可以分为集中式和分布式。在集中式的领域,我们推出了云原生的MySQL版本和云原生PG版本。并且基于云原生PG的版本,进一步做了Oracle的兼容性。所以在集中式云原生版本赛道上,我们实际上全面的拥抱开源生态,但是在此基础上,我们坚持的走自主自研的道路。在分布式道路上,我们全面的拥抱MySQL生态,推出了全面兼容MySQL云原生分布式版的PolarDB。

这是截至到目前为止使用PolarDB的客户,这些客户分布各行各业,从金融、零售、运营商、能源。目前我也非常高兴跟大家分享PolarDB已经有1万家企业及客户,PolarDB的全网部署CPU核数突破了100万核,我们在全球80多个可用区都有PolarDB的影子,并且100%兼容开源生态。

我们也获得了一系列权威认证,比如说在Gartner每年发布的全球云数据库市场报告的分析里面,我们连续四年进入了领导的象限。也是中国在基础软件领域唯一一个进入领导者象限的企业。

我们也获得了去年SIGMOD 2023年最佳论文,也是中国大陆研究团队首次摘得该奖项。我们的市场份额根据IDC的报告,连续4年获得了中国关系型数据库市场份额第一。其中在公共云的市场份额超过40%,线下加公共云合在一起,我们达到了27%。

我们也获得了一系列其他的认证,比如说中国电子学会的科技进步一等奖、分布式数据库金融的权威认证,以及国家安全测评中心推出的自主可控的认证。

这是PolarDB一些客户的典型案例,比如说在中国邮政、中国移动、中国联通、韵达、友邦保险,等等一系列PolarDB都起到中流砥柱的作用,支撑了多个上亿级别用户的关键业务使用。帮助客户实现了降本增效、安全稳定。

在分享今天开场最后几分钟时间里,我想借此时间展望PolarDB的未来。当然我的展望是非常搞对的总结一下我们对未来的判断,后面我们的同事以及今天的重磅嘉宾会展开深入的解读。总的来讲用几句话来概括:第一,PolarDB一定会和智能化深入结合,比如说提供更加智能化的使用数据库的体验,比如说在数据库内部更好的支持智能化的工作负载。

另外,PolarDB会坚定的推向一体化方向发展,让数据在数据库里自由流动,支持不同业务场景的不同数据处理需求。

具体来讲,我们认为有四化的趋势:一是云原生化、二是平台化、三是一体化、四是智能化。基于四化的趋势,我们认为数据管理开发就会像搭积木一样轻巧有趣。

云原生化就是将Serverless等等这些技术继续深入发展,平台化就是要提供标准的API,支持OpenAPI等等这些让开发更加自动化,并且基于云平台进行软硬件协同的创新。

一体化就是将多个不同的数据处理场景能够更加简单易用的让开发者使用起来,比如将TP/AP场景能够一体化的进行处理。这里并不是在一个引擎里完成所有的负载,而是在一份数据同一源数据的基础上支持多个引擎之间数据的流动。智能化,和AI的深度结合。

具体来讲,PolarDB作为云原生数据库的领导者,在四化的方向上会深入发展。比如在云原生化上我们做Serverless多主多写,跨AZ、跨Region灾备容灾,去做全球数据库,以及率先推出来的三层解耦的架构。

在平台化上,基于职能硬件做透明压缩,实现了3倍以上的压缩比。基于倚天ARM做深入的软硬件协同的优化,推出了全加密数据库。基于Intel的加密芯片能力,我们也积极的探索最新的CXL这种技术。

在一体化上,我们深入地探索Zero ETL,将PolarDB+AnalyticDB相结合,通过完整的一体化、为用户提供一站式的HTAP解决方案。我们将DB+存储,比如将PolarDB和缓存提供一体化数据库一致的体验。

在智能化上,我们深入的结合AI,比如用NL直接和数据库进行交互。我们对接大模型提供推理能力等等,这些面向AIGC的应用。

最后我想讲PolarDB这个名字,来自Polar这个单词,它代表北极,北极代表不断的探索极致,不断的探索边界,不断的去创新。Gartner在今年最新的DBMS云数据库魔力象限报告里也指出,阿里云的云原生数据库正在引领云原生数据库领域的技术创新。

回到我一开始讲的PolarDB设计的初衷,从易用性、稳定性、弹性、经济、一体化,我们提供了妙计的数据同步。产品体验在阿里云所有产品里NPS排名第1,提供5个9的高可用的保证,提供0-1000核秒级的弹性能力,最高可以帮助客户降低60%以上的成本。

今天大会有是面向开发者,有非常多的互动环节,在阿里云官网包括今天活动现场都有非常丰富的面向开发者、面向终端用户和客户的体验活动。比如说场景体验馆费用试用…等一系列活动,欢迎开发者积极的参与到我们提供的丰富的活动中,帮助PolarDB更好的去成长。

我今天的分享就到这里,再次感谢大家在背景的冬天抽时间来到现场,今天的主论坛会有更多的重磅嘉宾,基于我今天的开场进行进一步的深度解读。谢谢大家!