云数据库取代传统数据库的趋势正在加速。
根据今年8月IDC发布的2020年中国关系型数据库市场研究报告,中国市场上以公有云模式部署的关系型数据库市场占比达到51.5%,首次超过传统线下部署模式市场规模,预计到2025年将继续走高,占比达到73.5%。另一家权威机构Gartner 则预测, 2024 年全球云数据库的占比将提升至 75%。
在云数据库超越传统商业数据库逐渐占据主导地位的过程中,云计算巨头功不可没。截至目前,全球超过45万个数据库已经通过亚马逊云科技完成迁移上云。
亚马逊自身也是云数据库的超大型客户。2019年,亚马逊电商将存储在7500个Oracle数据库中的75PB的内部数据全部迁移到亚马逊云科技自己的数据库服务中。
“虽然亚马逊电商是Oracle全球排名前几的大客户,能够拿到非常好的折扣。但上云帮亚马逊电商节省了60%的成本,同时将面向消费者端的应用程序延迟降低了40%,数据库管理支出减少了70%。”
2021年11月24日,在亚马逊云科技数据库服务媒体沟通会上,亚马逊云科技大中华区产品部总经理顾凡透露。
在企业通向现代化应用的路径中,为什么说云数据库是大势所趋?以亚马逊云科技为例,我们来看看目前云数据库的优势,以及亚马逊云科技数据库产品的核心理念。
专库专用,打造丰富的工具箱
根据底层架构,数据库可以分为几大类:
一类是专库专用,按照不同的目的、使用场景构建不同类型的数据库产品,以亚马逊云科技为代表;
一类是通用平台模式,一个数据库打天下,通过多模态让一个引擎集成丰富的功能,以Oracle等传统数据库厂商为代表。
此外,近几年HTAP(混合事务和分析处理)概念火热,,其强调打破OLTP和OLAP之间的隔阂,既可以应用于事务型数据库场景,也可以应用于分析型数据库场景。
“专门构建的产品设计理念贯穿了亚马逊云科技众多产品线,我们比较不愿意去做大一统的产品,因为技术的选择永远是有牺牲的。回顾历史,很难有一个技术能够在性能、功能和可用性等方方面面都做到极致,如同一把锤子不可能是万能的。”顾凡表示。
目前,亚马逊云科技共有八个类别的数据库,涵盖了各种常见的数据库类型,包括关系型数据库、键值数据库、文档数据库、内存数据库、图数据库、时序数据库、分类账数据库、宽列数据库。
以最常用的关系型数据库为例,Amazon Aurora兼顾了商用数据库的速度和可用性,同时可媲美开源数据库简单开放与低成本,成为亚马逊云科技历史上用户数量增长最快的云服务。
Amazon Aurora可以提供5倍于标准MySQL的性能,以及3倍于PostgreSQL的吞吐量,但成本只有商业数据库的1/10。其可以同时跨3个可用区(AZ),复制6个数据副本,实现AZ+1的高可用(一个AZ出现故障,同时另外一个AZ的一个数据节点或者数据副本出现故障)。
推进Serverless数据库普及
Serverless的本质是通过封装几乎全部的底层资源和系统运维工作,使开发人员更容易专注于应用本身,并可以按需使用云基础设施。Serverless的概念最早就是由亚马逊云科技提出,并逐渐扩展到计算、存储、网络、容器、数据库、应用集成多个方面,形成了全栈式的Serverless服务。Serverless数据库也是亚马逊云科技的一大优势。
此前,企业按照峰值规划数据库资源池势必带来成本上的浪费,手动扩大缩小又带来了巨大的运维工作量。Serverless数据库可以帮企业省去基础设施层面大量繁复的工作,并实现完全的自动化扩展。它能够随着用户业务的请求数的增加和减少,智能化“膨胀”和“缩小”,实现资源的自动“吞吐”,无需人工介入,而且以颗粒度更小的计费模式节省成本。
目前,亚马逊云科技共有五大Serverless数据库。其中,Amazon Aurora Serverless V2,在不到一秒的时间内,可以从数百个事务扩展到数十万级别事务,最高可节省90%的数据库成本。
NoSQL数据库DynamoDB专门针对海量数据和极大工作负载,为世界上规模最大的应用程序提供支持。以亚马逊自身为例,亚马逊电商网站、语音助手Alexa以及全球数百个物流中心都采用DynamoDB作为数据库。此前在Prime会员日,DynamoDB每天可以处理超过10万亿个请求,并轻松应对每秒8920万次请求的峰值数据。
全球架构、一键部署
针对全球化企业,亚马逊云科技推出专为全球分布式应用系统设计的数据库产品,包括Amazon Aurora Global Database、Amazon DynamoDB Global Tables等。这些产品能够以一键部署的方式,帮助客户实现几千公里的跨区域数据库灾备、一分钟之内完成故障恢复、跨区域的数据复制延迟小于一秒等。
作为一家全球化的直播平台,近年来虎牙加速出海步伐,2020年,其海外版直播产品Nimo TV的MAU已经突破了三千万。随之而来的挑战是,原有的MySQL数据库的性能已经不能满足业务飞速发展的需求。通过采用Amazon Aurora替换MySQL,虎牙实现了数据库的性能提升、自动扩缩容、低延时的全球同步体验以及运维自动化,同时将数据库成本下降了50%以上。
此外,互联网直播平台的流量波动巨大,高峰期会有几十倍的突增,但没有规律可循,导致难以预测和预留数据库资源。通过采用无服务器架构的Amazon DynamoDB Global Tables服务,虎牙可以轻松应对十倍以上的流量突增。
加速数据库迁移上云
随着企业越来越多关键业务和应用跑在云上,数据库上云的需求也紧随其后,但是迁移过程中的复杂技术问题成为很多企业的痛点。对此,亚马逊云科技提供了灵活的多种方式帮助客户向云上迁移数据库,同时提供专业服务团队,并联合合作伙伴网络成员为企业提供从工具到人才的支持。
今年11月,亚马逊云科技在中国区域(北京与宁夏)推出Babelfish for Amazon Aurora PostgreSQL,客户无需或只需很少的代码更改,便可直接在Amazon Aurora PostgreSQL上运行 Microsoft SQL Server应用。这一服务加速了企业数据库上云的迁移,让企业可以利用原有的技术栈、原有的SQL Server T-SQL工程人员直接在云数据库中进行创新。
AI赋能与深度集成
“对于绝大多数企业来讲,机器学习还像几十年前的数据库技术,只是少数人才拥有的技能。”亚马逊云科技大中华区产品部数据类产品高级经理王晓野认为,亚马逊云科技正在通过各种技术创新,降低企业使用数据库、应用机器学习的门槛。
Neptune是亚马逊云科技专门构建的针对于图数据结构的数据库。通过Amazon Neptune,企业可以创建能在几毫秒内查询数十亿种关系的、先进的交互式图形应用程序。
Amazon Neptune降低了数据工程师使用机器学习的门槛。数据工程师不需要掌握机器学习技能,就可以直接从Amazon Neptune中导出数据、转换格式、训练模型并实现推理,将模型快速应用到欺诈检测、物品推荐等应用场景。
写在最后
在数据库领域,亚马逊云科技已经连续六年被Gartner评为领导者象限。尽量减少企业IT人员花在基础设施领域的时间和精力,“让开发团队写的每一行代码都是业务代码”,是亚马逊云科技数据库服务的核心目的之一。
云数据库快速增长的背后,其实是企业传统应用向现代化应用的转型,这个改变正驱动着更多企业从传统数据库转向全托管式的云数据库服务。敏捷性、通用性及扩容能力是现代化应用架构的典型特征,微服务、容器化、Serverless等新技术也是现代化应用的标志性技术。
如果企业选择了敏捷、灵活的现代化应用架构,大概率也会选择与之高度匹配的云数据库。这样才能最大限度发挥研发团队和技术人员的价值,将其投入到打造企业差异化竞争力当中。
-END-
本文为「智能进化论」原创作品。