在转换Astra DB managed Cassandra云数据库服务大约六个月后,DataStax正在采取合乎逻辑的下一步,将无服务器支持扩展到跨地区。Cassandra是此类功能的逻辑目标,因为它传统上是为需要快速写入的极端、扩展、分布式部署用例而设计的。
流行的概念是无服务器简化了操作,并且对于高度可变的流量负载,可以降低运行数据库的成本。对于全球分布的数据库,过度提供的成本很快就会增加。
Astra DB加入了一组非常精选的数据库,这些数据库是无服务器的,可以在不同程度上跨越多个区域。它是目前唯一一个在佐治亚州的多个云上运行的云。其他的包括PlanetScale,我们在一年前刚刚讨论过它,它允许您有选择地在一个或多个地区切分MySQL;但它目前仍处于测试阶段。还有DynamoDB,它提供了一个全局表功能,用于指定一些表以复制到其他区域,而Cosmos DB也提供了一个无服务器选项——但这两个都只在各自的云上运行。然而,其他多区域数据库云服务,如谷歌云扳手和蟑螂云并不是无服务器的。跨多个区域扩展的无服务器平台仍然相当罕见,因为在协调资源时,设计这些平台需要一些花哨的步法。
新的多区域功能将Astra DB作为单个逻辑实例跨客户选择的所有区域运行;在每个区域内,至少有两个用于故障切换的数据中心或可用性区域。在区域组中,管理员配置提交和复制写操作的方式和位置,以实现故障切换和本地可访问性。故障切换的默认做法是与同一区域中的另一个数据中心进行故障切换。至于复制写入,管理员可以有选择性地控制云提供商收取的写入请求单元的成本。
全球分布数据库的用例包括需要跨多个区域快速写入和读取的应用程序,而无需远程访问相关的延迟。此外,随着数据主权或居留权法律的迅速出现,跨区域能力为维护多个独立实例提供了一种替代方案;在这些情况下,管理员基本上可以共享数据库,将数据子集限制在其所在地区。
在新版本发布之前,一些DataStax客户已经在处理涉及跨地区复制的多地区部署。例如,Infosys在Cassandra所在的每个区域都设置了VM,以处理全局客户端的复制。他们面临着维护和更新所有虚拟机和相关YAML文件的难题。随着Astra DB现在为serverless添加了多区域支持,这些复杂性被掩盖了。
在这一点上,Astra DB跨多个区域的使用案例适用于需要快速本地访问的场景,这些场景对数据出口成本也很敏感。虽然Astra DB在所有三大公共云上都可用,但对所谓的“云间”(跨多个云提供商运行同一数据库)的需求很少或没有