亚马逊云科技近日宣布,完全托管的PB级云数据仓库服务Amazon Redshift的数据共享功能现已在由亚马逊云科技中国(北京)和(宁夏)区域推出。该功能可以让客户安全、方便地在Amazon Redshift集群之间实时共享数据,助力客户迈向一个 “Zero-ETL” 的未来。
亚马逊云科技一直致力于为客户消除数据 ETL(提取、转换和加载)和其它数据迁移任务所带来的繁重压力,帮助客户专注于分析数据,帮助业务获取新的洞察。此次推出的Amazon Redshift数据共享功能是在Amazon Redshift数据仓库之间共享数据的简单直接的方式。
此前,当需要在两个集群环境运行不同业务负载时,客户不得不复制和移动同一套数据才能实现数据共享,这一过程不仅提高了使用成本,也大大增加了数据维护和保证数据一致性的难度。
如今借助数据共享功能,客户可以实现即时、精细和高性能的数据访问,为所有数据使用者提供实时、一致的数据视图,从而在组织内和组织之间、以及与外部相关方进行安全受控的协作。利用该项功能,客户还可以将数据仓库的数据与多个BI 和分析集群共享;多个业务组之间可以方便地协作开展更广泛的分析和数据科学研究;组织内以及跨组织的协作也可以共享数据服务,以各种精度共享数据。
数据共享可以在同一账户内进行,也可以跨不同账户,只要账户在同一区域即可。在Amazon Redshift集群上使用数据共享不会产生额外成本,RA3节点类型的Amazon Redshift集群可以直接使用该功能。
在 “Zero-ETL” 技术领域,亚马逊云科技很早就在Amazon Redshift上推出联邦查询(Federated Query)功能,让用户可以对跨数据库、数据仓库和数据湖的数据进行查询和分析,而无需移动数据。联邦查询功能可实现实时数据集成并简化 ETL 处理流程。
2022年底,亚马逊云科技进一步发布两项功能,分别助力客户使用 Amazon Redshift 近乎实时地分析 Amazon Aurora 中的数据,无需在不同服务之间进行数据 ETL;以及帮助客户可以在 Amazon Redshift 的数据上轻松运行 Apache Spark 应用程序。通过这些新功能的陆续发布,亚马逊云科技帮助客户逐渐迈入一个 “Zero-ETL” 的未来。