GoogleCloudDataLakeはあらゆる形式のデータを柔軟かつスケーラブルに取り込み、統合・保存・分析できる次世代のデータプラットフォームで注目されています。
従来のデータウェアハウスでは難しかった非構造化データの活用を可能にし、GoogleCloud上でのリアルタイム分析や機械学習への連携を円滑にする点が特徴です。
たとえばBigQueryを用いた大規模なクエリ処理や、Dataflowによるストリーミングデータの処理など、GoogleCloudの各種DataLake関連サービスを組み合わせることでデータドリブンな意思決定をスムーズに進めることができます。
GoogleCloudDataLakeの利点ではまずストレージとコンピューティングが分離されていることにより、コスト効率の高い構成が可能である点が挙げられます。
DataLakeを中心にCloudStorageやCloudPub/SubCloudFunctionsといった各サービスが統合され、シームレスなデータ連携が実現します。