-
最小限のインフラストラクチャでS3バケット内のデータへクエリを発行する
-
CSVファイルに出力したデータをいち早く分析する
Amazon Athenaは、Amazon S3上のデータに対して標準SQLを実行できるデータ分析サービスです。サーバーレスですので、EC2インスタンスなどインフラ(実行環境)のセットアップや管理が不要です。
データ分析サービスにはAmazon EMRやAmazon Redshiftなどがありますが、いずれもインスタンスやクラスターなどのインフラの管理が必要です。Athenaはこのような考慮をすることなく、プロトタイプの検証や手早く分析をしたいようなケースに向いています。また、S3上に出力される様々なAWSのサービスのログをAthenaで分析するといった使い方もできます。
Athenaは、CSVやJSONなど一般的なデータ形式に加えて、Hadoop※でも利用可能なParquetなどのデータ形式にも対応しています。
※Hadoop(ハドゥープ) … ビッグデータ向けの並列分散処理を行うオープンソースのミドルウェア。AWSではAmazon EMRがHadoopに対応している。
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。
コメント