Amazon Athena

  • 最小限のインフラストラクチャでS3バケット内のデータへクエリを発行する

  • CSVファイルに出力したデータをいち早く分析する

Amazon Athenaは、Amazon S3上のデータに対して標準SQLを実行できるデータ分析サービスです。サーバーレスですので、EC2インスタンスなどインフラ(実行環境)のセットアップや管理が不要です。
データ分析サービスにはAmazon EMRやAmazon Redshiftなどがありますが、いずれもインスタンスやクラスターなどのインフラの管理が必要です。Athenaはこのような考慮をすることなく、プロトタイプの検証や手早く分析をしたいようなケースに向いています。また、S3上に出力される様々なAWSのサービスのログをAthenaで分析するといった使い方もできます。

Athenaは、CSVやJSONなど一般的なデータ形式に加えて、Hadoop※でも利用可能なParquetなどのデータ形式にも対応しています。
※Hadoop(ハドゥープ) … ビッグデータ向けの並列分散処理を行うオープンソースのミドルウェア。AWSではAmazon EMRがHadoopに対応している。

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事

コメント

この記事へのコメントはありません。