[B! AWS][glue] mapk0yのブックマーク

mapk0y id:mapk0y

AWSとglueに関するmapk0yのブックマーク (1)

AWS Glueを用いてパフォーマンス向上やコスト最適化するカラム名ありパーティションのデータに変換するETLコードを作成する | DevelopersIO
はじめに Amazon Redshift Spectrum や Amazon Athena は、いかにスキャンデータ量を少なくするかが重要です。その理由は、スキャンデータ量を少なくすることによってコストを削減するだけでなく、パフォーマンスも改善するからです。一般的なRDBのレンジスキャン、Amazon Redshiftのゾーンマップによるスキャンと同様です。スキャンデータ量を少なくするには様々なアプローチがありますが、Amazon Redshift Spectrum や Amazon Athenaにおいてスキャン対象のデータを削減するには、データを事前にパーティションして、条件に基づいてスキャンするパーティションを削減します。今回は、AWS Glueを用いてパフォーマンス向上やコスト最適化するカラム名ありパーティションのデータに変換するETLコードを作成する方法をご紹介します。パーティシ
mapk0y 2018/05/29
AWS

glue
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx