【AWS発表】 AWS Data Pipeline が Amazon Redshiftをサポート

この記事はAWSシニアエバンジェリスト Jeff BarrのAmazon Web Services Blogの記事、AWS Data Pipeline Now Supports Amazon Redshiftを平山毅 (Facebook, Twitter)が翻訳したものです。

AWS Data Pipeline (詳しい情報についてはブログの紹介記事をご覧ください。)は特定間隔でコンピュートとストレージのサービス間のデータを統合・処理するのに役立つWeb Serviceです。リソースや可用性、内部処理の依存性、一時的な失敗、タイムアウト、を心配することなく高い拡張性のある手法でクラウドやオンプレミスに蓄積されたデータを変換・処理することできます。

Amazon Redshift (詳しい情報はブログ記事をご覧ください。)は高速で、フルマネージドな数Gバイトからペタバイト以上までのデータセットに最適化されたペタバイト級でスケールするデータウェアハウスで、1年間のテラバイトあたりが$1000以下の費用しかかかりません。（従来のデータウェアハウスのおよそ1/10の費用です。）この記事からわかるように、最近、Redshiftの機能セットと利用可能なリージョンを拡張しました。

Data pipeline、Redshiftにこんにちは
本日は、この強力なAWS Servicesの組合せとして、Amazon Redhshiftが、AWS Data Pipelinte内で標準でサポートされ、接続可能になったことををお知らせします。このサポートは、2つの新しい機能を使うことによって、実装されます。

RedshiftCopyActivityは Amazon DynamoDBやAmazon S3から新規か既存のRedshiftのテーブルにデータをバルクコピーするのに使用されます。さまざまな方法で、この強力な機能を利用できます。もし、関係性のあるデータが蓄積されたAmazon RDSや Hadoopスタイルな並列処理を行うためAmazon Elastic MapReduceを使っているならば、 Redshiftにそのデータをロードする前にS3にデータを配置させて実現することできます。

SqlActivityは、Redshiftに蓄積されたデータに対してSQLクエリを実行するために使用されます。実行されるクエリに加えて、入力用と出力用のテーブルをそれぞれ指定できます。出力用に新規のテーブルを作成することもでき、既存のテーブルにクエリー結果をマージさせることも可能です。

これらの新規Activityは、AWS Management Console内のグラフィカルなパイプラインエディター、新しい「Redshift Copy template」、AWS CLI、AWS Data Pipeline APIsを使ってアクセスできます。

一緒にデータ配置する
代表的な使用例を見ていきましょう。 ECのWebサイトを運営していて、15分単位でWEBサイトのアクセスログをAmazon S3にデータ挿入すると仮定します。毎分、ログを整えるためにHiveを使い、SQLデータベースに関連する顧客データと結合し、 Redshiftにデータをロードし、地域ごとの売上や日次の顧客セグメントのような統計情報を計算させるため、SQLクエリーを実行します。最後に、長期分析のため、Redshiftに日次のデータを蓄積します。

AWS Management Consoleを使ってこのような処理を行うパイプラインの定義方法は以下の通りです。

表示されたパイプラインでS3からRedshiftにデータをコピーするActivityの定義方法は以下の通りです。

そして、統計処理方法は以下の通りです。

さあ、今すぐ始めましょう。
AWS Data Pipeline は米国東部(北バージニア）リージョンで利用でき、このリージョンのRedhiftへのアクセスをサポートします。現在、ElasticMapReduceおよび、DynamoDBはクロスリージョンのワークフローをサポートしておりますが、将来、Redshiftへのクロスリージョンのアクセスをできるようにする予定です。

Copy to Redshiftのドキュメントからまずはスタートしてみてください!

-- Jeff;

【AWS発表】 AWS Data Pipeline が Amazon Redshiftをサポート

Trending Articles

モーツァルトディヴェルティメント変ホ長調 K.563 の名盤

井上貴博アナウンサー彼女や結婚の噂は？実家や親が話題？人気は？

Ke Aloha Kalikimakaの歌詞を和訳します

PaliのLepe `Ula`ulaと歌詞の和訳

2014年6月6日号　三菱東京ＵＦＪ銀行（5月14日付）

LNK2019:未解決の外部シンボルと LNK1120:外部参照 1 が未解決について

ヴァンパイア・ノーツ　攻略

大阪・泉南イオンで飛び降り自殺とみられる転落事件が発生：ネットで拡散された理由とは

メールディーラーで受信するアドレスを追加できますか？

Robocopy のエラー (戻り値) について

林要の結婚や経歴&評判とWikiプロフやLOVOT(ラボット)とグルーブエックス株価は

【極☆寒】「凍った髪」を競い合う『国際ヘア・フリージング・コンテスト』！寒〜い写真に身震いしつつ過ぎ行く冬にサヨナラだ!!

滋賀の部落（同和地区）一覧

【銃刀法違反】吉田総業組長代行恩田達志容疑者を再逮捕

和歌山県代表決まる　都道府県対抗中学バレー

大浦街道で重体事故

【世界大学ランキング】第１位にジュリアード音楽院とウィーン国立音大、日本勢は？

【対策済】「SKYSEA Client View」のアップデートに失敗する問題についてのお知らせ

Lahaina Lunaの歌詞を和訳しました

画像・写真】ららぽーと横浜で16歳男子高校生が転落死不審な動き→逃走し警備員に追いかけられ→柵越え飛び降り・12m転落窃盗・万引き？それとも盗撮？