本日AWSはまた新たなサービスである、Glacierをロウンチしました!
Glacierが必要な背景
お客様及び企業様では今までに多くの時間と多くのお金を、ミッションクリティカルデータのアーカイブに使っていたことは疑いようがない事実でしょう。ディスクや、光学メディア、テープなどどれを使っていようが、ハードウェアの保守運用、キャパシティプランニング、ベンダーとの交渉や、ファシリティの運用など、思っていた以上に複雑で高くついていることでしょう。
いかがですか?
もしこれらが当てはまるなら、本日発表させて頂くAmazon Glacierは興味を持っていただけるのではないかと思います。Glacierはどれだけのデータ量であっても、僅かなコストで堅牢かつ安全にデータを保存することが出来ます。これは何を意味するかと言うと、お客様はテープライブラリやロボットなどの機器を手放すことが出来るようになります。また、今まで数十年にも及ぶ、データアーカイビングの本質的な運用管理の煩雑さや手間からの解放とも言えるのです。
Glacierは極めて低いコスト、1GBあたり$0.01(1ペニー、1ドルの100分の1、約1円!)、でのアーカイブストレージを提供します。非常に少量のデータでも、大量のデータ(TB、PB、またはそれ以上)のデータでも保存出来ます。AWSではいつも通りですが、初期費用はなく、使ったストレージの容量だけの従量課金になります。また、お客様がキャパシティプラニングを心配する必要はなく、ストレージ容量が無くなる心配もする必要はありません。Glacierは、お客様のデータ保存期間の長さに関係なく、アーカイブストレージ容量の調達の過不足、物理的に離れたファシリティの運用保守、ハードウェアの検証、データの完全性に関連する煩わしい問題を取り除いてくれます。
Glacierとは
弊社はAmazon S3を2006年3月にリリースしました。この6年間で、S3は健全かつ安定した成長を見せ、今現在では1兆オブジェクトを保存しています。GlacierはS3の堅牢性と信頼性の良い点を踏襲しつつ、極めて低いコストでお客様にアーカイブストレージを提供できるように設計された新しいアクセスモデルを提供します。
Glacierにデータを保存するには、まずボルト(vault)と呼ばれるものを作成します。1つのAWSアカウントで1リージョンあたり最大で1000ボルト作成する事が出来ます。ボルトを作成すると、あとはシンプルにデータをアップロードします(Glacierの用語ではアーカイブと言います)。各アーカイブは最大で40TBのデータを保存する事が出来ます。また、アップロードの高速化のために、マルチパートアップロードを行うことも出来ます。Glacierはお客様のデータをAES-256で暗号化し、変更不可能な形式で安全に保存します。Glacierはお客様のデータを複数のファシリティで保存できるとすぐに、お客様の保存リクエストの応答をします。
Amazon Glacierのボルトの作成
Glacierはお客様のデータを極めて高い堅牢性(Glacierの堅牢性の設計目標は、アーカイブあたりの年間平均で99.999999999%)で保存します。またバックエンドでは、Glacierはお客様の手を煩わせて何かして頂く必要なく、システマチックなデータの完全性チェックと自動修復を行います。冗長性は十分に確保しており、Glacierは2つのファシリティに例え同時に障害が発生しても耐える事が出来ます。
ここまで読んでいただいた方にはおわかりかと思いますが、これはAmazon S3と同じではないかと思われるかもしれません。しかしながら、Amazon Glacierは次の2点でS3とは決定的に異なります。
1つ目が、S3はデータの高速な取り出しに最適化されている点です(一般的には1リクエストあたり数十msecから数百msec)。Glacierは違います。Glacierでは、データの取り出しリクエストはキューに蓄積され、多少ゆっくりとしたペースで処理されます。アーカイブのダウンロードは3時間から5時間で可能になります。
お客様が行ったGlacierへの取り出しリクエストはジョブと呼ばれます。Glacierにデータがダウンロード可能になったかポーリングして頂いても結構ですし、データが利用可能になったときに通知でお知らせするようにAmazon SNSを使うことも可能です。利用可能になった後に、HTTP GETリクエスト(バイトのレンジリクエスト含む)でデータにアクセスします。データは24時間利用可能になっています。
取り出しリクエストのプライシングもS3とは異なっています。日次で評価される月間の平均ストレージ容量の5%以内の取り出しリクエストであれば、毎月無料です。それ以上になった場合は、GBあたり$0.01が取り出しリクエストのコストとなります(詳細はプライシングのページを参照ください)。もし保存している以上に頻繁にデータの取り出しが必要な場合、S3の方がよりコスト効果が高いサービスかもしれません。
2つ目として、S3は各オブジェクトに名前を付けることが出来ます。一方、Glacierではコストを極限まで低くするために、各アーカイブはアップロード時にユニークなIDが割り振られます。
Glacierの利用シーン
もう既にGlacierの活用シーンをお気づきかもしれませんが、以下のような活用シーンがあるでしょう。
- もしお客様がエンタープライズITの情報システム部門で働いているならば、電子メール、社内利用の共有ファイル群、法的な記録、ビジネス文章などに利用できます。これらのもの多くはほとんど利用しないか、または全く利用されないにも関わらず数年または10年以上にわたり保存しておかなければいけません。
- ディジタルメディアを扱う企業で働いているならば、書籍、映画、画像、音楽、フィルムデータなどのデータをアーカイブすることが出来ます。これらアセットは簡単に10PBほどに膨らみ、かつほとんどのデータは一般的にほとんどアクセスされません。
- もしお客様が科学データや研究データの生成と収集を行っているならば、Glacierを何かのときのために保存しておき、あとで取り出す事も可能です。
始めよう、Glacier
Glacierは本日より下記リージョンで利用可能です:US-East (N. Virginia)、US-West (N. California)、US-West (Oregon)、Asia Pacific (Tokyo)、EU-West (Ireland)リージョン
GlacierはAWS Management Consoleから利用する事が可能です。また、Glacier APIを使っても可能です。AWS SDKにもGlacierサポートを追加しています。もしGlacierについてより詳細に知りたい方がいらっしゃれば、ぜひ今度開催されるオンラインセミナーにご参加ください。
以上がGlacierの紹介でした。ぜひ皆様の忌憚ないフィードバックを頂けますと幸いです!