DATA MANAGEMENT
慣性との戦い:LTOからクラウドオブジェクトストレージへの移行
コンテンツ所持者にとって明白なことは、保有するデータに価値があるということです。スポーツチーム・映画スタジオ・制作会社は、自らのコンテンツ以外で商売をすることはほぼありません。しかし彼らは、コンテンツそのものと同じくらい保存場所が重要であるということに気づいていない可能性があります。
現代のコンテンツは、消費者・作成者双方からの高いアクセス性が求められています。こういった需要に対して、ストレージコストとデータへのアクセス性のバランスに秀でているのがクラウドオブジェクトストレージです。クラウドオブジェクトストレージでは、コンテンツをコスト効率よく大規模に保存し、必要なときに必要な場所から迅速にアクセスできます。これによって、多様なユースケースとテクノロジーにアクセスしながらメディアワークフローを改善し、コンテンツから新たな収益機会を生み出すことが可能になります。
クラウドストレージが大規模に成長を続けるメディアエコシステムへの架け橋になる一方で、LTOには限界があると言わざるを得ません。LTOは一般的に、保護が必要だがアクセスする可能性のないアーカイブコンテンツを低コストで保存する目的で使われています。LTOが発売された当初は、長期保存用としては最高級の品質を誇っていました。しかし、新たに発表されたLTO10は、2世代以上前のフォーマットをサポートしていません。さらに現段階では、LTO10ドライブの下位互換性については一切言及されていません。そのため、現代のニーズに見合わないLTOについて再考し、クラウドへのデータ移行という新たな方向性を定めるべき時が来ています。
移行を開始する
コンテンツ所有者は、テープストレージが安価で、信頼性が高く、標準的であるというメリットを認識しています。しかし、速度が遅く、扱いにくく、時代にそぐわないというデメリットもおそらく把握していることでしょう。テープストレージの優れた点は、二度と見ない可能性のある映像を長期間保管できることですが、問題はそこにあります。
テープストレージに保管されているコンテンツは、プライマリストレージに戻すまでほとんど何もできない状態になります。視聴者が閲覧することも、ストリーミングプラットフォームで検索されることも、パッケージが編集されることもありません。テープストレージがコンテンツの保存に適しているのは確かですが、コンテンツの寿命とは単にフィルムを保存することではなく、メディアエコシステム内で継続的な関連性を保つことにあります。
LTOの課題は、慣性、つまり静止している物体が静止したままでいようとする性質にあります。すでにテープストレージへの投資を行っている場合、それを変更するのは困難です。映像をテープに保存することにはそれほどコストがかかりませんが、テープからクラウドストレージに移行するには時間と予算の両方がかかります。
しかし、ニュートンの第一法則はこう言った状況にも解決策を与えてくれます。何事もやり始めは労力が必要かもしれませんが、データをテープストレージから移行させることで、流通の維持がはるかに容易になります。データの移行によって、ディスク上でもクラウド上でも、コンテンツがアクティブな状態で移動しやすくなり、価値を生み出すアプリケーションやメカニズムと自由に連携できるようになります。
時代に沿った変化
かつて主流だったテープストレージは、他のテクノロジーやエコシステムに置き換えられつつあります。このエコシステムによって、私たちの働き方やコンテンツ所有権をめぐるビジネスが改善されました。アーカイブコンテンツを扱う作業(カタログ作成、再配布、資料の編集など)は、もはやLTO形式では最適な対応ができなくなっています。
コンテンツの世界では、必要なときに必要な場所で必要なものにアクセスできる環境が求められており、クラウドはこういった需要に最も適しています。データの表示、共有、検索はすべてオンラインで行われるため、コンテンツがそこになければ、作業を実行することができません。
データの検索性
コンテンツの量が多い組織では、図書館システムにおけるデューイ十進分類法と同じくらい検索性が重要です。しかし残念ながら、LTOの検索機能は極めて限られています。LTOの形式では、探しているものを見つけるために欠かせない詳細なメタデータがサポートされていません。
一方、クラウドオブジェクトストレージは、詳細なメタデータをサポートする高度な検索オプションを備えています。そのため、編集者やその他の関係者は、コンテンツの名前や日付だけでなく、場所、カラープロファイル、カメラの種類、その他無数のパラメータで映像を検索することができます。
AIと自動的なメタデータタグ付けの進歩によって、新たな方法でカタログ検索を行うことが可能になりました。コンテンツ別に検索できる機能(例:アルバート・プホルスの打席、シルバーのトヨタ車、山脈のある風景など)は、編集者やコンテンツ管理者にとって大きなパラダイムシフトとなっています。Googleがインターネットと利用者の関係を再定義したのと同じように、AIを活用した高度な検索機能は、コンテンツと私たちの関係を再定義することになるでしょう。
収益化
昨今、コンテンツを収益化する方法は豊富にあります。ストリーミングサービス、商用ライセンス、ソーシャルメディアなどは、コンテンツ所有者が既存のライブラリから使用料を徴収し、コンテンツを最新に保つ手段として扱われています。ここには分かりやすいメリットがありますが、真のセールスポイントは必要な労力が少なく済むという点です。収益化は、新しいコンテンツを得ずとも既存のライブラリをフィルタリング・変換・共有するだけで済みます。
しかし、テープに記録されたままのコンテンツは、本来であれば実質的に活用できる素材をベンチに寝かせているようなものです。コンテンツを安価なLTOに保存することがコスト削減につながる場合もありますが、データが非アクティブな状態では組織に何の価値ももたらされません。コンテンツを保管するのであれば、その費用に見合った価値がある方が良いでしょう。クラウドへの移行は、ストレージコストを費用対効果の高い投資に変えることも含めて、継続的な収益性を実現するための重要な第一歩となります。
大規模なアクセス
LTOは信頼性とコスト効率に優れたストレージ形式ですが、他のストレージハードウェアと同様に、物理的な容量制限があります。保存および保持するコンテンツは際限なく増え続けるため、デバイス容量が限界に近づくたびにコストのかかるアップグレードを行う必要があります。LTOドライブは、圧縮データとネイティブフォーマット(RAWデータ)の容量が大きく異なる形で販売されることがよくあります。LTO10ドライブの場合、最大容量は圧縮データで90テラバイト、ネイティブデータはわずか36テラバイトです。メディアファイルは圧縮するには大きすぎるため、コンテンツ所有者はデータを非圧縮の状態で保存することを余儀なくされます。これは、利用可能なストレージ容量の167%に相当します。
ドライブ自体と同じ場所にいるユーザーだけが保存されたコンテンツにアクセスでき、物理的なリニアストレージ形式からファイルを取り出すのに数分から数時間かかる状態では、使い勝手が大幅に低下します。
こういった状況に対して、クラウドオブジェクトストレージは大規模なメディアに必要な無限の拡張性を提供します。これにより、新たなハードウェアを購入せずとも追加コンテンツを自由に取り込むことができるようになります。また、データの読み取りおよび書き込みが高速で行われるため、インターネットに接続されたあらゆるデバイスから大量のコンテンツにアクセスすることが可能になります。
制作現場が世界中に広がり、映像編集のプロセスが分散化されるにつれて、こういったグローバルな展開の価値がますます高まっています。Wasabi Hot Cloud Storageでは、ハイパースケーラーでは高額になりがちな下り転送料やアクセス料が無料なうえ、コンテンツへの完全なアクセスが保証されており、リモートワーカーが制限なく創造活動を行える環境を実現しています。
(避けられない)移行
もちろん、クラウドへの移行はそれほど簡単な作業ではありません。大規模なファイルのアップロードやインデックス作成には時間がかかるため、プロセス全体で貴重な帯域幅が消費される可能性があります。実際、移行の難しさは、LTOの長期ユーザーが現状のままでいる大きな要因になっています。
しかし実際には、好むと好まざるとにかかわらず、LTOからの移行は必須になると思われます。現段階では、最新のLTO10フォーマットは旧バージョンとの下位互換性がありません。つまり、新しいLTO10はLTO9以下のドライブでは動作せず、新しいドライブが古いテープで再生できない状態になっています。新しいフォーマットにアップグレードするには、新しいドライブを用意し、既存のコンテンツをLTO10に完全に移行させる必要があります。いずれにせよ、古いLTO形式を使用している場合は移行せざるを得ないのです。ここでポイントとなるのは、これまでと同じようなテープライブラリに移行するのか、それとも無限の拡張性を備えたクラウドに移行するのかということです。
全体的に見ると困難に思えるかもしれませんが、クラウドへの移行は段階的に進めるのが最適です。移行を迅速に進めたい場合は、役立つツールを使いましょう。たとえば、物理的なデータ転送アプライアンスにデータを入れることで、選択したクラウドプロバイダーに直接送信することができます。また、ファイル高速化サービスを利用すれば、パブリックインターネット経由の取り込みを大幅に高速化できます。
結論
従来、LTOはコンテンツを長期保存するうえでコスト効率の高い方法でした。しかし今は、データが最も貴重なリソースとなる新時代です。規模や形態を問わず、あらゆる組織では、古いコンテンツを利用し、アーカイブ映像の収益化、分析ツールによる新たなビジネスインサイトの獲得、AIモデルのトレーニングなどを行っています。LTOを利用していた場合、これらのいずれの目的にもデータを活用できないまま、ライブラリを新しい形式へアップグレードするだけの状態に陥ってしまいます。
コンテンツの重要性や可能性を見誤らないでください。クラウドは、コンテンツにとって新たな可能性への入り口となります。コンテンツをクラウドベースのメディアライブラリに保存するのが早ければ早いほど、その分データの潜在能力を活用できるようになります。
Wasabiの最新のホワイトペーパーでは、それを実現する方法について詳しくご説明しています。クラウドストレージの専門家による細やかな移行ガイドとベストプラクティスによって、テープからクラウドへのスムーズな移行を行うことができます。
昨今のAIチームは、クラウドオブジェクトストレージで増え続けるデータを保存および管理し、AIモデルのトレーニング、微調整、運用に役立てています。この理由は非常に明快で、機械学習パイプライン、検索拡張生成(RAG)、推論を含むAIワークロードの多くが非構造化データを好み、オブジェクトストレージはこういった煩雑な情報やメタデータの保存に最適であるためです。現在、画像・動画・メール・文書・センサーログなどの非構造化データが、企業データの80%以上を占めています。しかし残念ながら、こうしたデータの多くはサイロ化しているか、AI向けではないシステムに保存されている場合がほとんどです。そのため、貴重なデータを一元管理することができるクラウドオブジェクトストレージがAIチームの関心を集めています。クラウドオブジェクトストレージは高い拡張性とコスト効率を備え、非構造化データを簡単にAIへ適応させることができます。本ブログでは、クラウドオブジェクトストレージがAIワークロードに適している理由についてご説明します。1. AI導入のコストとリスクを削減AIイニシアチブの立ち上げには、コンピューティング、ストレージ、人材への多大な投資が必要です。従来のオンプレミスインフラでは、特にストレージに関して初期段階で多額の設備投資が求められる傾向があります。これは、初めてAIを導入するチームにとって現実的とは言えません。一方、クラウドオブジェクトストレージの場合は設備投資(CapEx)の代わりに従量課金制を採用しており、ニーズに応じてストレージコストを調整できます。これにより、新しい高価なインフラに全財産を投じずとも、パイロット運用、新しいモデルのテスト、戦略の調整が容易に行えます。AIの実験段階でクラウドオブジェクトストレージを使用することで、ハードウェア構築のコスト負担がない状態で迅速に作業を開始できます。2. 予算内での拡張を実現AIワークロードは大量のデータを消費し、非常に動的になる傾向があります。そのため、プロジェクトが進化し、新たな変数が導入されるにつれて、ビジョンモデル、大規模言語モデル(LLM)、微調整のサイズが肥大化することがよくあります。これによって、データ量だけでなく求められる容量も予測できないほど急増する可能性があります。クラウドはこのような成長にも対応し、柔軟に拡張します。例えば、来週に容量を2倍にする必要がある場合でも、クラウドオブジェクトストレージを使えば業務を中断せずに対応することが可能です(オブジェクトストレージを使用してデータの急増を管理する方法はこちら)。ただし、AIワークロードはAPIを集中的に消費する可能性があるため、クラウドオブジェクトストレージプロバイダーを選択する際には注意が必要です。再トレーニング、推論、パイプライン自動化が同じデータセットから繰り返し行われると、APIリクエストなどの手数料が急速に増加する恐れがあります。お手頃かつ予測可能なコストで大規模なAIデータを保管するには、使用量に基づいたシンプルな価格設定のプロバイダーを探す必要があります。3. いかなる場所でも最高のコンピューティングリソースを活用最新のAIワークロードはモジュール化されています。多くの場合、チームはクラウドでコンピューティングを実行したのち、別のクラウドでオーケストレーション処理を行い、内部および外部ソースからデータを取得します。そのため、コンピューティングとストレージを単一の環境に閉じ込める手法はもはや現実的ではありません。そこで、ストレージをコンピューティングから分離すれば、各ワークロードに最適なツールとクラウドを柔軟に使用できるようになります。S3互換のオブジェクトストレージは、パブリッククラウド、ハイブリッド展開、特殊なGPU環境ともスムーズに連携します。これにより、制限のない状態で、特定のニーズや市場に応じてコンピューティング環境とストレージ環境を組み合わせることが可能になります。クラウドオブジェクトストレージは、AIアーキテクチャに含まれるGPUファーストのクラウド、オンプレミスのデータセンター、コンテナ化されたアプリ、連携済みのデータパイプラインを柔軟に結び付けます。4. データサイロを解消し、AIパイプラインにデータを供給AIモデルには、単なるデータだけでなく、コンテキストが豊富な大量の非構造化データも必要です。しかし多くの組織では、こういったデータはAIワークフローに接続されていないレガシーシステム、部門サーバー、コールドアーカイブなどに閉じ込められています。オブジェクトストレージは、こうしたサイロを解消するのに役立ちます。オブジェクトストレージで大規模な非構造化データの取り込みを行うことで、AIパイプラインの各フェーズ(トレーニング、微調整、推論など)にわたって画像、動画、ログ、ドキュメントなどの資産にアクセスできるようになります。また、フラットなメタデータ主導アーキテクチャにより、特定のデータサブセットを迅速かつ効率的にタグ付け、クエリ、取得できるため、場所やタイミングを問わずAIモデルに必要な情報を容易かつ正確に提供することが可能です。AI向けに企業データを統合する際は、クラウドオブジェクトストレージを利用することでデータを使いやすくアクセスしやすい環境が実現します。5. AI資産を保護し、レジリエンスを確保独自のモデルを構築する場合でも、機密性の高い顧客データを使用して微調整する場合でも、コンプライアンスや将来の再トレーニングのために出力をアーカイブする場合でも、取り扱うコンテンツの保護は必須です。クラウドオブジェクトストレージは、データの耐久性、不変性、地理的な冗長性を強力にサポートします。また、オブジェクトロック、バージョン管理、ネイティブ暗号化(保存時および転送中)などの機能によって、データの改ざんや不正アクセスを防ぎます。さらに、GDPR、HIPAA、FERPAなどの業界標準および規制へも準拠します。こういった状態を保つことは、AIチームにとって単なるセキュリティ以上のものを意味します。AIモデルを再構築、再トレーニング、または再検証する必要がある場合、クラウド内に信頼性が高くイミュータブルなデータソースがあるかどうかは非常に重要です。スケーラブルで持続可能なAIの基盤ストレージ戦略は、AIイニシアチブの速度、コスト、成功に大きな影響を与えます。大規模言語モデル(LLM)の試験運用や、企業全体における検索拡張生成(RAG)ベースのアプリケーション拡張などを行う際は、それに対応しうるインフラが必要です。クラウドオブジェクトストレージは、昨今のAIに合わせて構築されています。また、大規模な非構造化データを処理し、あらゆるコンピューティング環境と簡単に統合でき、多額の先行投資も必要ありません。さらに、取り込みから推論、アーカイブに至るまで、データパイプラインの進化に合わせて適応できる柔軟性も備わっています。多くのプラットフォームがオブジェクトストレージを提供していますが、すべてがAI向けに最適化されているわけではありません。ハイパースケーラーを利用した場合、複雑な価格設定で下り転送料やAPIリクエスト料金がかかり、コストが予測不可能になる傾向があります。これにより、実験が停滞し、総所有コストが押し上がる可能性があります。一方、Wasabiは高性能かつS3互換のクラウドオブジェクトストレージによってこれらの障壁を排除します。また、Wasabiでは従量課金制を採用しており、容量に対して定額料金が設定されているため、下り転送料やAPIリクエスト料などの手数料は一切かかりません。Wasabiのセキュリティに対する多層防御アプローチでは、不変性と、業界初の機能であるマルチユーザー認証が手数料なしでご利用いただけます。これにより、たとえ管理者であっても、複数の承認なしにストレージバケットやアカウント全体を削除することができなくなり、重要なAIデータの保護がさらに強化されます。こういった条件を加味して、より多くのチームがデータ集約型のAIイニシアチブをサポートする際にWasabiを選択しています。...
データは今やビジネスにおける主要な通貨となっており、それゆえに攻撃者の主要な標的となっています。ランサムウェアの増加、内部脅威の深刻化、そしてコンプライアンス要件の厳格化に伴い、企業は攻撃者に決して侵害されることのない安全策を必要としています。12月2日(火)、Wasabiは「Covert Copy(コバート コピー)」を発表しました。これはWasabi Hot Cloud Storageの特許出願中の新機能であり、ユーザーが選択したストレージバケットに対して、ロックされた不可視(隠し)コピーを作成できるようにするものです。この保護されたコピーにより、万が一ランサムウェア攻撃を受けたとしても、重要なデータは手つかずのまま確実に守られます。エンタープライズクラスの保護を、シンプルかつ手頃な価格でランサムウェア攻撃の主な手口は、ビジネスに不可欠な機密データの持ち出しと、それに続くデータの暗号化や破壊です。被害を最大化し、可能な限り高額な身代金を搾取するために、バックアップデータまでもが攻撃対象となっています。これまで、他のクラウドプロバイダーで「仮想エアギャップ」を実装するには、高度なセキュリティ知識やシステム知識に加え、複雑なツール、ポリシー、ルールの管理が必要でした。その結果、多くの顧客はリソースや時間を費やすよりも、リスクを受け入れることを選んでしまっていました。Covert Copyは、導入の合理化、つまりシンプルにすることでその複雑さを無くします。これはWasabi Hot Cloud Storageに含まれる機能であるため、ユーザーは保護したいデータを選択し、数回クリックするだけで保護プロセスを開始できます。ストレージレベルでの高度なデータ保護のセットアップと運用がシームレスに行えるため、ユーザーは何を保護すべきかを驚くほど簡単に選択できます。Covert...
クラウドストレージは、あらゆる組織、特にマネージドサービスプロバイダー(MSP)がサポートするビジネスにとって基盤となる要素です。MSPとは、テクノロジー導入の最前線に立ち、常時接続のオンデマンド環境でクライアントと顧客のやり取りをサポートする役割を指します。最新のCloud Storage Indexによると、過去5年間で72%の組織がクラウドオブジェクトストレージを使用しています。今ではクラウドを単に導入するだけでなく、それに伴う説明責任も求められるようになり、より難解な課題に対応しなければなりません。また、昨今のデータ利用に合わせて構築されていないプラットフォームではクラウドストレージの請求額が予想を上回る傾向にあり、投資利益率(ROI)を検証する必要が生じています。私たちはこの状況に対応するトップクラスのMSPの現状を知るべく、Vanson Bourne社との提携により、大規模かつ複雑な環境を管理するMSPのシニアリーダーたちにインタビューを行いました。そこで得られた情報は驚くほど率直で、一貫性があり、時に困難な課題も伴うものでした。信頼性が高く、コスト効率に優れたクラウドストレージをサービスに組み込む際、MSPが直面する5つの厳しい現実を分析してみましょう。1. データ量は急増しており、その勢いは未だ衰えずデータの増加は減速していません。2024年、クラウドに保存されているデータ量は3.6ゼタバイトにのぼります。IDCは、2028年までにその量は3倍になると予測しています。AIの導入、コンプライアンス、ハイブリッドワークなど、データ増加の原因は多岐にわたります。それが何であれ、大量のデータ生成への早急な対応が求められていることに変わりはありません。インタビューを受けたMSPは、前年比15~20%のストレージ増加を行っていることがわかりました。リモートでの連携、セキュリティログ、AIモデルのトレーニングなどにビッグデータを使用する目的で、ストレージの需要が高まっています。2. 多くのMSPが依然として単一のエコシステムに留まっている多くのMSPは、単一のベンダーに依存しないアプローチを採用し、業界・インフラ・デジタル成熟度が異なるクライアントに幅広く対応しながら増大するデータ需要に対処しています。一方、各ベンダーのプラットフォームはそれぞれ目的が異なります。たとえば、AzureはMicrosoftベースのスタックを多用する企業に適しています。GCPはAI対応のワークロードと分析に秀でています。AWSは多くの場合、汎用ワークロードを強化します。ワークロードのパフォーマンス、コンプライアンス、コスト効率を両立させるには、こういったサービスを適切に組み合わせる必要があります。しかし現実には、MSPのストレージワークロードの70~75%はまだAWS上で実行されています。その理由は、AWSからの移行に高額なコストがかかるためです。データの移動、ワークロードの再調整、ベンダーの完全な切り替えを行う場合は「退出税」として下り転送料を支払う必要があります。もし、ビジネスにより適した別のプラットフォームを見つけたとしても、コストが高額になるため、クラウド移行が困難になる可能性があります。3. データアクセスおよびデータ利用の増加による予算オーバー2024年、MSPの80%がクラウドストレージ料金が予算オーバーになったと回答しています。また、この予算の半分は容量ではなく手数料に充てられたことが判明しました。データは日常的な操作で頻繁にアクセスされるため、コストが急速に増加します。85%の回答者が少なくとも月に1回バックアップデータを復元83%の回答者が少なくとも月に1回アーカイブデータにアクセスバックアップを復元、災害復旧計画のテスト実行、クライアントのアーカイブデータ取得などを行う場合、そのたびにAPI料金、下り転送料、階層移行コストが発生します。そのため、アーキテクチャを変更しない限り、クライアントのニーズに応じるためにより多くの料金を支払うことになります。4. コストを優先することでデータが無防備な状態にCloud Storage Indexでは毎年、セキュリティの重要性を強調していますが、組織の現状は異なるようです。実際に、ランサムウェア、誤削除、内部脅威に対する最も重要な安全対策の一つである不変性(オブジェクトロック)を実際に取り入れているMSPは半数以下でした。この理由は、オブジェクトロックなどのコア保護を有効にするとストレージコストが高くなるためと思われます。オブジェクトロック関連のコストオブジェクトロックを設定するためのPUTリクエスト保持設定を確認するためのGET/HEADリクエストライフサイクルポリシーが変更または拡張された場合のPOST/DELETEリクエストプレミアム機能を追加しないと最低限のセキュリティを得られない状態では、ベストプラクティスやコンプライアンスに対応できず、データの脆弱性が増すことになります。5....
