ジェネラル
真のセキュリティコスト:2025年、高等教育機関のIT部門におけるデータ保護
年末は立ち止まって一年を振り返る時期です。高等教育機関のITおよびセキュリティ担当者にとって、2025年は真のセキュリティコストが浮き彫りになった年でした。この影響は予算だけでなく、チームの在り方やデータの保存場所に関するあらゆる意思決定にも及んでいます。
こうした背景を踏まえ、高等教育におけるサイバーレジリエンスについて、この1年間で明らかになったことを見ていきましょう。
より巧妙化し、頻繁になるサイバー攻撃
2025年は大学や高等教育機関に対する攻撃が増加し、平均して、教育機関は1組織あたり毎週4,388件のサイバー攻撃を受けました。これは世界平均の2倍以上であり、前年と比べて31%増加しています(DeepStrike)。もし、大学キャンパスが常に標的にされているように感じている方がいる場合、それは気のせいではありません。
ランサムウェアの主な原因は、人為的ミス(PEBKAC: Problem Exists Between Keyboard and Chair)であることは以前から変わっていません。また、主な攻撃手段としてはソーシャルエンジニアリングが挙げられます。送信者がネイティブスピーカーではないことが一目瞭然な、不自然な文章のフィッシングメールやテキストメッセージは誰もがご存じでしょう。
しかし、この状態は急速に変化しています。攻撃者はAIを活用し、より洗練かつパーソナライズされた、一目で見破ることが困難なメッセージを作成するようになりました。毎日大量に届くメッセージの一つ一つを精査する時間的な余裕がない場合、これは大きな問題となります。AI以外にも、RaaS(Ransomware as a Service)といったものも存在します。これはいわばサブスクリプション型のサイバー犯罪であり、攻撃者に新たな手段を提供しながら攻撃のハードルを下げています。
特に高等教育機関は標的となる要素が非常に多いため、こうした状況を深刻にとらえる必要があります。教育機関には学生の記録だけでなく、応募者の財務情報、教職員のデータ、寄付者や卒業生のリストなど、詐欺行為の温床となりうる情報が豊富に存在します。さらに、高度な研究、特に医薬品や軍事用途に関連する研究などが加われば、機密性の高い知的財産の宝庫となります。
さらに、サイバー犯罪者の目的はもはや身代金だけに留まりません。政治的・社会的・学術的な理由で大学を攻撃するハクティビストも増えています。この場合、入学データ、研究プロジェクト、さらには入学選考の結果までもが標的になり得ます。高い知名度と資金力のある名門大学は特に魅力的なターゲットであり、脅威の状況は一般的なランサムウェア以上に複雑になっています。
IT予算の縮小とスキル不足によるセキュリティリスクの上昇
高等教育には、低コストで幅広いセキュリティを実現するというプレッシャーが存在します。EDUCAUSEによると、高等教育機関の42%が2025~2026年度にIT予算の減少を見込んでいます。同時に、大学キャンパスでは学期ごとに新しいユーザーが大量に追加され、IT職の離職率も比較的高いため、環境のパッチ適用、監視、セキュリティ維持がより難しくなっています。
Dellと共同で作成したeBook「The Hybrid Cloud Advantage for Higher Education」(英語)では、セキュリティ計画における財務的な課題について説明しています。ここには、夏季休暇後の進学辞退(サマーメルト)や将来的な入学者数の減少などの問題も含まれています。こうした状況のなか、攻撃者はより高度化し、AI、クラウド、遠隔学習プラットフォームなどの新技術を利用して攻撃の対象領域を拡大しています。
ESGのレポート「Life and Times of Cybersecurity Professionals」(英語)によると、組織の59%はスキル不足が原因で既存スタッフに過重な負担をかけており、40%が既に導入済みのセキュリティ技術を十分に活用できていないことがわかりました。つまり、セキュリティ対策にかかるコストには、単なる購入費用だけではなく、チームがセキュリティ対策を維持するための時間も含まれるということです。
事態が悪化した場合、金銭的な損失は甚大なものになります。EDUCAUSEによると、教育機関におけるデータ侵害の平均コストは386万ドルです。これには、データ損失、罰金のほか、システムの復旧、当局への報告、フォレンジック調査に費やす時間など、しばしば見落とされがちなコストも含まれています。
高等教育機関のITチームを混乱させるクラウドストレージコスト
クラウドストレージの真のコストを把握するのは、見た目よりも簡単ではありません。まず、ホット、クール、コールド、アーカイブと階層が多いため、データを適切な階層に割り当てる作業は複雑になりがちです。そもそも、データへのアクセス頻度を十分に把握し、自信を持って階層化できるほど正確な情報を持ち合わせている機関はどれくらい存在するでしょうか。大抵の場合において、その答えはNOです。
理論上は、コールドストレージは研究資料、バックアップ、古いファイルなどを保管するのに最適な場所のように思われます。しかし、問題は、そうしたデータのほとんどは実際には「コールドデータ」ではないということです。Wasabi 2025 Cloud Storage Index(英語)によると、教育関係者の89%が少なくとも月に一度はアーカイブデータにアクセスすると回答しており、これは世界平均の83%を上回っています。また、回答者の約3分の1が、データ検索の遅さが仕事に悪影響を与えていると回答しました。また、56%がインシデント対応の際にアーカイブデータへの迅速なアクセスが必要だとしており、遅延はリスクの上昇につながることを示唆しています。
しかし、クラウドストレージにおける真のコストは、請求書に記載されている容量から計算できるものだけではありません。クラウドに保存されたデータをダウンロードする際の下り転送料や、データの検索・移動・不変性の維持を目的としてアクセスするたびに発生するAPI料金もあります。Wasabi 2025 Cloud Storage Indexでは、教育分野の関係者から以下のような回答が述べられました。
クラウドストレージ料金の最大50%は、容量ではなく手数料に充てられている
アップロードとダウンロードのリクエスト料金は、GB単位では少額でも規模が大きくなるとあっという間に高額になる
コールドストレージからのデータ取得には数時間、場合によっては数日かかることもあり、結果的にほかのストレージよりも費用がかさむ
教育機関の4分の3が2024年にクラウドストレージの予算支出を超過したが、その主な原因は手数料
つまり、クラウドにおけるセキュリティコストを把握するには、保存するデータの容量以外も考慮する必要があるということです。特にインシデント発生時のように迅速なアクセスが求められる場面では、データを利用するたびにコストが発生し、大きな負担となります。
2026年に向けて、データ保護を再考する
データを保護するという、重要な課題に直面しています。そこで、個々の制御と同じくらい重要になるのが、アーキテクチャ、特にバックアップとアーカイブ戦略です。データの保存と保持の方法によって、コストと複雑さがさらに増えるか、それとも減るかが左右されます。
Dellと共同で作成したeBook「The Hybrid Cloud Advantage for Higher Education」(英語)ではこの課題に取り組み、レジリエンス、復旧性、コストの予測可能性を同時に改善するストレージ戦略を提案しています。そのアプローチの中核となるのが、DellとWasabiの統合です。
DellとWasabiによるシンプルかつ低コストな保護
Dell PowerProtect Data Manager、PowerProtect Data DomainとWasabi Hot Cloud Storageの統合によって、より高速でシンプルかつ予測可能なバックアップと復旧を実現します。これにより、以下のようなメリットが得られます。
予測可能なコスト:下り転送料やAPI料金が無料で、データの復元、復旧テスト、インシデント発生時のデータ取得に追加料金が課されない
復元の高速化:Hot Cloud Storageによって、遅延やデータ取得の手間など、コールドストレージ特有のデメリットを解消
組み込みのレジリエンス:複数の階層やポリシーを管理せずとも必要なデータを保持し、複雑さと無縁な長期保存を実現
オブジェクトとしてのアーカイブ:重複排除なしの完全なセカンドコピーをWasabiに保存することで、PowerProtect Data Managerからの復元を迅速に行い、階層化による遅延を解消
高等教育機関のITにおける意義
予算の超過やチームの疲弊を招くことなくサイバーレジリエンスを強化することは、不可能ではありません。DellとWasabiを組み合わせることで、大学はより迅速な復旧、シンプルなコンプライアンス遵守、予測可能なストレージ料金を実現できます。その結果、IT部門は隠れたコストやストレージ管理に追われる時間を減らし、本来の保護業務に集中できるようになります。
常に変化する環境の中で、テクノロジー予算を組むのは簡単なことではありません。昨今、セキュリティコストは増加し、AIやデータ関連のプログラムは加速しています。総予算を増やさずにインフラ、運用、人員配置のすべてを拡張することが求められるうえ、取締役会、規制当局、保険会社に対して、トラブル発生時でも事業を継続できることの証明を提出する必要もあります。こうしたプレッシャーの中心にあるのが、サイバーレジリエンスです。サイバーレジリエンスとは、重大なインシデントを吸収し、統制された形で復旧させ、何が起きたかを証明するものであり、ビジネスの継続を左右する存在です。また、サイバーレジリエンスはストレージ容量のコスト、バックアップおよび災害復旧ソフトウェア、専門サービス、外部監査、保険更新など、予算の各項目にも明確に現れます。そのため、これはデータ保護の問題であると同時に、組織のコスト策定にも大きく関わっています。CIOが取締役会に予算を提示する際、単にツールへの投資を主張するだけでは不十分です。そのツールによってコストが計画通りに推移すること、組織が障害に耐え復旧できること、そしてデータが検証に耐えうることを示さなければなりません。サイバーレジリエンスが明確に組み込まれていない場合、それがビジネスの基本条件であるという認識が薄まり、単に「あれば望ましいもの」として追いやられてしまいます。こういった文脈を踏まえて、サイバーレジリエンスを運用に組み込めるよう考察してみましょう。本ブログでは、CIOが予算計画を立てる際に役立つ7つのポイントをご紹介します。各テーマは、一般的な支出分野と、それが支えるべきレジリエンスの成果を結び付けています。CIOとして方針を決定する立場にある方も、承認を得るために計画を提示するリーダーの方も、予算を策定する際にぜひご活用ください。1.サイバーレジリエンスを運用要件の中核にする今や、サイバーインシデントは絶えず発生しうるリスクとなっています。そのため、取締役会、規制当局、保険会社は、事業が障害に耐え、管理された形で復旧できることの証明を求めています。こういった状況のなか、CIOは、不変コピー、複数ユーザー承認、職務分離、テスト済みの復旧といった具体的なレジリエンス対策を提示しながら、それらが業務システムをどのように保護しているかを説明できなければなりません。こうした根拠が示されない場合、インシデントによる影響の深刻化、保険の更新ストップ、リスク管理に対する信頼の低下などに陥ります。2.予期せぬ出費を排除し、ストレージコストを安定化させるクラウドストレージ予算はかつて背景的なコストとして扱われていましたが、今やIT予算の中でも特に安定させにくい項目の一つになっています。業界のベンチマーク調査(英語)によると、クラウドストレージ費用の大部分は、容量そのものではなく、下り転送料・API利用料・データ取得料の変動に由来していることが明らかになりました。このような変動によってストレージコストが予期せず増加すると、組織は予算内に収めるためにベストプラクティスを削減せざるを得なくなり、あらゆるサイバーレジリエンス計画を損なうことになります。ストレージ料金が予測可能であれば、財務部門は予算を把握でき、CIOは意図的かつ統制された形でレジリエンスに投資することができます。3.AIによるデータ増加を見据えたストレージ計画を立てるAIや機械学習を利用すると、ストレージ容量に絶え間ない負荷がかかります。学習データ、作業用データセット、アーカイブされたモデル、ログ、推論結果は急速に増加し続け、その多くは再利用・監査・再学習のために保持する必要があります。そのため、容量計画においては、生成されるデータ量、データの保持期間、保護の方法を明確に考慮しなければなりません。AIを前提にストレージを計画すれば、期待するスピードでビジネスを進められます。そうでない場合、プロジェクトは停滞し、モデルの進化速度にAIデータのレジリエンスが追いつかなくなります。4.ストレージ効率をイノベーションと近代化の資本に変える多くのCIOは、総予算を増やすことなくAI・分析・近代化・セキュリティを改善することが求められています。これを実現するには、日々の支出を調整して余地を生み出す必要があります。これに対して、ストレージ階層の簡素化、重複システムの廃止、見えにくいコストの削減を行うことで、単なるコスト削減にとどまらず、サイバーレジリエンスを維持しながら戦略的な取り組みへ予算を割り振ることができます。このように捉えると、ストレージ効率はレジリエンス強化と将来的な変革に役立つ資本となります。これが明確でない場合、せっかく利益を捻出できても一般経費に回収され、新しい取り組みは後回しにされてしまいます。5.ハードウェアの過剰購入から、適切な規模のオンデマンド容量へ移行する数年先を見越してストレージハードウェアを購入するという手法は、変化の激しい現在の環境には適していません。ワークロードの移行、新しいサービスの立ち上げ、プラッフォーム間のデータ移動が行われると、ある場所では容量が余り、別の場所では不足する事態に陥ります。こう言った状況は、資本の無駄遣いやプロジェクト遅延につながる恐れがあります。ストレージが段階的に拡張できれば、成長に関する意思決定は緊急対応ではなく通常のガバナンスの一環として行えます。サイバーレジリエンスの観点でも、重要なワークロードの実行場所に合わせて柔軟に保護と復旧を整合させることができ、不適切な過剰保護や保護不足のリスクを低減できます。6.適切なトレーサビリティとガバナンスで監査に対応する規制当局、監査当局、顧客は今や、データを単に暗号化するだけでなく、エンドツーエンドで適切に扱われている証拠を求めています。つまり、データの来歴、保持期間、アクセス履歴、保存場所を示す必要があります。これに伴い、CIOが重視すべき点も、データの暗号化から、データの収集・処理・保存・破棄がGDPR、HIPAA、AI関連の開示要件を満たしているかどうかに移りました。このレベルの可視性が欠けている場合、セキュリティとコンプライアンスの整合性が失われ、監査の長期化やコスト増加を招くとともに、手作業で証拠を収集することになります。こういった組織は、データの完全性とともに信頼も失います。7.重要データと財務データを同等の基準で管理する昨今の取締役会や監査委員会はデータを中核的な資産と見なす傾向にあり、重要な記録、モデル、ログが改ざんや削除されないという証拠を求めるようになりました。そのためCIOは、監査に耐えうる統制を設計する必要があります。具体的な対応策としては、独立した管理で論理的にエアギャップ化されたコピー、破壊的な操作に対する複数ユーザー承認(英語)、明確な職務分離などが挙げられます。これらが欠けている場合、監査で問題が露呈し、デジタル記録への信頼が低下します。その結果、是正作業が増え、M&Aや資金調達といったプロセスも遅延し複雑化します。予算に関する議論への影響これまでに挙げたポイントは、最初から予算計画に組み込まれて初めて意味を持ちます。そのためには、ツールや容量の問題ではなく、経営陣が理解できるビジネステーマへと議論をシフトする必要があります。ストレージ、バックアップ、保護に関する予算項目を成果と明確に結び付けることで、一貫性のあるレジリエンス戦略として提示できるようになります。実際にCIOが行うのは、個々の製品の必要性を単に主張することではなく、各テーマを具体的な根拠で裏付けることです。目標は、詳細な説明がなくても財務部門や取締役会の精査に耐えうる予算案を提示することです。サイバーレジリエンスの価値を示すことができれば、大きな説得力とともに予算を獲得できるようになります。容量にかかる料金と下り転送料・API料・データ取得料を分け、クラウドストレージ支出の推移を把握することで、コスト変動の原因を明らかにする。過去1年間の支出を日常的な運用費と新規投資に分け、ストレージのコスト削減がAI、データ、システム刷新の取り組みと明確に結びついていることを可視化する。AIデータの増加に関する前提条件を整え、学習データ、モデル、ログに必要な容量や保持期間を明確にする。直近のテスト結果に基づく復旧とレジリエンスに、RTO(目標復旧時間)やRPO(目標復旧時点)、および予算投資によって改善される項目リストを含める。監査、保険会社、規制当局は、保存データの暗号化だけでなく、トレーサビリティ、完全性、管理設計を重視していることを把握する。容量と利用率の状況を見極め、明らかな過剰購入、遊休資産、新規プロジェクトの制約となる問題点を明らかにする。このように活用すれば、予算は単にストレージ容量を正当化するためのものではなく、有効なサイバーレジリエンスとガバナンスを確立し、AI対応の環境を支える存在となります。まとめ本ブログで取り上げたリストの中から、組織の課題に沿ったテーマを2~3つ選び、次回の予算協議の軸に据えてください。そして、それぞれのテーマについて対処すべきリスクと必要な投資額を把握し、それらがレジリエンスの向上とAIおよびデータイニシアチブの支援につながるという根拠を明確に示しましょう。これを継続すれば、サイバーレジリエンスは単なる背景ではなく、データの信頼性と復旧性を支える中核になります。それは、予算においては説明可能なコミットメントに、役員会においては組織が負う価値のあるリスクに、AIやデータ施策においては管理と両立してビジネスを前進させる存在になります。こうして、CIOは自信を持ってサイバーレジリエンスを重視した予算編成を支持できるようになります。...
Veeamが新たにリリースしたSoftware Applianceには、バックアップインフラにおける構築や保護の変化が反映されています。これにより、安全なデフォルト設定、自動パッチ適用、組み込みの不変性を備えた状態で、強化されたLinuxベースのバックアップシステムを導入できるようになりました。また、一貫性があり再現可能なプロセスでの管理も行えることで、運用効率とベースラインセキュリティが大幅に改善しました。しかし、レジリエンスは導入だけで完結するものではありません。Veeam Software ApplianceにWasabi Hot Cloud Storageを組み合わせることで、データセンターを超えた保護が実現します。つまり、安全で予測可能かつコスト効率が高い保護を、独立して管理されるクラウド層に拡張することができるようになりました。この重要性を理解するには、サイバーレジリエンスの真の意味、従来のバックアップとの違い、そしてサイバーレジリエンスが現在、効果的なデータ保護戦略の基準となっている理由などを踏まえて、基本に立ち返る必要があります。今、サイバーレジリエンスがなぜ重要なのかサイバーレジリエンスは、サイバーセキュリティの単なる言い換えではありません。これは、いかなる障害が発生した場合でもシステムの稼働とデータの信頼性を維持するためのより幅広い取り組みを指す用語です。また、サイバー攻撃、停電、ソフトウェアパッチの失敗、夜中の人為的な単純ミスなど、原因を問わず障害に耐え、迅速に復旧する能力を指します。そのため、サイバーレジリエンスは現代のデータ保護の指針として重視されています。Veeam Software Applianceは、ワークロードが実行される場所で一貫性があり安全な導入と自動パッチ適用を行い、レジリエンスを根本から強化します。Wasabiは、その保護をオフサイトへと拡張し、復旧用データを検証可能な状態で安全に保管します。これにより、攻撃だけでなく、現実世界で起こりうるあらゆるトラブルに備えた、完全なエンドツーエンドの戦略が構築されますVeeam Data...
最新のAI対応のデータレイクは、耐久性があり、予期せぬコストが発生しないデータ基盤を構築するという、分かりやすい問題を解決するためのものでした。しかし、生成AIの登場により、データアーキテクチャはもはや単なるバックグラウンドのインフラではないことが明らかになりました。多くの場合、それが最大のボトルネックとなっています。生成AIは通常、モデル、GPU、フレームワークといった観点から語られます。しかし実際には、最初のボトルネックはもっと早い段階、つまり「データ」で発生します。トレーニング、ファインチューニング、検索、推論、継続的学習といったライフサイクルのあらゆる段階は、大量の非構造化データへの持続的かつ反復的なアクセスに依存しています。初期のアナリティクスのワークロードとは異なり、生成AIは「一度書き込んで、たまに読み取る」というパターンには従いません。データは次のように扱われます:実験やイテレーション(反復)を通じて継続的に再読み込みされる埋め込み(エンベディング)、インデックス、プロンプト、出力などの派生アーティファクト(生成物)に変換される再現性、ガバナンス、再トレーニングのために長期保存される変化の激しいコンピュート(計算)層から切り離される問題は、多くのクラウドストレージプラットフォームがこのような「再利用」を想定して設計されていないことです。Wasabiのオブジェクトストレージは、従来のクラウドの常識に逆らい、ストレージの経済性とアーキテクチャを、生成AIのワークロードの実際の動作に合わせています。新興の生成AIワークロード:ストレージへの要件生成AIのワークロードはすべて同じというわけではありませんが、「非構造化データへの反復アクセス」という共通点があります。主要なパターンと、それがストレージに何を要求するかを以下に示します。基盤モデルのトレーニング 基盤モデルのトレーニングは、テキスト、画像、音声、動画などの膨大な非構造化データセットに依存しており、トレーニングの実行や実験のたびに繰り返し読み込まれます。 ストレージの観点から見ると、これらのワークロードは以下の特徴を持ちます:読み取り集約型でスループット重視レイテンシよりもコストの予測可能性に敏感アーカイブの効率性よりも「データの再利用」に依存問題は、従来のクラウドストレージモデルでは、読み取りやデータの移動に対して課金(マネタイズ)されることが多い点です。この価格設定は、AIトレーニングに必要な反復アクセスパターンには逆効果です。 Wasabiは、アクセスベースの課金ではなく、容量ベースの価格設定を中心に構築されています。読み取りや下りデータ転送に対するペナルティ料金を排除することで、コスト変動の恐怖やアーキテクチャ上の妥協をすることなく、データを自由に再利用して実験を繰り返すことができます。ファインチューニング、アライメント、反復的なモデル開発 種類のプレッシャーをもたらします。データセットは小さくなりますが、変更頻度は高くなり、結果が再現可能で追跡可能であるようにデータを慎重に保存する必要があります。これらのワークフローには以下が必要です:データセットの不変性(イミュータビリティ)とバージョニングデータと、それが生成するモデル間の明確なリネージチーム間での並行実験階層化や手動のライフサイクル移行に大きく依存するストレージでは、ここで足かせになり始めます。Wasabiは、データを異なるストレージクラスに移動させることなく、大規模なオブジェクトの不変性とバージョニングをサポートします。データセットは安定してアクセス可能な状態を保ち、チームはガバナンスを維持したまま迅速に開発を反復できます。検索拡張生成(RAG)RAGは、生成AIがもたらした最大のアーキテクチャ的変化の1つです。 RAGパイプラインは継続的に非構造化コンテンツを取り込み、強化し、埋め込みを生成し、推論中に関連するコンテキストを検索します。ベクトルデータベースは類似性検索には優れていますが、記録システムではありません。 アクセスにペナルティを与えたり、データ移動に高額な料金を課したりするストレージモデルは、分離されたRAGアーキテクチャを必要以上に脆弱にし、コストを押し上げます。Wasabiを使用すれば、未加工データや強化されたデータを耐久性のある「信頼できる情報源」としてオブジェクトストレージに保存し、反復アクセスにかかるコストを予測可能に保つことができます。推論、フィードバックループ、継続的学習 推論はデータの増加を遅らせるどころか、加速させます。プロンプト、出力、ユーザーのやり取りは、監査、モデル評価、将来の再トレーニングのために保持される傾向にあります。時間とともに、推論データは次世代モデルの重要な入力となります。 Wasabiの容量優先の設計は、データ移行を強制したりアクセスにペナルティを与えたりすることなく、大量のデータ取り込みと長期保存をサポートします。AI対応データレイクからAI駆動型ビジネスインテリジェンスへAI対応データレイクの構築は出発点にすぎません。真の価値は、そのデータが「使いやすくなる(照会しやすく、強化しやすく、日々の意思決定を加速する答えに変換しやすくなる)」ことで現れます。 社内的には、Wasabiのビジネスインテリジェンス(BI)チームは、WasabiオブジェクトストレージとSnowflakeを組み合わせてこのパターンを適用し、セールスチーム向けに生成AIレスポンスを提供しています。未加工の資産(PDF、プレゼン資料、ログなど)はオブジェクトストレージに保存され、長期間にわたって経済的にアクセス可能な状態を維持します。一方、Snowflakeは構造化されたインテリジェンス層として機能します。なぜ生成AIは従来のストレージの常識を打ち破るのかほとんどのクラウド・オブジェクトストレージは、生成AIの世界では通用しない次のような前提に基づいて構築されていました:データは一度書き込まれ、めったに読み込まれないストレージ階層化がコスト最適化の主な方法であるストレージの経済性は、コンピュートの革新ほど重要ではないデータは単一のエコシステムに密接に結びついている生成AIは、これらの前提の限界を露呈させます。再読み込みが高額になると、運用チームはクリーンなシステムを構築するのではなく、コストを回避するためのアーキテクチャ設計を始めてしまいます。Wasabiは、以下の点を優先することでこれらの制約に逆らいます:アクセスベースの価格設定よりも、予測可能な経済性階層化の複雑さよりも、データの再利用性特定のエコシステムへのロックインを防ぐ、柔軟でポータブルなアーキテクチャバックエンドサービスではなく、戦略的インフラとしてのオブジェクトストレージ生成AI対応のオブジェクトストレージ・アーキテクチャトレーニングからRAG、推論に至るまで、共通のアーキテクチャパターンが現れます:オブジェクトストレージが耐久性のある「記録システム」として機能するコンピュート層はモジュール式で交換可能にするメタデータ、不変性、アクセス制御はストレージ層で適用される派生した生成物は使い捨てで再生成可能にするアーキテクトとプラットフォームチームにとっての意味生成AIプラットフォームを構築する場合、以下の点が不可欠となります:ストレージを後回しにせず、最優先の依存関係として扱うデータの再利用を容易かつ手頃な価格にする未加工データは「永続的」、派生アーティファクトは「使い捨て」として扱う経済性がシステム開発の反復(イテレーション)を妨げるのではなく、可能にするようにするオブジェクトストレージは、もはや単なるデータの保存場所ではありません。システムが迅速に動き、ガバナンスを維持し、コストのサプライズなしに拡張できるかどうかを決定づける重要な要素なのです。新興のAIワークロードは、常識に逆らうストレージを求めている生成AIシステムは、反復、再利用、そして洗練を重ねることで向上していきます。アクセスにペナルティを与えたり、厳格な階層化を強制したり、データをコンピュート層に密接に結びつけたりするストレージアーキテクチャは、あらゆる段階でそうした現実と相反してしまいます。従来のクラウドストレージモデルの常識に逆らうことで、Wasabiはオブジェクトストレージを、AI対応データレイクから本番環境の生成AIシステムに至るまで、新興の生成AIワークロードの実際の動作と適合させています。これにより、チームは技術的、運用的、そして経済的に長期にわたってスケールできるプラットフォームを構築できるようになります。...
