AI導入を遅らせる非構造化データの問題
企業データの90%は非構造化データです。AIで活用されるのは1%未満です。ボトルネックはデータではありません。これは、重要なごく一部の資産を使うために資産全体を複製するというETL税です。Annapurnaはこのモデルを覆します。その場でスキャンを行い、AIが取得するデータのみをステージングします。
非構造化資産を構造化し、データカタログ化する
Annapurnaは、NFS、SMB、AWS S3、Azure Blob、その他のオブジェクトストレージにまたがる数十億ものファイルを検出し、インデックス化します。ソースファイルは元の場所に残ります。AIパイプラインがデータカタログをクエリすると、Annapurnaは一致したサブセットのみをステージングし、そこから管理を維持します。一括移行は不要です。ストレージアーキテクチャはそのまま維持されます。
AI対応データセットの検証可能なデータリネージ
Annapurnaは、ソースファイルからAI対応のステージング済みデータセットまでデータリネージを作成して引き継ぎます。コンテンツハッシュ(ファイルフィンガープリント)、ACLレコード、および署名付き監査証跡。どのファイルがAI対応データセットの基になったのか、その問いに確実に答えます。
ソースからAIモデルまでの継続的なデータガバナンス
従来のETLでは、転送中に権限が削除されます。Annapurnaはソースのアクセス制御を取り込み、レイクハウスやアップストリームアプリケーションで適用できるよう、データカタログに直接表示します。管理が必要な別のセキュリティレイヤーを追加しなくても、データガバナンスのギャップが解消されます。
パイプラインが取得した分のみお支払い。それ以外はかかりません
パイプラインのコストは、AIが実際に消費するデータに応じて1:1でスケーリングします。AIが実際に必要とするごく一部を使用するために、資産全体をレイクハウスに複製する必要はありません。早期導入顧客は、利用開始初日からAIインフラの支出が消費量に連動していることを確認できます。
AI先進企業から信頼されています
「金融サービス業界では、規制対象となるペタバイト規模の分散した非構造化データの管理が、運用上の制約となっていました。Annapurnaは、新たなETLスタックを追加したり、コンプライアンス態勢を損なったりすることなく、AI向けに当社のデータ環境をマッピングし、データガバナンスを効かせ、インデックス化します」
Corey West
Piper Sandler & Co.最高技術責任者
FAQ:Rubrik Annapurna
Rubrik Annapurna
Annapurnaは本日より、資格のあるエンタープライズパートナーにご利用いただけます。貴社の資産にどのように適合するかについては、弊社チームまでご相談ください。
お問い合わせ、ありがとうございます!Rubrikのエキスパートよりご連絡を差し上げます。
免責条項:
本ページで言及している未公開のサービスや機能は現時点では利用できません。公開時期等はRubrikの単独の裁量により決定され、予定どおりに一般公開されない、または公開が中止される場合があります。ここで言及されるいかなるサービスや機能もRubrikが提供を約束するものではなく、責任や義務を負うものではなく、いかなる契約にも含ませることはできません。現在一般公開されているサービスや機能に基づいて、購入の意思決定を行うようにしてください。