より多くの組織がジェネレーティブの導入に向けて移行する中、AI, Googleは、私たち全員がセキュリティについてもっと関心を持つことを望んでいます。この目的を達成するために、テクノロジー大手は木曜日、セキュア AI フレームワーク (SAIF) をリリースしました。これは、当面はやや薄っぺらいものではあるものの、一種のセキュリティ ロードマップとなることを意図していました。
でももしこれが回避するための計画だと想像しているならイーロン・マスクが常々話している、AIの実存的な危険のようなもの、より小さく、より直接的に考えてください。
このフレームワークの 6 つの「コア要素」の概要は次のとおりです。
要素 1 と 2 は、組織の既存のセキュリティ フレームワークを拡張して、そもそも AI の脅威を組み込むことです。
要素 3 は、AI の脅威に対する防御に AI を組み込むことに関するものですが、それが意図的であるかどうかにかかわらず、かなり不穏なことに核軍拡競争を思い出させます。
要素 4 は、AI 関連の「制御フレームワーク」の統一によるセキュリティ上の利点についてです。
要素 5 と 6 は、AI アプリケーションが攻撃に耐えられるかどうか、不必要なリスクにさらされていないことを確認するために、AI アプリケーションを常に検査、評価、戦闘テストすることです。
今のところ、Google は主に、組織が AI を活用するための初歩的なサイバーセキュリティのアイデアを持ち込むことを望んでいるように見えます。 Google Cloud の情報セキュリティ責任者 Phil Venables 氏としてアクシオスに言った, 「人々がより高度なアプローチを模索しているときでも、基本も正しく理解する必要があることを、人々は本当に覚えておくべきです。」
マッシュ可能な光の速度
しかし、次のような生成 AI アプリケーションに関しては、すでにいくつかの新たな独自のセキュリティ上の懸念が現時点で発生しています。チャットGPT。
たとえば、セキュリティ研究者は、潜在的なリスクを 1 つ特定しています。即時注射これは、何の疑いも持たない AI チャットボット プラグインに向けられた悪意のあるコマンドがテキスト ブロックの中に潜んでいるという、奇妙な形の AI 悪用です。 AI がプロンプト インジェクションをスキャンすると、AI に与えられるコマンドの性質が変更されます。それは、テキストの中に邪悪なマインドコントロールの呪文を隠しているようなものです。ロン・バーガンディのテレプロンプター。奇妙ですよね?
そして、即時インジェクションは、Google が特に抑制に貢献したいとしている新しいタイプの脅威の 1 つにすぎません。他には次のようなものがあります。
「モデルの盗用」。翻訳モデルをだまして秘密を漏らす可能性のある方法です。
「データポイズニング」。悪意のある者が意図的に欠陥のあるデータを使用してトレーニングプロセスを妨害します。
もともとモデルをトレーニングするために使用された、潜在的に機密または機密性の高いテキストを抽出できるプロンプトを構築します。
Googleのブログ投稿SAIF については、このフレームワークは Google によって採用されていると述べています。 「フレームワーク」のリリースがより広い世界にとって何を意味するかというと、基本的には何もない可能性もありますが、標準として採用される可能性もあります。たとえば、米国政府の国立標準技術研究所 (NIST) は、2014 年にサイバーセキュリティに関するより一般的なフレームワークを発表しました。これは重要なインフラをサイバー攻撃から保護することを目的としていましたが、非常に影響力があり、ゴールドスタンダードとして認められているサイバーセキュリティに関する調査を行った IT 専門家の大多数が、サイバーセキュリティに関する調査を行っています。
しかし、Google は米国政府ではないため、OpenAI など Google の AI ライバルの目にそのフレームワークがどれほど権威を持つのか疑問が生じます。しかし、セキュリティに関しては、Google が AI 分野で先頭に立ってリードしようとしているように見えます。追いつくために競争するのではなく。おそらく、AI 競争の初期段階で失った影響力の一部を取り戻すことが、SAIF のリリースの真の目的なのかもしれません。