混乱して行き詰まってしまうAI条項?
過去 1 年間で、AI を導入した無数の製品やサービスが利用可能になり、目まぐるしく多様な機能が、しばしば判別しにくい専門用語で包まれています。
この便利な用語集を使用すると、AI と AGI の違い、実際に何が起こるかを理解できるようになります。チャットGPTGPT-4 が次のように説明されているのを聞いたら、それが何を意味するのかがわかります。ディープ ニューラル ネットワークを使用して構築された変圧器モデルを備えた LLM。飛び込んでみましょう。
エージェント
AI の文脈におけるエージェントとは、モデルまたは、ある種のタスクを自律的に実行できるソフトウェア プログラム。エージェントの例は次のとおりです。スマートホーム温度や照明を制御するデバイスからセンサーまでロボット掃除機そして無人自動車、ユーザーのプロンプトを学習して応答する ChatGPT のようなチャットボットに。複雑なタスクを実行する自律エージェントは、AI の次の飛躍がどのようなものであるかの例としてよく引用されます。
AGI(汎用人工知能)
AGI はプログラムの一種です。モデルそれは人間の完全な知的能力、つまり一般的な知能を持っています。 AGI には、推論、常識、抽象的な知識、創造性などの能力があります。基本的に、人間の指示がなくても自律的にタスクを実行できます。真の AGI はまだ存在していませんが、専門家は近い将来にそれが達成される可能性があると考えています (ただし、正確にいつ実現するかについては意見が異なります)。のような企業OpenAI、DeepMind、および Anthropic は、AGI の作成に取り組んでいます。
以下も参照してください。強力なAI
アルゴリズム
アンアルゴリズムコンピュータプログラムが従うべき一連の規則または命令です。 AI の文脈では、アルゴリズムはその知能を構築するための基礎です。人間の脳内の動作が一連のステップに分解されることを考えてください。アルゴリズムは、一連の if-then ステートメントを構築することでそのプロセスを模倣します。
位置合わせ
アラインメントとは、AI が計画に明示的に含まれていない目標をどの程度うまく達成できるかを指します。プロンプトまたはリクエストしてください。これらには、正確性、セキュリティ、危害防止などが含まれます。 AI が調整されていない場合、AI は本来の用途や用途から逸れ、間違った、または不適切な応答を返します。適切に調整されていないモデルは、誤った情報を広め、サイバーセキュリティの脅威を生み出し、危険または有害な情報を共有する可能性があるため、調整は倫理に関する会話の大きな部分を占めます。
AI(人工知能)
AI は、人間が設計した特定のタスクを自動化または実行できるテクノロジーの総称です。最近、AI について話すとき (「AI が人類を滅ぼそうとしている」または「AI が私たちの仕事を置き換えようとしている」)、彼らは AGI と生成型 AI について話しています。しかし、AI は、コンテンツや製品を推奨するアルゴリズム、自動運転車、音声アシスタントなど、私たちが長年使用してきた多くのテクノロジーを包含する巨大な概念です。
ブラックボックス
特定の AI モデルはブラック ボックスと呼ばれることもあります。これは、ユーザーがテクノロジーの内部動作を見たり理解したりできないことを意味します。ブラック ボックス問題は、OpenAI やグーグル彼らは自分たちがどのように働いているかについて秘密主義であることで有名です。しかしまた、生成 AI はある程度自律的であるため、開発者ですらアルゴリズムがどのように出力を生成するかを完全には理解していません。倫理学者や政策立案者がAI企業の説明責任と透明性の向上を求める中、ブラックボックスを解明する重要性が高まっている。
チャットボット
チャットボットは、ChatGPT など、人間と会話できるプログラムまたはモデルの一種ですが、この用語は、電話やテキストでカスタマー サービス担当者と話す代わりの手段を提供するカスタマー サービス チャットボットを指すこともあります。チャットボットのようなものChatGPT、Bard、Bing、Character.AI はすべて、ユーザーと人間のような高度な会話を行う機能で注目を集めていますが、チャットボットは以前から存在していました。 ELIZA は最初のチャットボットと考えられていますが、1966年に開発されたMITの科学者ジョセフ・ワイゼンバウムによる。
ディープラーニング
ディープラーニングは以下のサブセットです機械学習それは人間の学習方法を模倣しています。ニューラル ネットワークを活用したディープ ラーニングは、複数のレイヤーのアルゴリズムを使用して、会話や画像などの複雑で抽象的な概念を理解します。深層学習の応用例には次のものがあります。顔認識技術、ChatGPT などのチャットボット、無人自動車。
普及モデル
拡散モデルは、トレーニングされたものと同様の応答を生成できる機械学習モデルです。技術的に言えば、変分推論を使用してトレーニングされたマルコフ連鎖。マルコフ連鎖と変分推論は、大量のデータ内のシーケンスと近似情報を予測するために使用される数学用語です。ただし、理解する必要があるのは、拡散モデルによって AI 画像生成が可能になるということです。安定した拡散、OpenAIのダルイー、 そして旅の途中これらはすべて、拡散モデルを使用した製品の例です。
生成AI
OpenAI による ChatGPT の開始のおかげで、生成 AI が主流になりました。生成 AI は、ユーザーからのプロンプトに基づいてテキスト、画像、ビデオ、オーディオ、コードを作成できる AI の一種です。生成 AI は、ChatGPT のような AI チャットボットを強化します。
これは、最初にデータからパターンを学習することで機能します (「トレーニング以下)、プロンプトからの新しいデータに基づいて学習を続けます。生成 AI は通常、次のようなチャット インターフェイスの形式で存在します。ChatGPT、Bing、Bard, そのため、ユーザーと往復の会話を行うことができます。 ChatGPT の開始あれほどの熱狂を引き起こしたそれは人々が生成 AI の機能を理解し、活用するための簡単でアクセスしやすい方法だったからです。生成型 AI の広範な使用にはさまざまな利点がありますが、危険も伴います。幻覚を起こす、または自信を持って物事を作ります。
より単純な形式の AI とは異なり、有限の目的を持つセンサーや既存の情報をオウム返しする音声アシスタントとは対照的に、生成 AI はトレーニング データからまったく新しいコンテンツを作成できます。
倫理学者や政策立案者は、生成型AIの規制誤った情報を広めたり、偏見を根付かせたり、サイバー犯罪を可能にしたりする可能性があるためです。生成 AI モデルは Web から収集したデータセットも使用するため、プライバシーとセキュリティに関する懸念が生じています。著作権侵害。コンテンツを迅速に生成し、タスクを自動化するその機能は、特にメディアや業界での仕事の置き換えに関する懸念も引き起こしています。エンターテインメント 産業。
GPU (グラフィックス プロセッシング ユニット)
GPU は、複数の複雑な計算を処理できる強力なチップまたはグラフィック カードです。 GPU は、名前が示すとおり、当初は画像やグラフィックスを処理するために開発されましたが、機械学習に必要な大量のコンピューティング能力を処理できるため、AI に適応されてきました。その推定ChatGPT は 20,000 の GPU を使用し、そのモデルを駆動するには最終的に 30,000 のグラフィックス カードが必要になるということです。
幻覚
生成型 AI、特にテキストベースのチャットボットは、でっち上げてしまう傾向があります。生成型 AI は時として完全に脱線し、真実ではないことについて自信を持って話す可能性があるため、これは「幻覚」と形容されます。
マッシュ可能な光の速度
たとえば、生成 AI チャットボットは、スティーブ ジョブズがラット パック時代にラスベガスで人気だったクロースアップ マジシャンであると言って幻覚を起こすかもしれません。しかし、より一般的に(そして憂慮すべきことに)、生成型 AI チャットボットは、現実とフィクションを混ぜることによって、微妙に幻覚を示します。たとえば、スティーブ・ジョブズは Apple の創設者 (本当)、iPhone の発売を監督した (本当)、と宣言される可能性があります。時間さんの 今年の人(真実ではありません)。
これは、生成 AI モデルが前の単語との確率的な関係に基づいて単語を予測することで機能するために発生します。何を生成しているのかを理解することができません。 ChatGPT は感覚を持って動作する可能性があることを思い出してください。そうではありません。
脱獄
脱獄チャットボットは、本来の用途以外のことをチャットボットに実行させています。ある種のものを使用すると、プロンプト、ジェイルブレイクにより、ユーザーはルールやガードレールをバイパスできるようになり、基本的にユーザーを騙して、ルールに従って行うべきではないことを実行させることができます。アライメント。脱獄は、楽しみのためにチャットボットに攻撃的または不適切なことを言わせることから、ナパーム弾の作り方などの危険で実用的な情報を共有させることまで多岐にわたります。
大規模言語モデル (LLM)
大規模言語モデルは、テキストを理解して生成するために膨大な量のデータに基づいてトレーニングされる AI ソフトウェア プログラムです。 LLM は、確率に基づいて次の単語を予測することで文をつなぎ合わせます。 LLM は非常に多くのデータを使用してトレーニングされているため、基本的にはインターネット全体— 彼らはこの方法を使用して人間のようなテキストを生成することに非常に成功しています。 OpenAI の GPT モデル、Google の PaLM モデル、および Meta のラマモデルはすべて LLM の例です。 GPT-3.5 と GPT-4 は、ChatGPT と PaLM 2 および Bard を強化するものです。
ライセンスされたデータ
ライセンスされたデータとは、企業または組織が次の目的で購入またはアクセスする Web からの情報です。トレーニングあい。ライセンスされたデータを使用してモデルをトレーニングしたという企業の事例を耳にするかもしれません。つまり、データは合法的に取得されたということになります。
ChatGPT のような AI モデルをトレーニングするために必要なデータが大量にあるため、ライセンス付きデータの問題が最近よく取り上げられています。それは得ます法的には曖昧、パブリックドメインとは何か、元の作成者の意図、企業がそのデータの使用をどのように許可されるべきかについての議論のためです。
機械学習
機械学習は、モデルがデータに基づいてトレーニングされ、時間の経過とともに学習および改善される人工知能の手法です。機械学習モデルはデータを使用してパターンを認識し、情報を分類し、予測を行います。例としては、スパムメールのフィルタリング (分類学習)、住宅データを使用した住宅価格の予測 (回帰学習)、犬の画像の識別 (ディープラーニング) などが挙げられます。
AIと機械学習は、しばしば同じ意味で使用される用語ですが、機械学習は AI のサブセットであり、知能を構築するためにデータを使用してトレーニングされることによって定義されます。
モデル
AI に関連してこの用語が頻繁に飛び交うのを聞いたことがあるでしょう。モデルは、特定の目的のために設計されたプログラムまたはアルゴリズムです。 AI モデルは、特定のタスクを複製および/または自動化するように設計されたプログラムの一般用語です。
自然言語処理 (NLP)
ChatGPT の応答が不気味に人間的である理由は、自然言語処理によるものです。この用語は、テキストと音声に基づいてモデルをトレーニングし、人間のように理解して表現できるようにする訓練を指します。自然言語処理には、モデルが言語の複雑さやニュアンスを理解できるようにするための言語学の研究も含まれます。
ニューラルネットワーク
人間の脳の仕組みにヒントを得たニューラル ネットワークは、相互に通信する人工の「ニューロン」またはノードで構成されるアルゴリズムです。2 つのニューロン間の各接続には、特定の値または「重み」が含まれます。これらの重みは、入力に関する特定の評価を自動的に行います。 、特定のしきい値に達するとニューロンが「発火」し、ネットワーク内の他のニューロンに情報が伝達されます。ディープラーニング。
オープンソース
オープンソースとは、ソフトウェア プログラムのソース コードがオープンで無料で公開されていることを意味します(一方、ブラックボックス閉まっています)。つまり、開発者はそれを使用して独自の製品を使用、変更、構築できます。オープンソース AI モデルは、秘密に包まれていることが多い AI 開発を民主化する方法とみなされています。クローズドソースである Google や OpenAI のモデルとは異なり、Meta は最近オープンソース LLM をリリースしました (ラマ2)。その他のオープンソース モデルには次のものがあります。ファルコン、MPT、 そしてパジャマレッド。
パラメータ
パラメータは、実行中に重み付けまたは調整できる LLM 内の変数です。トレーニング具体的な結果を決定するため。 LLM の強力さに関するパラメーターについて聞いたことがあるかもしれません。たとえば、GPT-4 には 1.7 兆個のパラメーターがあります。 LLM のパラメータが増えるほど、LLM はより複雑になり、より多くの学習が必要になります。
パラメータは高品質カメラの設定であると考えてください。カメラでは、光、フィルム速度、ズーム、絞り、レンズの交換などを調整でき、すべての設定でわずかに異なる結果が得られます。これを何十億、何兆倍するか、それがパラメーターの役割です。
プロンプト
プロンプトは、ユーザーがチャットボットに送信するリクエストまたは質問です。大規模な言語モデルから最適な応答を確保することに特化したサブカルチャー全体が存在します。コード生成の場合でも、脱獄、または単に探している最良の答えを得る場合、プロンプトは明確さ、簡潔さ、コンテキスト、および意図によって異なります。
以下も参照してください。即戦力エンジニア。
即戦力エンジニア
生成型 AI チャットボットの台頭により、適切なプロンプトを作成するための専門知識が突然求められています。そこです迅速なエンジニアリングプロンプト エンジニアは、LLM に関する深い知識を持ち、さまざまな目的に最適なプロンプトを最適化できる人です。それは、チャットボットがリクエストを確実に理解することや、モデルを調べて脅威や脆弱性を見つけることなどです。
即時注入攻撃
LLM の台頭により、次のような新しい種類のサイバー攻撃が発生しています。プロンプトインジェクション攻撃。即時注射、同様脱獄、慎重に作成されたプロンプトを使用して、ChatGPT などのモデルを不正な目的で操作する行為です。ハッカーはプロンプト インジェクションを通じてチャットボット内の脆弱性を悪用し、機密情報を共有したり、モデルのガードレールをバイパスしたりします。攻撃者は、チャットボットと対話することによってこれを直接使用するか、プラグインまたは Web ページ内にプロンプトを隠すことによって間接的に、個人情報や支払い情報に密かにアクセスします。
レコメンドアルゴリズム/システム
ChatGPT が登場する前から、AI はすでに私たちの生活の大きな部分を占めていました。この最も一般的な例の 1 つは、推奨アルゴリズム (またはシステム) です。の用語です機械学習ユーザーのデータと行動に基づいて推奨を行うアルゴリズム。のおすすめ番組Netflix、Amazon の商品、YouTube や TikTok のビデオ、およびインスタグラム以下は、実際に動作している推奨アルゴリズムの例です。
強力なAI
強力な AI は、AGI または汎用人工知能。これは、人間のように自律的に「思考」し、行動することができる、(今のところ)理論的な形式の人工知能です。
トークン
トークンは、トークン内の情報の単位です。大規模な言語モデル。それは、単語、単語の一部、句読点、またはコードのセグメントであり、本質的には意味を持つものの最も基本的な形式です。 LLM が特定の数のトークンでトレーニングされている、または価格モデルのコストが 1,000 トークンあたり特定のセント数であると聞いた場合、これはそれを指します。
トレーニング
トレーニングは、データを機械学習モデル。トレーニングには、教師あり学習と教師なし学習の 2 種類があります。教師あり学習は、何らかの方法ですでにラベル付けまたは分類されたデータを使用してモデルをトレーニングすることですが、教師なし学習はラベルなしのデータを使用するため、パターンと関連付けを独自に学習する必要があります。それぞれの種類のトレーニングには、独自の長所と短所があります。 GPT-4 のような LLM は、教師なし学習と教師あり学習の両方を組み合わせて使用します。
トレーニングデータ
トレーニング データは、機械学習モデルをトレーニングするために使用されるデータです。 LLM のトレーニング データは、主にインターネットから収集された、データセットと呼ばれる膨大な量のデータで構成されています。
Common Crawl や Wikipedia データベースのような公開データセットと、そのためのリソースを持つ Google などの企業が収集した非公開または独自のデータセットがあります。たとえば、そのデータセットである MassiveWeb は、Google 所有の DeepMind によって作成され、Reddit、Facebook、YouTube、Medium などのソーシャル メディアやブログ サイトが含まれています。したがって、これらのサイトのいずれかに投稿したことがある場合、あなたのデータはおそらく使用されている吟遊詩人を訓練するために。
トランス
GPT (ChatGPT など) は、Generative Pre-trained Transformer の略であることをご存知ですか?それは単なる舌を巻く略語ではありません。変圧器の一種ですニューラルネットワークこれは、生成 AI に使用される深層学習モデルを強化します。単語を埋め込むことで機能します (トークン)「自己注意」メカニズムを使用してコンテキストを使用し、次の単語が何であるかを予測できるようにします。そうしないと、モデルは単語を相互に関連性のないデータのビットとして認識するだけになります。
ChatGPT のような製品の開発を開始したトランスフォーマー モデルは、紙2017 年に Google とトロント大学の研究者によって発表されました。