AGI (汎用人工知能)
多くの領域にわたって人間レベルでほとんどの知的タスクを実行できる仮説的な AI システム。
重要な技術用語を最高レベルの明瞭さで説明します。研究者、学生、人間中心の教育向けに設計されています。
表示中 213 一致する用語。
多くの領域にわたって人間レベルでほとんどの知的タスクを実行できる仮説的な AI システム。
目標を達成するために観察、推論、行動を起こすことができるソフトウェア システム。多くの場合ツールやメモリを使用します。
AI システムを人間の意図、価値観、安全上の制約に従って動作させる作業。
AI が社会でどのように開発および使用されるかをガイドするポリシー、標準、および監視メカニズム。
AI システムにおける有害な動作、障害、誤用のリスクを軽減することに重点を置いた分野。
問題を解決したりタスクを完了したりするためにコンピュータが従う、定義された一連のルールまたは手順。
歪んだデータ、仮定、またはモデリングの選択によって引き起こされるモデル出力の体系的な不公平。
AI システムのロジック、データ ソース、制限がどの程度明確に文書化され、理解しやすいか。
機械学習モデルのトレーニングまたは評価に使用される人間が追加したラベルまたはメタデータ。
あるソフトウェア システムが別のシステムにリクエストを送信し、別のシステムからの応答を受信するための構造化された方法。
パターン認識、推論、言語、意思決定を必要とするタスクを実行するシステムを構築する広範な分野。
出力を生成するときに、入力の関連部分に動的に焦点を当てるモデル コンポーネント。
人間による直接的な制御を制限したり、制御せずにリアルタイムで意思決定し、行動できるシステム。
ネットワークを通じて予測誤差を逆方向に伝播することによってモデルの重みを更新するコア トレーニング アルゴリズム。
より複雑なアプローチが実際に結果を改善するかどうかを比較するために使用される単純な参照モデル。
モデルのパフォーマンスを測定および比較するために使用される標準化されたテストまたはデータセット。
データまたはモデルの動作におけるエラーまたは不公平性の一貫したパターン。
スケーラブルなストレージと処理技術を必要とする非常に大規模で複雑なデータセット。
内部推論が人間によって直接解釈することが困難なモデル。
モデルの信頼スコアが実際の正確性確率とどの程度一致するか。
AI モデルが問題を中間ステップに分解する推論スタイル。
モデルが入力を 1 つ以上の事前定義されたカテゴリに割り当てるタスク。
分類タスク専用に設計されたモデル。
テキストと画像間の共有表現を学習するマルチモーダル モデル アーキテクチャ。
モデルのトレーニングと実行に必要な処理リソース。多くの場合、FLOPS または GPU 時間で測定されます。
画像やビデオから意味を抽出する AI の分野。
言語モデルが一度に処理できる入力トークンの最大量。
モデルが事前の知識を忘れることなく新しいデータから学習し続けることができるトレーニング アプローチ。
画像などのグリッド状のデータを処理するために最適化されたニューラル アーキテクチャ。
不正確な確率にペナルティを課すことによって分類モデルをトレーニングするために使用される一般的な目的関数。
モデルの一般化を改善するために変更されたトレーニング サンプルを作成する手法。
モデルのパフォーマンスを低下させる可能性がある、時間の経過に伴う実世界の入力データの変化。
教師あり学習のために生データにタグまたはターゲット出力を割り当てるプロセス。
トレーニング、検証、テストに使用される構造化サンプルまたは非構造化サンプルのコレクション。
分類子によって予測されたクラスを分離する特徴空間内の曲面。
一連の if-then 特徴分割を通じて予測を行うモデル。
表現学習に多層ニューラル ネットワークを使用する機械学習のサブセット。
ノイズを反転して画像、音声、その他のコンテンツを合成することを学習する生成アーキテクチャ。
大規模な教師モデルからの知識をより小規模な生徒モデルに圧縮します。
あるドメインでトレーニングされたモデルを別のドメインでより適切に実行できるように転送するメソッド。
テキスト、画像、またはその他のデータの意味論的な意味を捉える数値ベクトル表現。
入力を潜在表現に変換するモデルのコンポーネント。
複数のモデルからの予測を組み合わせて堅牢性または精度を向上させます。
トレーニング後にモデルの品質を測定するために使用される保持されたデータセット。
モデルの動作を人間にどの程度解釈して説明できるか。
モデルが真陽性のケースを見逃す不正確な予測。
モデルが陰性のケースを陽性として誤ってフラグを立てる不正確な予測。
モデルが予測を行うために使用する入力変数。
学習をより簡単かつ効果的にするために入力変数を設計または変換します。
生データをモデルが使用できる有益な特徴に変換します。
ほんの少数の例から行動を学習または適応すること。
ドメイン固有のデータに対するトレーニングを継続して、事前トレーニングされたモデルを特定のタスクに適応させます。
多くの下流タスクに適応できる大規模な事前トレーニング済みモデル。
外部ツールまたは API をトリガーする構造化呼び出しを生成するモデル機能。
ジェネレーターとディスクリミネーターが相互にトレーニングする生成セットアップ。
トレーニング セットの外にある新しい未確認のデータに対してモデルがどの程度うまく機能するか。
テキスト、画像、オーディオ、ビデオ、コードなどの新しいコンテンツを生成する AI システム。
損失を減らすために各パラメータをどの程度変更する必要があるかを示すベクトル。
誤差が少なくなる方向にパラメータを更新する最適化手法。
モデル出力のトレーニングまたは評価に使用される信頼できる参照ラベル。
安全でないまたは望ましくないモデルの動作を制限するルール、チェック、および制御。
モデルが流暢ではあるが誤った情報またはサポートされていない情報を生成する場合。
人間が AI 出力をレビュー、ガイド、またはオーバーライドするワークフロー。
学習率、バッチサイズ、深度など、トレーニング前に設定される構成値。
プロンプトで直接提供される例のパターンに従うモデルの機能。
トレーニングされたモデルが予測または出力を生成する実行時フェーズ。
各応答の生成中に消費される処理電力の量。
命令と応答のペアに基づいてモデルを微調整して、タスクの追跡を改善します。
テキストクエリからユーザーの目的を予測し、正しくルーティングします。
モデルの安全制約を回避することを目的とした即時テクニック。
モデルのトレーニング データに反映された最新の時点。
より大きなモデルの出力を模倣するためにより小さなモデルをトレーニングします。
推論や検索に使用されるエンティティと関係のグラフ構造。
一般化を改善するためにハードラベルを柔らかくする正則化方法。
リクエストを送信してからモデルの出力を受信するまでの時間。
テキストを生成および分析するために大規模なテキスト コーパスでトレーニングされた言語モデル。
各更新ステップでパラメータがどの程度変更されるかを制御するトレーニング ハイパーパラメータ。
低ランクのアダプター行列を追加する、パラメーター効率の高い微調整方法。
トレーニング中の予測誤差を定量化する数学的目標。
システムがデータからパターンを学習し、時間の経過とともに改善できるようにする方法。
AI エージェントが継続性を向上させるためにステップまたはセッション全体で使用する保存されたコンテキスト。
選択されたエキスパートのみが入力ごとに実行される特殊なサブネットワークを備えたアーキテクチャ。
モデルの使用目的、メトリック、制限、リスクを説明するドキュメント。
現実世界の状況がトレーニングの想定と異なるため、時間の経過とともにパフォーマンスが低下します。
モデルの重みの数値精度を下げて、メモリと推論のコストを削減します。
テキスト、画像、音声などの複数のデータ型を処理または生成できるモデル。
人、場所、日付、組織などのエンティティを識別する NLP タスク。
AI の分野は、人間の言語の理解と生成に焦点を当てていました。
生物学的ニューロンとシナプスにヒントを得た階層型計算モデル。
値を一貫したスケールに変換して、最適化の安定性を向上させます。
画像またはスキャン内のテキストを機械可読テキストに変換するテクノロジー。
検査、適合、再利用のために公開された重みまたはコードとともにリリースされたモデル。
モデルがトレーニング データを記憶し、目に見えない入力に対してパフォーマンスが低下する場合。
出力に影響を与える、モデル内で学習された重み。
追加されたパラメーターの小さなサブセットをトレーニングすることでモデルを適応させる方法。
モデルが真の次のトークンにどれだけ驚いたかを測定する言語モデルのメトリクス。
前処理、モデル ステップ、後処理ステージの順序付けられたワークフロー。
実際に正しい予測陽性者の割合。
下流の適応の前に、広範なデータに対する初期の大規模モデルのトレーニング。
生成モデルに提供される入力命令とコンテキスト。
プロンプトを設計して、出力品質、信頼性、制御性を向上させます。
悪意のある命令がモデルの入力または取得されたコンテンツに挿入される攻撃パターン。
重要性の低いモデルの重みやニューロンを削除して、サイズを削減し、計算を行います。
モデルの重みを 8 ビットや 4 ビットなどの低精度形式に変換します。
外部の知識を取得し、それを推論時の生成にフィードする方法。
モデルが正しく識別する実際の陽性の割合。
コンテンツや製品のランク付けに関するユーザーの好みを予測するモデル パイプライン。
敵対的なプロンプトを使用して AI システムをストレス テストすると、障害とリスクが明らかになります。
報酬によるトレーニングは、エージェントが長期的な利益を最大化するアクションを学習することを示します。
人間の好みの信号を使用してモデルの動作を形成するトレーニング方法。
クエリの知識源から関連する文書または記録を検索します。
RLHF パイプラインでよく使用される、優先信号に基づいて出力をスコアリングするモデル。
ノイズ、シフト、または敵対的な入力の下でパフォーマンスを維持するモデルの機能。
安全でないモデルの入力または出力をブロックまたは書き換えるモデレーション層。
モデルのサイズ、データ、またはコンピューティングによってパフォーマンスがどのように向上するかを示す経験的な関係。
多くの場合、埋め込みを使用して、キーワードの正確な重複ではなく意味に一致する検索を行います。
マスクされた部分または変換された部分を予測することにより、ラベルのないデータから表現を学習します。
テキスト内の感情的な調子や意見を分類する NLP タスク。
待ち時間、コスト、またはデバイス上での使用を低減するために最適化されたコンパクトな言語モデル。
計算量を減らすために、多くのパラメーターがゼロまたは非アクティブになっているモデル。
入力を既知の出力にマッピングするラベル付きの例を使用してモデルをトレーニングします。
機密トレーニング データを強化、シミュレート、または保護するために使用される人工的に生成されたデータ。
モデルの動作、ポリシー、および応答スタイルを設定する優先度の高い命令。
生成される出力のランダム性を制御するサンプリング設定。
単語部分や記号など、言語モデルによって処理されたテキストの塊。
テキストをモデル入力用のトークンに分割するプロセス。
検索、計算機、API などの外部ツールを呼び出すモデルの機能。
次の可能性が最も高い k 個のトークンのみからサンプリングするデコード戦略。
確率の合計が p になる最小のトークン セットからサンプリングする復号化戦略。
あるタスクまたはドメインで学んだ知識を応用して、別のタスクを改善すること。
注意を使用してシーケンス全体の関係を並行してモデル化するニューラル アーキテクチャ。
トレーニング中に計算され、時間の経過とともに下方に最適化されたモデルの誤差値。
明示的なターゲット出力を持たない、ラベルのないデータからのパターンの学習。
開発中にモデルを調整し、過剰適合を防ぐために使用されるデータセット。
高次元の埋め込みベクトルの保存とクエリのために最適化されたデータベース。
視覚情報とテキスト情報を共同処理するマルチモーダル モデル。
きれいなラベルが不足している場合に、ノイズの多いラベル、ヒューリスティックなラベル、または部分的なラベルを使用してモデルをトレーニングする。
ニューラル ネットワークを通過する信号をスケールする学習された数値。
意味関係を捉えた単語の密なベクトル表現。
AI 予測をより透明性があり、理解しやすくするためのテクニックと実践。
事前の一般知識に頼って、タスク固有の例を使用せずにタスクを解決する。
AI システムが計画、実行、結果を確認し、目標に向かって反復する複数段階のプロセス。
AI システムおよびプロバイダーに対する欧州連合のリスクベースの規制枠組み。
システムをより安全で制御しやすくするために必要な、時間、コンピューティング、または製品の速度に関する追加のコスト。
ベンチマーク テストの例またはそれに近いバリアントがトレーニング データに存在すると、報告されるパフォーマンスが水増しされます。
単純な相関関係ではなく、因果関係を推定する方法。
測定されたモデル メトリックの真の値が含まれる可能性が高い統計範囲。
モデルの出力が、文書化された一連の固定された原則によって導かれる、トレーニングおよび行動形成のアプローチ。
データがどこから来たのか、どのように変換されたのか、どこで使用されたのかの記録。
データセットまたはモデル アーティファクトの文書化された起源、所有権、および履歴。
統計ノイズを追加して、出力から個々のレコードを確実に推測できないようにするプライバシー技術。
推論時の計算量を減らしながら、より大きなモデルの動作を模倣するようにトレーニングされた小さなモデル。
セマンティック検索、クラスタリング、および取得に使用されるベクトルにデータを変換することに特化したモデル。
モデルのバージョン間でプロンプト、データセット、スコアリング ロジックを実行する反復可能な評価フレームワーク。
トレーニングと推論のために、検証された ML 機能を一貫して保存および提供するためのマネージド システム。
AI の応答がソース データまたは取得された証拠によってどの程度裏付けられるか。
出力トークンを有効な構造またはポリシーに準拠した選択肢に制限する生成戦略。
人間のランキングに基づいてトレーニングされたモデルは、ユーザーがどの応答を好む可能性が高いかを予測します。
実稼働環境でモデルのリクエストを受け取り、予測を返すデプロイされた API インターフェイス。
検索、サポートの自動化、または対応のグラウンディングに使用される、厳選された文書または記録のコレクション。
同様の概念がベクトルとして互いに近くに配置される、圧縮された表現空間。
環境全体でモデルのバージョン管理、承認、追跡を行うための中央カタログ。
AI 推論は、リモートのクラウド サービスではなく、ユーザーのハードウェア上でローカルに実行されます。
モデル出力を検証し、厳密に型指定されたマシンで使用可能な構造に変換するロジック。
変数、書式設定ルール、タスク固有の指示を含む再利用可能なプロンプト パターン。
ユーザーのクエリに関連する、取得されたアイテムの割合。
AI システムが定義された使用状況において安全であるという、証拠によって裏付けられた構造化された議論。
ユーザー側の意思決定に影響を与えることなく、運用トラフィックと並行してモデルを実行します。
JSON、ツール引数、型付きフィールドなどの定義されたスキーマに制約されたモデル出力。
品質または推論を向上させるために応答生成中に使用される追加の推論計算。
AI 出力に対するユーザーの信頼と、各タスクにおけるシステムの実際の信頼性を一致させます。
API 呼び出し、トークン、推論時間、または消費されたコンピューティングに応じてコストが変動する価格設定。
短期間の運用期間を超えた処理後に要求/応答ペイロードが保存されないポリシー。
小規模なドラフト モデルが提案するトークンを、より大きなモデルが並行して検証する推論高速化方法。
以前のトークンから保存されたキーと値のテンソルにより、トランスフォーマーは過去のアテンションを再計算することなく新しいトークンを生成できます。
AI アプリケーションが標準的な方法で外部ツール、データ ソース、コンテキスト プロバイダーに接続できるようにするオープン プロトコル。
AI エージェントが目標を完了するか停止条件に達するまで、観察、計画、行動、反映する反復サイクル。
タスクをより確実に解決するために、推論ステップとツール使用アクションを交互に挿入するプロンプト パターン。
モデルが複数の分岐ソリューション パスを探索し、最も有望なものを選択する推論アプローチ。
別の報酬モデルを必要とせずに、好みのペアに基づいてモデルを直接微調整するトレーニング方法。
4 ビットの重み量子化と LoRA アダプターを組み合わせてメモリの必要性を削減する微調整手法。
最適化されたアテンション アルゴリズムにより、メモリの使用量が削減され、トランスフォーマーのトレーニングと推論が高速化されます。
複数のアテンション操作を並行して実行して、さまざまなタイプの関係をキャプチャするトランスフォーマー メカニズム。
トランスフォーマーがシーケンスの順序を区別できるように、トークンの埋め込みに情報が追加されました。
クエリとキー ベクトルを回転して相対的なトークンの位置をエンコードする位置エンコード方式。
トークンの距離に基づいて注意スコアにペナルティを課す位置バイアス手法で、モデルがより長いコンテキストを推定するのに役立ちます。
コンピューティングを削減するために、各トークンが近くのトークンの固定サイズのウィンドウのみに注目するアテンション パターン。
最も頻繁に使用される文字のペアを再利用可能なトークンに結合するサブワードのトークン化アルゴリズム。
言語に依存しないトークナイザーは、空白で事前に分割することなく、生のテキストからサブワード単位を直接学習します。
徹底的な比較を行わずにクエリに近いベクトルを検索し、正確性を犠牲にして速度を向上させるアルゴリズム。
高次元ベクトルに対する高速近似最近傍検索のためのグラフベースのインデックス構造。
取得された結果の初期セットを並べ替えて、最も関連性の高い項目を先頭に配置するモデル。
キーワード (語彙) 検索とベクトル (意味) 検索を組み合わせて、再現率と精度を向上させる検索アプローチ。
高精度の関連性判断のために、クエリとドキュメントを 1 つのパスで一緒にスコアリングするモデル。
クエリとドキュメントを別々のベクトルにエンコードして、大規模な規模で迅速に比較できるようにするモデル。
言語モデルを使用して、評価中に他のモデルからの出力をスコアリングまたは比較します。
生成された k 個のサンプルのうち少なくとも 1 つがテストに合格する可能性を測定するコード評価メトリクス。
多肢選択式の質問を使用して、57 の学術および専門科目にわたる言語モデルをテストするベンチマーク。
単体テストを通じてコード生成の正確さを測定するために使用される Python プログラミング問題のベンチマーク。
言語モデルにおける段階的な推論を評価するために使用される、小学校の算数の文章題のベンチマーク。
モデルの主張が検証可能な現実世界の情報とどの程度正確に一致するか。
モデルの主張を裏付けるためにモデルの応答に含まれるソースの一節または文書への参照。
AI が生成したテキストまたはメディアに検出可能な信号を埋め込み、後でそれが機械によって生成されたものであると識別できるようにします。
トレーニング前とトレーニング後の中間トレーニング段階。能力やドメインの調整によく使用されます。
事前トレーニング後に適用されるトレーニング ステップ (命令調整、設定の最適化、安全性調整など)。
モデル自体のコピーとの相互作用や競合を通じてデータを生成することでモデルが向上するトレーニング設定。
複数のクエリ バリアントを生成し、それぞれの結果を取得し、ランキングを融合する取得方法。
再現率を向上させるためにユーザー クエリをいくつかのバリアントに書き換える検索手法。
小さなチャンクを検索しますが、より豊富なコンテキストを得るために、より大きな親ドキュメントを返す検索パターン。
より確率の高い出力を見つけるために、各ステップで上位のいくつかの候補シーケンスを保持するデコード アルゴリズム。
ループを減らすためにモデルがすでに生成したトークンの確率を下げるデコード設定。
これまでのトークンの出現頻度に比例してトークンの確率を下げるデコード設定。
トークンが出現する確率を減らし、新しい話題を促すデコード設定。