百科事典を開く

AI用語集

重要な技術用語を最高レベルの明瞭さで説明します。研究者、学生、人間中心の教育向けに設計されています。

213 条件検索 + アルファベットフィルター平易な言葉での定義

表示中 213 一致する用語。

AGI (汎用人工知能)

多くの領域にわたって人間レベルでほとんどの知的タスクを実行できる仮説的な AI システム。

AI関連用語

AIエージェント

目標を達成するために観察、推論、行動を起こすことができるソフトウェア システム。多くの場合ツールやメモリを使用します。

AI関連用語

AIの調整

AI システムを人間の意図、価値観、安全上の制約に従って動作させる作業。

AI関連用語

AI ガバナンス

AI が社会でどのように開発および使用されるかをガイドするポリシー、標準、および監視メカニズム。

AI関連用語

AIの安全性

AI システムにおける有害な動作、障害、誤用のリスクを軽減することに重点を置いた分野。

AI関連用語

アルゴリズム

問題を解決したりタスクを完了したりするためにコンピュータが従う、定義された一連のルールまたは手順。

AI関連用語

アルゴリズムのバイアス

歪んだデータ、仮定、またはモデリングの選択によって引き起こされるモデル出力の体系的な不公平。

AI関連用語

アルゴリズムの透明性

AI システムのロジック、データ ソース、制限がどの程度明確に文書化され、理解しやすいか。

AI関連用語

注釈

機械学習モデルのトレーニングまたは評価に使用される人間が追加したラベルまたはメタデータ。

AI関連用語

API(アプリケーションプログラミングインターフェース)

あるソフトウェア システムが別のシステムにリクエストを送信し、別のシステムからの応答を受信するための構造化された方法。

AI関連用語

人工知能 (AI)

パターン認識、推論、言語、意思決定を必要とするタスクを実行するシステムを構築する広範な分野。

AI関連用語

注意メカニズム

出力を生成するときに、入力の関連部分に動的に焦点を当てるモデル コンポーネント。

AI関連用語

自律システム

人間による直接的な制御を制限したり、制御せずにリアルタイムで意思決定し、行動できるシステム。

AI関連用語

バックプロパゲーション

ネットワークを通じて予測誤差を逆方向に伝播することによってモデルの重みを更新するコア トレーニング アルゴリズム。

AI関連用語

ベースラインモデル

より複雑なアプローチが実際に結果を改善するかどうかを比較するために使用される単純な参照モデル。

AI関連用語

ベンチマーク

モデルのパフォーマンスを測定および比較するために使用される標準化されたテストまたはデータセット。

AI関連用語

バイアス

データまたはモデルの動作におけるエラーまたは不公平性の一貫したパターン。

AI関連用語

ビッグデータ

スケーラブルなストレージと処理技術を必要とする非常に大規模で複雑なデータセット。

AI関連用語

ブラックボックスモデル

内部推論が人間によって直接解釈することが困難なモデル。

AI関連用語

校正

モデルの信頼スコアが実際の正確性確率とどの程度一致するか。

AI関連用語

思考の連鎖

AI モデルが問題を中間ステップに分解する推論スタイル。

AI関連用語

分類

モデルが入力を 1 つ以上の事前定義されたカテゴリに割り当てるタスク。

AI関連用語

分類子

分類タスク専用に設計されたモデル。

AI関連用語

クリップ

テキストと画像間の共有表現を学習するマルチモーダル モデル アーキテクチャ。

AI関連用語

コンピューティング

モデルのトレーニングと実行に必要な処理リソース。多くの場合、FLOPS または GPU 時間で測定されます。

AI関連用語

コンピュータビジョン

画像やビデオから意味を抽出する AI の分野。

AI関連用語

コンテキストウィンドウ

言語モデルが一度に処理できる入力トークンの最大量。

AI関連用語

継続的な学習

モデルが事前の知識を忘れることなく新しいデータから学習し続けることができるトレーニング アプローチ。

AI関連用語

畳み込みニューラル ネットワーク (CNN)

画像などのグリッド状のデータを処理するために最適化されたニューラル アーキテクチャ。

AI関連用語

クロスエントロピー損失

不正確な確率にペナルティを課すことによって分類モデルをトレーニングするために使用される一般的な目的関数。

AI関連用語

データ拡張

モデルの一般化を改善するために変更されたトレーニング サンプルを作成する手法。

AI関連用語

データドリフト

モデルのパフォーマンスを低下させる可能性がある、時間の経過に伴う実世界の入力データの変化。

AI関連用語

データのラベル付け

教師あり学習のために生データにタグまたはターゲット出力を割り当てるプロセス。

AI関連用語

データセット

トレーニング、検証、テストに使用される構造化サンプルまたは非構造化サンプルのコレクション。

AI関連用語

意思決定の境界線

分類子によって予測されたクラスを分離する特徴空間内の曲面。

AI関連用語

デシジョンツリー

一連の if-then 特徴分割を通じて予測を行うモデル。

AI関連用語

ディープラーニング

表現学習に多層ニューラル ネットワークを使用する機械学習のサブセット。

AI関連用語

普及モデル

ノイズを反転して画像、音声、その他のコンテンツを合成することを学習する生成アーキテクチャ。

AI関連用語

蒸留

大規模な教師モデルからの知識をより小規模な生徒モデルに圧縮します。

AI関連用語

ドメイン適応

あるドメインでトレーニングされたモデルを別のドメインでより適切に実行できるように転送するメソッド。

AI関連用語

埋め込み

テキスト、画像、またはその他のデータの意味論的な意味を捉える数値ベクトル表現。

AI関連用語

エンコーダ

入力を潜在表現に変換するモデルのコンポーネント。

AI関連用語

アンサンブル

複数のモデルからの予測を組み合わせて堅牢性または精度を向上させます。

AI関連用語

評価セット

トレーニング後にモデルの品質を測定するために使用される保持されたデータセット。

AI関連用語

説明可能性

モデルの動作を人間にどの程度解釈して説明できるか。

AI関連用語

偽陰性

モデルが真陽性のケースを見逃す不正確な予測。

AI関連用語

誤検知

モデルが陰性のケースを陽性として誤ってフラグを立てる不正確な予測。

AI関連用語

特徴

モデルが予測を行うために使用する入力変数。

AI関連用語

特徴量エンジニアリング

学習をより簡単かつ効果的にするために入力変数を設計または変換します。

AI関連用語

特徴抽出

生データをモデルが使用できる有益な特徴に変換します。

AI関連用語

数回の学習

ほんの少数の例から行動を学習または適応すること。

AI関連用語

微調整

ドメイン固有のデータに対するトレーニングを継続して、事前トレーニングされたモデルを特定のタスクに適応させます。

AI関連用語

基礎モデル

多くの下流タスクに適応できる大規模な事前トレーニング済みモデル。

AI関連用語

関数呼び出し

外部ツールまたは API をトリガーする構造化呼び出しを生成するモデル機能。

AI関連用語

GAN (敵対的生成ネットワーク)

ジェネレーターとディスクリミネーターが相互にトレーニングする生成セットアップ。

AI関連用語

一般化

トレーニング セットの外にある新しい未確認のデータに対してモデルがどの程度うまく機能するか。

AI関連用語

生成AI

テキスト、画像、オーディオ、ビデオ、コードなどの新しいコンテンツを生成する AI システム。

AI関連用語

グラデーション

損失を減らすために各パラメータをどの程度変更する必要があるかを示すベクトル。

AI関連用語

勾配降下法

誤差が少なくなる方向にパラメータを更新する最適化手法。

AI関連用語

グラウンドトゥルース

モデル出力のトレーニングまたは評価に使用される信頼できる参照ラベル。

AI関連用語

ガードレール

安全でないまたは望ましくないモデルの動作を制限するルール、チェック、および制御。

AI関連用語

幻覚

モデルが流暢ではあるが誤った情報またはサポートされていない情報を生成する場合。

AI関連用語

人間参加型

人間が AI 出力をレビュー、ガイド、またはオーバーライドするワークフロー。

AI関連用語

ハイパーパラメータ

学習率、バッチサイズ、深度など、トレーニング前に設定される構成値。

AI関連用語

状況に応じた学習

プロンプトで直接提供される例のパターンに従うモデルの機能。

AI関連用語

推論

トレーニングされたモデルが予測または出力を生成する実行時フェーズ。

AI関連用語

推論時間の計算

各応答の生成中に消費される処理電力の量。

AI関連用語

命令チューニング

命令と応答のペアに基づいてモデルを微調整して、タスクの追跡を改善します。

AI関連用語

意図の分類

テキストクエリからユーザーの目的を予測し、正しくルーティングします。

AI関連用語

脱獄

モデルの安全制約を回避することを目的とした即時テクニック。

AI関連用語

知識の遮断

モデルのトレーニング データに反映された最新の時点。

AI関連用語

知識の蒸留

より大きなモデルの出力を模倣するためにより小さなモデルをトレーニングします。

AI関連用語

ナレッジグラフ

推論や検索に使用されるエンティティと関係のグラフ構造。

AI関連用語

ラベルのスムージング

一般化を改善するためにハードラベルを柔らかくする正則化方法。

AI関連用語

レイテンシ

リクエストを送信してからモデルの出力を受信するまでの時間。

AI関連用語

大規模言語モデル (LLM)

テキストを生成および分析するために大規模なテキスト コーパスでトレーニングされた言語モデル。

AI関連用語

学習率

各更新ステップでパラメータがどの程度変更されるかを制御するトレーニング ハイパーパラメータ。

AI関連用語

LoRA (低ランク適応)

低ランクのアダプター行列を追加する、パラメーター効率の高い微調整方法。

AI関連用語

損失関数

トレーニング中の予測誤差を定量化する数学的目標。

AI関連用語

機械学習 (ML)

システムがデータからパターンを学習し、時間の経過とともに改善できるようにする方法。

AI関連用語

メモリ (エージェントメモリ)

AI エージェントが継続性を向上させるためにステップまたはセッション全体で使用する保存されたコンテキスト。

AI関連用語

専門家の混合 (MoE)

選択されたエキスパートのみが入力ごとに実行される特殊なサブネットワークを備えたアーキテクチャ。

AI関連用語

モデルカード

モデルの使用目的、メトリック、制限、リスクを説明するドキュメント。

AI関連用語

モデルドリフト

現実世界の状況がトレーニングの想定と異なるため、時間の経過とともにパフォーマンスが低下します。

AI関連用語

モデルの量子化

モデルの重みの数値精度を下げて、メモリと推論のコストを削減します。

AI関連用語

マルチモーダルモデル

テキスト、画像、音声などの複数のデータ型を処理または生成できるモデル。

AI関連用語

固有表現認識 (NER)

人、場所、日付、組織などのエンティティを識別する NLP タスク。

AI関連用語

自然言語処理 (NLP)

AI の分野は、人間の言語の理解と生成に焦点を当てていました。

AI関連用語

ニューラルネットワーク

生物学的ニューロンとシナプスにヒントを得た階層型計算モデル。

AI関連用語

正規化

値を一貫したスケールに変換して、最適化の安定性を向上させます。

AI関連用語

OCR (光学式文字認識)

画像またはスキャン内のテキストを機械可読テキストに変換するテクノロジー。

AI関連用語

オープンソースモデル

検査、適合、再利用のために公開された重みまたはコードとともにリリースされたモデル。

AI関連用語

過学習

モデルがトレーニング データを記憶し、目に見えない入力に対してパフォーマンスが低下する場合。

AI関連用語

パラメータ

出力に影響を与える、モデル内で学習された重み。

AI関連用語

パラメータ効率の良い微調整 (PEFT)

追加されたパラメーターの小さなサブセットをトレーニングすることでモデルを適応させる方法。

AI関連用語

Perplexity

モデルが真の次のトークンにどれだけ驚いたかを測定する言語モデルのメトリクス。

AI関連用語

パイプライン

前処理、モデル ステップ、後処理ステージの順序付けられたワークフロー。

AI関連用語

精度

実際に正しい予測陽性者の割合。

AI関連用語

事前トレーニング

下流の適応の前に、広範なデータに対する初期の大規模モデルのトレーニング。

AI関連用語

プロンプト

生成モデルに提供される入力命令とコンテキスト。

AI関連用語

迅速なエンジニアリング

プロンプトを設計して、出力品質、信頼性、制御性を向上させます。

AI関連用語

即時注入

悪意のある命令がモデルの入力または取得されたコンテンツに挿入される攻撃パターン。

AI関連用語

剪定

重要性の低いモデルの重みやニューロンを削除して、サイズを削減し、計算を行います。

AI関連用語

量子化

モデルの重みを 8 ビットや 4 ビットなどの低精度形式に変換します。

AI関連用語

RAG (検索拡張生成)

外部の知識を取得し、それを推論時の生成にフィードする方法。

AI関連用語

リコール

モデルが正しく識別する実際の陽性の割合。

AI関連用語

推薦システム

コンテンツや製品のランク付けに関するユーザーの好みを予測するモデル パイプライン。

AI関連用語

レッドチーム

敵対的なプロンプトを使用して AI システムをストレス テストすると、障害とリスクが明らかになります。

AI関連用語

強化学習

報酬によるトレーニングは、エージェントが長期的な利益を最大化するアクションを学習することを示します。

AI関連用語

ヒューマンフィードバックからの強化学習 (RLHF)

人間の好みの信号を使用してモデルの動作を形成するトレーニング方法。

AI関連用語

検索

クエリの知識源から関連する文書または記録を検索します。

AI関連用語

報酬モデル

RLHF パイプラインでよく使用される、優先信号に基づいて出力をスコアリングするモデル。

AI関連用語

堅牢性

ノイズ、シフト、または敵対的な入力の下でパフォーマンスを維持するモデルの機能。

AI関連用語

セーフティフィルター

安全でないモデルの入力または出力をブロックまたは書き換えるモデレーション層。

AI関連用語

スケーリングの法則

モデルのサイズ、データ、またはコンピューティングによってパフォーマンスがどのように向上するかを示す経験的な関係。

AI関連用語

セマンティック検索

多くの場合、埋め込みを使用して、キーワードの正確な重複ではなく意味に一致する検索を行います。

AI関連用語

自己教師あり学習

マスクされた部分または変換された部分を予測することにより、ラベルのないデータから表現を学習します。

AI関連用語

感情分析

テキスト内の感情的な調子や意見を分類する NLP タスク。

AI関連用語

小規模言語モデル (SLM)

待ち時間、コスト、またはデバイス上での使用を低減するために最適化されたコンパクトな言語モデル。

AI関連用語

スパースモデル

計算量を減らすために、多くのパラメーターがゼロまたは非アクティブになっているモデル。

AI関連用語

教師あり学習

入力を既知の出力にマッピングするラベル付きの例を使用してモデルをトレーニングします。

AI関連用語

合成データ

機密トレーニング データを強化、シミュレート、または保護するために使用される人工的に生成されたデータ。

AI関連用語

システムプロンプト

モデルの動作、ポリシー、および応答スタイルを設定する優先度の高い命令。

AI関連用語

温度

生成される出力のランダム性を制御するサンプリング設定。

AI関連用語

トークン

単語部分や記号など、言語モデルによって処理されたテキストの塊。

AI関連用語

トークン化

テキストをモデル入力用のトークンに分割するプロセス。

AI関連用語

ツールの使用

検索、計算機、API などの外部ツールを呼び出すモデルの機能。

AI関連用語

Top-k サンプリング

次の可能性が最も高い k 個のトークンのみからサンプリングするデコード戦略。

AI関連用語

Top-p (核) サンプリング

確率の合計が p になる最小のトークン セットからサンプリングする復号化戦略。

AI関連用語

転移学習

あるタスクまたはドメインで学んだ知識を応用して、別のタスクを改善すること。

AI関連用語

変圧器

注意を使用してシーケンス全体の関係を並行してモデル化するニューラル アーキテクチャ。

AI関連用語

トレーニングロス

トレーニング中に計算され、時間の経過とともに下方に最適化されたモデルの誤差値。

AI関連用語

教師なし学習

明示的なターゲット出力を持たない、ラベルのないデータからのパターンの学習。

AI関連用語

検証セット

開発中にモデルを調整し、過剰適合を防ぐために使用されるデータセット。

AI関連用語

ベクターデータベース

高次元の埋め込みベクトルの保存とクエリのために最適化されたデータベース。

AI関連用語

視覚言語モデル (VLM)

視覚情報とテキスト情報を共同処理するマルチモーダル モデル。

AI関連用語

弱い監督

きれいなラベルが不足している場合に、ノイズの多いラベル、ヒューリスティックなラベル、または部分的なラベルを使用してモデルをトレーニングする。

AI関連用語

重量

ニューラル ネットワークを通過する信号をスケールする学習された数値。

AI関連用語

単語の埋め込み

意味関係を捉えた単語の密なベクトル表現。

AI関連用語

XAI(説明可能なAI)

AI 予測をより透明性があり、理解しやすくするためのテクニックと実践。

AI関連用語

ゼロショット学習

事前の一般知識に頼って、タスク固有の例を使用せずにタスクを解決する。

AI関連用語

エージェントのワークフロー

AI システムが計画、実行、結果を確認し、目標に向かって反復する複数段階のプロセス。

AI関連用語

AI法

AI システムおよびプロバイダーに対する欧州連合のリスクベースの規制枠組み。

AI関連用語

調整税

システムをより安全で制御しやすくするために必要な、時間、コンピューティング、または製品の速度に関する追加のコスト。

AI関連用語

ベンチマーク漏れ量

ベンチマーク テストの例またはそれに近いバリアントがトレーニング データに存在すると、報告されるパフォーマンスが水増しされます。

AI関連用語

因果推論

単純な相関関係ではなく、因果関係を推定する方法。

AI関連用語

信頼区間

測定されたモデル メトリックの真の値が含まれる可能性が高い統計範囲。

AI関連用語

憲法AI

モデルの出力が、文書化された一連の固定された原則によって導かれる、トレーニングおよび行動形成のアプローチ。

AI関連用語

データリネージュ

データがどこから来たのか、どのように変換されたのか、どこで使用されたのかの記録。

AI関連用語

データの出所

データセットまたはモデル アーティファクトの文書化された起源、所有権、および履歴。

AI関連用語

差分プライバシー

統計ノイズを追加して、出力から個々のレコードを確実に推測できないようにするプライバシー技術。

AI関連用語

蒸留モデル

推論時の計算量を減らしながら、より大きなモデルの動作を模倣するようにトレーニングされた小さなモデル。

AI関連用語

埋め込みモデル

セマンティック検索、クラスタリング、および取得に使用されるベクトルにデータを変換することに特化したモデル。

AI関連用語

エバルハーネス

モデルのバージョン間でプロンプト、データセット、スコアリング ロジックを実行する反復可能な評価フレームワーク。

AI関連用語

フィーチャーストア

トレーニングと推論のために、検証された ML 機能を一貫して保存および提供するためのマネージド システム。

AI関連用語

グラウンディング性

AI の応答がソース データまたは取得された証拠によってどの程度裏付けられるか。

AI関連用語

保護されたデコード

出力トークンを有効な構造またはポリシーに準拠した選択肢に制限する生成戦略。

AI関連用語

人間の好みのモデル

人間のランキングに基づいてトレーニングされたモデルは、ユーザーがどの応答を好む可能性が高いかを予測します。

AI関連用語

推論エンドポイント

実稼働環境でモデルのリクエストを受け取り、予測を返すデプロイされた API インターフェイス。

AI関連用語

ナレッジベース

検索、サポートの自動化、または対応のグラウンディングに使用される、厳選された文書または記録のコレクション。

AI関連用語

潜在空間

同様の概念がベクトルとして互いに近くに配置される、圧縮された表現空間。

AI関連用語

モデルレジストリ

環境全体でモデルのバージョン管理、承認、追跡を行うための中央カタログ。

AI関連用語

オンデバイスAI

AI 推論は、リモートのクラウド サービスではなく、ユーザーのハードウェア上でローカルに実行されます。

AI関連用語

出力パーサー

モデル出力を検証し、厳密に型指定されたマシンで使用可能な構造に変換するロジック。

AI関連用語

プロンプトテンプレート

変数、書式設定ルール、タスク固有の指示を含む再利用可能なプロンプト パターン。

AI関連用語

検索精度

ユーザーのクエリに関連する、取得されたアイテムの割合。

AI関連用語

セーフティケース

AI システムが定義された使用状況において安全であるという、証拠によって裏付けられた構造化された議論。

AI関連用語

シャドウ展開

ユーザー側の意思決定に影響を与えることなく、運用トラフィックと並行してモデルを実行します。

AI関連用語

構造化された出力

JSON、ツール引数、型付きフィールドなどの定義されたスキーマに制約されたモデル出力。

AI関連用語

テスト時のコンピューティング

品質または推論を向上させるために応答生成中に使用される追加の推論計算。

AI関連用語

トラストキャリブレーション

AI 出力に対するユーザーの信頼と、各タスクにおけるシステムの実際の信頼性を一致させます。

AI関連用語

従量制課金

API 呼び出し、トークン、推論時間、または消費されたコンピューティングに応じてコストが変動する価格設定。

AI関連用語

データ保持ゼロ

短期間の運用期間を超えた処理後に要求/応答ペイロードが保存されないポリシー。

AI関連用語

投機的デコード

小規模なドラフト モデルが提案するトークンを、より大きなモデルが並行して検証する推論高速化方法。

AI関連用語

KVキャッシュ

以前のトークンから保存されたキーと値のテンソルにより、トランスフォーマーは過去のアテンションを再計算することなく新しいトークンを生成できます。

AI関連用語

MCP (モデル コンテキスト プロトコル)

AI アプリケーションが標準的な方法で外部ツール、データ ソース、コンテキスト プロバイダーに接続できるようにするオープン プロトコル。

AI関連用語

エージェントループ

AI エージェントが目標を完了するか停止条件に達するまで、観察、計画、行動、反映する反復サイクル。

AI関連用語

反応する

タスクをより確実に解決するために、推論ステップとツール使用アクションを交互に挿入するプロンプト パターン。

AI関連用語

思考の木

モデルが複数の分岐ソリューション パスを探索し、最も有望なものを選択する推論アプローチ。

AI関連用語

DPO (直接優先最適化)

別の報酬モデルを必要とせずに、好みのペアに基づいてモデルを直接微調整するトレーニング方法。

AI関連用語

QLoRA

4 ビットの重み量子化と LoRA アダプターを組み合わせてメモリの必要性を削減する微調整手法。

AI関連用語

フラッシュアテンション

最適化されたアテンション アルゴリズムにより、メモリの使用量が削減され、トランスフォーマーのトレーニングと推論が高速化されます。

AI関連用語

マルチヘッドアテンション

複数のアテンション操作を並行して実行して、さまざまなタイプの関係をキャプチャするトランスフォーマー メカニズム。

AI関連用語

位置エンコーディング

トランスフォーマーがシーケンスの順序を区別できるように、トークンの埋め込みに情報が追加されました。

AI関連用語

RoPE (回転位置埋め込み)

クエリとキー ベクトルを回転して相対的なトークンの位置をエンコードする位置エンコード方式。

AI関連用語

アリビ

トークンの距離に基づいて注意スコアにペナルティを課す位置バイアス手法で、モデルがより長いコンテキストを推定するのに役立ちます。

AI関連用語

スライディングウィンドウの注意

コンピューティングを削減するために、各トークンが近くのトークンの固定サイズのウィンドウのみに注目するアテンション パターン。

AI関連用語

BPE (バイトペアエンコーディング)

最も頻繁に使用される文字のペアを再利用可能なトークンに結合するサブワードのトークン化アルゴリズム。

AI関連用語

センテンスピース

言語に依存しないトークナイザーは、空白で事前に分割することなく、生のテキストからサブワード単位を直接学習します。

AI関連用語

ANN (近似最近傍)

徹底的な比較を行わずにクエリに近いベクトルを検索し、正確性を犠牲にして速度を向上させるアルゴリズム。

AI関連用語

ニューサウスウェールズ州

高次元ベクトルに対する高速近似最近傍検索のためのグラフベースのインデックス構造。

AI関連用語

リランカー

取得された結果の初期セットを並べ替えて、最も関連性の高い項目を先頭に配置するモデル。

AI関連用語

ハイブリッド検索

キーワード (語彙) 検索とベクトル (意味) 検索を組み合わせて、再現率と精度を向上させる検索アプローチ。

AI関連用語

クロスエンコーダー

高精度の関連性判断のために、クエリとドキュメントを 1 つのパスで一緒にスコアリングするモデル。

AI関連用語

バイエンコーダー

クエリとドキュメントを別々のベクトルにエンコードして、大規模な規模で迅速に比較できるようにするモデル。

AI関連用語

裁判官としてのLLM

言語モデルを使用して、評価中に他のモデルからの出力をスコアリングまたは比較します。

AI関連用語

Pass@k

生成された k 個のサンプルのうち少なくとも 1 つがテストに合格する可能性を測定するコード評価メトリクス。

AI関連用語

MMLU

多肢選択式の質問を使用して、57 の学術および専門科目にわたる言語モデルをテストするベンチマーク。

AI関連用語

HumanEval

単体テストを通じてコード生成の正確さを測定するために使用される Python プログラミング問題のベンチマーク。

AI関連用語

GSM8K

言語モデルにおける段階的な推論を評価するために使用される、小学校の算数の文章題のベンチマーク。

AI関連用語

事実

モデルの主張が検証可能な現実世界の情報とどの程度正確に一致するか。

AI関連用語

引用

モデルの主張を裏付けるためにモデルの応答に含まれるソースの一節または文書への参照。

AI関連用語

透かし

AI が生成したテキストまたはメディアに検出可能な信号を埋め込み、後でそれが機械によって生成されたものであると識別できるようにします。

AI関連用語

トレーニング中期

トレーニング前とトレーニング後の中間トレーニング段階。能力やドメインの調整によく使用されます。

AI関連用語

トレーニング後

事前トレーニング後に適用されるトレーニング ステップ (命令調整、設定の最適化、安全性調整など)。

AI関連用語

セルフプレイ

モデル自体のコピーとの相互作用や競合を通じてデータを生成することでモデルが向上するトレーニング設定。

AI関連用語

RAG フュージョン

複数のクエリ バリアントを生成し、それぞれの結果を取得し、ランキングを融合する取得方法。

AI関連用語

複数クエリの取得

再現率を向上させるためにユーザー クエリをいくつかのバリアントに書き換える検索手法。

AI関連用語

親ドキュメントの取得

小さなチャンクを検索しますが、より豊富なコンテキストを得るために、より大きな親ドキュメントを返す検索パターン。

AI関連用語

ビームサーチ

より確率の高い出力を見つけるために、各ステップで上位のいくつかの候補シーケンスを保持するデコード アルゴリズム。

AI関連用語

反復ペナルティ

ループを減らすためにモデルがすでに生成したトークンの確率を下げるデコード設定。

AI関連用語

周波数ペナルティ

これまでのトークンの出現頻度に比例してトークンの確率を下げるデコード設定。

AI関連用語

プレゼンスペナルティ

トークンが出現する確率を減らし、新しい話題を促すデコード設定。

AI関連用語