AGI(인공일반지능)
다양한 영역에 걸쳐 인간 수준에서 대부분의 지적 작업을 수행할 수 있는 가상의 AI 시스템입니다.
가장 명확하게 설명된 필수 기술 용어입니다. 연구자, 학생, 인간 중심 교육을 위해 설계되었습니다.
표시 213 일치하는 용어.
다양한 영역에 걸쳐 인간 수준에서 대부분의 지적 작업을 수행할 수 있는 가상의 AI 시스템입니다.
종종 도구와 메모리를 사용하여 목표를 달성하기 위해 관찰하고, 추론하고, 조치를 취할 수 있는 소프트웨어 시스템입니다.
AI 시스템이 인간의 의도, 가치, 안전 제약에 따라 작동하도록 만드는 작업입니다.
사회에서 AI가 개발되고 사용되는 방식을 안내하는 정책, 표준 및 감독 메커니즘입니다.
AI 시스템의 유해한 행동, 실패, 오용 위험을 줄이는 데 중점을 둔 분야입니다.
문제를 해결하거나 작업을 완료하기 위해 컴퓨터가 따르는 정의된 규칙 또는 단계 세트입니다.
왜곡된 데이터, 가정 또는 모델링 선택으로 인해 발생하는 모델 출력의 체계적 불공평성입니다.
AI 시스템의 논리, 데이터 소스 및 제한 사항이 얼마나 명확하게 문서화되고 이해되는지.
기계 학습 모델을 훈련하거나 평가하는 데 사용되는 사람이 추가한 레이블 또는 메타데이터입니다.
한 소프트웨어 시스템이 다른 시스템에 요청을 보내고 응답을 받는 구조화된 방식입니다.
패턴 인식, 추론, 언어 또는 의사 결정이 필요한 작업을 수행하는 시스템 구축의 광범위한 분야입니다.
출력을 생성할 때 입력의 관련 부분에 동적으로 초점을 맞추는 모델 구성 요소입니다.
인간의 직접적인 통제가 제한되거나 전혀 없는 상태에서 실시간으로 결정을 내리고 행동할 수 있는 시스템입니다.
예측 오류를 네트워크를 통해 역방향으로 전파하여 모델 가중치를 업데이트하는 핵심 훈련 알고리즘입니다.
더 복잡한 접근 방식이 실제로 결과를 개선하는지 비교하는 데 사용되는 간단한 참조 모델입니다.
모델 성능을 측정하고 비교하는 데 사용되는 표준화된 테스트 또는 데이터 세트입니다.
데이터 또는 모델 동작의 일관된 오류 또는 불공정 패턴입니다.
확장 가능한 저장 및 처리 기술이 필요한 매우 크고 복잡한 데이터 세트입니다.
내부 추론을 인간이 직접 해석하기 어려운 모델입니다.
모델의 신뢰도 점수가 실제 정확성 확률과 얼마나 일치하는지입니다.
AI 모델이 문제를 중간 단계로 분해하는 추론 스타일입니다.
모델이 하나 이상의 사전 정의된 범주에 입력을 할당하는 작업입니다.
분류 작업을 위해 특별히 설계된 모델입니다.
텍스트와 이미지 간의 공유 표현을 학습하는 다중 모드 모델 아키텍처입니다.
모델을 훈련하고 실행하는 데 필요한 처리 리소스는 FLOPS 또는 GPU 시간으로 측정되는 경우가 많습니다.
이미지와 영상에서 의미를 추출하는 AI의 한 분야.
언어 모델이 한 번에 처리할 수 있는 최대 입력 토큰 양입니다.
모델이 사전 지식을 잊지 않고 새로운 데이터로부터 계속 학습할 수 있도록 하는 훈련 접근 방식입니다.
이미지와 같은 그리드형 데이터 처리에 최적화된 신경 아키텍처입니다.
잘못된 확률에 페널티를 적용하여 분류 모델을 훈련하는 데 사용되는 일반적인 목적 함수입니다.
모델 일반화를 개선하기 위해 수정된 훈련 예제를 생성하는 기술.
시간에 따른 실제 입력 데이터의 변화로 인해 모델 성능이 저하될 수 있습니다.
지도 학습을 위해 원시 데이터에 태그 또는 대상 출력을 할당하는 프로세스입니다.
학습, 검증 또는 테스트에 사용되는 구조화된 또는 구조화되지 않은 예제 모음입니다.
분류기에 의해 예측된 클래스를 구분하는 특징 공간의 표면입니다.
일련의 if-then 특성 분할을 통해 예측을 수행하는 모델입니다.
표현 학습을 위해 다층 신경망을 사용하는 기계 학습의 하위 집합입니다.
이미지, 오디오 또는 기타 콘텐츠를 합성하기 위해 노이즈를 역전시키는 방법을 학습하는 생성 아키텍처입니다.
대규모 교사 모델의 지식을 소규모 학생 모델로 압축합니다.
한 도메인에서 훈련된 모델을 전송하여 다른 도메인에서 더 나은 성능을 발휘하는 방법입니다.
텍스트, 이미지 또는 기타 데이터의 의미론적 의미를 포착하는 숫자 벡터 표현입니다.
입력을 잠재 표현으로 변환하는 모델의 구성 요소입니다.
여러 모델의 예측을 결합하여 견고성이나 정확성을 향상합니다.
학습 후 모델 품질을 측정하는 데 사용되는 홀드아웃 데이터세트입니다.
모델의 행동이 인간에게 해석되고 설명될 수 있는 정도입니다.
모델이 참양성 사례를 놓친 잘못된 예측입니다.
모델이 부정적인 사례를 긍정적인 것으로 잘못 표시하는 잘못된 예측입니다.
예측을 위해 모델에서 사용되는 입력 변수입니다.
학습을 더 쉽고 효과적으로 만들기 위해 입력 변수를 설계하거나 변환합니다.
원시 데이터를 모델이 사용할 수 있는 유용한 기능으로 변환합니다.
소수의 사례를 통해 행동을 학습하거나 적용합니다.
사전 훈련된 모델을 특정 작업에 맞게 조정하기 위해 도메인별 데이터에 대한 지속적인 훈련입니다.
다양한 다운스트림 작업에 적용할 수 있는 사전 학습된 대규모 모델입니다.
외부 도구나 API를 트리거하는 구조화된 호출을 생성하는 모델 기능입니다.
생성자와 판별자가 서로 훈련하는 생성 설정입니다.
훈련 세트 외부에서 볼 수 없는 새로운 데이터에 대해 모델이 얼마나 잘 수행되는지입니다.
텍스트, 이미지, 오디오, 비디오, 코드 등 새로운 콘텐츠를 생산하는 AI 시스템.
손실을 줄이기 위해 각 매개변수를 얼마나 변경해야 하는지 보여주는 벡터입니다.
오류를 줄이는 방향으로 매개변수를 업데이트하는 최적화 방법입니다.
모델 출력을 학습하거나 평가하는 데 사용되는 신뢰할 수 있는 참조 라벨입니다.
안전하지 않거나 바람직하지 않은 모델 동작을 제한하는 규칙, 검사 및 제어입니다.
모델이 유창하지만 거짓이거나 지원되지 않는 정보를 생성하는 경우.
인간이 AI 출력을 검토, 안내 또는 재정의하는 워크플로입니다.
학습률, 배치 크기, 깊이 등 훈련 전에 설정되는 구성 값입니다.
프롬프트에 직접 제공된 예제의 패턴을 따르는 모델의 능력입니다.
훈련된 모델이 예측 또는 출력을 생성하는 런타임 단계입니다.
각 응답을 생성하는 동안 소비된 처리 능력의 양입니다.
작업 추적을 개선하기 위해 지시-응답 쌍에 대한 모델을 미세 조정합니다.
텍스트 쿼리에서 사용자의 목적을 예측하여 올바르게 라우팅합니다.
모델의 안전 제약을 우회하기 위한 신속한 기술입니다.
모델의 학습 데이터에 반영된 최신 시점입니다.
더 큰 모델의 출력을 모방하기 위해 더 작은 모델을 훈련합니다.
추론이나 검색에 사용되는 개체와 관계의 그래프 구조입니다.
일반화를 개선하기 위해 하드 라벨을 부드럽게 하는 정규화 방법입니다.
요청을 보내는 것과 모델의 출력을 받는 것 사이의 시간입니다.
텍스트를 생성하고 분석하기 위해 대규모 텍스트 말뭉치를 학습한 언어 모델입니다.
매개변수가 각 업데이트 단계를 얼마나 변경하는지 제어하는 훈련 하이퍼파라미터입니다.
낮은 순위의 어댑터 행렬을 추가하는 매개변수 효율적인 미세 조정 방법입니다.
훈련 중 예측 오류를 수량화하는 수학적 목표입니다.
시스템이 데이터로부터 패턴을 학습하고 시간이 지남에 따라 개선될 수 있도록 하는 방법입니다.
AI 에이전트는 연속성을 향상하기 위해 여러 단계 또는 세션에서 사용하는 저장된 컨텍스트입니다.
입력당 선택된 전문가만 실행하는 특수 하위 네트워크가 있는 아키텍처입니다.
모델의 의도된 용도, 지표, 제한 사항 및 위험을 설명하는 문서입니다.
실제 조건이 훈련 가정과 다르기 때문에 시간이 지남에 따라 성능이 저하됩니다.
모델 가중치의 수치 정밀도를 줄여 메모리와 추론 비용을 줄입니다.
텍스트, 이미지, 오디오 등 다양한 데이터 유형을 처리하거나 생성할 수 있는 모델입니다.
사람, 장소, 날짜 또는 조직과 같은 엔터티를 식별하는 NLP 작업입니다.
AI 분야는 인간의 언어를 이해하고 생성하는 데 중점을 둡니다.
생물학적 뉴런과 시냅스에서 영감을 얻은 계층형 계산 모델입니다.
최적화 안정성을 향상시키기 위해 값을 일관된 규모로 변환합니다.
이미지나 스캔의 텍스트를 기계가 읽을 수 있는 텍스트로 변환하는 기술입니다.
검사, 조정 및 재사용을 위해 공개 가중치 또는 코드와 함께 출시된 모델입니다.
모델이 훈련 데이터를 기억하고 보이지 않는 입력에 대해 제대로 수행되지 않는 경우.
출력에 영향을 미치는 모델 내부의 학습된 가중치입니다.
추가된 매개변수의 작은 하위 집합을 훈련하여 모델을 조정하는 방법입니다.
모델이 실제 다음 토큰에 얼마나 놀랐는지 측정하는 언어 모델 측정항목입니다.
전처리, 모델 단계, 후처리 단계의 순서가 지정된 워크플로우입니다.
예측된 긍정 중 실제로 정확한 비율입니다.
다운스트림 적응 전 광범위한 데이터에 대한 초기 대규모 모델 교육.
생성 모델에 제공되는 입력 지침 및 컨텍스트입니다.
출력 품질, 신뢰성 및 제어 가능성을 향상시키기 위한 프롬프트를 설계합니다.
모델 입력이나 검색된 콘텐츠에 악의적인 명령을 삽입하는 공격 패턴입니다.
덜 중요한 모델 가중치나 뉴런을 제거하여 크기와 계산을 줄입니다.
모델 가중치를 8비트 또는 4비트와 같은 낮은 정밀도 형식으로 변환합니다.
추론 시 외부 지식을 검색하여 생성에 제공하는 방법입니다.
모델이 올바르게 식별한 실제 긍정의 비율입니다.
콘텐츠 또는 제품 순위에 대한 사용자 선호도를 예측하는 모델 파이프라인입니다.
실패와 위험을 밝히기 위해 적대적인 메시지를 사용하여 AI 시스템의 스트레스 테스트를 수행합니다.
에이전트가 장기적인 수익을 극대화하는 행동을 학습하는 보상 신호를 통한 교육입니다.
인간의 선호 신호를 사용하여 모델 행동을 형성하는 훈련 방법입니다.
쿼리에 대한 지식 소스에서 관련 문서 또는 기록을 찾습니다.
RLHF 파이프라인에서 자주 사용되는 선호 신호를 기반으로 출력에 점수를 매기는 모델입니다.
소음, 교대 또는 적대적인 입력 하에서 성능을 유지하는 모델의 능력입니다.
안전하지 않은 모델 입력 또는 출력을 차단하거나 다시 작성하는 조정 계층입니다.
모델 크기, 데이터 또는 컴퓨팅에 따라 성능이 어떻게 향상되는지 보여주는 경험적 관계입니다.
종종 임베딩을 사용하여 정확한 키워드 중복이 아닌 의미와 일치하는 검색을 수행합니다.
마스킹되거나 변환된 부분을 예측하여 레이블이 지정되지 않은 데이터로부터 표현을 학습합니다.
텍스트의 감정적 어조나 의견을 분류하는 NLP 작업입니다.
낮은 대기 시간, 비용 또는 기기 내 사용에 최적화된 컴팩트 언어 모델입니다.
계산을 줄이기 위해 많은 매개변수가 0이거나 비활성인 모델입니다.
입력을 알려진 출력에 매핑하는 레이블이 지정된 예제를 사용하여 모델을 교육합니다.
민감한 훈련 데이터를 강화, 시뮬레이션 또는 보호하는 데 사용되는 인위적으로 생성된 데이터입니다.
모델의 동작, 정책 및 응답 스타일을 설정하는 우선순위가 높은 명령입니다.
생성된 출력의 무작위성을 제어하는 샘플링 설정입니다.
단어 조각이나 기호와 같은 언어 모델에 의해 처리되는 텍스트 덩어리입니다.
모델 입력을 위해 텍스트를 토큰으로 분할하는 프로세스입니다.
검색, 계산기 또는 API와 같은 외부 도구를 호출하는 모델의 기능입니다.
가장 가능성이 높은 k개의 다음 토큰에서만 샘플링하는 디코딩 전략입니다.
확률의 합이 p인 가장 작은 토큰 세트에서 샘플링하는 디코딩 전략입니다.
한 작업이나 영역에서 배운 지식을 적용하여 다른 작업을 개선합니다.
시퀀스 전체의 관계를 병렬로 모델링하는 데 주의를 기울이는 신경 아키텍처입니다.
훈련 중에 계산되고 시간이 지남에 따라 하향 최적화되는 모델 오류 값입니다.
명시적인 목표 출력 없이 레이블이 지정되지 않은 데이터에서 패턴을 학습합니다.
모델을 조정하고 과적합을 방지하기 위해 개발 중에 사용되는 데이터 세트입니다.
고차원 임베딩 벡터를 저장하고 쿼리하는 데 최적화된 데이터베이스입니다.
시각적 정보와 텍스트 정보를 공동으로 처리하는 다중 모드 모델입니다.
깨끗한 레이블이 부족한 경우 시끄러운 레이블, 경험적 레이블 또는 부분 레이블을 사용하여 모델을 교육합니다.
신경망을 통과하는 신호의 크기를 조정하는 학습된 숫자 값입니다.
의미론적 관계를 포착하는 단어의 밀집된 벡터 표현입니다.
AI 예측을 더욱 투명하고 이해하기 쉽게 만드는 기술과 사례입니다.
사전 일반 지식에 의존하여 작업별 예시 없이 작업을 해결합니다.
AI 시스템이 목표를 향해 계획하고, 실행하고, 결과를 확인하고 반복하는 다단계 프로세스입니다.
AI 시스템 및 제공업체에 대한 유럽 연합의 위험 기반 규제 프레임워크입니다.
시스템을 보다 안전하고 제어하기 쉽게 만드는 데 필요한 시간, 컴퓨팅 또는 제품 속도의 추가 비용입니다.
벤치마크 테스트 예시나 유사 변형이 학습 데이터에 있으면 보고된 성능이 부풀려집니다.
단순한 상관 관계가 아닌 인과 관계를 추정하는 방법입니다.
측정된 모델 지표의 실제 값을 포함할 가능성이 있는 통계 범위입니다.
모델 출력이 고정된 서면 원칙 세트에 따라 안내되는 교육 및 행동 형성 접근 방식입니다.
데이터가 어디서 왔는지, 어떻게 변환되었는지, 어디에 사용되었는지에 대한 기록입니다.
데이터 세트 또는 모델 아티팩트의 문서화된 출처, 소유권 및 기록입니다.
개별 기록을 출력에서 안정적으로 추론할 수 없도록 통계적 노이즈를 추가하는 개인 정보 보호 기술입니다.
추론 시 더 적은 컴퓨팅을 사용하면서 더 큰 모델의 동작을 모방하도록 훈련된 더 작은 모델입니다.
데이터를 의미 검색, 클러스터링 및 검색에 사용되는 벡터로 변환하는 데 특화된 모델입니다.
모델 버전 전반에 걸쳐 프롬프트, 데이터 세트 및 채점 논리를 실행하는 반복 가능한 평가 프레임워크입니다.
훈련 및 추론을 위해 검증된 ML 기능을 일관되게 저장하고 제공하기 위한 관리형 시스템입니다.
AI 응답이 소스 데이터 또는 검색된 증거에 의해 뒷받침되는 정도입니다.
출력 토큰을 유효한 구조 또는 정책 준수 선택으로 제한하는 생성 전략입니다.
사용자가 선호할 것 같은 응답을 예측하기 위해 인간 순위를 학습한 모델입니다.
모델 요청을 수신하고 프로덕션에서 예측을 반환하는 배포된 API 인터페이스입니다.
검색, 지원 자동화 또는 기반 대응에 사용되는 엄선된 문서 또는 기록 모음입니다.
유사한 개념이 벡터로 서로 가까이 위치하는 압축된 표현 공간입니다.
여러 환경에서 모델을 버전 관리, 승인 및 추적하기 위한 중앙 카탈로그입니다.
AI 추론은 원격 클라우드 서비스가 아닌 사용자 하드웨어에서 로컬로 수행됩니다.
모델 출력을 검증하고 강력한 형식의 기계에서 사용 가능한 구조로 변환하는 논리입니다.
변수, 형식 지정 규칙 및 작업별 지침이 포함된 재사용 가능한 프롬프트 패턴입니다.
사용자의 검색어와 관련된 검색 항목의 비율입니다.
정의된 사용 상황에서 AI 시스템이 안전하다는 증거에 의해 뒷받침되는 구조화된 주장입니다.
사용자가 직면하는 결정에 영향을 주지 않고 프로덕션 트래픽과 동시에 모델을 실행합니다.
JSON, 도구 인수 또는 입력된 필드와 같은 정의된 스키마로 제한된 모델 출력입니다.
품질이나 추론을 개선하기 위해 응답 생성 중에 사용되는 추가 추론 계산입니다.
AI 출력에 대한 사용자 신뢰도를 각 작업에 대한 시스템의 실제 신뢰도와 일치시킵니다.
API 호출, 토큰, 추론 시간 또는 소비된 컴퓨팅에 따라 비용이 조정되는 가격입니다.
단기 운영 창을 초과하여 처리한 후 요청/응답 페이로드가 저장되지 않는 정책입니다.
작은 초안 모델이 더 큰 모델이 병렬로 검증하는 토큰을 제안하는 추론 가속화 방법입니다.
변환기가 과거 주의를 다시 계산하지 않고 새 토큰을 생성할 수 있도록 하는 이전 토큰의 저장된 키 및 값 텐서입니다.
AI 애플리케이션이 표준 방식으로 외부 도구, 데이터 소스 및 컨텍스트 제공자에 연결할 수 있게 해주는 개방형 프로토콜입니다.
AI 에이전트가 목표를 완료하거나 정지 조건에 도달할 때까지 관찰하고, 계획하고, 행동하고, 반성하는 반복 주기입니다.
작업을 보다 안정적으로 해결하기 위해 추론 단계와 도구 사용 동작을 인터리브하는 프롬프트 패턴입니다.
모델이 여러 분기 솔루션 경로를 탐색하고 가장 유망한 경로를 선택하는 추론 접근 방식입니다.
별도의 보상 모델이 필요 없이 선호 쌍에 대해 직접 모델을 미세 조정하는 학습 방법입니다.
4비트 가중치 양자화와 LoRA 어댑터를 결합하여 메모리 요구 사항을 줄이는 미세 조정 기술입니다.
메모리 사용을 줄이고 변환기 훈련 및 추론 속도를 높이는 최적화된 주의 알고리즘입니다.
다양한 유형의 관계를 캡처하기 위해 여러 주의 작업을 병렬로 실행하는 변환기 메커니즘입니다.
변환기가 시퀀스 순서를 구별할 수 있도록 토큰 임베딩에 정보가 추가되었습니다.
쿼리 및 키 벡터를 회전하여 상대 토큰 위치를 인코딩하는 위치 인코딩 방법입니다.
토큰 거리에 따라 주의 점수에 불이익을 주는 위치 바이어스 방법으로, 모델이 더 긴 컨텍스트로 추정하는 데 도움이 됩니다.
계산을 줄이기 위해 각 토큰이 근처 토큰의 고정 크기 창에만 주의를 기울이는 주의 패턴입니다.
가장 자주 사용되는 문자 쌍을 재사용 가능한 토큰으로 병합하는 하위 단어 토큰화 알고리즘입니다.
공백을 미리 분할하지 않고 원시 텍스트에서 직접 하위 단어 단위를 학습하는 언어에 구애받지 않는 토크나이저입니다.
철저한 비교 없이 쿼리에 가까운 벡터를 찾고 정확성을 속도로 바꾸는 알고리즘입니다.
고차원 벡터에 대한 빠른 근사 최근접 검색을 위한 그래프 기반 인덱스 구조입니다.
검색된 결과의 초기 세트를 재정렬하여 가장 관련성이 높은 항목을 맨 위에 배치하는 모델입니다.
더 나은 기억력과 정확성을 위해 키워드(어휘) 검색과 벡터(의미) 검색을 결합한 검색 접근 방식입니다.
높은 정확도의 관련성 판단을 위해 쿼리와 문서를 한 번에 점수를 매기는 모델입니다.
쿼리와 문서를 별도의 벡터로 인코딩하여 대규모로 빠르게 비교할 수 있는 모델입니다.
평가 중에 언어 모델을 사용하여 다른 모델의 출력을 점수화하거나 비교합니다.
생성된 k개 샘플 중 하나 이상이 테스트를 통과할 가능성을 측정하는 코드 평가 지표입니다.
객관식 질문을 사용하여 57개 학술 및 전문 과목에 대한 벤치마크 테스트 언어 모델입니다.
단위 테스트를 통해 코드 생성 정확성을 측정하는 데 사용되는 Python 프로그래밍 문제의 벤치마크입니다.
언어 모델의 단계별 추론을 평가하는 데 사용되는 초등학교 수학 단어 문제의 벤치마크입니다.
모델의 주장이 검증 가능한 실제 정보와 얼마나 정확하게 일치하는지입니다.
모델의 주장을 뒷받침하기 위해 모델의 응답에 포함된 소스 구절이나 문서에 대한 참조입니다.
AI가 생성한 텍스트나 미디어에 감지 가능한 신호를 삽입하여 나중에 기계가 생성한 것으로 식별할 수 있습니다.
사전 훈련과 사후 훈련 사이의 중간 훈련 단계로, 역량이나 영역 조정에 자주 사용됩니다.
명령어 튜닝, 선호도 최적화, 안전 튜닝 등 사전 학습 이후 적용되는 학습 단계입니다.
상호작용이나 자체 복사본과의 경쟁을 통해 데이터를 생성하여 모델을 개선하는 교육 설정입니다.
여러 쿼리 변형을 생성하고 각각에 대한 결과를 검색하고 순위를 통합하는 검색 방법입니다.
회상률을 높이기 위해 사용자 쿼리를 여러 변형으로 다시 작성하는 검색 기술입니다.
작은 청크를 검색하지만 더 풍부한 컨텍스트를 위해 더 큰 상위 문서를 반환하는 검색 패턴입니다.
더 높은 확률의 출력을 찾기 위해 각 단계에서 상위 여러 후보 시퀀스를 유지하는 디코딩 알고리즘입니다.
루프를 줄이기 위해 모델이 이미 생성한 토큰의 확률을 낮추는 디코딩 설정입니다.
지금까지 토큰이 나타난 빈도에 비례하여 토큰의 확률을 줄이는 디코딩 설정입니다.
토큰이 전혀 등장할 확률을 줄여 새로운 화제를 불러일으키는 디코딩 설정입니다.