학습
뉴스
도구
Jobs
용어집
인증
퀴즈
미션
지원
English
Search
⌘K
AI 도구 제출
기부
English
Search
⌘K
학습
AI Guides & Foundations
뉴스
Latest AI Developments
도구
Top AI Directory
Jobs
AI Hiring Board
용어집
AI Terms Dictionary
인증
Get Your AI Certificate
퀴즈
Interactive AI Assessments
미션
Why We Exist
지원
Help and Contact
AI 도구 제출
기부
English
← 모든 퀴즈로 돌아가기
가이드 연계 퀴즈 • 하드 레벨 • 6 질문
RLHF 퀴즈의 그룹화된 보상 정규화
그룹화된 보상 정규화 및 GRPO 알고리즘에 대한 이해를 테스트합니다.
관련 가이드 경로
Rlhf의 그룹화된 보상 정규화
질문 1 의 6
정답: 0
그룹화된 보상 정규화에서 각 응답의 보상은 무엇과 비교됩니까?
힌트가 필요하신가요?
고정된 전역 상수
해당 프롬프트 그룹의 평균 및 표준 편차
이전 시대의 보상
모델의 매개변수 개수