학습
뉴스
도구
Jobs
용어집
인증
퀴즈
미션
지원
English
Search
⌘K
AI 도구 제출
기부
English
Search
⌘K
학습
AI Guides & Foundations
뉴스
Latest AI Developments
도구
Top AI Directory
Jobs
AI Hiring Board
용어집
AI Terms Dictionary
인증
Get Your AI Certificate
퀴즈
Interactive AI Assessments
미션
Why We Exist
지원
Help and Contact
AI 도구 제출
기부
English
← 모든 퀴즈로 돌아가기
가이드 연계 퀴즈 • 하드 레벨 • 6 질문
인간 피드백 퀴즈를 통한 강화 학습
RLHF 이면의 단계와 메커니즘에 대한 이해도를 테스트해 보세요.
관련 가이드 경로
인간 피드백을 통한 강화 학습
질문 1 의 6
정답: 0
언어 모델에 대한 RLHF의 주요 목적은 무엇입니까?
힌트가 필요하신가요?
모델의 매개변수 수를 늘리려면
유용성과 안전성에 대한 인간의 선호에 맞춰 출력을 조정합니다.
더 빠른 추론을 위해 모델을 압축하려면
모델을 다른 언어로 번역하려면