AI 每日情報
AI 日報
主題
偏好式強化學習
偏好式強化學習、代理系統與具身世界模型趨勢 — 2026/02/08
重點涵蓋偏好式 RL 與 RLHF 的個人化、多目標設計,以及 Agentic 歸因與 Motus 具身架構。