
評測、內化與多代理:AI 技術趨勢全面總覽 — 2026/02/20
重點包含 IndicEval 在地化評測、Context Distillation、Team-of-Thoughts 等研究與應用觀察。

重點包含 IndicEval 在地化評測、Context Distillation、Team-of-Thoughts 等研究與應用觀察。

聚焦模型使用邊界、具身智能與端側部署,並梳理人才與市場動向。

焦點:具身與長上下文模型、向量化治理、產業應用與新型資安威脅。

強調從單點模型到跨層級系統工程,包括效率、能源與治理的協同挑戰。

涵蓋作者觀點、精神健康風險、Mobile GUI 代理與 OCR 小模型進展。

DeepSeekMath‑V2 宣稱開源 IMO 金牌級;attention gating 獲 NeurIPS 最佳;GRPO‑only 挑戰 SFT,並關注多模態產品化與治理風險。

討論AI責任保險排除、27M模型、PhysX-Anything、具身智能與治理前瞻。

企業趨向平台化供應商抽象、端雲閉環與頻域/量化等工程化演進。