左高頻

研究人員重複 OpenAIRLHF 中基於近端策略優化 (PPO) 的工作
新聞報導 專業技術
研究人員重複 OpenAIRLHF 中基於近端策略優化 (PPO) 的工作
2023 年 10 月 27 日
Meta 推出改變遊戲規則的開源軟體 LLaMa-2-聊天效能前所未有
Featured 新聞報導 專業技術
Meta 推出改變遊戲規則的開源軟體 LLaMa-2-聊天效能前所未有
2023 年 7 月 18 日
OpenAI:新的流程監督獎勵模型改進了人工智能推理
Featured 新聞報導 專業技術
OpenAI:新的流程監督獎勵模型改進了人工智能推理
2023 年 6 月 1 日
Anthropic 基於 60 條原則為聊天模型提出“上下文 AI”
Featured 新聞報導 微博 專業技術
Anthropic 基於 60 條原則為聊天模型提出“上下文 AI”
2023 年 5 月 10 日
Hot Stories
加入我們的時事通訊。
最新消息
加入我們的創新技術社區