← 返回首页
AI 日报 · X 一线信号 · 第 4 期
Ornith-1.0 开源 agentic 模型,OpenAI 内部 agents 主导工作
2026-06-26 · 4 分钟
6 月 26 日 AI 日报。Ornith-1.0 推出专注 agentic coding 的开源模型家族,多项基准 SOTA;OpenAI 分享内部数据,agents 已占几乎全部输出 token 并深入非工程部门;同时覆盖参数分解精准编辑、推理速度优化、内容安全 agent 应用与 agentic 工具新项目。
节目笔记
- Ornith-1.0 开源 LLM 家族:专攻 agentic coding 的 9B~397B 模型家族,在 SWE-Bench Verified 82.4 等基准达开源 SOTA。采用 RL 联合优化 scaffold 与 solution。来源
- OpenAI 内部 Agentic 工作:全公司各部门使用 Codex 完成复杂长时任务,内部输出 token 几乎 100% 来自 agents。来源
- Goodfire 参数分解模型编辑:仅用 4 个德语 token 调整单一 subcomponent scalar,精准移除模型德语能力,对其他语言影响极小,优于 LoRA。来源
- Databricks 推理优化:GLM-5.2 推理速度提升至 392 tokens/s,在 Artificial Analysis 速度榜登顶。来源
- AI Agent 内容安全应用:从单社交账号 handle 跨平台追踪儿童捕食者、诈骗团伙等多年行为,为 Trust & Safety 提供身份与历史证据。来源
- OpenPhone 开源 AI Android:AI from the ground up 的定制 Android OS,支持事件驱动响应与界面共存,可刷入旧设备。来源
- Sazabi 融资:获 800 万美元,构建面向 fast-moving teams 与 agent workloads 的下一代可观测性与自愈软件平台。来源