← 返回首页

AI 日报 · X 一线信号 · 第 4 期

Ornith-1.0 开源 agentic 模型，OpenAI 内部 agents 主导工作

2026-06-26 · 4 分钟

6 月 26 日 AI 日报。Ornith-1.0 推出专注 agentic coding 的开源模型家族，多项基准 SOTA；OpenAI 分享内部数据，agents 已占几乎全部输出 token 并深入非工程部门；同时覆盖参数分解精准编辑、推理速度优化、内容安全 agent 应用与 agentic 工具新项目。

节目笔记

Ornith-1.0 开源 LLM 家族：专攻 agentic coding 的 9B~397B 模型家族，在 SWE-Bench Verified 82.4 等基准达开源 SOTA。采用 RL 联合优化 scaffold 与 solution。来源

OpenAI 内部 Agentic 工作：全公司各部门使用 Codex 完成复杂长时任务，内部输出 token 几乎 100% 来自 agents。来源

Goodfire 参数分解模型编辑：仅用 4 个德语 token 调整单一 subcomponent scalar，精准移除模型德语能力，对其他语言影响极小，优于 LoRA。来源

Databricks 推理优化：GLM-5.2 推理速度提升至 392 tokens/s，在 Artificial Analysis 速度榜登顶。来源

AI Agent 内容安全应用：从单社交账号 handle 跨平台追踪儿童捕食者、诈骗团伙等多年行为，为 Trust & Safety 提供身份与历史证据。来源

OpenPhone 开源 AI Android：AI from the ground up 的定制 Android OS，支持事件驱动响应与界面共存，可刷入旧设备。来源

Sazabi 融资：获 800 万美元，构建面向 fast-moving teams 与 agent workloads 的下一代可观测性与自愈软件平台。来源