← 返回首页
AI 日报 · X 一线信号 · 第 3 期
AI 工程师的生产级技能栈与 Qwen 世界模型开源
2026-06-25 · 5 分钟
本期聚焦 AI 工程师在生产环境中的完整技能要求,阿里巴巴 Qwen 开源的 AgentWorld 世界模型,以及 Cursor 从 Notion 委派任务、支持 GLM 5.2 等实用更新。我们还讨论了 OpenAI 自研推理芯片和开源部署带来的真实成本案例。
节目笔记
本期话题
- AI 工程师的生产级技能栈:从 harness engineering、context engineering、KV cache 管理、量化到 RAG 全栈、评估、观测性与安全的多租户隔离。生产故障往往来自这些工程细节而非 prompt 本身。来源
- Qwen AgentWorld 世界模型开源:Alibaba Qwen 开源原生建模 agent 环境的模型(Terminal/Web/SWE/OS 等),CPT+SFT+RL 三阶段训练。在 AgentWorldBench 上 397B 模型 58.71 分超过 GPT-5.4,35B 版本大幅提升且支持本地全权重运行。来源
- Cursor Notion 集成与 GLM 5.2 支持:可直接从 Notion 委派任务给云端 agent(使用统一 Cursor SDK/模型/运行时),自动生成 PR 供团队 review;同时接入 GLM 5.2 开源模型并发布 CursorBench 评估数据。来源 来源
- OpenAI Jalapeño 推理芯片:中央 die 约 831mm²,6×HBM3E 共 216GB 内存,带宽 ~7.2TB/s,FP4 算力 ~10PFLOPS,由前 Google 工程师设计、Broadcom 代工。来源
- 开源部署成本案例与 Hermes:Anthropic 月账单超百万美元后改用租用 GPU + 开源模型实现约 100x 降本;NousResearch Hermes 被用于可靠的 24/7 AI chief of staff,支持 Telegram、语音、Google Workspace 等工具和日常 routine。来源 来源