JW Jackson Wang
Open to conversations

AI STRATEGY PRODUCT · 2027 fall

Building agents
that actually ship.

王策 / 字节跳动 · 豆包-商业化-大模型策略产品。定义模型策略、Agent 的到端理想态,指引模型训练和优化;搭建自动评测体系,把模型能力转化为可量化的产品结果。

  • Current 豆包-商业化-大模型策略产品
  • Base 北京
  • Updated 2026 · 06 · 30
王策 · 海岸木栏留影
2025 · 大连海岸 · 个人页最后更新 06 / 30
01

Selected work

2025 → 2026 · 5 entries · full résumé ↓

01 字节跳动 · 豆包商业化 2026.03 — 至今

豆包小程序 Agent

负责 APP 内自然语言触发小程序的小程序Agent的模型训练与链路,以「提 LT」为北极星指标。 从 0 到 1 定义地图与缴费两个场景的到端理想态,定义模型行为,对模型badcase分析,指明模型优化方向;搭起 MCP 与到端评测体系, 支持合版模型综合调用工具能力。

HLT+0.31% (0.25% 显著)
0上线场景
02 字节跳动 · GMPT 2026.01 — 2026.03

Browser Agent

非 GUI 跨网页综合任务智能体。元 Skill 探索任务 SOP 的 API 调用链, 派生 Skill 自动执行,API 资产持续积累。

0%提效
03 小红书 · 智能商分 2025.09 — 2025.12

ReAct 架构化商分 Agent

Orchestrator Agent 综合调用 subAgent 与 tools,基于多轮 tool call 闭环后生成报告。上线后稳定泛化场景数翻倍。

0泛化场景
0%+看板准确率
04 字节跳动 · GMPT 2026.Q1

数分 Agent · 多轮 Context 压缩

Agentic RAG + 动态 System Prompt,结合 Cursor 逆向工程结论, 设计多轮上下文压缩策略,让 Agent 稳健跨表数据下钻。

0%Context 压缩
0%Evo-memory 召回
05 美团 · Friday 基建 2025.06 — 2025.09

Agent 评测 Dashboard

评价指标覆盖 MCP、RAG、Agent 等模块,支持自配置大模型测评。

0%模块使用率
06 百度 · 文心 APP 2025.02 — 2025.06

VQA 意图模型微调

prompt + 多级标签 + 图片制定标准训练集,对意图识别模型 SFT。

0%召回率
0s时延
02

Research

2025 · 04 · 类 Manus 垂类智能体落地机会研究

从「可落地性」与「对 B 端价值」两轴出发,把候选场景画在 2×2 矩阵里—— 右上是短期最该打的,左下是 AI 现阶段不该接的。 配上「任务复杂度」维度,可以快速判断一个 Agent 想法是真正可做,还是只是看着性感。

对B端价值 vs 可落地性 矩阵
Fig. 01 对 B 端价值 × 可落地性
任务复杂度 vs 可落地性 矩阵
Fig. 02 任务复杂度 × 可落地性

完整报告 / 数据集见 作品集-AI/Manus类超级智能体落地机会探究.pdf ,共梳理 21 个候选场景。

03

Off the clock

Things I do when no one is shipping metrics.

王策 · 壹仔个现场 演出
Live · 2025 壹仔个现场 · 主持 & 演出
01

音乐 / Vocal

R&B 为主,流行为辅、林俊杰 10 年老粉! 致力于修炼 Vocal、声乐技术多多交流!

02

现场 Live

多次线下 live 表演,朝阳 The Box「壹仟个现场」演出在央视频平台播出。

03

运动 / Sports

足球 · 最爱梅西!
LOL 钻石 · 主打上单 / 辅助。

04

开发 / Vibecoding

用 Claude Code 写自己的小工具,这里 有几个 demo。

04

Contact

Let's build something
useful, together.

一起聊聊模型训练、Agent 评测、Agent Harness、垂类智能体、AI 商业化路径,或者合作一个有意思的 side project