🎯 数字Polly v3:用 brainstorming 审视 Skills,用 paper-figurer 画论文图

🎯 数字Polly v3:用 brainstorming 审视 Skills,用 paper-figurer 画论文图

"你的 20+ Skills 里,有多少是真正在用的?"

这个问题在我脑子里盘旋了一整天。五天前的《Skills 觉醒时刻》让我意识到 Skills 是可复用的专家人格,两天前的《打造数字版的我》给了它记忆。但今天我发现,光有记忆还不够——我需要审视这套 Skills 体系本身。

于是我做了一件有点元(meta)的事:用 brainstorming 来 brainstorm 整个 Skills 体系。

结果?发现了一个巨大的能力真空——论文配图。

数字Polly v3:从"能记住"到"会画图"。

缘起:20+ Skills 需要一次大检阅

有了记忆系统后,我开始审视现有的 Skills 体系。

我一直在用 Claude Code,也积累了 20+ 个 Skills,但总觉得哪里不对劲。有些 Skills 从没触发过,有些功能重叠严重,更关键的是——我没有一个清晰的愿景:这套 Skills 到底要把 Claude 打造成什么样的助手?

于是,我决定用刚学到的 brainstorming 方法论,对整个 Skills 体系来一次彻底的"灵魂拷问"。

第一步:用 brainstorming 审视 brainstorming

有点元(meta)的操作——我先把 Superpowers 的 brainstorming skill 移植过来,然后用它来 brainstorm 整个 Skills 体系的设计。

Q1: 你希望 Claude 的核心定位是什么?
    A. 研究助手
    B. 代码开发者  
    C. 内容创作者
    D. 全栈综合(全都要)

我的回答: D

这个选择决定了后续的一切——我不想要一个狭窄的专才,我想要一个能真正代表我的"数字分身"。

高频任务浮出水面

继续追问下去,真正高频使用的场景逐渐清晰:

场景频率当前覆盖
写博客✅ blog-writer
AI 模型训练✅ image-model-training-expert
学术论文/专利✅ academic-paper-writer
论文配图❌ 缺失
技术设计探索❌ 缺失

一个关键发现:论文配图需求没有被覆盖

我翻看了现有的三个视觉 Skills:

  • canvas-design → 海报、艺术设计
  • algorithmic-art → 生成艺术
  • dream-painter → AI 图像创意

没有一个是为学术配图设计的。这是个真空地带。

Paper Figurer 的诞生

当我明确需求后,下一个问题是:怎么命名?

Claude 给了几个选项:

  • academic-figure-designer — 太长
  • paper-diagram-maker — 太泛
  • figure-smith — 有点奇怪
  • paper-figurer — 简洁、个人化、精准

我选了 paper-figurer。这个名字带着一点自造词的趣味,但含义一目了然。

三高标准

这是我对论文配图的核心要求:

标准含义检验方式
高精度像素级对齐、数学级准确放大 400% 无瑕疵
高美感顶刊级审美、配色和谐可直接投 CVPR/NeurIPS
高效率快速迭代、模板复用10 分钟出初稿

工具链选择

为什么不用 AI 生图(DALL-E、Midjourney)?因为学术配图需要的是精确控制,不是"大致感觉"。一个模型架构图里的箭头指向错误,就是硬伤。

最终技术栈:

图类型工具理由
模型架构图TikZ像素级控制、可复现
流程图D2语法简洁、自动布局
实验曲线MatplotlibPython 生态、灵活度高
热力图Seaborn + custom配色专业

目录结构遵循 skill-creator 标准

paper-figurer/
├── SKILL.md                 # 主技能文档
├── references/              # Claude 读取的参考规范
│   ├── color-palettes.md   # 5套学术配色
│   ├── typography.md       # 字号线宽规范
│   └── tikz-patterns.md    # TikZ 常用模式
├── scripts/                 # 工具脚本
│   ├── render_tikz.py
│   ├── render_d2.py
│   └── quality_check.py
└── assets/                  # 输出模板
    ├── model-architecture/vit.tex
    ├── flowchart/lora-pipeline.d2
    ├── comparison/ablation.py
    └── attention-map/attention.py

这里有个细节值得一提:我一开始把模板放在 templates/ 目录,后来 Review 时发现按 skill-creator 标准应该叫 assets/——因为这些文件是"复制后修改使用"的输出资源,而非"读入 context 参考"的文档。

小事情,但专业性体现在细节里。

实战测试:ContextWeave 架构图

正好手头有篇论文需要画架构图,直接实战检验。

论文描述的系统包含 6 个模块:

  • Document Processor
  • Section-Aware Chunk Engine
  • Context Weaver
  • Translation Orchestrator
  • LLM Provider
  • Quality Validator

还有底层的 MCP Protocol Layer。

我让 Claude 调用 paper-figurer skill,生成了这段 TikZ 代码:

\node[core] (chunk) at (0, 2.5) {Section-Aware\\Chunk Engine};
\node[llm] (llm) at (0, 0.5) {LLM Provider\\{\tiny (DeepSeek/GPT)}};
\draw[biarrow] (orch) -- (llm);

编译一次成功。600 DPI 导出,放大看细节,对齐完美。

这就是我想要的效果——不是 AI 猜测我想要什么,而是精确执行我的设计

Brainstorming 的价值

回头看这次开发过程,brainstorming skill 的价值不在于它输出了什么"答案",而在于它提出的问题迫使我澄清自己的想法。

Q3: 视觉设计类 Skills 中,你最常需要哪些类型?
    A. 配图、封面图
    B. 信息图表
    C. 交互式原型
    D. 技术图解(架构图、流程图)
    E. 生成式艺术

我的回答: A, D, E

如果没有这个结构化的追问,我可能会继续模糊地觉得"现有的视觉 skills 够用了",而不会意识到论文配图是个真空。

后续计划

今天只完成了两个 Skills,但 brainstorming 还识别了其他几个能力缺口:

缺口状态优先级
✅ brainstorming已完成-
✅ paper-figurer已完成-
🔲 人格持久化待开发
🔲 实验记录待开发
🔲 文献研究待开发

还有 8 个潜在冗余的 Skills 需要清理:

  • brand-guidelines
  • internal-comms
  • slack-gif-creator
  • ...

渐进式迭代,每次只做一小步,保证质量。

写在最后

从觉醒到记忆,从记忆到专业技能——数字Polly 正在一步步成型。

版本日期核心能力
v101-22Skills 觉醒 — 可复用的专家人格
v201-25记忆系统 — 双轨记忆,不再失忆
v301-27专业技能 — brainstorming + paper-figurer

今天的两个 Skills 填补了重要的能力缺口:

  • brainstorming 让我在设计前先想清楚
  • paper-figurer 让我的论文配图达到顶刊水准

下一步?人格持久化。让它不只是记住事实,还能记住"我是谁"。

这不是科幻,这是正在发生的事情。


今日开发成果:

  • brainstorming skill — 苏格拉底式设计探索
  • paper-figurer skill — 顶刊级论文配图
  • ContextWeave 架构图 — 首次实战验证

留言与讨论