大家最近好像都在考虑用 agent 来写论文,刚好我最近用 agent 协助写了一篇 (传统工科,非 AI 方向)。为了更快的水上 3 级 (
),给大家分享一下我的思路吧。
用的工具 (codex,claude(反重力里面调用),还有 GPT Pro,notebookllm),MinerU (PDF 转 MD)
你需要的一些 skill 和 promt 可以看一些 github 的项目 比如:GitHub - Orchestra-Research/AI-Research-SKILLs: Comprehensive open-source library of AI research and engineering skills for any AI model. Package the skills and your claude code/codex/gemini agent will be an AI research agent with full horsepower. Maintained by Orchestra Research. · GitHub
先叠个甲,我很菜的,就是提供一个思路。
就是像写一个项目一样,这个做 AI/计算机方向的佬们应该会更清楚,我就是看着大家的做法,做了个 agent.md,claude.md 和 codex.md
agent.md:
claude.md:
codex.md:
然后呢,把一篇论文拆成几部分,这里的顺序看你自己,我是习惯按下面的结构写的。
基本流程就是
首先:用 GPT/CLAUDE/GEMINI(notebookllm),里面用他们的 deep reaserch 去找你这篇论文相关的文献,以及你的 result 可能涉及的文献,然后下载下来,用 MinerU 把 PDF 转成 MD,你也可以不转,不过 agent 读 PDF 好像很痛苦。这里的 EXAMPL,好处就是你节省了后面让 agent 自己再去重复做 web search 的工作,让他直接模仿写作手法/或者对照分析就好了。
然后就是让 agent 给你总结 写作风格,并且你根据自己学科得要去,弄一个 学术语言写作规则,这个你可以从 github 上面找,每个人的喜好不一样,我就很喜欢动词转名词,然后做被动语态。你在把你的实际做了什么试验 跟 agent 讨论一下,让 Agnes 有一个基础的概念,这样你的 00 background & Example 就弄好了。
接下来就是文章结构了,这里得结构说得其实是 文章你这个故事 (别笑,就是编故事) 的思路,创新点,研究目的,研究内容,研究方法,和边界约束。就跟开题一样
后面就很顺了,你该咋写咋写,每个章节结构呢就是,
实际我的操作布置 5 阶段,我的 Final Version 还会扔给 GPT Pro 做最后一轮分析评估,对抗性机制可以不加,不过我建议还是加,你别管他喷得有多厉害。
这里我有个 03 Result 和 04 Result & Discussion,是因为我的 03 里面是一个很粗糙的试验结果,让着 Agent 一起分析了。04 才是成稿。
这里有个小经验,虽然大家都在吐槽 antigravity 一直在 retry,但是 antigravity 里面的 claude 可以调用 Gemini 3 Flash IMAGE 帮你生成草图 (提示词都是 claude 给你写的),这个其实很方便,虽然后面还得重画,但是会给一个很好的思路。
后面的润色和降低 AI 率,那就是按照 github 上面的一些经验来做了,也没什么好办法。
实际的情况,大家按照自己的情况来布置,这里面的灵活性很大,每个人对文章结构的理解都不一样。
最重要的一点,agent 写得东西,自己还是要重新读几遍,然后自己稍微改改 (大部分时间我觉得 agent 比我写得好,但是我还是读起来不舒服,比如 agent 一句话可能很高级很长,我还是喜欢直接的短句,就给他改了)。







