Markdown 是 AI 世界默认的输出语言,你每天看到的分项、加粗、标题,都是它。但最近一篇文章把这件事重新问了一遍:在 AI 代理时代,Markdown 还是最合适的格式吗?
触发这场讨论的是 Anthropic Claude Code 团队成员 Thariq Shihipar 的一篇文章,标题叫《The Unreasonable Effectiveness of HTML》(HTML 出人意料的有效性)。他在文章里展示了 20 个用 Claude Code 生成 HTML 的例子,双栏对比、带注释的代码审查报告、可以直接在浏览器里打开的计划文档。随后 Andrej Karpathy 转发并补充了自己的判断,把这个话题推到了更大的受众面前。
一句话背景:Markdown 是轻量标记语言,用 # 表示标题、** 表示加粗;HTML 是网页语言,用标签控制结构和样式。两者都能表达格式,但能表达的复杂度和使用场景不同。
Context
Markdown 为什么是默认选项
原因是 token 成本。在 2022 年,ChatGPT 的上下文窗口只有 8,192 个 token。同样的内容,HTML 消耗的 token 大约是 Markdown 的 3 倍,有测试数据是 8,000 对 2,800。当预算很紧时,每个省下来的 token 都是一段保留下来的信息。Markdown 赢得了那场战争,因为它在那时是合理的经济选择。
Markdown
## About Us
Plain text, **bold**, links.
约 3 tokens — 简洁
HTML 等效写法
<h2 class="section-title"
id="about">About Us</h2>
<p>Plain text, <b>bold</b>...</p>
约 12–15 tokens — 同样信息,更多开销
但现在是 2026 年,上下文窗口已经到了 100 万 token。当年那个成本限制,基本消失了。
讨论到这里,分歧就出来了。支持 Markdown 的人说:它给 AI 读效率最高;支持 HTML 的人说:它给人读体验最好。这两件事都是真的,只是说的不是同一个场景。
MD
Markdown 适合:AI 内部交流
模型到模型的信息传递、RAG 检索管道、知识库输入、提示词组织。结构清晰,token 开销低,机器解析准确率更高。表格数据上,Markdown 键值格式的提取准确率(60.7%)高于 HTML 表格(53.6%)。
HTML
HTML 适合:交付给人类
报告、规格文档、代码审查结果、计划文件、需要分享或存档的任何东西。可以双栏对比、色标标注、跳转链接,直接在浏览器里打开,发链接就能看。Markdown 你会滚过去;HTML 你会停下来读。
一个实用的试验:下次让 Claude 做一份分析或计划,在最后加一句「将结果输出为单个 HTML 文件」,然后在浏览器里打开看看。很多人第一次这样做后说:这是第一次我真的把 AI 生成的文档完整读完了。
Gallery
Thariq 的 20 个 HTML 实例,按用途分 9 类
说 HTML 好用太抽象。Thariq 在原文附了一个展示站(thariqs.github.io/html-effectiveness),放了 20 个用 Claude Code 生成的真实 HTML 文件,每个都能在浏览器里直接打开。按用途分成 9 类,下面逐类拆。
三种方案并排对比,四种空状态 UI 方向的 mockup,带时间线和风险表的完整实施计划
这是 Thariq 建议最先试的场景。做产品时经常面临选择困难,传统做法是在脑子里想象或者画草图,但很难直观对比差异。HTML 可以把 6 种方案网格排列在一个页面里,每个方案展示不同的布局、基调和信息密度,旁边标注取舍分析。你直接滚动浏览、并排对比,不用在多个文件之间来回切换。Markdown 写同样的内容,只能是三段顺序排列的文字,你得自己在脑子里对齐。
带 diff 渲染和行内批注的 PR review,附动机说明和逐文件说明的 PR writeup,模块依赖关系图
代码审查是最典型的「信息密度决定效率」的场景。HTML 版本直接渲染 diff,行内标注红/黄/绿色严重程度,点击跳转到对应发现。Markdown 版本只能把 diff 贴成代码块,批注写在下面,你得自己对着行号找。一个 500 行的 PR,HTML 版本 2 分钟扫完重点,Markdown 版本你可能要 15 分钟逐行读。
活的设计规范文档,色板、间距、组件变体展示
设计规范用 Markdown 写,颜色只能写色号文字,间距只能写数字。HTML 可以直接渲染色板、展示真实间距、并排展示组件的不同状态(default / hover / disabled)。设计师和开发者看的是同一个文件,不需要再打开 Figma 对照。
可交互原型,参数可以实时拖动调节
这是 Markdown 完全做不到的事情。HTML 可以带滑块、输入框、实时预览。比如你在探索一个定价方案,HTML 原型可以让你拖动价格滑块实时看不同档位的利润变化。Markdown 只能列一个静态表格。
SVG 插图和流程图,点击可查看详情
Markdown 里画图要么靠 ASCII art(难看),要么引用外部图片链接(多一步)。HTML 可以内嵌 SVG,流程图直接渲染在页面里,点击节点展开详情。一个文件搞定,不依赖任何外部资源。
键盘控制的幻灯片,20 行 JS 实现
不需要 PowerPoint,不需要 Google Slides。一个 HTML 文件,按方向键翻页,浏览器全屏就是演示模式。20 行 JavaScript。你让 AI 帮你准备一个快速的内部分享,直接生成这个就能用,不用再开一个演示软件。
功能解释和概念解释,TL;DR + 可折叠细节
学一个新概念,Markdown 给你一长篇文字。HTML 可以先给你一句话总结(TL;DR),想看细节点击展开,不想看就折叠着。信息层次清晰,你自己控制读多深。
周状态报告和事故时间线,图表化展示
周报用 Markdown 写,就是一堆 bullet point。HTML 版本可以带进度条、带图表、带颜色编码的状态标签(绿色正常 / 黄色注意 / 红色阻塞)。事故时间线可以沿时间轴展开,每个节点附操作记录。视觉信息比纯文字高效得多。
Ticket 看板、Feature Flag 编辑器、Prompt 调优器
这是最出人意料的一类。AI 不只是输出文档,它输出了一个可以操作的小工具。Ticket 看板可以拖动卡片,Feature Flag 编辑器可以切换开关,Prompt 调优器带「复制为 JSON」按钮。这些不是原型,是你当天就能用的工具,而且是一个 HTML 文件。
9 类有一个共同点:用 Markdown 写出来你会滚过去,用 HTML 写出来你会停下来看。差别不在好不好看,在于你愿不愿意读完。
📎 完整 20 个示例可以在 thariqs.github.io/html-effectiveness 直接浏览,每个文件可以下载在浏览器里打开。
Perspective
Karpathy 看得更远:这只是格式进化的中间站
Karpathy 在转发评论里提出了一个更宏观的观察。他把 AI 的输出格式描述为一条进化路径,大意是:
2
Markdown
当前默认,有基础结构,好一些
3
HTML
正在形成的新标准 · 有布局、有交互性
···
交互式神经网络视频 / 模拟
更远的未来,技术尚不成熟
大约三分之一的人类大脑是专门处理视觉的大规模并行处理器,它是信息进入大脑的十车道超级高速公路。随着 AI 进步,我认为我们会看到一种利用这个优势的发展趋势。
— Andrej Karpathy,前 Tesla AI 总监 / OpenAI 联合创始人
他的意思是:Markdown 相对于纯文本是进步,HTML 相对于 Markdown 是进步,但两者都是中间站,不是终点。AI 最终会产出的,是充分利用人类视觉处理能力的形式,而不是把信息压缩成纯文字让你自己脑补。
这场讨论在开发者圈子里热,但对普通 AI 用户也有直接的实用价值。有一个简单的分流原则可以直接用:
格式选择参考
AI 读
Markdown。给模型的输入、提示词、知识库、RAG 数据——用 Markdown 或纯文本,效率更高,解析更准。
人读
HTML。要分享、要存档、要认真读完的文档——让 AI 输出 HTML,浏览器打开,体验完全不同。
日常对话
Markdown 足够,不需要为每个回答都生成 HTML,成本和场景不匹配。
目前没有哪个格式「赢了」。这场争论的真正意思是:AI 交付物的形式本身值得用心设计,不是非得用 AI 生成的默认样式。如果你让 AI 帮你写报告或分析,多加一句「输出为 HTML,可以在浏览器直接查看」,结果可能会让你重新理解什么叫「可用的 AI 输出」。
📖 延伸阅读:Thariq Shihipar《Using Claude Code: The Unreasonable Effectiveness of HTML》,20 个实例展示 HTML 输出的实际效果。可在 X / 小红书搜索标题找到。