AI 输出格式之争：Markdown 还是 HTML？

Markdown 是 AI 世界默认的输出语言，你每天看到的分项、加粗、标题，都是它。但最近一篇文章把这件事重新问了一遍：在 AI 代理时代，Markdown 还是最合适的格式吗？

触发这场讨论的是 Anthropic Claude Code 团队成员 Thariq Shihipar 的一篇文章，标题叫《The Unreasonable Effectiveness of HTML》（HTML 出人意料的有效性）。他在文章里展示了 20 个用 Claude Code 生成 HTML 的例子，双栏对比、带注释的代码审查报告、可以直接在浏览器里打开的计划文档。随后 Andrej Karpathy 转发并补充了自己的判断，把这个话题推到了更大的受众面前。

一句话背景：Markdown 是轻量标记语言，用 # 表示标题、** 表示加粗；HTML 是网页语言，用标签控制结构和样式。两者都能表达格式，但能表达的复杂度和使用场景不同。

Context

Markdown 为什么是默认选项

原因是 token 成本。在 2022 年，ChatGPT 的上下文窗口只有 8,192 个 token。同样的内容，HTML 消耗的 token 大约是 Markdown 的 3 倍，有测试数据是 8,000 对 2,800。当预算很紧时，每个省下来的 token 都是一段保留下来的信息。Markdown 赢得了那场战争，因为它在那时是合理的经济选择。

Markdown
## About Us
Plain text, **bold**, links.
约 3 tokens — 简洁

HTML 等效写法

<h2 class="section-title" id="about">About Us</h2> <p>Plain text, <b>bold</b>...</p>

约 12–15 tokens — 同样信息，更多开销

但现在是 2026 年，上下文窗口已经到了 100 万 token。当年那个成本限制，基本消失了。

Analysis

不是谁更好，是各有用场

讨论到这里，分歧就出来了。支持 Markdown 的人说：它给 AI 读效率最高；支持 HTML 的人说：它给人读体验最好。这两件事都是真的，只是说的不是同一个场景。

Markdown 适合：AI 内部交流

模型到模型的信息传递、RAG 检索管道、知识库输入、提示词组织。结构清晰，token 开销低，机器解析准确率更高。表格数据上，Markdown 键值格式的提取准确率（60.7%）高于 HTML 表格（53.6%）。

HTML

HTML 适合：交付给人类

报告、规格文档、代码审查结果、计划文件、需要分享或存档的任何东西。可以双栏对比、色标标注、跳转链接，直接在浏览器里打开，发链接就能看。Markdown 你会滚过去；HTML 你会停下来读。

一个实用的试验：下次让 Claude 做一份分析或计划，在最后加一句「将结果输出为单个 HTML 文件」，然后在浏览器里打开看看。很多人第一次这样做后说：这是第一次我真的把 AI 生成的文档完整读完了。

Gallery

Thariq 的 20 个 HTML 实例，按用途分 9 类

说 HTML 好用太抽象。Thariq 在原文附了一个展示站（thariqs.github.io/html-effectiveness），放了 20 个用 Claude Code 生成的真实 HTML 文件，每个都能在浏览器里直接打开。按用途分成 9 类，下面逐类拆。

探索与规划 3 个示例

三种方案并排对比，四种空状态 UI 方向的 mockup，带时间线和风险表的完整实施计划

这是 Thariq 建议最先试的场景。做产品时经常面临选择困难，传统做法是在脑子里想象或者画草图，但很难直观对比差异。HTML 可以把 6 种方案网格排列在一个页面里，每个方案展示不同的布局、基调和信息密度，旁边标注取舍分析。你直接滚动浏览、并排对比，不用在多个文件之间来回切换。Markdown 写同样的内容，只能是三段顺序排列的文字，你得自己在脑子里对齐。

代码审查 3 个示例

带 diff 渲染和行内批注的 PR review，附动机说明和逐文件说明的 PR writeup，模块依赖关系图

代码审查是最典型的「信息密度决定效率」的场景。HTML 版本直接渲染 diff，行内标注红/黄/绿色严重程度，点击跳转到对应发现。Markdown 版本只能把 diff 贴成代码块，批注写在下面，你得自己对着行号找。一个 500 行的 PR，HTML 版本 2 分钟扫完重点，Markdown 版本你可能要 15 分钟逐行读。

设计系统 2 个示例

活的设计规范文档，色板、间距、组件变体展示

设计规范用 Markdown 写，颜色只能写色号文字，间距只能写数字。HTML 可以直接渲染色板、展示真实间距、并排展示组件的不同状态（default / hover / disabled）。设计师和开发者看的是同一个文件，不需要再打开 Figma 对照。

原型制作 2 个示例

可交互原型，参数可以实时拖动调节

这是 Markdown 完全做不到的事情。HTML 可以带滑块、输入框、实时预览。比如你在探索一个定价方案，HTML 原型可以让你拖动价格滑块实时看不同档位的利润变化。Markdown 只能列一个静态表格。

图表 2 个示例

SVG 插图和流程图，点击可查看详情

Markdown 里画图要么靠 ASCII art（难看），要么引用外部图片链接（多一步）。HTML 可以内嵌 SVG，流程图直接渲染在页面里，点击节点展开详情。一个文件搞定，不依赖任何外部资源。

演示文稿 1 个示例

键盘控制的幻灯片，20 行 JS 实现

不需要 PowerPoint，不需要 Google Slides。一个 HTML 文件，按方向键翻页，浏览器全屏就是演示模式。20 行 JavaScript。你让 AI 帮你准备一个快速的内部分享，直接生成这个就能用，不用再开一个演示软件。

研究学习 2 个示例

功能解释和概念解释，TL;DR + 可折叠细节

学一个新概念，Markdown 给你一长篇文字。HTML 可以先给你一句话总结（TL;DR），想看细节点击展开，不想看就折叠着。信息层次清晰，你自己控制读多深。

报告 2 个示例

周状态报告和事故时间线，图表化展示

周报用 Markdown 写，就是一堆 bullet point。HTML 版本可以带进度条、带图表、带颜色编码的状态标签（绿色正常 / 黄色注意 / 红色阻塞）。事故时间线可以沿时间轴展开，每个节点附操作记录。视觉信息比纯文字高效得多。

自定义编辑器 3 个示例

Ticket 看板、Feature Flag 编辑器、Prompt 调优器

这是最出人意料的一类。AI 不只是输出文档，它输出了一个可以操作的小工具。Ticket 看板可以拖动卡片，Feature Flag 编辑器可以切换开关，Prompt 调优器带「复制为 JSON」按钮。这些不是原型，是你当天就能用的工具，而且是一个 HTML 文件。

9 类有一个共同点：用 Markdown 写出来你会滚过去，用 HTML 写出来你会停下来看。差别不在好不好看，在于你愿不愿意读完。

📎 完整 20 个示例可以在 thariqs.github.io/html-effectiveness 直接浏览，每个文件可以下载在浏览器里打开。

Perspective

Karpathy 看得更远：这只是格式进化的中间站

Karpathy 在转发评论里提出了一个更宏观的观察。他把 AI 的输出格式描述为一条进化路径，大意是：

原始文本

难读，没有结构

Markdown

当前默认，有基础结构，好一些

HTML

正在形成的新标准 · 有布局、有交互性

···

交互式神经网络视频 / 模拟

更远的未来，技术尚不成熟

大约三分之一的人类大脑是专门处理视觉的大规模并行处理器，它是信息进入大脑的十车道超级高速公路。随着 AI 进步，我认为我们会看到一种利用这个优势的发展趋势。 — Andrej Karpathy，前 Tesla AI 总监 / OpenAI 联合创始人

他的意思是：Markdown 相对于纯文本是进步，HTML 相对于 Markdown 是进步，但两者都是中间站，不是终点。AI 最终会产出的，是充分利用人类视觉处理能力的形式，而不是把信息压缩成纯文字让你自己脑补。

So What

对实际使用的意思

这场讨论在开发者圈子里热，但对普通 AI 用户也有直接的实用价值。有一个简单的分流原则可以直接用：

格式选择参考

AI 读

Markdown。给模型的输入、提示词、知识库、RAG 数据——用 Markdown 或纯文本，效率更高，解析更准。

人读

HTML。要分享、要存档、要认真读完的文档——让 AI 输出 HTML，浏览器打开，体验完全不同。

日常对话

Markdown 足够，不需要为每个回答都生成 HTML，成本和场景不匹配。

目前没有哪个格式「赢了」。这场争论的真正意思是：AI 交付物的形式本身值得用心设计，不是非得用 AI 生成的默认样式。如果你让 AI 帮你写报告或分析，多加一句「输出为 HTML，可以在浏览器直接查看」，结果可能会让你重新理解什么叫「可用的 AI 输出」。

📖 延伸阅读：Thariq Shihipar《Using Claude Code: The Unreasonable Effectiveness of HTML》，20 个实例展示 HTML 输出的实际效果。可在 X / 小红书搜索标题找到。