从零到产品 · Vibe Coding 实战

AI 帮你 merge 文件
结果靠谱吗？

MergeCheck — 一个用传统代码验证 AI 输出的小工具的诞生记

Syneira.AI 慢观察 · By Syneira Lab · Apr 2026

Live App

在线试用 MergeCheck ↗

mergecheck.streamlit.app · 拖文件即可

起因

再强的 AI 大模型，只要基于 LLM，就难以避免单独使用时存在上下文管理不稳定和不确定性。但在追求稳妥的场合，确定性比效率甚至更重要——一个专门做多个文件合并检查的轻量小工具，排除幻想干扰。

AI agent 帮人合并文件越来越常见了。你让 Claude 或 ChatGPT 把三个月的销售报表拼成一个大表，它很乐意帮你做。但问题是：你怎么知道它合对了？

漏了几行你不知道。重复了一条你不知道。某个数字从 $500 变成 $5000，如果你不逐行检查，也不知道。

核心原则：AI 干活之前算指纹，干完之后再算一次
对不上就报警。验证过程不经过 AI，纯传统代码。
本工具核验不通过 AI，拒绝不确定性

思路拆解

起意来自朋友的需求。想清楚三件事就开干了：

产品思考

用户画像

半技术用户——没有太多时间做技术开发，但又熟悉 Excel 等传统工具，了解数据结构和主键、Join、Append、去重合并等常识。不需要你会写代码，但你得知道什么叫"主键"和"总和对不上"。

技术选型

pandas 做对账逻辑比 JS 写起来快。UI 最朴素还是优先免费版 Streamlit——如果增加功能可以移植到其他平台。文件纯英文环境不涉及编码，大小预期在中小，更大的数据通常会得到数分工程师专业处理。

核心决策：对账逻辑突出纯数学

暂时不通过 AI 进行表头自动分析和推断——确定性是这个工具的全部价值。用 AI 来验证 AI 的输出？那不是套娃吗。所以 6 个检查函数全是传统代码，没有一行调 LLM。

它查什么：6 项自动对账

上传 N 个 input CSV + 1 个 AI 合并后的 output CSV，一键跑 6 项检查：

#	检查项	说人话
1	Schema 检查	所有文件的列名是不是一致的？多了少了哪列？
2	行数核对	input 总共多少行，output 多少行，差几行？
3	主键去重	output 里有没有重复的记录？
4	漏行检测	哪些 input 里有的记录在 output 里找不到了？
5	金额汇总核对	指定数值列（金额、数量）input 和 output 的总和对不对？
6	随机抽样	从 output 随机抽 5 条，肉眼看看有没有明显问题

每项结果用 ✅❌⚠️ 标记。报告带时间戳 + 每个文件的 SHA-256 指纹——出具正式下载版，但只报告，不主动修。修报告是另外的价钱了（并不是 🤪）——因为修报告又一次引入黑箱，不如先给用户看清楚再决定。

为什么要哈希校验

📄 文件身份证（SHA-256）

对每个上传文件生成唯一一串 hex 指纹

用来确认审计基于同一份文件

如果有人事后改了文件再说"你的报告不对"——拿指纹一比就清楚

🔍 可复核、可追溯

报告记录输入、输出、配置与哈希

方便复盘、留档与团队复核

审计可追溯 = 专业感 + 信任

技术栈（极简）

整个项目不需要数据库、不需要用户登录、不需要 API 集成。Python 一把梭：

🖥

前端：Streamlit

Python 写 UI，免费部署到 Streamlit Cloud。不用学前端。

🐍

核心逻辑：pandas + hashlib + Decimal

pandas 处理 CSV，hashlib 算 SHA-256 指纹，Decimal 做金额计算（不用 float，避免浮点精度问题）。

📦

外部依赖：csv-diff

Simon Willison 的开源库（pip install csv-diff），按 primary key 对比两个 CSV，返回新增/删除/变更的行。

Vibe Coding 实战心得

理清思路以后就启动 Claude Code 了。纯分享性质目的的开发，GitHub 开源。几个体会：

💡 从需求到 MVP 的真实节奏

周一晚上：定 spec，想清楚不做什么比做什么更重要（不做 Excel、不做 API、不做登录）
周二到周四：Claude Code 搭骨架 + 核心逻辑 + 演示数据 + 前端联调
周五：报告美化 + 文件指纹
周末：录 demo + 发布

一周，每晚 1-2 小时。不是全职做的。

演示数据是故意带错误的——3 个 input 文件合并后，故意漏 3 条、重复 1 条、改错 1 个金额。这样跑 demo 的时候 6 项检查里有 4 项 ❌，效果拉满。

更大的方向

MergeCheck 是一个更大方向的 MVP 切入点：AI Workflow Auditing——为受监管行业做 AI workflow 的合规级审计与对账。

文件 merge 是最简单、最容易验证的 AI 任务，先从这里切入。后续可以扩展到 lineage（数据血缘）、schema drift（结构漂移）、agent 执行路径审计。

竞品空白：LangSmith/Langfuse 做 LLM observability（模型层监控），没人做"业务级 reconciliation"（业务层对账）。这是一个缝隙。

⚠️ 写在最后

这不是一个要做大的商业产品。它是一个从生活出发的需求、纯分享性质的开发。朋友需要，就做了。做完顺便练了 Claude Code，顺便有了内容素材，顺便验证了一个方向。这就是 Vibe Coding 最好的状态——轻装上阵，做完就是收获。

Vibe CodingClaude Code数据对账开源从生活出发