从零到产品 · Vibe Coding 实战

AI 帮你 merge 文件
结果靠谱吗?

MergeCheck — 一个用传统代码验证 AI 输出的小工具的诞生记
Syneira.AI 慢观察 · By Syneira Lab · Apr 2026
Live App
在线试用 MergeCheck ↗
mergecheck.streamlit.app · 拖文件即可

起因

再强的 AI 大模型,只要基于 LLM,就难以避免单独使用时存在上下文管理不稳定和不确定性。但在追求稳妥的场合,确定性比效率甚至更重要——一个专门做多个文件合并检查的轻量小工具,排除幻想干扰。

AI agent 帮人合并文件越来越常见了。你让 Claude 或 ChatGPT 把三个月的销售报表拼成一个大表,它很乐意帮你做。但问题是:你怎么知道它合对了?

漏了几行你不知道。重复了一条你不知道。某个数字从 $500 变成 $5000,如果你不逐行检查,也不知道。

核心原则:AI 干活之前算指纹,干完之后再算一次
对不上就报警。验证过程不经过 AI,纯传统代码。
本工具核验不通过 AI,拒绝不确定性

思路拆解

起意来自朋友的需求。想清楚三件事就开干了:

产品思考
1
用户画像
半技术用户——没有太多时间做技术开发,但又熟悉 Excel 等传统工具,了解数据结构和主键、Join、Append、去重合并等常识。不需要你会写代码,但你得知道什么叫"主键"和"总和对不上"。
2
技术选型
pandas 做对账逻辑比 JS 写起来快。UI 最朴素还是优先免费版 Streamlit——如果增加功能可以移植到其他平台。文件纯英文环境不涉及编码,大小预期在中小,更大的数据通常会得到数分工程师专业处理。
3
核心决策:对账逻辑突出纯数学
暂时不通过 AI 进行表头自动分析和推断——确定性是这个工具的全部价值。用 AI 来验证 AI 的输出?那不是套娃吗。所以 6 个检查函数全是传统代码,没有一行调 LLM。

它查什么:6 项自动对账

上传 N 个 input CSV + 1 个 AI 合并后的 output CSV,一键跑 6 项检查:

#检查项说人话
1Schema 检查所有文件的列名是不是一致的?多了少了哪列?
2行数核对input 总共多少行,output 多少行,差几行?
3主键去重output 里有没有重复的记录?
4漏行检测哪些 input 里有的记录在 output 里找不到了?
5金额汇总核对指定数值列(金额、数量)input 和 output 的总和对不对?
6随机抽样从 output 随机抽 5 条,肉眼看看有没有明显问题

每项结果用 ✅❌⚠️ 标记。报告带时间戳 + 每个文件的 SHA-256 指纹——出具正式下载版,但只报告,不主动修。修报告是另外的价钱了(并不是 🤪)——因为修报告又一次引入黑箱,不如先给用户看清楚再决定。

为什么要哈希校验

📄 文件身份证(SHA-256)

对每个上传文件生成唯一一串 hex 指纹
用来确认审计基于同一份文件
如果有人事后改了文件再说"你的报告不对"——拿指纹一比就清楚

🔍 可复核、可追溯

报告记录输入、输出、配置与哈希
方便复盘、留档与团队复核
审计可追溯 = 专业感 + 信任

技术栈(极简)

整个项目不需要数据库、不需要用户登录、不需要 API 集成。Python 一把梭:

🖥
前端:Streamlit
Python 写 UI,免费部署到 Streamlit Cloud。不用学前端。
🐍
核心逻辑:pandas + hashlib + Decimal
pandas 处理 CSV,hashlib 算 SHA-256 指纹,Decimal 做金额计算(不用 float,避免浮点精度问题)。
📦
外部依赖:csv-diff
Simon Willison 的开源库(pip install csv-diff),按 primary key 对比两个 CSV,返回新增/删除/变更的行。

Vibe Coding 实战心得

理清思路以后就启动 Claude Code 了。纯分享性质目的的开发,GitHub 开源。几个体会:

💡 从需求到 MVP 的真实节奏
周一晚上:定 spec,想清楚不做什么比做什么更重要(不做 Excel、不做 API、不做登录)
周二到周四:Claude Code 搭骨架 + 核心逻辑 + 演示数据 + 前端联调
周五:报告美化 + 文件指纹
周末:录 demo + 发布

一周,每晚 1-2 小时。不是全职做的。

演示数据是故意带错误的——3 个 input 文件合并后,故意漏 3 条、重复 1 条、改错 1 个金额。这样跑 demo 的时候 6 项检查里有 4 项 ❌,效果拉满。

更大的方向

MergeCheck 是一个更大方向的 MVP 切入点:AI Workflow Auditing——为受监管行业做 AI workflow 的合规级审计与对账。

文件 merge 是最简单、最容易验证的 AI 任务,先从这里切入。后续可以扩展到 lineage(数据血缘)、schema drift(结构漂移)、agent 执行路径审计。

竞品空白:LangSmith/Langfuse 做 LLM observability(模型层监控),没人做"业务级 reconciliation"(业务层对账)。这是一个缝隙。

⚠️ 写在最后
这不是一个要做大的商业产品。它是一个从生活出发的需求、纯分享性质的开发。朋友需要,就做了。做完顺便练了 Claude Code,顺便有了内容素材,顺便验证了一个方向。这就是 Vibe Coding 最好的状态——轻装上阵,做完就是收获。

Vibe CodingClaude Code数据对账开源从生活出发