挑战
手动发票处理速度慢、易出错,是应付账款部门的主要瓶颈:
- 数量 — 每月 300-500 张发票,来自 100 多个供应商,格式各异(PDF、扫描图片、电子邮件附件)
- 手动录入 — 每张发票需要 3-5 分钟手动录入到 QuickBooks(总计:每月 25-40 小时)
- 错误率 — 5-8% 的数据录入错误率导致付款差异和供应商纠纷
- 格式不一致 — 每个供应商使用不同的发票布局,使得基于模板的 OCR 不可靠
- 缺失字段 — 发票通常缺乏清晰的明细项,需要人工解释
- 重复检测 — 重复发票偶尔会导致双重付款
- GL 科目映射 — 分配正确的总账科目需要机构知识
我们的解决方案
我们构建了一个AI驱动的发票处理流程,该流程结合了用于文本提取的 OCR、基于 LLM 的智能字段解析以及用于自动记账条目创建的 QuickBooks API 集成。
架构
- 数据摄取: 电子邮件监听器 + 文件上传 API + 拖放式仪表板
- OCR 引擎: 基于云的 Vision API,用于从 PDF 和扫描图像中提取文本
- AI 解析器: LLM,用于智能字段提取和解释
- 验证: 基于规则的验证引擎,具有置信度评分功能
- 会计集成: QuickBooks Online API,用于账单创建和供应商匹配
- 仪表板: React 管理界面,用于审核、批准和异常处理
- 数据库: PostgreSQL,用于发票记录、审计跟踪和供应商映射
- 队列: 异步作业队列,用于批量处理
处理流程
阶段 1:数据摄取
发票通过多个渠道进入系统:
- 电子邮件转发 — 由 IMAP 监听器监控的专用电子邮件地址
- 文件上传 — 管理仪表板上的拖放界面
- API 上传 — 来自其他系统的程序化提交
- 批量导入 — 从共享驱动器批量上传
支持的格式: PDF, PNG, JPG, TIFF, HEIC, 多页 PDF
阶段 2:OCR 文本提取
- 预处理 — 扫描文档的图像增强(去倾斜、对比度调整、降噪)
- 文本提取 — Cloud Vision API 提取所有带空间定位的文本
- 布局分析 — 使用空间定位识别表格、页眉、页脚和明细项
- 置信度评分 — 跟踪每个字符的 OCR 置信度;低置信度区域被标记以供审核
阶段 3:AI 驱动的字段提取
LLM 接收原始 OCR 文本并提取结构化的发票数据,包括供应商信息(名称、地址)、发票标识符(编号、日期、PO 参考)、财务数据(小计、税金、总计、货币、付款条款)以及带有描述、数量和金额的单独明细项。
提取过程使用结构化输出模式、用于边缘情况的少样本示例、用于模糊字段的思维链推理以及按字段的置信度评分。
阶段 4:验证与丰富
在创建 QuickBooks 条目之前,提取的数据会经过验证:
自动化检查:- 数学验证 — 明细项金额与小计核对;小计 + 税金与总计核对
- 重复检测 — 发票号码 + 供应商 + 金额与现有记录核对
- 日期合理性 — 发票日期不能是未来日期;到期日晚于发票日期
- 供应商匹配 — 将供应商名称与 QuickBooks 供应商列表进行模糊匹配
- GL 科目建议 — AI 根据供应商历史和明细项描述建议总账科目
- 金额阈值 — 超过可配置阈值的发票将被标记,需要手动批准
- 高置信度发票自动批准(所有字段均已提取,数学检查通过,供应商匹配成功)
- 中置信度发票进入审核队列(某些字段不确定或新供应商)
- 低置信度发票需要手动录入(OCR 质量差或非结构化格式)
阶段 5:QuickBooks 集成
供应商匹配与创建:提取的供应商名称将与现有的 QuickBooks 供应商列表进行模糊匹配。如果匹配度高于置信度阈值,则链接到现有供应商。否则,将使用提取的信息创建一个新供应商,并缓存以备将来发票使用。
账单创建:QuickBooks 账单对象由经过验证的发票数据构建,其中明细项映射到适当的 GL 科目,应用税金,设置付款条款,并附上原始发票 PDF。内部记录会与 QuickBooks 账单 ID 进行交叉引用。
GL 科目映射:- 基于规则 — 针对已知供应商的特定供应商 GL 映射
- AI 建议 — LLM 分析明细项描述并根据历史模式建议科目
- 学习循环 — 手动更正反馈以改进未来的建议
- 默认回退 — 未映射的项分配到一个通用科目,供以后审核
QuickBooks API 集成
认证
- OAuth 2.0,带自动令牌刷新
- 安全的凭据存储,带静态加密
- 支持多公司,适用于拥有多个 QuickBooks 文件的企业
错误处理
- 遵守 API 速率限制,采用指数退避机制
- 瞬时故障重试逻辑,延迟逐渐增加
- 冲突解决,以防止重复记录
- 回滚失败的部分创建,以防止孤立记录
仪表板与工作流程
发票队列
发票按状态分类:待审核、自动批准、异常(验证失败或 API 错误)和已完成(已同步到 QuickBooks)。
审核界面
- 并排视图:原始发票与提取数据对照显示
- 内联编辑纠正字段,并突出显示差异
- 一键批准/拒绝,可附带可选备注
- 对同一供应商的多张发票进行批量批准
分析
- 处理量跟踪(每日/每周/每月)
- 自动批准率监控(目标:70%+)
- 每张发票的平均处理时间
- 错误率和常见失败原因
- 与手动处理相比的成本节约
- 供应商特定准确性趋势
主要功能
- 多格式 OCR — PDF、扫描件、照片和多页文档
- AI 字段提取 — 基于 LLM 的解析无需模板即可处理任何发票布局
- 置信度评分 — 根据提取确定性进行自动路由
- 重复检测 — 防止重复提交的发票导致双重付款
- 供应商自动匹配 — 模糊匹配将发票链接到现有 QuickBooks 供应商
- GL 科目建议 — AI 根据历史模式推荐费用科目
- QuickBooks 自动同步 — 创建带明细项、税金和附带 PDF 的账单
- 学习循环 — 手动更正可提高未来的提取准确性
- 批量处理 — 通过电子邮件转发或批量上传处理数百张发票
- 审计跟踪 — 每次提取、编辑、批准和同步事件的完整日志
成果
技术栈
常见问题
MicrocosmWorks 构建了一个由 AI 驱动的 OCR 管道,在结构化发票上实现了超过 95% 的提取准确率,显著降低了与手动将数据录入 QuickBooks 相关的错误率。该系统使用多遍验证,将供应商名称、行项目和总计等提取字段在过账前与 QuickBooks 主数据进行交叉核对,从而捕获人工操作员通常会遗漏的差异。
是的,MicrocosmWorks 开发的系统采用自适应 OCR 与经过多样化发票布局训练的机器学习模型相结合,无需为每个供应商配置模板。无论文档结构如何,它都能自动识别发票号码、日期、行项目、税额和付款条件等关键字段,并随着时间的推移从更正中学习以提高准确性。
MicrocosmWorks 实施了一种置信度评分机制,将低于可配置准确度阈值的发票标记出来进行人工审核,而不是将不正确的数据推送到 QuickBooks。系统将低置信度提取项路由到审核队列,操作员可以在其中更正字段,并且这些更正会反馈到模型中,以便在未来的处理周期中更好地处理类似文档。
MicrocosmWorks 提供 AI 发票处理集成服务,开发费率为 $25-$45/小时,这比按页收费的现成企业级 OCR 解决方案显著更经济实惠。总投资取决于发票格式的数量、您的 QuickBooks 会计科目表映射的复杂性,以及您是否需要实时或批量处理工作流。
MicrocosmWorks 构建了一个重复数据删除引擎,该引擎在创建新条目之前,会根据现有 QuickBooks 记录检查提取的发票号码、供应商 ID、金额和日期。该系统使用模糊匹配来捕获供应商可能在格式上略有不同的近似重复项,并维护所有匹配和拒绝条目的审计日志,以用于合规性和对账目的。
