收据与发票提取器 - OCR转结构化JSON
拍一张收据或发票,获取供应商、日期、总额、税款、货币和清单等结构化JSON。免费,基于OCR,无需注册。
放一张收据或发票照片
关于收据提取器
OCR先通过Tesseract运行,然后启发式字段提取器提取供应商(首行)、日期、税务行、行项(以钱结尾的行)和总额(靠近“总”关键词的最大金额)。输出是纯JSON——直接放入你的簿记流程。
Frequently Asked Questions
OCR会读取照片中的每一行文字,然后启发式提取器会查找日期(多种格式模式)、金额(含货币符号和小数)、税务关键词(增值税、税收、商品服务税、销售税)以及行项(以货币模式结尾的行)。接近“总额”关键词的最大金额被视为收据总额。
technical供应商(第一行非空的,通常是商店名称)、日期(发现的每个日期模式)、总额(最佳猜测)、税额、货币(通过符号检测的美元/欧元/英镑/日元/印后方印度卢比),以及包含描述和金额的行项列表。输出支持JSON格式,用于簿记、费用报告或CRM导入。
features是的——场提取逻辑同样适用于两者。带有行明细和金额的明细发票能产生更丰富的清单;热印收据也可以,尽管拉伸或褪色的热感纸照片可能会丢失准确性。
usage常见原因包括:收据被斜着拍摄(OCR误读数字为字母)、总通行使用了非英语词汇如“TOTAL”,写成了另一种语言,或者打印的收据热感文本褪色。在光线良好的情况下正面重拍照片,OCR应该能识别出来。
tips提取器通过收据文本中的货币符号识别美元($)、欧元(€)、英镑(GBP)、日元(¥)、印度卢比(₹)。数值本身不会被转换——用户(或下游系统)应在需要时应用汇率。
features是的——下载JSON,导入QuickBooks、Xero、Concur或自定义费用API。结构稳定:供应商、日期[]、总额、税款、货币、物品[{描述、金额}]。写一个小型映射脚本,你就能自动录入收据。
tips是的——通过我们的OCR服务,隔离处理,并在24小时内删除。我们不保留收据,也不用于培训。对于非常敏感的报销(私人侦探、新闻报道),可以考虑本地运行OCR。
privacy测试期间免费,无每日上限,无需注册。结构化的JSON没有水印或品牌标识。
pricingUse Cases
自动化费用报告
购买时拍下每一张营业收据。提取出来的JSON通过API直接传输到Concur、Expensify或QuickBooks——无需手动录入数据,也无需月底的收据堆积如山。
个人预算
按类别追踪杂货和家庭支出。将每张收据提取成JSON,并在表格或预算应用中按周或按月汇总——比手动录入快得多。
税收扣除追踪
对于自由职业者和小企业主来说,每一张免赔收据都非常重要。全年提取结构化数据,然后在报税时导出为CSV供CPA使用。
餐厅小费追踪
多班的服务员和调酒师可以提取每日收据,以追踪小费、小费和总额。在下班时,可以干净利落地对比POS报告。
可报销差旅
出差结束后,扫描并提取所有交通、餐饮和住宿收据。JSON 可以在几分钟内模板化成费用报告,而不是花一个小时手动转录。
共居与室友支出分析
通过提取所有收据来跟踪共享家庭支出,然后再分摊。去除“我付钱了吗?”的争论,并生成可审计的月度摘要。
Pixoate