レシート&請求書エクストラクタ - OCRから構造化JSONへ
領収書や請求書をスナップして、ベンダー、日付、合計、税金、通貨、項目を構造化JSONで取得できます。無料でOCRベース、登録不要。
領収書や請求書の写真を提出してください
レシートエクストラクターについて
OCRはまずTesseractを通過し、その後ヒューリスティックフィールド抽出器でベンダー(最初の行)、日付、税務行、行(お金で終わる行)、そして合計(「total」キーワードの近くで最大の金額)を抽出します。出力は単純なJSONです — そのまま簿記のパイプラインに入力してください。
画像を強化し続ける
これらの人気のあるツールを使用して、写真編集を次のレベルに引き上げましょう
Frequently Asked Questions
OCRは写真のすべてのテキストを読み取り、ヒューリスティック抽出器で日付(複数のフォーマットパターン)、金額(通貨記号や小数点付き)、税金キーワード(VAT、TAX、GST、売上税)、および行項目(貨幣パターンで終わる行)を探します。「合計」キーワードの近くにある金額が最も大きいものがレシート合計として扱われます。
technicalベンダー(空でない最初の行、通常は店舗名)、日付(見つけたすべての日付パターン)、合計(最善の推測)、税額、通貨(USD/EUR/GBP/JPY/INR、シンボルから検出)、そして説明と金額を含む項目のリスト。出力は簿記、経費報告書、CRMインポートに対応可能なJSON対応です。
featuresはい、同じフィールド抽出の論理が両方に当てはまります。項目説明や金額を含む明細請求書はより充実した品目リストを生み出します。サーマルプリントのレシートも使えますが、伸びたり色あせたりしたサーマルペーパーの写真は正確さを失うことがあります。
usageよくある原因は、レシートが斜めに撮影されたため(OCRが数字を文字と誤読する)、合計行に「TOTAL」のような英語以外の単語が別の言語で書かれている、または印刷されたレシートの熱感テキストが色あせている、などです。良い照明で写真を真っ直ぐ撮り直せば、OCRで認識されるはずです。
tipsエクストラクターは領収書のテキストにある通貨記号からUSD($)、EUR(€)、GBP(£)、JPY(¥)、INR(₹)を認識します。数値自体は変換されません。必要に応じてユーザー(または下流システム)が為替レートを適用します。
featuresはい、JSONをダウンロードしてQuickBooks、Xero、Concur、またはカスタム経費APIに入力してください。構造は安定しています:ベンダー、日付[]、合計、税金、通貨、アイテム[{description, amount}]。小さなマッピングスクリプトを作れば、自動レシート入力ができます。
tipsはい、OCRサービスに送信し、単独処理し、24時間以内に削除しました。領収書は保管せず、研修に使用することもありません。非常に機密性の高い経費報告書(民間探偵、ジャーナリズム)については、OCRをローカルで運用することを検討してください。
privacyベータ中は無料、デイリーキャップなし、サインアップも不要です。構造化されたJSONには透かしやブランディングはありません。
pricingUse Cases
自動経費報告
購入時にすべてのレシートをスナップで確認しましょう。抽出されたJSONはAPI経由で直接Concur、Expensify、QuickBooksに入力され、手動のデータ入力や月末のレシートのパニックもありません。
個人予算管理
食料品や家計の支出をカテゴリーごとに追跡しましょう。すべての領収書をJSONに抽出し、週や月ごとにスプレッドシートや予算アプリで集約できます。手動入力よりもはるかに速いです。
税控除の追跡
フリーランサーや小規模事業者にとって、控除額の領収書は一つ一つ重要なものです。年間を通じて構造化データを抽出し、税務申告時にCSVにエクスポートしてCPAに使う。
レストランのチップ追跡
複数シフトで働くサーバーやバーテンダーは、日々の領収書を抽り出してチップ、チップ、合計額を追跡できます。シフト終了時のPOSレポートときれいに照合します。
報酬付き旅行
出張後は、すべての交通手段、食事、宿泊の領収書をスキャンして取り出してください。JSONは手書きで1時間かかる代わりに数分で経費報告書にテンプレート化できます。
コリビングとルームメイトのための支出分析
分割前にすべての領収書を取り出して、共有の家計支出を追跡しましょう。「これにお金を払ったのか?」という議論を排除し、監査可能な月次要約を作成できます。
Pixoate