Traitement de factures assisté par l'IA avec OCR et intégration QuickBooks
Une entreprise de taille moyenne, traitant des centaines de factures fournisseurs chaque mois, devait éliminer la saisie manuelle des données en extrayant automatiquement les données des factures à l'aide de l'IA/OCR et en les synchronisant directement dans QuickBooks pour la tenue de livres et le suivi des paiements.
Discutez de Votre Projet
Le Défi
Le traitement manuel des factures était lent, sujet aux erreurs et représentait un goulot d'étranglement majeur dans la comptabilité fournisseurs :
- Volume — 300 à 500 factures/mois provenant de plus de 100 fournisseurs dans des formats variés (PDF, images numérisées, pièces jointes d'e-mail)
- Saisie manuelle — Chaque facture prenait 3 à 5 minutes à saisir manuellement dans QuickBooks (total : 25 à 40 heures/mois)
- Taux d'erreur — Un taux d'erreur de saisie de 5 à 8 % entraînait des écarts de paiement et des litiges avec les fournisseurs
- Incohérence de format — Chaque fournisseur utilisait une mise en page de facture différente, rendant l'OCR basé sur des modèles peu fiable
- Champs manquants — Les factures manquaient souvent de détails clairs par poste, nécessitant une interprétation
- Détection des doublons — Les factures en double entraînaient occasionnellement des doubles paiements
- Mappage de codes GL — L'affectation du bon compte General Ledger nécessitait des connaissances institutionnelles
Notre Solution
Nous avons construit un pipeline de traitement de factures assisté par l'IA qui combine l'OCR pour l'extraction de texte, l'analyse intelligente de champs basée sur les LLM, et l'intégration de l'API QuickBooks pour la création automatisée d'écritures comptables.
Architecture
- Ingestion : Écouteur d'e-mails + API de téléchargement de fichiers + tableau de bord glisser-déposer
- Moteur OCR : API Cloud Vision basée sur le cloud pour l'extraction de texte à partir de PDF et d'images numérisées
- Analyseur IA : LLM pour l'extraction et l'interprétation intelligentes des champs
- Validation : Moteur de validation basé sur des règles avec évaluation de la confiance
- Intégration comptable : API QuickBooks Online pour la création de factures et la correspondance des fournisseurs
- Tableau de bord : Interface d'administration React pour la révision, l'approbation et la gestion des exceptions
- Base de données : PostgreSQL pour les enregistrements de factures, la piste d'audit et les mappages de fournisseurs
- File d'attente : File d'attente de tâches asynchrones pour le traitement par lots
Pipeline de traitement
Étape 1 : Ingestion
Les factures entrent dans le système par plusieurs canaux :
- Redirection d'e-mails — Adresse e-mail dédiée surveillée par un écouteur IMAP
- Téléchargement de fichiers — Interface glisser-déposer sur le tableau de bord d'administration
- Téléchargement via API — Soumission programmatique depuis d'autres systèmes
- Importation en masse — Téléchargement par lots depuis des lecteurs partagés
Formats pris en charge : PDF, PNG, JPG, TIFF, HEIC, PDF multipages
Étape 2 : Extraction de texte OCR
- Pré-traitement — Amélioration de l'image (redressement, ajustement du contraste, réduction du bruit) pour les documents numérisés
- Extraction de texte — L'API Cloud Vision extrait tout le texte avec un positionnement spatial
- Analyse de mise en page — Positionnement spatial utilisé pour identifier les tableaux, les en-têtes, les pieds de page et les postes de ligne
- Évaluation de la confiance — Confiance OCR par caractère suivie ; les régions à faible confiance sont signalées pour examen
Étape 3 : Extraction de champs assistée par l'IA
Le LLM reçoit le texte OCR brut et extrait les données de facture structurées, y compris les informations du fournisseur (nom, adresse), les identifiants de facture (numéro, dates, référence PO), les données financières (sous-total, taxe, total, devise, conditions de paiement), et les postes individuels avec descriptions, quantités et montants.
L'extraction utilise des schémas de sortie structurés, des exemples few-shot pour les cas limites, un raisonnement chain-of-thought pour les champs ambigus, et une évaluation de la confiance par champ.
Étape 4 : Validation et enrichissement
Avant de créer une entrée QuickBooks, les données extraites passent par la validation :
Vérifications automatisées :- Validation mathématique — Les montants des postes sont vérifiés par rapport au sous-total ; le sous-total + la taxe sont vérifiés par rapport au total
- Détection des doublons — Numéro de facture + fournisseur + montant vérifiés par rapport aux enregistrements existants
- Cohérence des dates — Date de facture non future ; date d'échéance après la date de facture
- Correspondance des fournisseurs — Correspondance floue du nom du fournisseur avec la liste des fournisseurs QuickBooks
- Suggestion de code GL — L'IA suggère un compte General Ledger basé sur l'historique du fournisseur et les descriptions des postes
- Seuil de montant — Les factures dépassant un seuil configurable sont signalées pour approbation manuelle
- Les factures à haute confiance sont automatiquement approuvées (tous les champs extraits, vérifications mathématiques réussies, fournisseur correspondant)
- Les factures à confiance moyenne sont placées dans une file d'attente de révision (certains champs incertains ou nouveau fournisseur)
- Les factures à faible confiance nécessitent une saisie manuelle (qualité OCR médiocre ou format non structuré)
Étape 5 : Intégration QuickBooks
Correspondance et création de fournisseurs :Les noms de fournisseurs extraits sont mis en correspondance floue avec la liste des fournisseurs QuickBooks existants. Si une correspondance est trouvée au-dessus d'un seuil de confiance, le fournisseur existant est lié. Sinon, un nouveau fournisseur est créé avec les informations extraites et mis en cache pour les futures factures.
Création de factures :Les objets de facture QuickBooks sont construits à partir des données de facture validées, avec les postes de ligne mappés aux comptes GL appropriés, les montants de taxe appliqués, les conditions de paiement définies et le PDF de la facture originale joint. L'enregistrement interne est référencé par l'ID de facture QuickBooks.
Mappage des comptes GL :- Basé sur des règles — Mappages GL spécifiques aux fournisseurs pour les fournisseurs connus
- Suggéré par l'IA — Le LLM analyse les descriptions des postes et suggère des comptes basés sur des schémas historiques
- Boucle d'apprentissage — Les corrections manuelles sont réinjectées pour améliorer les suggestions futures
- Retour par défaut — Les éléments non mappés sont attribués à un compte générique pour examen ultérieur
Intégration API QuickBooks
Authentification
- OAuth 2.0 avec rafraîchissement automatique des jetons
- Stockage sécurisé des identifiants avec chiffrement au repos
- Prise en charge multi-entreprise pour les entreprises avec plusieurs fichiers QuickBooks
Gestion des erreurs
- Respect des limites de débit de l'API avec rétention exponentielle
- Logique de nouvelle tentative pour les échecs transitoires avec des délais croissants
- Résolution des conflits pour éviter les enregistrements en double
- Annulation des créations partielles échouées pour éviter les enregistrements orphelins
Tableau de bord et flux de travail
File d'attente des factures
Les factures sont organisées par statut : en attente de révision, approuvées automatiquement, exceptions (validation échouée ou erreurs API) et terminées (synchronisées avec QuickBooks).
Interface de révision
- Vue côte à côte : facture originale et données extraites
- Modification en ligne pour les champs corrigés avec mise en évidence des différences
- Approuver/rejeter en un clic avec notes facultatives
- Approbation par lots pour plusieurs factures du mĂŞme fournisseur
Analytiques
- Suivi du volume de traitement (quotidien/hebdomadaire/mensuel)
- Suivi du taux d'auto-approbation (objectif : 70%+)
- Temps de traitement moyen par facture
- Taux d'erreur et raisons courantes d'échec
- Économies de coûts par rapport au traitement manuel
- Tendances de précision spécifiques aux fournisseurs
Fonctionnalités clés
- OCR multi-formats — PDF, numérisations, photos et documents multipages
- Extraction de champs par l'IA — L'analyse basée sur les LLM gère toute mise en page de facture sans modèles
- Évaluation de la confiance — Routage automatique basé sur la certitude d'extraction
- Détection des doublons — Empêche les doubles paiements de factures resoumises
- Correspondance automatique des fournisseurs — La correspondance floue lie les factures aux fournisseurs QuickBooks existants
- Suggestion de code GL — L'IA recommande des comptes de dépenses basés sur des schémas historiques
- Synchronisation automatique QuickBooks — Factures créées avec les postes, la taxe et le PDF joint
- Boucle d'apprentissage — Les corrections manuelles améliorent la précision d'extraction future
- Traitement par lots — Gère des centaines de factures via la redirection d'e-mails ou le téléchargement en masse
- Piste d'audit — Journal complet de chaque extraction, modification, approbation et événement de synchronisation
Résultats
Stack Technologique
caseStudyDetail.more Études de Cas
Découvrez plus de nos implémentations techniques
Insertion d'annonces côté client (CSAI) avec analyse des marqueurs SCTE-35 et intégration de lecteurs multiplateformes
Une plateforme de streaming vidéo devait implémenter l'insertion d'annonces côté client (CSAI) sur les applications web, mobiles et de télévision connectée — permettant des expériences publicitaires personnalisées au niveau de l'appareil avec un support complet d'interaction publicitaire (superpositions cliquables, bannières complémentaires, boutons de saut) que l'insertion côté serveur ne peut pas offrir.
Plateforme de Web Scraping et de Génération de Contenu de Blog Propulsée par l'AI
Une entreprise médiatique avait besoin d'une plateforme de contenu intelligente capable d'automatiser la création de contenu de blog en récupérant du contenu web existant, en l'analysant à l'aide de l'AI et en générant des articles de blog originaux et optimisés pour le SEO à partir des données extraites.
PrĂŞt Ă Transformer Votre Entreprise ?
Discutons de la façon dont nous pouvons appliquer des solutions similaires à vos défis.