comptabilité data finance

La comptabilité : matière première de l’information financière

Depuis Lucas Paccioli jusqu’à l’implémentation récente des outils d’automatisation, en passant par la révolution des tableurs Excel, rien n’a changé dans la finalité de la comptabilité : seul l’outil de production a été révolutionné.

Nous vous avons précédemment parlé de thermodynamique et d’entropie pour souligner à quel point la comptabilité est un environnement structuré mais complexe. Cette fois, nous vous proposons de prendre de la hauteur et de redécouvrir votre métier sous l’angle du traitement de données.

La comptabilité au cœur de l’information financière

La plupart des process de la corporate finance sont déjà en grand partie automatisés : Reporting financier, révision annuelle, projection de trésorerie, recouvrement, suivi de DSO … Rappelons qu’à l’origine de tous ces process se trouve l’information financière à son état le plus brut : la comptabilité.

En effet, la comptabilité traduit dans un langage normé la réalité d’une transaction économique. C’est un processus extrêmement qualitatif qui consiste à retranscrire un format de données faiblement structurée voire non-structurées (contrats, factures, échéanciers, sinistre …) dans un format structuré (écritures comptables).

En France, la normalisation « par le haut » émanant de l’ANC et des recommandations de l’OEC permettent d’avoir une donnée selon un référentiel standard et normé facilitant l’interprétation et la comparabilité. La mise en place du FEC n’a fait que renforcer ce phénomène.

À l’inverse, dans certaines économies, notamment les États-Unis où les standards émanent de la base par les « generally accepted accounting practices », il est difficile de garantir le principe de comparabilité tant les pratiques sont diverses et sujettes à interprétation.

Par conséquent, le modèle français du langage économique que nous partageons au travers de la comptabilité est garant d’une donnée de base interprétable par n’importe quel agent économique, quelle qu’en soit la finalité.

Comptabilité et Data Wrangling : quelles similitudes ?

Pour mettre en place un outil de machine learning, le processus peut être décomposé en 4 phases :

  • La récupération de données
  • Le nettoyage
  • La construction du modèle
  • L’exploitation du modèle

Contrairement aux idées reçues, la phase de modélisation représente la plus courte de toutes. En effet, les data engineer passent le plus de temps sur la récupération de données et le nettoyage de ces données pour les rendre exploitables. Comme le souligne la CNIL[1], « L’algorithme sans données est aveugle. Les données sans algorithmes sont muettes » (p.20). L’enjeu pour les équipes data engineering est de capter l’information, la traduire en variable exploitable et l’incorporer de manière cohérente au dataset.

En ce sens, la saisie comptable s’apparente à ce processus qui porte le nom de data wrangling.

comptabilité information financière

Chaque étape du processus de comptabilisation, depuis la récupération de la pièce justificative auprès du client jusqu’à la validation de l’écriture dans l’ERP, en passant par le choix du code d’imputation de la charge ou du produit s’inscrivent dans une démarche de data wrangling.

De même, il s’agit du processus le plus chronophage de l’élaboration des états financiers. En moyenne, la saisie comptable (inc. la récupération d’information auprès du client) représente 40 à 60 % du temps. Ce process est d’autant plus long que le langage comptable a ses propres règles à suivre (PCG) et qu’il résulte d’un procédé qualitatif de collecte et de structuration d’information (achat ou vente ? Avoir ou facture ? Date de fait générateur ou date de paiement ? TVA récupérable ou exonérée ?).

Le FEC, un gain de temps considérable pour la mise en place d’un modèle d’automatisation

Pour développer un outil d’automatisation comptable, il faut naturellement des données comptables dans leurs phases structurée et non-structurée. En d’autres termes, l’entrainement d’une IA destinée à automatiser la saisie se fait sur la base d’une confrontation de l’écriture comptable avec la pièce afférente.

Pour ce faire, la méthodologie la plus évidente consisterait à entrer en base des millions de factures, à y lier les variables qui en découlent (date, montant H.T, TVA, partenaire commercial …) ainsi que l’écriture comptable qui traduit cette transaction. Une fois les millions de cas saisi en base, l’outil n’aurait plus qu’à les intégrer et s’exercer à comptabiliser de nouvelles factures.

Toutefois, une telle approche nécessiterait un temps considérable avant d’obtenir une base de données suffisante pour entrainer un algorithme de machine learning

Lors du développement de Chaintrust, nous avons « hacké » le process en capitalisant sur les efforts préalables que vous aviez déjà fourni par le passé : nous nous sommes basés sur le FEC. En effet, le FEC est la trace que vous avez laissée de votre jugement professionnel face à une transaction économique lors des exercices précédents. Par conséquent, l’outil, même s’il est « dans l’enfance », connait déjà les règles que vous et des centaines de confrères avez adoptées face à une situation impliquant le montant, le partenaire commercial, votre cœur de métier etc …

En définitive, Chaintrust ne génère pas directement de la valeur ajoutée. Il ne fait que répéter la qualité d’un travail déjà produit par le passé, vous permettant ainsi de consacrer du temps à de nouvelles tâches génératrices de valeur ajoutée. Mais au fond, c’est tout ce dont vous avez besoin pour gagner un temps précieux au quotidien…


[1] CNIL (2017), Comment permettre à l’Homme de garder la main ? Les enjeux éthiques des algorithmes et de l’intelligence artificielle, Synthèse du débat public animé par la CNIL dans le cadre de la mission de réflexion éthique confiée par la loi pour une république numérique.