Les données comptables : entre espoir et déception

De plus en plus d’articles et de blogs soulèvent le fait que les Experts-Comptables, possèdent une mine importante de données en particulier grâce au FEC et aux liasses fiscales.

Cette somme de données permettrait aux professionnels du chiffre de monétiser et/ou d’exploiter ces données.

Cela est factuellement vrai mais l’exploitation et l’utilisation de ces données est complexe et rien ne laisse présager que leur exploitation sera possible à court terme.

Les données des Experts-Comptables sont une mine incroyable d’information

Comme expliqué dans cet article de notre blog https://www.chaintrust.io/2019/06/11/lautomatisation-de-la-saisie-et-lia/, le FEC est une source incroyable de données. Ces dernières sont exhaustives, préformatées et structurées.

En effet la possession de ces données place les Experts-Comptables dans une position très favorable pour les exploiter. Si l’ensemble des Experts-Comptables mettaient en commun ces données, et parvenaient à les exploiter ils auraient à leur disposition une base de données très complètes qui permettraient d’entraîner des algorithmes de machine learning et d’IA.

Les opportunités sont incroyables, il serait par exemple possible :

  • d’optimiser des algorithmes de saisie automatique des factures d’achats et de vente (c’est ce que nous faisons progressivement chez Chaintrust)
  • de créer des modèles prédictifs pour décoder les signaux qui amènent une entreprise à augmenter ses revenus, changer de statut juridique, faire faillite…
  • d’utiliser ces modèles pour prévoir les services à proposer au client avant même qu’il les demande, anticiper les besoins en comptabilité et en conseil pour proposer un service au plus près des besoins.

Expliquons ce qu’est l’Intelligence Artificielle

Pour bien comprendre comment fonctionne l’Intelligence Artificielle, il faut comprendre ce qu’est une inférence.

Une inférence est une règle qui permet à un algorithme de prendre une décision.

Par exemple, en analysant le FEC :

Nous nous apercevons que le compte de tiers du client « A » pour des frais d’essence est « FESSE », nous en déduisons donc que si la pièce justificative comporte les mots clés « Essence », « Total », « Esso »… le compte de tiers concerné est « FESSE ».

En voyant cette règle plusieurs milliers de fois, un algorithme va être capable de la « comprendre » et d’appliquer cette règle la prochaine fois qu’il verra la dépense concernée.

En multipliant les inférences (c’est-à-dire les règles) et en les affinant, les algorithmes vont être en mesure de classer de plus en plus d’écritures, tout en étant de plus en plus autonomes dans leur classement.

On va appeler cela de l’Intelligence Artificielle. En fonction de l’indépendance et de la technologie, les noms seront différents : deep learning, machine learning, réseaux neuronaux… mais globalement cela reste des inférences plus ou moins automatisées et indépendantes.

Cette mine d’information nécessite des compétences et des ressources énormes

Pour entrainer des modèles d’Intelligence Artificielle à comprendre et à appliquer une règle, il faut que les algorithmes rencontrent cette règle plusieurs milliers de fois.

Il faut 100 000 FEC avec cette même règle pour que l’algorithme « comprenne » et « copie » cette règle. Au contraire d’un collaborateur comptable à qui l’on expliquera cette règle une fois sur un dossier et qui sera capable de comprendre le fonctionnement spécifique sur ce dossier.

Les Experts-Comptables détiennent une masse de données énorme, mais celle-ci demande un travail titanesque d’harmonisation.

  • Reprenons l’exemple précédent : pour le client « A » les dépenses d’essence vont dans le compte de tiers « FESSE », mais pour le client « B », ces mêmes dépenses vont dans le compte « 08CB ».
  • Dans l’exemple « A » c’est la nature de la dépense qui qualifie le compte de tiers alors que dans l’exemple « B » c’est le mode de règlement.
  • Encore plus complexe, le client va chez TOTAL, il achète une roue, un mars et fait le plein d’essence. La roue va dans le compte « FTOTAL », le mars dans le compte « FNDF » et le plein dans le compte « FESSE ».

En résumé

  1. Si l’on veut faire travailler des algorithmes pour exploiter cette donnée il faut l’harmoniser et la standardiser.
  2. Il ne faut pas simplement analyser la donnée mais décoder les règles qui s’y rapportent et qui sont très qualitatives. Acheter un groupe électrogène pour le revendre ou l’acheter pour l’utiliser, fait passer la dépense d’un compte d’immobilisation à un compte de charge. Pourtant rien ne différencie la facture de ce même achat. Cette logique est complexe à comprendre pour un algorithme, et c’est cette logique qu’il faut « décoder » pour l’intégrer.

Tant que cet effort ne sera pas fait, l’exploitation de ces données est impossible, voir même contreproductif.

La comptabilité est le règne de l’exception. En ingénierie de données, une exception est synthétisée dans un contexte. Tout notre travail chez Chaintrust est de modéliser des contextes pour chacun de nos clients. Une fois que le contexte est bien défini, le code peut tourner avec très peu d’intervention humaine.

Le Data Ingineer au cœur du processus

Le problème est que pour faire ce travail titanesque sur les données il faut embaucher des personnes très spécifiques : les data Ingineer.

Ces profils sont absolument introuvables sur le marché de l’emploi actuels ! Les GAFA leurs proposent avant la fin de leurs études des salaires à 6 chiffres, et la majorité d’entre eux choisissent leur emploi à cause de défis techniques spécifiques qui les intéressent.

Etant incubés à Polytechnique, nous avions participé à des sessions de recrutement pour en embaucher ; les offres de grosses sociétés présentent dans ce salon (défense et industrie) était sans commune mesure avec ce qu’une société « standard » peut offrir. Les seuls profils ayant donné suite à nos sollicitations l’ont fait pour les défis techniques que nous proposions.

Conclusion

Dire que la data est le nouvel or noir des professions du chiffre est une image assez parlante.

Avant d’extraire le pétrole, il faut faire des études de faisabilité, des forages et du raffinage. Cela demande des coûts prohibitifs qui ont abouti à une concentration du marché dans quelques acteurs, qui grâce à leur capitalisation et leur savoir-faire, ont la majorité du marché.

C’est l’analogie entre

  • le baril de pétrole vendu 50 € pour 160 litres
  • le prix de l’essence à la pompe à 1.4 € le litre.

C’est l’étape de raffinage, l’acheminement, le stockage et la mise aux normes qui permettent d’exploiter ce baril. Avoir un baril de pétrole brut n’a aucun intérêt sans l’infrastructure et les capacités techniques et industrielles de le traiter.

Seul un effort commun important de l’ensemble des Experts Comptables permettra de dégager les ressources financières pour embaucher les talents nécessaires à la centralisation, l’harmonisation et l’exploitation de ces données.

Il faut également garder à l’esprit que Bercy et les éditeurs de logiciels sont, également détenteur de cette information et cherchent aussi à traiter et exploiter ces données.

Mikael Gandon CEO @Chaintrust www.chaintrust.io/