Article réservé aux abonnés Archimag.com

Droit et intelligence artificielle : de la donnée de jurisprudence à la prédictivité

  • avocat_database.jpg

    avocat-ordinateur
    Fabien Waechter : "Un outil qui se prétend juridique ne peut se réaliser dans un simple calcul de scoring". (Freepik/Ijeab)
  • La masse des décisions rendues par les juridictions françaises constitue un vivier de données : celle des justiciables, mais aussi des juges, des avocats. De nouveaux outils qui construisent de l’intelligence artificielle permettent de révéler ces données de jurisprudence, d’en extraire les éléments les plus importants, dont... la solution juridique.

    La jurisprudence est aujourd’hui l’objet de toutes les attentions. Ses bases sont gigantesques, les histoires qu’elles racontent dépassent l’imagination, mais... l’animent aussi.

    Que de faits, que d’histoires dans ces bases, alors... imaginons ! Imaginons un monde où tout est prévu. Voire plus loin encore : imaginons un monde où ne peut arriver que ce qui est prévu, et vous, justiciable, êtes dans une situation qui vous fait sortir des cases : celles qui vous assurent et vous rassurent. Vous avez perdu votre dernier parent, votre mère, l’année dernière, ce fut une grande peine, mais ce fut aussi la fin d’une vie tranquille. Vous avez hérité de sa maison, en bordure du plateau de Meillant (Cher). La maison était assurée depuis 70 ans, mais, en revanche, se produit l’inattendu : le glissement de terrain, qui s’est déclaré il y a 8 ans, mais dont votre mère ne s’est pas inquiétée, parce qu’elle venait d’apprendre qu’elle était malade. Résultat : la maison s’écroule. Mais pire encore ! Le terrain s’écroule aussi et menace la nouvelle extension urbaine de La Haie des Forges en contrebas. La commune vous a assigné il y a deux mois. La protection juridique de votre assurance ne vous couvre pas parce qu’elle n’assure pas les glissements de terrain, et parce que vous n’avez rien fait contre. Votre avocat ne veut pas prendre l’affaire parce que les chances de vous en sortir n’existent pas : de tels faits ne sont pas répertoriés dans MemoJusticia, la base de données des justiciables. N’étant pas prévue, cette situation juridique donnera lieu à un long procès, très difficile, compliqué, avec force de protagonistes (vous, la ville ; vous contre la ville, vous, les assureurs ; vous contre la terre entière...) et qui ne changera rien à l’affaire : le terrain s’écroule, votre monde s’écroule. Vous ne faites plus partie des justiciables. Alors voilà tout était prévu sauf ce qui ne l’est pas. Vous n’osez en parler à personne, vous avez peur du regard de vos amis, votre mère n’est plus là pour vous entendre, votre femme saisirait sans doute l’occasion pour divorcer, ce qui viendrait ajouter des faits aux faits... non prévus... Et maintenant, vous êtes précondamné, parce que pire : vous êtes exclu !

    Tout prévoir ne peut correspondre à une justice légitime. En 2018, il est encore temps de dépasser la simple prédictivité, et de fixer des objectifs à cette quête d’automatisation de la justice.

    1. Oui aux « outils de justice »

    Les données judiciaires entrent dans l’aire du big data. Ce qui constitue l’immense masse de données dites « brutes » trouve une autre utilité que la seule issue des contentieux consignée dans la minute du greffe.

    Mais que la jurisprudence donne lieu à des utilisations chiffrées n’est pas nouveau. La pratique de « prédictivité » existe en réalité depuis longtemps. Ainsi en est-il de l’avocat qui cherche à consulter les décisions de la chambre devant laquelle il plaidera pour savoir, par exemple, comment est interprété un texte par tel ou tel magistrat.

    De même, des outils existent pour calculer les indemnités encourues par les justiciables (devant les juridictions prud’homales ou en matière de calcul d’indemnités-dommage corporel).

    Certains éditeurs juridiques (LexisNexis, Lexbase...), décelant dans la décision de justice une valeur informationnelle, avaient ainsi découvert son caractère « data ». Ils ont collecté la jurisprudence sous forme de data. Ils ont numérisé de greffe en greffe le plus grand nombre de décisions, sans sélection lors de leur intégration dans leurs bases, dans un premier temps, pour traiter toutes les données, de toutes les décisions, et présenter à l’utilisateur le maximum de grilles de lectures.

    Exploitation des décisions dans toutes leurs composantes objectives

    Aujourd’hui, le texte de chaque décision est traité comme de la data via des mécanismes d’intelligence artificielle. Une plus large utilisation de la jurisprudence est donc rendue possible par l’exploitation des décisions dans toutes leurs composantes objectives (dates, faits, références textuelles...). Les bases de jurisprudence représentent une masse d’informations, qui nécessite la meilleure qualification technique, pour une utilisation la plus précise : « zoning », éléments d’identification les plus complets (ville, juridiction, date, parties...), remontée des éléments chiffrés...

    Au fond, il s’agit de rassembler une expérience collective, et de constituer une immense mémoire : celle de la justice !

    Mais la donnée brute, pour être plus facilement lisible, doit être enrichie : c’est le rôle des éditeurs juridique et des professionnels de la justice.

    Aucune base existante ne peut se prévaloir de l’exhaustivité

    En effet, d’une part, l’accès aux décisions de justice en France ne permet pas la constitution de bases exhaustives, ce qui exclut des statistiques abouties, qui pourraient dès lors servir de repère. Aujourd’hui, même si l’État prend ses dispositions pour essayer de produire des stocks de data exploitables (Loi n° 2016-1321 du 7 octobre 2016 pour une République numérique), les décisions ne sont pas publiées par les juridictions sous forme de data, et des obstacles juridiques nécessaires (respect de la vie privée...) empêchent une publication ouverte des décisions. Actuellement, aucune base existante chez les éditeurs, même publique, ne peut se prévaloir de l’exhaustivité : il faudra accepter le défaut de perfection, et la reproduire dans toute modélisation statistique.

    Une contextualisation éditoriale des faits, mais aussi de la solution juridique, est nécessaire. Si la précision de la caractérisation des data est impérative, un enrichissement scientifique, éditorial est indispensable pour construire une véritable anticipation des solutions. La réalisation d’outils d’informatique éditoriale très puissants (thématisation juridique automatique, moteur de recherche de faits, chaîne de contentieux, cartographie des visas et fondements des décisions...) dépasse donc le simple référencement des termes d’une décision. Un outil qui se prétend juridique ne peut se réaliser dans un simple calcul de « scoring ».

    2. Non à la « justice outil »

    Une justice statistique n’est pas légitime.

    La statistique se base sur les seuls faits répertoriés. Les faits étant seuls susceptibles de donner lieu à des contentieux portés devant la justice, à l’inverse, la justice ne peut prévoir tous les faits : or si on exclut des faits, on exclut du droit, donc de la justice. Aussi, baser les résultats d’une justice sur un répertoire de faits comporte un double risque :

    1. empêcher que des faits non prévus puissent se présenter devant la justice ;
    2. ignorer certains faits, par défaut de base complète.

    Aucune justice ne peut sortir légitime de la seule publication de faits, qui sont autant de cas personnels, même mis en relation avec des solutions juridiques.

    La statistique doit impérativement être interprétée au regard de son sens juridique. L’analyse de la dispersion d’éléments chiffrés, par exemple, sur la répartition géographique des solutions, ou encore, l’étude de l’évolution d’un contentieux sur une période donnée dégageront des tendances majoritaires. Mais d’autres solutions isolées existent, dont la rareté, loin d’être la preuve de la faiblesse d’un raisonnement juridique, peut participer d’une grande pertinence juridique.

    Une forme de représentation du droit

    La démarche numérique de la justice doit se référer à une forme de représentation du droit, alliant traitement automatique des décisions, révélation de data et analyse juridique, ce que, par exemple, un éditeur de contenu, à la différence d’un simple logiciel, peut prétendre à faire.

    Tous les outils numériques imaginables ne peuvent aller dans le sens d’une justice légitime que s’ils sont soumis à une interprétation juridique.

    Attention, l’interprétation du droit doit être exercée avec précaution : ne s’agit-il pas du rôle du conseil ? Ce qui ressemblerait à une prévisibilité du droit doit être accompagné, expliqué et... conseillé. En effet, faire le choix de telle ou telle solution au regard de solutions existantes majoritaires ou, plus risqué, minoritaires, ne peut se faire sans conseil. Toute interprétation devra donc être accompagnée, pour être lisible et utilisée à bon escient. Ainsi, si les outils de justice sont bien sûr utiles au juge, ils seront aussi des outils intéressants pour le justiciable... accompagné, conseillé. Clairement, les avocats ont un rôle essentiel à jouer, qui leur est très naturel : celui d’accompagner le justiciable ! Tout comme Mondrian répartissait les couleurs avec des traits noirs, seuls des professionnels de la justice seront capables d’utiliser la matière judiciaire avec discernement.

    Une trop bonne prédictivité jouerait contre la jurisprudence

    En définitive, la prédictivité pourrait empêcher le rôle de la jurisprudence. Tout comme une liberté dangereuse est bien plus saine qu’une servitude tranquille, à terme, il faut considérer qu’une trop bonne prédictivité jouerait contre la jurisprudence elle-même : la précéderait même. Une prédictivité dotée de force jurisprudentielle se rapprocherait d’une dangereuse solution absolue, qui ne respecterait pas la légitimité très particulière de la justice, le troisième pouvoir fondateur de la démocratie.

    Fabien Waechter
    [Président de l’Adij
    Président de Lexbase]
    NB : Fabien Waechter s’exprime dans cette tribune en son nom propre, sans engager la position des membres de l’Adij.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    Archimag-313
    Aujourd’hui, on parle de data ou de métadonnées plus que de documents. En outre, avec le travail collaboratif, on a affaire à plusieurs auteurs et de multiples versions. Dès lors, est-ce la fin du document ? Un expert donne son point de vue, en introduisant les notions de traces, de conservation et de gouvernance...
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Le chiffre du jour
    des bibliothèques proposant des ressources numériques ont constaté depuis le début du confinement une augmentation des usages de leurs ressources en ligne, selon une enquête flash menée par le ministère de la Culture fin mars 2020.
    Recevez l'essentiel de l'actu !
    Publicité

    Data 2020.PNG