Lexique généré par ChatGPT (et complété par des humains) – Juriconnexion – Janvier 2024

Juriconnexion à propos

Lexique généré par ChatGPT (et complété par des humains) – Juriconnexion – Janvier 2024

Prompt utilisé pour générer le lexique version 0

« J’organise une conférence sur l’IA générative pour de documentalistes juridiques, des juristes et des avocats. Pourrais-tu me fournir une liste des 50 termes essentiels pour comprendre l’IA générative ? Présente cette liste sous forme de tableau avec une première colonne listant ces termes et une deuxième avec les définitions. Ordonne cette liste par ordre alphabétique. Donne les traductions anglaises de ces termes. N’oublie pas les termes Prompt, IA faible, IA forte, Données personnelles ».

Terme Définition
AI Générative (Generative AI) Sous-domaine de l’IA qui se concentre sur la création de contenu original, souvent en utilisant des modèles génératifs.
Algorithme Une séquence d’instructions ou de règles bien définies conçues pour effectuer une tâche ou résoudre un problème donné. En informatique et en intelligence artificielle, les algorithmes sont fondamentaux pour la conception de logiciels et de modèles.
Apprentissage Automatique (Machine Learning) Processus par lequel les machines apprennent à partir de données pour améliorer leurs performances sans être explicitement programmées.
Auto-Génération (Self-Generation) La capacité d’un modèle génératif à créer du contenu original sans une entrée externe directe, dépendant souvent d’un processus interne d’apprentissage à partir de ses propres sorties.
Autoencodeur (Autoencoder) Un type de réseau de neurones utilisé pour apprendre une représentation compacte des données, souvent utilisé dans la génération de contenu.
Bias (Biais) Distorsions ou préjugés dans les résultats des modèles d’IA, souvent liés à des biais présents dans les données d’entraînement.
Big Data Le Big Data fait référence à la gestion et à l’analyse de vastes ensembles de données qui dépassent la capacité des méthodes traditionnelles de traitement de données. Il se caractérise par le volume, la variété et la vélocité des données.
Consentement Informatisé La nécessité d’obtenir le consentement des individus pour l’utilisation de leurs données dans des systèmes d’IA générative.
Data Lake Un Data Lake est un référentiel de stockage de données qui permet de stocker des données brutes, non traitées, à grande échelle. Contrairement aux bases de données traditionnelles, un Data Lake peut stocker des données de différents types sans les structurer au préalable.
Data Mining Le Data Mining, ou fouille de données, est le processus d’extraction d’informations significatives et de motifs précédemment inconnus à partir de grandes quantités de données. Il utilise des techniques statistiques, mathématiques et informatiques pour découvrir des tendances ou des modèles.
Donnée à caractère personnel Une donnée à caractère personnel est une information qui permet d’identifier directement ou indirectement une personne physique. Cela inclut des éléments tels que le nom, l’adresse, le numéro de téléphone, l’adresse e-mail, etc.
Décodage Autoregressif Un processus de génération où chaque élément de la séquence est généré un à un en fonction des éléments précédemment générés.
Deep Learning Sous-domaine du machine learning utilisant des réseaux neuronaux profonds pour des tâches complexes.
Déontologie Algorithmique L’application de principes éthiques aux algorithmes, y compris ceux utilisés dans les modèles génératifs.
Entraînement Non Supervisé (Unsupervised Learning) Une approche d’apprentissage machine où le modèle est laissé à lui-même pour découvrir des motifs dans les données sans étiquettes.
Explainability (Explicabilité) Capacité à comprendre et à expliquer le fonctionnement des modèles d’IA, particulièrement important dans un contexte juridique.
Éthique de l’IA Ensemble de principes et de lignes directrices visant à assurer une utilisation éthique et responsable de l’IA.
Équité Algorithmique (Fairness) Un principe qui vise à garantir que les algorithmes traitent équitablement toutes les personnes, indépendamment de certaines caractéristiques.
Évaluation des Risques Le processus d’analyse des risques liés à l’utilisation de l’IA, y compris les risques éthiques, juridiques et techniques.
Évaluation des Modèles Le processus d’évaluation de la performance et de l’efficacité des modèles d’IA, généralement à l’aide de métriques spécifiques.
Évolution des Modèles Le processus d’adaptation et de mise à jour des modèles d’IA pour suivre les changements dans les données et les besoins des utilisateurs.
Économie des Données Le concept selon lequel les données sont considérées comme une ressource économique importante dans le développement de l’IA.
Émulation Humaine La capacité d’un modèle d’IA à imiter ou reproduire des comportements humains de manière réaliste.
Fine-Tuning Le processus d’ajustement d’un modèle pré-entraîné pour une tâche spécifique ou un ensemble de données particulier.
Gouvernance des données La gouvernance des données englobe les politiques, les procédures et les normes qui régissent la gestion, l’utilisation et la protection des données au sein d’une organisation. Elle vise à assurer la qualité, la confidentialité, la sécurité et la conformité des données.
Hyperparamètres Paramètres du modèle qui ne sont pas appris à partir des données mais sont définis avant le processus d’entraînement.
IA (Intelligence Artificielle) Définition générale : Systèmes informatiques capables de réaliser des tâches normalement nécessitant l’intelligence humaine.
IA faible L’IA faible se réfère à des systèmes d’IA conçus pour des tâches spécifiques et qui ne possèdent pas de compréhension ou de conscience générale. Ces systèmes sont limités à la tâche pour laquelle ils ont été créés.
IA Forte L’IA forte est une forme hypothétique d’IA qui aurait une compréhension générale comparable à celle d’un être humain, capable de raisonner et de s’adapter à différents domaines de connaissance.
IA Généraliste ou Spécialisée L’IA généraliste est capable de traiter une large gamme de tâches intellectuelles de manière similaire à un être humain, tandis que l’IA spécialisée est conçue pour des tâches spécifiques.
Inférence (inference) Processus par lequel un modèle d’IA produit une sortie à partir d’une entrée, en utilisant les paramètres appris lors de l’entraînement.
Langage Naturel (Natural Language Processing – NLP) Domaine de l’IA visant à permettre aux machines de comprendre, interpréter et générer un langage humain.
Loi de Moore Observation affirmant que la puissance de calcul des ordinateurs double environ tous les deux ans, influençant le développement de l’IA.
LSTM (Long Short-Term Memory) Un type d’architecture de réseau de neurones récurrents (RNN) utilisé pour traiter des séquences de données, souvent utilisé dans des modèles génératifs.
Modèle de Rappel (Retrieval Model) Un modèle qui extrait des informations pertinentes à partir d’une base de données ou d’un corpus de texte existant.
Modèles de Langage Modèles capables de comprendre et de générer du langage naturel, souvent entraînés sur de vastes ensembles de données textuelles.
Modèle de langage avancé (LLM Large Language Model) Modèle de langage informatique capable de comprendre et générer du texte à grande échelle, souvent pré-entraîné sur de vastes ensembles de données.
Modèle de fondation (Foundational Model) Modèle qui sert de base ou de référence pour d’autres modèles, souvent utilisé comme point de départ pour des tâches spécifiques.
Modèles Génératifs Modèles capables de générer de nouvelles données, souvent en imitant des modèles existants.
Neurone artificiel Unité de calcul élémentaire qui reçoit des entrées pondérées, applique une fonction d’activation et produit une sortie.
OpenAI Une organisation de recherche en intelligence artificielle qui a développé plusieurs modèles d’IA, dont GPT (Generative Pre-trained Transformer).
Open Data L’Open Data se réfère à la pratique de rendre des ensembles de données accessibles au public, de manière à ce que quiconque puisse les utiliser, les réutiliser et les redistribuer librement. L’objectif est de promouvoir la transparence et l’innovation.
Pré-Entraînement (Pre-training) Le processus d’entraînement initial d’un modèle sur une tâche liée avant de le fine-tuner sur une tâche spécifique.
Prompt (invite) Un « prompt » dans le contexte de l’IA se réfère à l’instruction ou à la requête donnée à un modèle d’IA pour obtenir une réponse ou une tâche spécifique. Il s’agit du texte ou de la commande initiale qui guide le comportement de l’IA.
RAG (Retriever and Generative models) Une approche d’IA générative qui combine des modèles de rappel (retriever) pour extraire des informations pertinentes et des modèles génératifs pour créer des réponses.
Réseaux Générateurs Adverses (GAN – Generative Adversarial Networks) Système de deux réseaux neuronaux (générateur et discriminateur) travaillant de manière concurrentielle pour créer des données originales.
Réseaux Neuronaux (Neural Networks) Modèles informatiques inspirés par la structure et le fonctionnement du cerveau humain, utilisés pour le traitement des informations et l’apprentissage machine.
Réseaux Neuronaux Récurrents (RNN – Recurrent Neural Networks) Des modèles de réseaux neuronaux conçus pour traiter des séquences de données, ce qui peut être utile dans la génération de texte cohérent.
Robots conversationnels / Chatbot Un robot conversationnel, également appelé « chatbot » (contraction de « chat » et « robot »), est un programme informatique conçu pour simuler une conversation avec des utilisateurs humains, en particulier via des interfaces textuelles ou vocales. Les chatbots utilisent des algorithmes d’IA pour comprendre les questions et fournir des réponses appropriées.
Style de Transfert (Style Transfer) Une technique qui permet de transférer le style artistique d’une image à une autre, souvent utilisée dans la génération d’images artistiques.
Text-to-Text Approche où les modèles traitent les tâches en convertissant l’entrée et la sortie en formats de texte.
Transfert d’Apprentissage (Transfer Learning) Utilisation d’un modèle pré-entraîné sur une tâche pour améliorer les performances sur une tâche différente mais similaire.
Transformer Une architecture de réseau de neurones introduite par Vaswani et al. en 2017, qui a révolutionné le traitement du langage naturel et est souvent utilisée dans les modèles génératifs, tels que les modèles GPT (Generative Pre-trained Transformers). Le Transformer est particulièrement important dans le contexte de l’IA générative en raison de son architecture parallèle efficace qui permet de traiter de grandes quantités de données de manière plus rapide et plus efficace que les architectures précédentes, en particulier pour les tâches liées au traitement du langage naturel.
Turing Test Un test proposé par Alan Turing pour évaluer la capacité d’une machine à exhiber un comportement indiscernable de celui d’un être humain.
Vague Zéro Une approche de l’IA générative qui vise à créer des modèles capables de comprendre et de générer des connaissances à partir de zéro.
Vectorisation (vectorization) Opération qui consiste à transformer une donnée non numérique, comme un texte, une image ou un son, en un vecteur de nombres, qui peut être traité par un modèle d’IA.
Zéro-Shot Learning (L’apprentissage à zéro coups) Une capacité du modèle à effectuer une tâche sans avoir été explicitement entraîné sur des exemples spécifiques de cette tâche.

 

Sites et glossaires utiles :

Glossaire CNIL et celui du Blog du modérateur.

Conseil de l’Europe : https://www.coe.int/fr/web/artificial-intelligence/glossary

Glossaire de l’UNESCO (publié en 2018 et actualisé à mai 2023) : https://courier.unesco.org/fr/articles/glossaire-de-lintelligence-artificielle

Glossaire publié au JO sur la francisation des termes techniques (2018) Vocabulaire de l’intelligence artificielle (liste de termes, expressions et définitions adoptés) NOR : CTNR1832601K – JORF n°0285 du 9 décembre 2018

Glossaire pratique de l’Université de Laval à Québec (daté de janvier 2020)  petit lexique de l’Université de Laval à Québec