Section II : Fonctionnement de base des systèmes d’IA : données, algorithmes, types d’apprentissage automatique
Introduction
L’IA repose sur trois piliers :
Les donnéesLes algorithmes
L’apprentissage
Les données : le carburant de l’IA
Types de données :
- Images (photos, vidéos)
- Textes (SMS, articles)
- Sons (voix, musique)
- Données numériques (capteurs, météo, trafic)
Exemple simple :
Pour apprendre à reconnaître une pomme, il faut montrer à l’IA des centaines d’images de pommes sous différents angles.
Les algorithmes : les recettes de l’IA
Définition
- Un algorithme est une suite d’instructions logiques et précises qui permettent de résoudre un problème.
- Dans l’IA, l’algorithme sert à transformer des données en résultats exploitables.
Métaphore simple : la recette de cuisine
- Recette = suite d’étapes à suivre.
- Ingrédients = données (images, textes, sons).
- Plat final = résultat (classification, décision, prédiction).
- Ingrédients = images de fruits
- Recette = règles qui comparent la couleur, la taille, la forme, etc.
- Plat final = reconnaissance “pomme”, “banane”, “orange”.
Types d'interactions dans le domaine de l'IA
- La première est une interaction avec une base de données des images par exemple. Ce serveur va envoyer les données à l'intelligence artificielle que l'on va appeler ici un agent et cet agent va restituer des résultats Cela crée ainsi une boucle.
- La deuxième est une interaction avec un environnement comme par exemple une machine de production ou un jeu vidéo. Dans ce cas, on ne va plus se retrouver avec des données brutes mais avec un environnement. Cet environnement va renseigner l'agent de l'état du jeu. Puis, l'agent va répondre par une action à effectuer sur cet environnement.
Types d’apprentissage automatique
Les trois grands types d’apprentissage
Apprentissage supervisé
L’IA apprend avec des exemples étiquetés (on connaît la bonne réponse)
Apprentissage non supervisé
L’IA apprend sans étiquette, elle cherche seule des structures ou des groupes dans les données.
Apprentissage par renforcement
L’IA apprend par essais-erreurs, en recevant des récompenses ou punitions selon ses actions.
1. Apprentissage supervisé
Le machine learning supervisé est un type d’apprentissage automatique dans lequel le modèle est entraîné sur un ensemble de données étiqueté (c’est-à-dire que la variable cible ou de sortie est connue). Par exemple, dans le cas d’un modèle de prévision des tornades sur une période donnée, un data scientist inclut dans les variables d’entrée la date, le lieu, la température, les schémas de flux de vent, etc., et la sortie correspond à l’activité réelle des tornades enregistrée ces jours-là. L’apprentissage supervisé est généralement utilisé pour l’évaluation des risques, la reconnaissance d’images, l’analyse prédictive et la détection des fraudes, et comprend plusieurs types d’algorithmes. L’apprentissage supervisé est généralement utilisé pour l’évaluation des risques, la reconnaissance d’images, l’analyse prédictive et la détection des fraudes, et comprend plusieurs types d’algorithmes.
- Algorithmes de classification : prédisent les variables de sortie catégorielles (par exemple, « indésirables » ou « pas indésirables ») en étiquetant les données d’entrée. Les algorithmes de classification incluent, entre autres, la régression logistique, les k-plus proches voisins et les machines à vecteurs de support (SVM).
- Algorithmes de régression : prédisent les valeurs de sortie en identifiant des relations linéaires entre des valeurs réelles ou continues (par exemple, la température, le salaire). Les algorithmes de régression comprennent la régression linéaire, la forêt d’arbres décisionnels et l’optimisation de gradient, ainsi que d’autres sous-types.
2. Machine learning non supervisé
Les algorithmes d’apprentissage non supervisé, tels que Apriori, GMM (modèles de mélange gaussien) et PCA (analyse en composantes principales), tirent des conclusions à partir d’ensembles de données non étiquetés, facilitant ainsi l’analyse exploratoire des données et permettant la reconnaissance de formes et la modélisation prédictive. La méthode d’apprentissage non supervisé la plus courante est l’analyse de cluster, qui utilise des algorithmes de clustering pour catégoriser les points de données en fonction de la similarité des valeurs (comme dans la segmentation des clients ou la détection d’anomalies). Les algorithmes d’association permettent aux data scientists d’identifier les associations entre les objets de données au sein de grandes bases de données, ce qui facilite la visualisation des données et la réduction de la dimensionnalité.3. Apprentissage par renforcement
L’apprentissage par renforcement, également appelé apprentissage par renforcement basé sur les commentaires humains (RLHF), est un type de programmation dynamique qui entraîne des algorithmes à l’aide d’un système de récompense et de punition. Pour déployer l’apprentissage par renforcement, un agent effectue des actions dans un environnement spécifique pour atteindre un objectif prédéterminé. L’agent est récompensé ou pénalisé pour ses actions en fonction d’un indicateur établi (généralement des points), ce qui l’encourage à poursuivre les bonnes pratiques et à éliminer les mauvaises. À force de répétition, l’agent apprend les meilleures stratégies. Les algorithmes d’apprentissage par renforcement sont courants dans le développement de jeux vidéo et sont fréquemment utilisés pour apprendre aux robots à reproduire des tâches humaines.Vérifiez vos acquis avec des QCM
Question 1 : Les trois piliers fondamentaux de l’intelligence artificielle sont :
Question 2 : Le rôle principal des données dans l’IA est :
Question 3 : Quels types de données peuvent être utilisés par une IA ?
Question 4 : Dans l’exemple d’apprentissage d’une IA à reconnaître une pomme, que représente « l’image de la pomme » ?
Question 5 : Qu’est-ce qu’un algorithme dans le contexte de l’IA ?
Question 6 : Dans la métaphore de la cuisine, que représentent les « ingrédients » ?
Question 7 : Dans la métaphore de la cuisine, le « plat final » correspond à :
Question 8 : Dans le machine learning, l’« apprentissage supervisé » signifie que :
Question 9 : L’apprentissage non supervisé est utilisé pour :
Question 10 : L’apprentissage par renforcement repose sur :
Question 11 : Dans un apprentissage supervisé, un « label » (étiquette) représente :
Question 12 : Un exemple typique d’apprentissage supervisé est :
Question 13 : Quels sont des algorithmes utilisés dans l’apprentissage supervisé ?
Question 14 : L’apprentissage non supervisé permet notamment :
Question 15 : L’analyse en composantes principales (PCA) est utilisée pour :
Question 16 : L’apprentissage par renforcement implique :
Question 17 : L’apprentissage par renforcement est particulièrement utilisé pour :
Question 18 : Quelle affirmation décrit le mieux un agent intelligent ?
Question 19 : Dans le contexte d’une IA, qu’est-ce qu’un environnement ?
Question 20 : Quel type d’interaction correspond à une IA qui contrôle un robot dans une usine ?
Question 21 : Un algorithme de classification sert à :
Question 22 : Un algorithme de régression sert à :
Question 23 : Les algorithmes non supervisés comme K-means ou GMM servent à :
Question 24 : Dans le RLHF (Reinforcement Learning with Human Feedback), le rôle du retour humain est :
Question 25 : Quelle phrase résume le mieux le rôle global de l’apprentissage en IA ?
