Section III : Découverte de l’IA générative : textes, images, audio – fonctionnement et exemples

Introduction

En Mars 2023, Bill Gates le cofondateur de la fameuse société Microsoft, a posté sur son blog le message suivant : il y a trois grands temps dans la transformation informatique. Il y a eu le temps de l'Internet, le temps du mobile et aujourd'hui, le temps de lʼIA générative. Mais pour expliquer ce que c’est que l’IA générative qui fait parler le monde aujourd’hui, nous commençons tout d’abord par rappeler quelques concepts de l’IA Classique. LʼIA est une discipline de l'informatique qui existe depuis les années 50 et qui a connu des grandes avancées technologiques et scientifiques. On parle de : Machine Learning, des réseaux de neurones artificiels, Deep Learning pour arriver aujourd’hui à lʼIA générative.

Modèles discriminants vs. Modèles génératifs

L'apprentissage automatique ou Machine Learning est un sous-domaine de l'IA. Il s'agit d’un programme ou d'un système qui crée un modèle à partir de données existantes. Plus précisément, l'apprentissage automatique donne à l'ordinateur la capacité d'apprendre sans programmation explicite.  Si l'apprentissage automatique touche un vaste domaine et englobe de nombreuses techniques, l'apprentissage profond est un type d'apprentissage automatique qui permet de traiter des problèmes beaucoup plus complexes que ceux abordés par l'apprentissage automatique. Ceci est dû à l’usage des réseaux de neurones artificiels. Les modèles d'apprentissage profond peuvent être divisés en deux types : les modèles génératifs et  les modèles discriminatifs.
Un modèle discriminant est un type de modèle qui est utilisé pour classer ou prédire les étiquettes des   données. Dans cet exemple, le modèle arrive à prédire l’image en entrée en tant qu’un chien et le classe  tel  quel et non pas comme un chat.
Quant au modèle génératif, en plus de sa capacité de prédire que c’est un chien il peut également générer une nouvelle image d’un chien d’où le nom modèle génératif.

L’intelligence artificielle générative

L’IA Générative est alors un sous domaine de l’apprentissage profond qui crée de nouveaux contenus à base de ce qu'elle a appris du contenu existant. Pour ce faire, L'IA générative utilise des réseaux neuronaux artificiels et plus précisément un modèle génératif pour traiter des vastes données non structurés. Dans ce cas, Le processus d'apprentissage de l’IA Générative permet la création d’un modèle statistique en tentant d'apprendre des motifs structurés à partir d’un contenu non structuré.

Une deuxième caractéristique de L'IA générative par rapport à l’IA classique c’est qu’elle permet de créer des ponts entre les différents domaines tels que : le traitement du langage naturel ou le domaine de l'imagerie. On part d'un texte pour faire une vidéo, d'une vidéo pour faire un podcast ou bien faire des slides à partir d’un fichier audio. Ce qui crée donc des liens multimodaux. 

Une bonne façon de distinguer ce qui relève de l'IA générative et ce qui n'en relève pas est illustré sur le schéma suivant :
  • Il ne s'agit pas d'IA générative lorsque la sortie est un nombre, une probabilité ou une  classe, par exemple : spam ou  non-spam, …etc.
  • Il s'agit d’IA générative lorsque le résultat est du langage naturel, de la parole ou, une image par exemple.

Les modèles de langues génératifs vs. Les modèles d’images génératifs

Nous soulignons que les modèles d’IA générative sont un sous-ensemble de modèles de fondation. Les modèles de fondation sont entraînés sur des données à grande échelle et diversifiées et peuvent être utilisés ou adaptés pour un large éventail de tâches en aval. Au cours des dernières années, plusieurs dizaines de ces modèles de fondation ont été développés, par exemple des modèles de texte à texte comme (GPT) ou de texte à image comme (DALL-E).

On distingue deux types de modèles de l’IA générative selon la nature des données :

Les modèles d’images génératifs : 

Les modèles d’images génératifs produisent de nouvelles images. Ils peuvent aussi générer la légende  de l’image, effectuer une recherche par image comme étant le cas de CLIP. Ils  peuvent aussi générer la complétion   d’une image abimée comme le cas de CoModGAN.

Les modèles de langues génératifs :

Ces modèles apprennent à reconnaître  les schémas linguistiques grâce à des données d'entraînement. Puis, à partir d'un texte, ils prédisent le texte qui va  suivre comme étant le cas de GPT ou    générer des images et vidéos comme par exemple DALL-E.

Evolution de l’intelligence artificielle générative

Nous avons parcouru un long chemin depuis la programmation traditionnelle jusqu’aux modèles génératifs en passant par le concept de réseaux de neurones. Nous allons résumer  par la suite le processus de cette remarquable évolution.

Dans la programmation traditionnelle, nous devons coder en dur les règles permettant de distinguer un chien en  définissant ses caractéristiques en détail- Son type ; sa couleur ; le nombre de pattes, … etc.

Dans la vague des réseaux de neurones, nous avons pu donner au réseau des images de chats et de chiens et lui demander s’il s'agit d’un chien, et il arrive à prédire que c’était un chien sans avoir à programmer auparavant ses caractéristiques en détail.

Enfin, Dans la vague générative, nous pouvons, en tant qu'utilisateurs, générer notre propre contenu en posant simplement une question dans l'invite. 

Ainsi, lorsque vous demandez à un modèle comme GPT ou Palm qu’est-ce  qu’est un chien, il peut vous donner tout ce qu’il  a appris sur un chien ainsi que   ses caractéristiques.


Vérifiez vos acquis avec des QCM

Question 1 : Qu’est-ce que l’IA générative ?

Question 2 : Quelle différence principale distingue un modèle génératif d’un modèle discriminant ?

Question 3 : Quel événement Bill Gates a-t-il décrit comme la troisième grande transformation informatique ?

Question 4 : L’IA générative repose principalement sur :

Question 5 : Quelle phrase décrit correctement la notion de “modèle de fondation” ?

Question 6 : Quels sont les domaines couverts par l’IA générative ?

Question 7 : Quel type de résultat indique qu’un modèle est génératif ?

Question 8 : Quel est un exemple de modèle de langage génératif ?

Question 9 : Quel modèle est capable de générer des images à partir de texte ?

Question 10 : Que signifie la multimodalité dans l’IA générative ?

Question 11 : Quelle tâche un modèle génératif d’images comme CoModGAN peut-il accomplir ?

Question 12 : Qu’est-ce qu’un modèle discriminant fait typiquement ?

Question 13 : Quels sont des exemples de modèles d’IA générative textuelle ?

Question 14 : Quelle phrase résume correctement le rôle du Machine Learning dans l’IA générative ?

Question 15 : Quelle est une caractéristique clé de l’apprentissage profond ?

Question 16 : Quelle tâche illustre un modèle génératif multimodal ?

Question 17 : Quelle est la différence entre la programmation classique et l’IA générative ?

Question 18 : Dans la vague générative, l’utilisateur peut :

Question 19 : Quelles sont les applications concrètes de l’IA générative ?

Question 20 : Pourquoi l’IA générative est-elle considérée comme une révolution ?

Question 21 : Quel est l’un des avantages majeurs des modèles de fondation ?

Question 22 : Quelle est la contribution des réseaux de neurones à l’IA générative ?

Question 23 : Quelles sont les limites actuelles de l’IA générative ?

Question 24 : Quelle est une problématique éthique de l’IA générative ?

Question 25 : Quelle compétence devient essentielle à l’ère de l’IA générative ?

Question 26 : Quelles sont les opportunités de l’IA générative pour l’éducation ?

Question 27 : Dans quel domaine l’IA générative est-elle déjà utilisée efficacement ?

Question 28 : Quel est le rôle du “fine-tuning” dans l’IA générative ?

Question 29 : Quelle est une tendance récente dans l’évolution des modèles génératifs ?

Question 30 : Quelle est une perspective future de l’IA générative ?

Next Post Previous Post
No Comment
Add Comment
comment url