À propos de cette page
Ces exercices corrigés sur « L'intelligence artificielle » en terminale permettent de s'entraîner et de vérifier ses acquis en enseignement scientifique. Ils suivent le programme officiel de terminale et sont classés par difficulté (facile, moyen, difficile). Au programme : Qu'est-ce que l'intelligence artificielle ?, IA symbolique et IA par apprentissage, L'apprentissage automatique (machine learning), L'apprentissage supervisé : entraînement et test. Écris ta réponse puis clique sur « Vérifier » : la correction est immédiate et tolère majuscules, espaces et ponctuation. Cet entraînement aide à mémoriser les méthodes, repérer ses erreurs et gagner en confiance avant un contrôle. Exercices gratuits proposés par un professeur particulier à Marseille pour réviser enseignement scientifique en terminale.
Exercices corrigés, classés du plus simple au plus complexe. Cherche d'abord seul au brouillon, puis déplie la correction détaillée pour vérifier ta méthode et tes raisonnements.
Exercice 1 — Vocabulaire de l'intelligence artificielle
Définis avec précision chacune des notions suivantes du thème intelligence artificielle.
- Qu'appelle-t-on « intelligence artificielle » ? Précise ce qu'est une IA « faible ».
- Définis l'apprentissage automatique (machine learning).
- Qu'est-ce qu'un biais d'une IA et d'où provient-il le plus souvent ?
1. L'intelligence artificielle est l'ensemble des méthodes et programmes permettant à une machine d'accomplir des tâches que l'on associe à l'intelligence humaine (perception, raisonnement, décision, langage). Une IA « faible » (ou spécialisée) est performante sur une tâche précise pour laquelle elle a été conçue, mais ne possède ni conscience ni compréhension générale : c'est le cas de toutes les IA actuelles.
2. L'apprentissage automatique est une méthode par laquelle un algorithme ajuste automatiquement ses paramètres internes à partir d'un jeu de données d'entraînement, afin de minimiser ses erreurs et de généraliser à de nouvelles situations. On ne programme pas la solution, mais la capacité à l'apprendre à partir d'exemples.
3. Un biais est une erreur systématique du modèle qui défavorise certaines situations ou certains groupes. Il provient le plus souvent d'un jeu de données d'entraînement non représentatif ou porteur de préjugés humains : l'IA reproduit (voire amplifie) les régularités de ses données.
Exercice 2 — IA symbolique ou IA par apprentissage ?
Pour chaque situation, indique l'approche la plus adaptée (IA symbolique à base de règles, ou IA par apprentissage) et justifie en une phrase.
- Calculer automatiquement le montant d'un impôt à partir d'un barème officiel précis.
- Reconnaître si une photo contient un chat ou un chien.
- Diagnostiquer une panne d'un appareil à partir d'un arbre de décision rédigé par des experts.
- Traduire automatiquement un texte du français vers l'anglais.
1. IA symbolique : le barème est un ensemble de règles précises, connues et écrites explicitement (« si revenu entre X et Y, alors taux Z »). Inutile d'apprendre à partir d'exemples.
2. IA par apprentissage : il est impossible d'écrire toutes les règles décrivant un chat ou un chien ; on entraîne le modèle sur des milliers d'images étiquetées.
3. IA symbolique : l'arbre de décision est un ensemble de règles « si… alors… » fournies par des experts (système expert).
4. IA par apprentissage : la langue est trop riche et irrégulière pour des règles écrites une à une ; les traducteurs modernes apprennent sur d'énormes corpus de textes bilingues.
Exercice 3 — Entraînement, test et surapprentissage
À l'aide du graphique « Erreur du modèle au fil de l'entraînement » du cours, réponds aux questions suivantes.
- Comment évolue l'erreur sur le jeu d'entraînement au fil de l'apprentissage ?
- Comment évolue l'erreur sur le jeu de test ? À partir de quel moment se comporte-t-elle différemment ?
- Comment nomme-t-on le phénomène où le modèle devient excellent sur l'entraînement mais médiocre sur le test ?
- Pourquoi est-il indispensable d'évaluer un modèle sur un jeu de test indépendant ?
1. L'erreur sur le jeu d'entraînement diminue continûment : le modèle s'ajuste de mieux en mieux aux exemples qu'il a vus.
2. L'erreur sur le jeu de test diminue d'abord, puis remonte à partir d'un certain stade de l'entraînement (ici vers 30 itérations). Au-delà, le modèle s'améliore sur l'entraînement mais se dégrade sur des données nouvelles.
3. Ce phénomène s'appelle le surapprentissage (overfitting) : le modèle « apprend par cœur » les exemples d'entraînement au lieu de capter des régularités généralisables.
4. Parce que la seule chose qui compte en pratique est la performance sur des données jamais vues (généralisation). Un bon score sur l'entraînement ne prouve rien (le modèle a pu mémoriser) : seul un jeu de test indépendant mesure la performance réelle.
Exercice 4 — Le neurone artificiel
On considère un neurone artificiel à deux entrées, de poids $w_1 = 0{,}5$ et $w_2 = -1$, et de biais $b = 0{,}2$. La somme pondérée est $s = w_1x_1 + w_2x_2 + b$.
- Calcule la somme pondérée $s$ pour les entrées $x_1 = 2$ et $x_2 = 1$.
- Le neurone renvoie 1 si $s > 0$ et 0 sinon. Quelle est sa sortie pour ces entrées ?
- Que représentent, dans un réseau de neurones, les poids comme $w_1$ et $w_2$ ? Comment sont-ils déterminés ?
- Pourquoi dit-on souvent qu'un grand réseau de neurones est une « boîte noire » ?
1. $s = 0{,}5 \times 2 + (-1) \times 1 + 0{,}2 = 1 - 1 + 0{,}2 = 0{,}2$.
2. Comme $s = 0{,}2 > 0$, le neurone renvoie la sortie 1.
3. Les poids quantifient l'importance accordée à chaque entrée dans le calcul. Ils ne sont pas fixés à la main : ils sont déterminés automatiquement pendant l'apprentissage, en les ajustant pour réduire l'erreur du modèle sur les données d'entraînement.
4. Un grand réseau comporte des millions de poids ajustés par l'apprentissage. On constate qu'il fonctionne (il donne de bonnes réponses), mais il est très difficile d'expliquer précisément pourquoi il produit telle sortie pour telle entrée : son fonctionnement interne reste opaque, d'où l'expression « boîte noire ».
Exercice 5 — Performance et taille du jeu de données
À l'aide du graphique « Performance en fonction de la taille du jeu de données » du cours, réponds aux questions.
- Que devient la précision du modèle lorsque la taille du jeu de données augmente ?
- Compare le gain de précision quand on passe de 1 000 à 10 000 exemples, puis de 1 000 000 à 10 000 000 d'exemples. Que constates-tu ?
- Pourquoi parle-t-on de « rendements décroissants » ?
- Au-delà de la quantité, cite deux qualités que doit posséder un bon jeu de données.
1. La précision augmente avec la taille du jeu de données : plus le modèle dispose d'exemples, mieux il apprend.
2. De 1 000 à 10 000 exemples (×10), la précision passe de 62 % à 78 %, soit +16 points. De 1 000 000 à 10 000 000 (×10 également), elle passe de 93 % à 95 %, soit seulement +2 points. Le même facteur multiplicatif apporte beaucoup moins de gain quand le jeu est déjà grand.
3. On parle de rendements décroissants car chaque ajout de données rapporte de moins en moins : la courbe s'aplatit. Doubler les données ne double pas la performance.
4. Un bon jeu de données doit être représentatif (couvrir la diversité des situations réelles) et de qualité (données correctement étiquetées, propres, sans biais). La quantité seule ne suffit pas.
Exercice 6 — Analyse de document scientifique : un biais algorithmique
Étudie le document suivant puis réponds aux questions en exploitant à la fois le document et tes connaissances.
- Document — « Une entreprise a entraîné une IA de tri automatique des candidatures à partir des CV des personnes recrutées au cours des dix dernières années. Or, durant cette période, l'entreprise avait majoritairement recruté des hommes pour les postes techniques. À l'usage, l'IA s'est mise à défavoriser systématiquement les candidatures de femmes, qu'elle jugeait moins « conformes ». L'outil a finalement été abandonné. »
Question : Quel problème l'IA décrite dans le document présente-t-elle ?
- Explique précisément l'origine de ce comportement, en reliant le résultat aux données d'entraînement utilisées.
- Cette IA était-elle « objective » du seul fait qu'elle est une machine ? Justifie.
- Propose deux mesures qui auraient pu limiter ce biais.
1. L'IA présente un biais : elle commet une erreur systématique en défavorisant les candidatures de femmes pour les postes techniques. C'est une discrimination produite par l'algorithme.
2. L'IA a appris sur les CV des personnes recrutées dans le passé. Comme l'entreprise avait surtout recruté des hommes aux postes techniques, le modèle a appris que le profil « masculin » correspondait aux personnes embauchées et a reproduit cette régularité. Le biais des données historiques (déséquilibre hommes/femmes) a été appris puis amplifié par l'IA (« garbage in, garbage out »).
3. Non. Une IA n'est pas objective par nature : elle reflète fidèlement les données qui l'ont entraînée. Ici, les données contenaient un préjugé humain passé ; l'IA l'a donc reproduit. Le caractère « machine » ne garantit aucune neutralité.
4. Deux mesures parmi : équilibrer le jeu de données pour qu'il soit représentatif (autant de profils variés) ; retirer ou neutraliser les variables sensibles (genre) ; auditer/tester l'IA pour détecter les biais avant déploiement ; maintenir un contrôle humain sur les décisions. Toute mesure pertinente visant la qualité des données ou la supervision est acceptée.