Apprentissage automatique, réseaux de neurones et enjeux de l'IA (programme de Tle, thème « Les entreprises et l'intelligence artificielle »).
Évaluation complète de fin de chapitre, tout en niveau difficile. Travaille seul et sans aide, puis vérifie tes réponses avec le corrigé détaillé dépliable en bas de page.
Exercice 1 — Comprendre l'apprentissage automatique
Corrigé :
Dans l'IA symbolique, des experts humains écrivent explicitement des règles logiques « si… alors… » : la machine applique ces règles. Dans l'IA par apprentissage (machine learning), la machine n'est pas programmée règle par règle ; elle apprend automatiquement des régularités à partir d'un grand nombre d'exemples. (1,5 pt)
En apprentissage supervisé, on fournit des couples (entrée, réponse correcte) et le modèle ajuste ses paramètres pour reproduire ces réponses. Le jeu d'entraînement sert à ajuster les paramètres (le modèle apprend dessus) ; le jeu de test, indépendant et jamais vu, sert à mesurer la performance réelle, c'est-à-dire la capacité à généraliser. (1,5 pt)
Le surapprentissage (overfitting) survient lorsque le modèle « apprend par cœur » les exemples d'entraînement : il est excellent sur ceux-ci mais médiocre sur des données nouvelles. On cherche à l'éviter car le but d'une IA est de généraliser à des situations inédites, pas de mémoriser. (1 pt)
Exercice 2 — Raisonnement sur document : performance et données
Corrigé :
La précision augmente avec la taille du jeu de données : de 62 % pour 1 000 images à 95 % pour 10 millions. Plus le modèle dispose d'exemples, mieux il apprend. (1,5 pt)
De 1 000 à 10 000 images (×10), la précision gagne +16 points (62 → 78 %). De 1 000 000 à 10 000 000 (×10 également), elle ne gagne que +2 points (93 → 95 %). À facteur multiplicatif égal, le gain diminue fortement : c'est le phénomène de rendements décroissants (la courbe s'aplatit). (2 pt)
Comme on est déjà à 95 %, ajouter encore des images n'apportera qu'un gain marginal, pour un coût de collecte et d'annotation élevé. Il serait plus efficace d'agir sur d'autres leviers : améliorer la qualité et la représentativité des données (réduire les biais, corriger les étiquettes), ou perfectionner l'algorithme/l'architecture du modèle. (1,5 pt)
Exercice 3 — Le neurone artificiel et le réseau
Corrigé :
$s = 2 \times 1 + (-1) \times 2 + (-0{,}5) = 2 - 2 - 0{,}5 = -0{,}5$. (1 pt)
Comme $s = -0{,}5 < 0$, le neurone renvoie la sortie 0. (1 pt)
Pour un réseau de neurones, « apprendre » signifie ajuster automatiquement les poids de toutes les connexions (et les biais) à partir des données d'entraînement, de façon à réduire l'erreur globale du réseau. Les poids ne sont pas fixés à la main. (1 pt)
Un grand réseau possède des millions de poids appris : on constate qu'il fonctionne mais on explique mal pourquoi il produit telle réponse, d'où l'expression « boîte noire ». C'est un problème d'éthique car, dans des décisions sensibles (santé, justice, recrutement), on doit pouvoir justifier et contrôler une décision : un système inexplicable rend difficile de détecter ses biais et d'établir les responsabilités. (1 pt)
Exercice 4 — Analyse de documents : un biais et ses conséquences
Corrigé :
L'IA présente un biais : sa performance est très inégale selon les groupes (99 % contre 70 %). D'après le document 2, une IA reproduit les régularités de ses données ; ici, le jeu d'entraînement était dominé par un seul groupe de population. Le modèle a donc bien appris à reconnaître ce groupe, mais mal les autres, sous-représentés dans les données : le biais des données a produit un biais du modèle. (2 pt)
Non. L'IA n'est pas objective du seul fait d'être une machine : elle reflète fidèlement ses données d'entraînement (doc 2). Comme ces données étaient déséquilibrées, le résultat l'est aussi (doc 1). La machine ne garantit donc aucune neutralité. (1 pt)
Deux mesures parmi : rééquilibrer le jeu de données en y intégrant suffisamment d'exemples de tous les groupes ; auditer/tester l'IA séparément sur chaque groupe avant déploiement ; collecter des données plus diverses et de meilleure qualité ; maintenir un contrôle humain. (1 pt)
Synthèse : une IA par apprentissage ne vaut que par ses données (doc 2) ; un jeu de données non représentatif conduit à des performances inégales et discriminatoires, comme le montre la reconnaissance faciale (doc 1). La quantité ne suffit pas : la représentativité et la qualité des données sont décisives, car des données biaisées produisent un modèle biaisé. Veiller à la qualité et à la diversité des données est donc un enjeu scientifique et éthique central de l'IA. (1 pt)
Exercice 5 — L'IA dans les entreprises : atouts et limites
Corrigé :
Atout : l'IA permet d'automatiser des tâches, d'augmenter la productivité, d'analyser de grandes quantités de données ou d'offrir de nouveaux services (recommandation, maintenance prédictive…). Limite/risque : biais des modèles, manque d'explicabilité (« boîte noire »), dépendance à des données de qualité, coût énergétique, ou suppression/transformation de certains emplois. (1 pt)
Au-delà de la technique, l'IA soulève des enjeux éthiques et sociétaux, par exemple : la protection des données personnelles (RGPD) et de la vie privée ; les biais et discriminations possibles ; la responsabilité en cas d'erreur (voiture autonome, diagnostic) ; l'impact sur l'emploi ; le coût environnemental. Citer au moins deux de ces enjeux avec une explication brève suffit. (1 pt)
Cours particuliers de enseignement scientifique à Marseille, en présentiel ou à distance — un prof qui s'adapte à ton rythme et reprend ce qui coince.