npmrunseb
FR EN
← Tous les billets

De ChatGPT au terminal : l'IA développeur est devenue un agent

On a tous commencé pareil. Une fenêtre de chat, un prompt, et on copiait-collait la réponse dans l’éditeur. Pour certains, ce geste dure encore. Pour d’autres, il est devenu aussi archaïque que d’aller chercher la documentation sur papier.

L’IA pour développeurs n’a pas seulement gagné en puissance : elle a changé de nature. Entre le GPT-3 derrière une API et Claude Code qui planifie, exécute, corrige et recommence, il y a trois générations d’outils, chacune portant une posture différente. Pas une posture d’outil ; une posture de collaborateur.

En résumé — L’IA développeur est passée du chatbot externe (GPT, custom instructions) à l’assistant dans l’éditeur (GitHub Copilot), puis à l’agent dans le terminal (Claude Code, Copilot CLI). La rupture n’est pas de performance : c’est de délégation. En janvier 2026, seulement 14 % des développeurs utilisent des agents quotidiennement ; les équipes qui ont fait le saut décrivent une productivité d’un autre ordre.

L’IA comme outil externe : la génération copier-coller

ChatGPT, sorti en novembre 2022, a normalisé l’usage du LLM pour les développeurs. Pour la première fois, une interface en langage naturel répondait de façon cohérente sur des sujets techniques. Le geste s’est vite standardisé : poser la question, lire la réponse, copier le bout de code, l’adapter au contexte.

En 2025, selon le Stack Overflow Developer Survey 2025 (consulté le 2026-05-16), 84 % des développeurs utilisent ou prévoient d’utiliser des outils IA dans leur workflow, contre 76 % l’année précédente. 51 % les utilisent quotidiennement. En 2022, ces chiffres étaient marginaux.

Ce premier âge de l’IA dev se caractérise par une séparation nette : l’IA est dans une fenêtre, le code est dans l’éditeur. Les custom instructions de ChatGPT représentent une première tentative de personnalisation, mais elles restent statiques, non contextualisées, indépendantes de la base de code réelle. La posture est celle de l’assistant externe. On l’interroge. Il répond. On intègre manuellement.

La limite est structurelle : l’IA n’a pas accès à votre code, ne connaît pas votre architecture, ne peut pas exécuter de commandes. Elle conseille ; elle ne fait pas.

Réseau de neurones artificiels — illustration TheDigitalArtist / Pixabay Représentation conceptuelle d'un réseau de neurones artificiels — IA développeur

L’IA dans l’éditeur : la génération complétion

GitHub Copilot, sorti en preview en 2021 et généralisé en 2022, a changé la relation. L’IA n’est plus dans un onglet séparé ; elle est dans le flux de travail. La complétion inline, le chat intégré, puis l’Agent Mode ont progressivement transformé Copilot d’un générateur de boilerplate en assistant capable de tâches multi-fichiers.

L’adoption en témoigne. Selon le JetBrains AI Pulse de janvier 2026 (10 000+ développeurs professionnels, localisé en 8 langues, consulté le 2026-05-16), GitHub Copilot reste l’outil le plus connu avec 76 % de notoriété et 29 % d’adoption au travail, dont 40 % dans les entreprises de plus de 5 000 employés. 4,7 millions d’abonnés payants et une présence chez 90 % des entreprises du Fortune 100 témoignent d’une intégration dans les standards enterprise.

Le 25 février 2026, GitHub a annoncé la disponibilité générale de Copilot CLI : un agent terminal avec quatre sous-agents spécialisés (Explore, Task, Code Review, Plan) et un mode autopilot. Copilot franchit le seuil de l’IDE pour entrer dans le terminal.

Cette génération reste néanmoins ancrée dans la logique de l’assistance : l’IA suggère, l’humain décide, l’humain intègre. Pour les équipes qui travaillent sur la stratégie IDE en entreprise, Copilot représente souvent le premier palier d’outillage standardisé ; les agents en constituent le suivant.

Du terminal, l’IA coordonne : la génération agent

Claude Code est sorti en disponibilité générale en 2025. Sa différence architecturale avec les outils précédents est fondamentale : il n’est pas un assistant qu’on interroge, c’est un agent qu’on mandate.

La distinction n’est pas rhétorique. Claude Code lit votre dépôt, planifie une implémentation, édite des fichiers à travers toute la codebase, exécute les tests, interprète les erreurs et itère jusqu’à livrer un résultat vérifiable. La fenêtre de contexte de 1 million de tokens d’Opus 4.6 permet de tenir en mémoire une codebase entière, y compris les imports, les dépendances et l’historique d’erreurs.

Les chiffres d’adoption sont frappants. En janvier 2026, selon le JetBrains AI Pulse, Claude Code est passé de 3 % d’adoption à 18 % en huit mois, soit une croissance 6x. En US/Canada, l’adoption atteint 24 %. La satisfaction est la plus haute du marché : 91 % de CSAT et un NPS de 54 — sur une échelle où 50 est déjà considéré comme exceptionnel.

L’Agent Teams, disponible depuis début 2026, permet de lancer plusieurs agents en parallèle dans des terminaux séparés, avec une liste de tâches partagée et une communication inter-agents en temps réel. Le guide d’Anthropic sur la construction d’agents efficaces pose la base conceptuelle de ces architectures multi-agents.

Développeur au terminal — photo Luca Bravo / Unsplash Développeur travaillant dans un terminal avec du code affiché à l'écran

GitHub Copilot CLI ou Claude Code : quelle est la vraie différence ?

La comparaison directe rate l’essentiel. Ces outils ne résolvent pas le même problème.

GitHub Copilot est un assistant IDE avec une extension terminal. Son point fort : l’intégration native dans l’écosystème GitHub (PRs, issues, Actions), les completions inline temps-réel, et un déploiement enterprise mature. Pour les équipes déjà dans l’écosystème Microsoft, il est inclus dans les abonnements existants.

Claude Code est un agent terminal avec accès facultatif à l’IDE. Son point fort : la délégation de tâches complexes, le raisonnement cross-repository sur de grandes bases de code, et les skills partageables en équipe. Pour les tâches qui nécessitent de tenir plusieurs dizaines de fichiers en tête simultanément, la différence de contexte (1 M tokens vs 64-128 K pour Copilot) n’est pas cosmétique.

La mesure la plus objective disponible est le SWE-bench Verified, le benchmark de référence pour l’ingénierie logicielle autonome :

Score SWE-bench Verified — ingénierie logicielle autonome (2026) Claude Code (Opus 4.6) 80,8 % GitHub Copilot 56,4 % 0 % 100 % Benchmark : résolution autonome de vraies issues GitHub — SWE-bench Verified, avril 2026
Source : SWE-bench.com, consulté le 2026-05-16

L’écart de 24 points n’est pas une différence de degré : il reflète la différence entre un outil conçu pour assister et un outil conçu pour exécuter. Selon l’enquête Digital Applied Q1 2026 (2 847 développeurs, consulté le 2026-05-16), 24 % des migrations de Copilot vers Claude Code sont motivées par les capacités multi-fichiers et agentiques. La migration inverse n’apparaît pas dans les données.

La réponse pragmatique que la majorité des seniors ont trouvée : les deux. Copilot Pro à 10 $/mois pour les completions en continu et les workflows GitHub natifs ; Claude Code Max à 100 $/mois pour les tâches complexes déléguées. Ce n’est pas redondant ; ce sont deux couches de valeur différentes qui ne se chevauchent pas.

Qu’est-ce que les skills changent concrètement pour un lead dev ?

Les skills Claude Code sont la fonctionnalité la moins visible et probablement la plus structurante pour les équipes.

Un skill, c’est un fichier SKILL.md dans le dépôt qui définit un workflow exécutable par l’agent. /review, /deploy, /migrate, /generate-migration : des commandes qui encapsulent non seulement des instructions, mais du contexte injecté automatiquement — diff git en cours, état des migrations existantes, résultat des derniers tests. Le skill est versionné dans le dépôt, partagé par toute l’équipe, et s’améliore comme n’importe quel autre bout de code.

Dans les missions DevX que je mène, c’est ce point qui change le plus profondément la dynamique d’équipe. Avant, les conventions de code review vivaient dans une page Confluence que personne ne lisait avant de soumettre une PR. Avec un skill /review, elles deviennent une instruction exécutable : l’agent les applique, les développeurs junior les voient s’appliquer, et elles évoluent par PR comme le reste du code.

L’articulation avec les Dev Containers est naturelle : le Dev Container définit l’environnement, le CLAUDE.md et les skills définissent les workflows. L’onboarding devient reproductible jusqu’au comportement de l’agent.

Le Model Context Protocol (MCP) étend encore le périmètre : 300+ intégrations permettent à Claude Code de travailler avec Linear, Sentry, PostgreSQL, Slack. Ce n’est plus seulement le code qui est dans le contexte ; c’est l’ingénierie entière.

Pour quel profil et dans quel contexte ?

La réponse dépend de la taille de l’équipe et du type de travail.

Développeurs seniors et leads tech : la stack duale est le consensus en 2026. Selon l’enquête du Pragmatic Engineer de mars 2026 (900+ ingénieurs, consulté le 2026-05-16), Claude Code est l’outil #1 après seulement 8 mois d’existence et 95 % des répondants utilisent l’IA au moins hebdomadairement. Les staff+ engineers sont les plus grands utilisateurs d’agents (63,5 % en usage régulier) ; ce sont eux qui ont les tâches les plus complexes et le plus de contexte à gérer.

Startups et petites équipes : Claude Code domine à 75 % dans les organisations de moins de 10 personnes (Pragmatic Engineer). L’absence de contraintes de procurement enterprise et la valeur immédiate sur des tâches de refactoring ou de migration pèsent lourd.

Grandes organisations : GitHub Copilot reste le standard d’entreprise, porté par la distribution Microsoft et les accords enterprise. Claude Code entre par la porte de l’automatisation : les pipelines CI/CD headless, la revue de code automatisée, les tâches de migration pilotées par agent. C’est le même schéma que j’observe dans les missions d’auto-hébergement en production : les outils les plus puissants arrivent d’abord par les équipes techniques, pas par le procurement.

Équipe de développeurs en collaboration — photo rawpixel.com / Unsplash Équipe de développeurs travaillant ensemble autour de leurs ordinateurs portables

Ce qui m’a surpris dans les enquêtes récentes : la résistance à l’IA ne corrèle pas avec l’ancienneté. Les développeurs de 20 ans d’expérience adoptent les agents au même rythme que les juniors, selon l’enquête ACTI de janvier 2026 (consulté le 2026-05-16). La réticence vient du contexte organisationnel ; pas de l’expertise technique.

Questions fréquentes

Claude Code remplace-t-il GitHub Copilot ?

Non. Ces outils adressent deux couches différentes du workflow. Copilot gère les completions inline et les workflows GitHub natifs : c’est la couche “typage assisté” du quotidien. Claude Code prend en charge les tâches de délégation complexes : refactorings multi-fichiers, migrations, débogage de production. La plupart des développeurs seniors utilisent les deux simultanément sans conflit. Selon le Pragmatic Engineer, 46 % des utilisateurs réguliers de Claude Code utilisent aussi Copilot.

Les skills Claude Code sont-ils disponibles pour toute l’équipe ?

Oui, à condition de les placer dans le dossier .claude/skills/ du dépôt. Les skills de niveau projet sont versionnés avec Git : chaque membre de l’équipe y a accès au git clone. Les skills de niveau personnel restent locaux. Un skill partagé devient une convention d’équipe exécutable, au même titre qu’un linter ou un fichier de configuration ESLint versionné.

Quel est le coût réel d’une stack Claude Code en entreprise ?

Pour un développeur senior avec un usage intensif : Copilot Pro à 10 $/mois + Claude Code Max 5x à 100 $/mois = 110 $/mois. Pour les équipes, Copilot Business est à 19 $/siège ; Claude Code Teams à 100 $/siège minimum (5 sièges). Au regard des heures économisées sur les refactorings complexes et la revue de code automatisée, le ROI est positif dès la première semaine d’utilisation régulière selon les données Digital Applied Q1 2026.

Quel modèle Claude Code utilise-t-il par défaut ?

Claude Code utilise par défaut Claude Sonnet 4.6 pour l’équilibre vitesse/qualité. Opus 4.6 est disponible pour les tâches nécessitant le plus haut niveau de raisonnement : refactorings architecturaux, debugging de systèmes complexes. Sur le benchmark SWE-bench Verified, Opus 4.6 score 80,8 % — le meilleur score publié pour un agent d’ingénierie logicielle autonome en avril 2026. Haiku 4.5 couvre les tâches rapides à faible coût de tokens.

La rupture n’est pas dans les benchmarks

La vraie discontinuité entre les générations n’est pas un score sur SWE-bench. C’est une question de posture : est-ce qu’on guide l’IA pas à pas, ou est-ce qu’on lui confie un objectif et on revient sur le résultat ?

Les développeurs qui ont intégré cette posture ne reviennent pas en arrière. Pas parce que c’est plus facile : bien formuler un objectif est plus exigeant que corriger du code ligne par ligne. Mais le rapport entre l’effort investi et la valeur produite a changé de façon irréversible.

Les skills et les agents ne sont pas des fonctionnalités avancées réservées aux early adopters. Ils définissent comment l’ingénierie se pratique en 2026 ; les équipes qui les ont intégrés dans leur stratégie IDE le mesurent concrètement.