Uptime Formation > IA pour les Développeurs > Jour 1 - Fondamentaux > 3 - Tool Calling et MCP

3 - Tool Calling et MCP

Comprendre ce que fait réellement l’agent

La boîte noire

Problème avec certains outils : Vous ne voyez pas ce que l’agent fait.

Utilisateur: "Ajoute l'authentification"
┌─────────────────────────────────────┐
│         BOÎTE NOIRE                 │
│   ??? fichiers modifiés ???          │
│   ??? commandes exécutées ???        │
│   ??? accès réseau ???              │
└─────────────────────────────────────┘
Résultat: "C'est fait !"

Risque : L’agent peut modifier des fichiers critiques, exécuter des commandes dangereuses, ou faire des appels réseau non désirés.

Tool Calling transparent

OpenCode montre chaque action :

Utilisateur: "Ajoute l'authentification"

[ACTION] Reading file: src/api/routes.py
[ACTION] Reading file: src/models/user.py
[ACTION] Creating file: src/middleware/auth.py
[ACTION] Running command: pytest tests/
[ACTION] Writing file: src/api/routes.py (+15 lines)

Résultat: "J'ai ajouté le middleware d'authentification.
Voulez-vous que je crée les tests ?"

Vous gardez le contrôle :

Chaque action est visible
Vous pouvez annuler
Vous comprends le raisonnement

Le pattern des outils

Un “outil” est une capacité donnée à l’agent.

# Exemple d'outil: lecture de fichier
tools:
  - name: read_file
    description: "Lit le contenu d'un fichier"
    parameters:
      path: string  # Chemin du fichier

L’agent décide quand l’utiliser :

Agent: "Pour ajouter l'auth, je dois d'abord comprendre
       la structure existante. Je vais lire les fichiers."
       
[APPEL] read_file(path="src/api/routes.py")
[APPEL] read_file(path="src/models/user.py")

Les outils courants

Outil	Description	Risque
`read_file`	Lire un fichier	Aucun
`write_file`	Créer/modifier fichier	Modifications
`run_command`	Exécuter shell	Élevé
`search_code`	Grep/ripgrep	Aucun
`lsp_diagnostics`	Erreurs de type	Aucun
`web_fetch`	Requêtes HTTP	Réseau

MCP : Model Context Protocol

Le standard pour connecter des outils aux agents.

┌─────────────┐     ┌─────────────┐     ┌─────────────┐
│   OpenCode   │◄───│    MCP     │◄───│  Serveur    │
│   (Agent)   │     │  (Protocole)│     │  (Outils)   │
└─────────────┘     └─────────────┘     └─────────────┘

Avantages :

Outils modulaires
Communauté partage des MCPs
Séparation des responsabilités

Pourquoi les agents IA codent si bien ?

Les agents modernes dépassent les LLM classiques grâce à 3 piliers :

1. Accès à l’information actuelle

┌─────────────────────────────────────────────────────────────┐
│                    AVANT vs APRÈS                            │
├─────────────────────────────────────────────────────────────┤
│ LLM classique (2023)     │ Agent avec tool calling          │
│ "Je ne connais pas..."    │ "Laisse-moi chercher..."        │
│ Connaissance figée        │ Documentation temps réel        │
│ Hallucinations            │ Sources vérifiées               │
└─────────────────────────────────────────────────────────────┘

Web Search MCP :

# L'agent peut chercher en temps réel
tools:
  - web_search: "React 19 best practices"    # Résultats 2025
  - fetch_docs: "https://react.dev/learn"   # Doc officielle
  - deepwiki: "vercel/next.js"                # Repo structuré

Exemple concret :

YOU: "Why is my Next.js app not hydrating correctly?"

AGENT: Let me search for recent Next.js hydration issues...
[web_search: "Next.js 15 hydration mismatch 2025"]
AGENT: Found! In Next.js 15, async components have new restrictions...

2. Ancrage dans la documentation

DeepWiki et Context7 : deux approches pour ancrer le LLM.

Outil	Méthode	Usage
DeepWiki	Scrap un repo entier → Markdown structuré	“Comment utiliser l’API de ce projet ?”
Context7	Query documentation up-to-date	“Quelle est la signature de fetch() dans Next.js 14 ?”

# DeepWiki example
deepwiki_fetch:
  url: "vercel/next.js"
  # Retourne un markdown structuré du repo
  # L'agent peut chercher dans ce contexte

Pourquoi ça marche :

Le LLM n’a pas à deviner
Les exemples de code sont réels
Les signatures sont exactes

3. Boucles de feedback rapides

┌──────────────────────────────────────────────────────────────┐
│                    FEEDBACK LOOP                              │
│                                                               │
│   ┌──────────┐    ┌──────────┐    ┌──────────┐    ┌───────┐   │
│   │ Générer  │───►│ Exécuter │───►│ Vérifier │───►│Corriger│  │
│   └──────────┘    └──────────┘    └──────────┘    └───────┘   │
│        │                │               │               │      │
│        │                │               │               │      │
│        ▼                ▼               ▼               ▼      │
│   Code généré     Tests/Build      Erreurs?        Fix & retry│
│                                                               │
└──────────────────────────────────────────────────────────────┘

Tools de vérification :

# L'agent peut:
- run: "pytest tests/"           # Tests unitaires
- run: "tsc --noEmit"            # Type checking
- run: "eslint src/"             # Linting
- browser_snapshot: page         # Vérifier UI (Playwright)

Exemple :

AGENT: I'll add the authentication middleware...
[write_file: src/middleware/auth.ts]

AGENT: Let me verify it works...
[run: npm run build]
ERROR: Cannot find name 'Request'

AGENT: I need to import the Request type...
[edit_file: src/middleware/auth.ts, add import]

AGENT: Build passes. Now running tests...
[run: npm test]
SUCCESS: All tests pass

Synthèse

Pilier	Sans agent	Avec agent
Information	Connaissance figée (date cutoff)	Web search, docs temps réel
Ancrage	Hallucinations possibles	Sources vérifiées dans contexte
Feedback	L’utilisateur teste manuellement	Auto-vérification (tests, build, types)

Résultat : Les agents peuvent produire du code qui compile et passe les tests sans intervention humaine.

MCP populaires

MCP	Usage	Installation
filesystem	Accès fichiers	Intégré
postgres	Requêtes DB	`mcp-postgres`
github	Issues, PRs	`mcp-github`
playwright	Browser automation	`mcp-playwright`
slack	Messages Slack	`mcp-slack`

Configuration dans OpenCode :

# ~/.config/opencode/mcp.yaml
mcpServers:
  postgres:
    command: mcp-postgres
    args: ["postgresql://user:pass@localhost/db"]
    env:
      POSTGRES_URL: postgresql://...
  
  github:
    command: mcp-github
    args: []
    env:
      GITHUB_TOKEN: ${GITHUB_TOKEN}

Playwright et le quirk des screenshots

Un screenshot n’a pas besoin d’être une image.

# L'agent peut demander un screenshot
# Playwright renvoie une représentation textuelle !

# Pas ça (lourd, tokens) :
screenshot_base64 = "iVBORw0KGgoAAAANSUhEUgAA..."  # 50KB+

# Mais ça (léger, exploitable) :
page_snapshot = """
- Button "Login" [focused]
- TextBox "Email" 
- TextBox "Password"
- Link "Forgot password?"
"""

OpenCode utilise les snapshots textuels :

Économie de tokens massive
Plus exploitable par le LLM
Pas de vision nécessaire

Vector Search vs Clever Grep

Deux approches pour chercher du code :

Vector Search (sémantique)

Query: "où est la validation du mot de passe ?"
→ [Embedding] → Recherche vectorielle
→ Résultat: src/services/auth.py ligne 42

Avantages :

Comprend le sens
Fonctionne sans mots-clés exacts

Inconvénients :

Indexation nécessaire
Tokens pour l’embedding
Peut manquer des détails précis

Clever Grep (AST-aware)

# L'agent utilise ripgrep avec patterns
rg "password" --type py -A 3 -B 3
rg "def.*valid" --type py

Avantages :

Rapide, pas d’indexation
Précis sur les noms exacts
Pas de tokens supplémentaires

Inconvénients :

Nécessite les bons mots-clés

Recommandation : Les deux sont complémentaires. OpenCode utilise grep par défaut, vector search si configuré.

TP : Tool Calling en pratique

Le TP fil rouge continue : comprendre et tracer les appels d’outils.

Voir 3_tp_tool_calling.md →