Uptime Formation > IA pour les Développeurs > Jour 2 - Avancé > 8 - TP Debugging IA

8 - TP Debugging IA

Diagnostiquer et corriger les échecs

Objectif

Apprendre à reconnaître les patterns d’échec et à les corriger.

Partie 1 : Hallucinated API

Exercice

Donner un prompt vague :

>Ajoute une validation email côté serveur

Observer :

L’agent a-t-il créé validate_email() de zéro ?
Cette fonction existe-t-elle dans le codebase ?

Diagnostic :

# Vérifier ce que l'agent a ajouté
git diff

# Chercher la fonction
grep -r "validate_email" src/

Exercices supplémentaires

Voir les scénarios détaillés dans la section Scénarios de Bugs IA :

Scénario	Description
Happy Path Bias	Fonction password reset sans edge cases
Fix Loop Infini	Transcript d’une boucle de 15 minutes
Spéculation Non Vérifiée	Optimisation multiprocessing sans vérifier le contexte
Suppression Tests	Patterns anti-test (suppression, skip, affaiblissement)
Hallucination Dépendances	Imports de packages inexistants

Utilisation :

Lire un scénario
Identifier les patterns d’échec
Appliquer les corrections proposées
Observer les comportements similaires avec un agent IA

Correction

Ajouter à AGENTS.md :

## Available Validators
- src/validators.py: sanitize(), format_date()
## DO NOT CREATE new validators without approval

Relancer avec contrainte :

>Ajoute validation email en utilisant UNIQUEMENT
>les fonctions existantes dans src/validators.py

Partie 2 : Infinite Loop

Exercice

Créer un test impossible :

# tests/test_impossible.py
def test_impossible():
    # Ce test ne peut jamais passer
    assert False, "This test always fails"

Lancer l’agent :

>Fix the failing tests

Observer le nombre d’itérations.

Diagnostic

# Compter les tentatives
git log --oneline | wc -l

# Voir le pattern
git log --oneline -10

Correction

Arrêter après N itérations
Analyser pourquoi ça échoue
Supprimer ou corriger le test impossible

Partie 3 : The “Done” Bug

Exercice

Demander une tâche complexe :

>Refactor the entire authentication system

L’agent dit “Done!"

Vérification

# Ne PAS faire confiance au "Done"
# Vérifier :

# Combien de fichiers modifiés ?
git diff --stat

# Les tests passent-ils ?
make test

# Le code compile-t-il ?
make build

# Y a-t-il des TODOs ?
grep -r "TODO" src/

Pattern à regarder

Agent: "I've completed the refactoring!"

Reality check:
- 0files modified
- Tests: 0 pass, 0 fail
- Build: success (nothing changed)

Partie 4 : Tool Spam

Exercice

Observer les logs d’un agent :

# Mode verbeux
opencode --verbose 2>&1 | tee agent.log

Identifier les répétitions :

# Compter les read_file
grep "read_file" agent.log | wc -l

# Trouver les doublons
grep "\[TOOL\]" agent.log | sort | uniq -c | sort -rn | head -20

Diagnostic

Si le même fichier est lu 5+ fois, c’est du spam.

Correction

AGENTS.md avec structure claire
Demander à l’agent de “summarize” après lecture :

# AGENTS.md
## Before Coding
- Summarize what you learned from reading files
- List the files you'll modify
- Explain your approach in one paragraph

Partie 5 : Context Amnesia

Exercice

Donner une tâche longue :

>This is step 1 of 10. [détails...]

Après plusieurs steps, demander :

>What was step 1 about?

Observer

L’agent se souvient-il des steps précédents ?
À quel point le contexte est-il rempli ?

# Estimer les tokens
wc -w agent.log
# Approximation: 1 token ≈ 4 chars

Correction

Rotation après ~70% du contexte
AGENTS.md comme “checklist”

# AGENTS.md
## Completed Steps
- [x] Step 1: ...
- [x] Step 2: ...
- [ ] Step 3: ...

Partie 6 : Créer un Bug Report

Pour chaque échec, documenter

# Bug Report - 2024-01-15

## Task
Add user pagination with total count.

## What Happened
Agent created validate_email() function that doesn't exist.
Modified 47 files instead of 2.
Tests failed.

## Expected
Modify src/api/routes/users.py only.
Add tests in tests/test_users.py.
All tests pass.

## Files Affected
- src/api/routes/users.py (unexpected)
- src/utils/validators.py (created, shouldn't)
- 45 other files (unnecessary)

## Context Window
- Tokens: 180k/200k
- Iterations: 15

## Guardrails Violated
- "DO NOT create new utilities"

## How to Fix
1. Revert changes to non-essential files
2. Remove created validators.py
3. Use existing pagination pattern

Livrable

À la fin de ce TP :

Avoir rencontré au moins 2 patterns d’échec
Avoir corrigé avec AGENTS.md
Avoir créé un bug report
Avoir observé le tool spam dans les logs

Checkpoint

Pattern retenu : Ne pas faire confiance au “Done”, vérifier indépendamment.

Question clé : Quel pattern d’échec avez-vous rencontré le plus ?

Prochain module

Module 9 : Tests et Qualité avec l’IA.