5 - TP Contexte et coûts

Visualiser sa consommation avec codeburn

codeburn est un dashboard TUI qui lit les fichiers de session de vos outils IA directement sur disque — sans wrapper, sans clé API — et vous montre où partent vos tokens : par projet, par modèle, par type d’activité.

Installation

npm install -g codeburn
# Ou sans installer :
npx codeburn

Prérequis : Node.js 22+.

Exercice

1. Lancer le dashboard sur vos 7 derniers jours :

codeburn

Naviguez avec les flèches pour changer la période. Tapez c pour comparer les modèles, o pour les suggestions d’optimisation.

2. Résumé rapide en une ligne :

codeburn status

3. Identifier les commandes qui brûlent le plus de tokens :

codeburn optimize

Repérez les tool calls inutilement coûteux (lecture de fichiers entiers, commandes verbose…).

4. Export pour archiver :

codeburn report -p 30days
codeburn export

Ce que vous cherchez : quel outil / quel projet consomme le plus ? Y a-t-il des pics inexpliqués ? Les suggestions optimize correspondent-elles à ce que vous observez ?


Étape 10 : Réduire sa consommation avec rtk

rtk est un proxy CLI qui filtre et compresse les sorties de commandes avant qu’elles n’entrent dans le contexte de votre agent — 60 à 90% de tokens en moins sur les commandes courantes (git status, ls, diff, pytest…).

Installation

# Linux/macOS :
curl -fsSL https://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh | sh

# macOS via Homebrew :
brew install rtk

# Vérifier :
rtk --version

Initialisation

# Pour Claude Code :
rtk init -g

# Pour un autre outil :
rtk init --gemini       # Gemini CLI
rtk init --copilot      # GitHub Copilot
rtk init --agent cursor # Cursor

Redémarrez votre outil IA après l’init — les commandes se réécrivent automatiquement via un hook Bash.

Exercice

1. Comparer la sortie brute vs. filtrée :

Dans un repo avec de l’activité Git :

# Sortie brute :
git status

# Sortie filtrée pour l'agent :
rtk git status

Observez la différence de volume. Faites pareil avec rtk git log et rtk git diff.

2. Lancer une session avec rtk actif :

Lancez votre agent sur une tâche courante (ajout d’une feature, correction d’un bug). Comparez le coût affiché avec une session équivalente sans rtk.

3. Voir les économies accumulées :

rtk gain

4. Découvrir les opportunités d’optimisation :

rtk discover

Commandes disponibles :

Catégorie Exemples
Fichiers rtk ls, rtk read, rtk find, rtk grep, rtk diff
Git rtk git status/log/diff/push/pull
Tests rtk pytest, rtk jest, rtk cargo test
Build/Lint rtk tsc, rtk ruff check, rtk cargo build
Containers rtk docker ps, rtk kubectl pods

Ce que vous cherchez : sur quel type de commande le gain est-il le plus fort ? Est-ce que la sortie filtrée reste suffisante pour que l’agent travaille correctement ?


Livrable

À la fin de ce TP :

  • Mesuré sa consommation sur une tâche réelle
  • Identifié deux tâches : une “Plan” (raisonnement), une “Act” (exécution)
  • Configuré un profil frugal dans son outil
  • Essayé le pattern pingre (Gemini gratuit → modèle cheap)
  • Visualisé sa consommation avec codeburn (codeburn optimize)
  • Réduit les tokens d’une session avec rtk (rtk gain)

Checkpoint

Question clé : Pour quelle tâche d’aujourd’hui auriez-vous pu utiliser un modèle moins cher ?

Pattern retenu : Phase Plan = raisonnement fort. Phase Act = modèle frugal.


Prochain module

Module 6 : Multimodal - screenshots, images, et au-delà.