Découpage de texte RAG : chevauchement, export JSONL et réglages
Préparez vos documents pour la recherche vectorielle et le RAG : fenêtres fixes, chevauchement, export JSONL — en local.
Pourquoi le découpage compte
Le RAG découpe les documents, les vectorise et ne récupère que les passages pertinents. La qualité du découpage conditionne la pertinence des réponses.
Caractères vs tokens
L’outil FormaX RAG Chunker utilise des fenêtres de caractères avec chevauchement (rapide, local). En production, passez souvent au découpage par token.
JSONL
Chaque ligne : chunk_index, text, metadata.start/end — prêt pour votre base vectorielle.
Ouvrir l’outil — traitement dans le navigateur.