📝
FormaX Team18 mai 20266 min

Découpage de texte RAG : chevauchement, export JSONL et réglages

Préparez vos documents pour la recherche vectorielle et le RAG : fenêtres fixes, chevauchement, export JSONL — en local.

RAGIATraitement de données

Pourquoi le découpage compte

Le RAG découpe les documents, les vectorise et ne récupère que les passages pertinents. La qualité du découpage conditionne la pertinence des réponses.

Caractères vs tokens

L’outil FormaX RAG Chunker utilise des fenêtres de caractères avec chevauchement (rapide, local). En production, passez souvent au découpage par token.

JSONL

Chaque ligne : chunk_index, text, metadata.start/end — prêt pour votre base vectorielle.

Ouvrir l’outil — traitement dans le navigateur.