Maîtriser l'ingénierie RAG3 / 10

Embeddings & Vector Stores 101

Un embedding transforme le sens en géométrie. Un vector store rend cette géométrie explorable en millisecondes. Maîtriser les deux, et la retrieval devient facile.

Publié le 7 mai 20262 min de lectureHaythem Rehouma · Claude Mastery

Un embedding mappe le texte à un point dans un espace haute-dimensionnel où la proximité signifie un sens similaire. La retrieval est alors simplement « trouver les points les plus proches de cette question ». Tout le reste est de la tuyauterie.

Choisir un modèle

Qualité vs. coût — les plus grands modèles capturent les nuances mieux mais coûtent plus par token et par requête.
Dimensions — plus de dimensions peuvent capturer davantage, mais coûtent en stockage et en temps de recherche. Beaucoup de systèmes en production se situent à 768–1536.
Cohérence — embeddez vos documents et vos requêtes avec le même modèle. Mélanger les modèles brouille la géométrie.

Où les stocker

pgvector (Postgres) — si vous exécutez déjà Postgres, commencez ici. Une base de données, transactionnelle, filtrable par métadonnées avec du SQL pur.
Vector DBs dédiées — préférez-les à grande échelle ou quand vous avez besoin de features d'index spécialisées. Ne commencez pas là pour un premier produit.

Les indexes maintiennent la vitesse

La recherche exacte du plus proche voisin est O(n) — acceptable à 10k vecteurs, pénible à 10M. Les indexes approximate nearest-neighbour (ANN) (HNSW, IVPFlat) échangent une trace de recall contre des ordres de magnitude de vitesse.

Les vecteurs seuls ratent les termes exacts et les mots-clés rares. Ensuite : les combiner avec la recherche par mots-clés — la retrieval hybride.

Choisir un modèle

Où les stocker

Les indexes maintiennent la vitesse

Skills Claude reliés à installer

Partager cet article

Série — Maîtriser l'ingénierie RAG

Continuer

database

Le cours Claude Mastery