Dominar la ingeniería RAG4 / 10

Búsqueda Híbrida — Palabra clave + Vector

La búsqueda vectorial entiende significado pero falla con términos exactos, IDs y palabras raras. La búsqueda por palabra clave los domina y pierde la paráfrasis. Usa ambas.

Publicado el 9 may 20261 min de lecturaHaythem Rehouma · Claude Mastery

La búsqueda vectorial es excelente en "qué significa esto" y mala en "encuentra el fragmento que literalmente dice ERR_CONN_4032." La búsqueda por palabra clave es lo opuesto. La RAG en producción usa ambas.

Dónde gana cada una

Vector — paráfrasis, conceptos, "cómo cancelo" coincidiendo con "terminación de suscripción".
Palabra clave (BM25) — términos exactos, códigos de error, nombres de productos, acrónimos, jerga rara que el embedding suaviza.

Ejecuta ambas para cada consulta; obtienes dos listas ordenadas.

Fusionar listas con RRF

Reciprocal Rank Fusion combina listas ordenadas sin necesitar puntuaciones comparables: cada documento obtiene 1 / (k + rank) de cada lista, sumado. Los documentos que se clasifican bien en cualquiera de las listas ascienden; los documentos fuertes en ambas dominan.

score(doc) = Σ  1 / (k + rank_in_list_i)     # k ≈ 60

Es pocas líneas de código, no requiere calibración de puntuación, y supera de forma confiable a cualquiera de los recuperadores solos.

Dónde gana cada una

Fusionar listas con RRF

Compartir este artículo

Serie — Dominar la ingeniería RAG

Sigue aprendiendo

El curso Claude Mastery