Skip to content

إتقان هندسة RAG3 / 10

التضمينات وقواعد البيانات الموجهة 101

التضمين يحول المعنى إلى هندسة. قاعدة البيانات الموجهة تجعل تلك الهندسة قابلة للبحث في أجزاء من الثانية. احصل على كليهما بشكل صحيح وتصبح الاسترجاعية سهلة.

التضمينات وقواعد البيانات الموجهة 101

التضمين يرسم النص إلى نقطة في فضاء عالي الأبعاد حيث القُرب يعني تشابه المعنى. الاسترجاعية إذن مجرد "إيجاد أقرب النقاط لهذا السؤال". كل شيء آخر مجرد بنية تحتية.

اختيار نموذج

  • الجودة مقابل التكلفة — النماذج الأكبر تضمّن الدقائق بشكل أفضل لكن تكلف أكثر لكل رمز ولكل استعلام.
  • الأبعاد — المزيد من الأبعاد قد يلتقط أكثر، لكن يكلف التخزين ووقت البحث. العديد من الأنظمة الإنتاجية تجلس عند 768–1536.
  • الاتساق — ضمّن مستنداتك واستعلاماتك باستخدام نفس النموذج. خلط النماذج يشوه الهندسة.

حيث تخزنها

  • pgvector (Postgres) — إذا كنت تشغل بالفعل Postgres، ابدأ هنا. قاعدة بيانات واحدة، معاملات، قابلة للتصفية حسب البيانات الوصفية باستخدام SQL عادي.
  • قواعس بيانات موجهة مخصصة — استخدمها بنطاق واسع أو عندما تحتاج إلى ميزات فهرسة متخصصة. لا تبدأ هنا من أجل منتج أول.

الفهارس تحافظ عليها سريعة

بحث الجار الأقرب الدقيق هو O(n) — جيد عند 10k متجه، مؤلم عند 10M. فهارس البحث عن الجار الأقرب التقريبي (ANN) (HNSW, IVPFlat) تبادل جزء صغير من الاستدعاء بسرعة بأوامر أكبر من حيث الحجم.

المتجهات وحدها تفتقد المصطلحات الدقيقة والكلمات المفتاحية النادرة. بعده: دمجها مع البحث عن الكلمات المفتاحية — الاسترجاعية الهجينة.

شارك هذا المقال

#VectorDB #RAG #AI

LinkedInX / TwitterBlueskyThreadsRedditHacker NewsWhatsAppبريد إلكتروني

السلسلة — إتقان هندسة RAG

  1. الجزء 01لماذا يفشل نظام RAG البسيط في الإنتاجعرض البحث المتجه بـ 50 سطر الذي يبهر في دفتر الملاحظات ينهار في اللحظة التي يطرح فيها المستخدمون الحقيقيون أسئلتهم الحقيقية. إليك السبب — والخريطة للخروج منها.
  2. الجزء 02تقسيم النصوص — القرار الذي يحدد حدودك الأعلىلا يمكنك استرجاع ما قسمته بشكل سيء. تقسيم النصوص هو أكثر الأدوات التي لا تحظى بالتقدير في RAG — والأرخص لتطبيقها بشكل صحيح.
  3. الجزء 03التضمينات وقواعد البيانات الموجهة 101أنت هناالتضمين يحول المعنى إلى هندسة. قاعدة البيانات الموجهة تجعل تلك الهندسة قابلة للبحث في أجزاء من الثانية. احصل على كليهما بشكل صحيح وتصبح الاسترجاعية سهلة.
  4. الجزء 04الاسترجاع الهجين — الكلمات الرئيسية + المتجهاتالبحث المتجهي يفهم المعنى لكن يتعثر على المصطلحات الدقيقة والمعرّفات والكلمات النادرة. البحث بالكلمات الرئيسية يحققها ويفتقد إعادة الصياغة. استخدم كليهما.
  5. الجزء 05إعادة الترتيب — الفوز السريع بالجودةالاسترجاع يحضر لك 30 مقطعاً معقولاً. معيد الترتيب يقرأها مقابل السؤال الفعلي ويرفع الأجزاء الملائمة حقاً إلى الأعلى.
  6. الجزء 06توجيه المولّد — التأسيس والاستشهاداتالاسترجاع الممتاز يضيع إن تجاهله النموذج أو لم يستطع الإشارة إلى مصادره. التأسيس هو انضباط في تصميم المحفزات، وليس إضافة لاحقة.
  7. الجزء 07التقييم — لا يمكنك تحسين ما لا تقيسهبدون مجموعة تقييم، كل تغيير في RAG مجرد انطباع. مع واحدة، تضبط التقسيم والاسترجاع والإشارات برقم يخبرك إن كنت ساعدت أم أضررت.
  8. الجزء 08التعامل مع الهلوسات والضمانات الأمنيةعندما لا يجد الاسترجاع شيئاً، ينسج النموذج الذكي إجابات من العدم. الضمانات الأمنية تحول "الخطأ الواثق" إلى "عدم التأكد الصادق" — الفرق الذي يثق به المستخدمون فعلاً.
  9. الجزء 09الانضباط في التكلفة والزمن الكامناستعلام RAG يلمس التضمينات وقاعدة بيانات المتجهات وإعادة الترتيب ونموذج اللغة. كل واحد يضيف الميلي ثواني والسنتات. في النطاق الكبير، الانضباط هنا هو الفرق بين الهامش والكارثة.
  10. الجزء 10معمارية مرجعية الـ RAG للإنتاجكل عنصر في مكانه: الاستيعاب، الاسترجاع الهجين، إعادة الترتيب، التوليد المدعوم بالمصادر، الضمانات، التقييم والتخزين المؤقت — الخطة التي يمكنك نشرها.

تابع التعلّم

مهارة في الكتالوج

database

Database development and operations workflow covering SQL, NoSQL, database design, migrations, optimization, and data engineering.

افتح المهارة ←

الدورة

دورة Claude Mastery

12 وحدة · 5 لغات · شهادة · تجربة 3 أيام مجاناً.

الخطط ←
LinkedInX / TwitterBlueskyThreads