Skip to content

إتقان هندسة RAG10 / 10

معمارية مرجعية الـ RAG للإنتاج

كل عنصر في مكانه: الاستيعاب، الاسترجاع الهجين، إعادة الترتيب، التوليد المدعوم بالمصادر، الضمانات، التقييم والتخزين المؤقت — الخطة التي يمكنك نشرها.

معمارية مرجعية الـ RAG للإنتاج

إليك النظام الكامل في صفحة واحدة — الخطة التي تحول المقالات التسع السابقة إلى شيء يمكنك نشره.

خط أنابيب الاستيعاب (دون الاتصال)

  1. نظّف المستندات المصدرية (أزل المحتوى الزائد، أصلح الترميز).
  2. قسّم بشكل هيكلي، 300–600 رمز، تداخل يقارب 15%.
  3. أثرِ كل مقطع بالبيانات الوصفية (المصدر، القسم، التاريخ، الرابط).
  4. ضمّن باستخدام نموذج مصدر معين.
  5. فهرّس في Postgres/pgvector مع فهرس ANN + فهرس كلمات أساسية.

خط أنابيب الاستعلام (مباشر)

  1. (اختياري) أعد صياغة الاستعلام باستخدام نموذج صغير.
  2. استرجع بشكل هجين — متجهات + كلمات أساسية، مندمجة بـ RRF، أفضل 30–50.
  3. أعد ترتيب باستخدام cross-encoder؛ احتفظ بأفضل 3–8.
  4. بوابة الثقة — إذا كانت أعلى درجة ضعيفة، أرجع "لا أعرف".
  5. وليّد مدعومًا بالمصادر، مع استشهادات، من المقاطع المحتفظ بها.
  6. تحقق من الأمانة في المخرجات؛ خزّن الإجابة مؤقتًا.

الحلقة التي تضمن الصدق

ضعها في إطار التقييم والمراقبة: شغّل مجموعة التقييم على كل تغيير (الاسترجاع، الأمانة، الملاءمة)، وسجّل الاستعلامات الفعلية مع درجات استرجاعها حتى تتمكن من توسيع مجموعة التقييم من الإنتاج.

هذا هو RAG للإنتاج: استرجاع قابل للقياس، توليد مدعوم بالمصادر، صادق تحت عدم اليقين، وميسور التكلفة في الحجم. لديك الآن الخريطة والآليات.

شارك هذا المقال

#RAG #LLM #AI

LinkedInX / TwitterBlueskyThreadsRedditHacker NewsWhatsAppبريد إلكتروني

السلسلة — إتقان هندسة RAG

  1. الجزء 01لماذا يفشل نظام RAG البسيط في الإنتاجعرض البحث المتجه بـ 50 سطر الذي يبهر في دفتر الملاحظات ينهار في اللحظة التي يطرح فيها المستخدمون الحقيقيون أسئلتهم الحقيقية. إليك السبب — والخريطة للخروج منها.
  2. الجزء 02تقسيم النصوص — القرار الذي يحدد حدودك الأعلىلا يمكنك استرجاع ما قسمته بشكل سيء. تقسيم النصوص هو أكثر الأدوات التي لا تحظى بالتقدير في RAG — والأرخص لتطبيقها بشكل صحيح.
  3. الجزء 03التضمينات وقواعد البيانات الموجهة 101التضمين يحول المعنى إلى هندسة. قاعدة البيانات الموجهة تجعل تلك الهندسة قابلة للبحث في أجزاء من الثانية. احصل على كليهما بشكل صحيح وتصبح الاسترجاعية سهلة.
  4. الجزء 04الاسترجاع الهجين — الكلمات الرئيسية + المتجهاتالبحث المتجهي يفهم المعنى لكن يتعثر على المصطلحات الدقيقة والمعرّفات والكلمات النادرة. البحث بالكلمات الرئيسية يحققها ويفتقد إعادة الصياغة. استخدم كليهما.
  5. الجزء 05إعادة الترتيب — الفوز السريع بالجودةالاسترجاع يحضر لك 30 مقطعاً معقولاً. معيد الترتيب يقرأها مقابل السؤال الفعلي ويرفع الأجزاء الملائمة حقاً إلى الأعلى.
  6. الجزء 06توجيه المولّد — التأسيس والاستشهاداتالاسترجاع الممتاز يضيع إن تجاهله النموذج أو لم يستطع الإشارة إلى مصادره. التأسيس هو انضباط في تصميم المحفزات، وليس إضافة لاحقة.
  7. الجزء 07التقييم — لا يمكنك تحسين ما لا تقيسهبدون مجموعة تقييم، كل تغيير في RAG مجرد انطباع. مع واحدة، تضبط التقسيم والاسترجاع والإشارات برقم يخبرك إن كنت ساعدت أم أضررت.
  8. الجزء 08التعامل مع الهلوسات والضمانات الأمنيةعندما لا يجد الاسترجاع شيئاً، ينسج النموذج الذكي إجابات من العدم. الضمانات الأمنية تحول "الخطأ الواثق" إلى "عدم التأكد الصادق" — الفرق الذي يثق به المستخدمون فعلاً.
  9. الجزء 09الانضباط في التكلفة والزمن الكامناستعلام RAG يلمس التضمينات وقاعدة بيانات المتجهات وإعادة الترتيب ونموذج اللغة. كل واحد يضيف الميلي ثواني والسنتات. في النطاق الكبير، الانضباط هنا هو الفرق بين الهامش والكارثة.
  10. الجزء 10معمارية مرجعية الـ RAG للإنتاجأنت هناكل عنصر في مكانه: الاستيعاب، الاسترجاع الهجين، إعادة الترتيب، التوليد المدعوم بالمصادر، الضمانات، التقييم والتخزين المؤقت — الخطة التي يمكنك نشرها.

تابع التعلّم

مهارة في الكتالوج

architecture

Architectural decision-making framework. Requirements analysis, trade-off evaluation, ADR documentation. Use when making architecture decisions or analyzing system design.

افتح المهارة ←

PDF — مدى الحياة

MCP

اربط Claude Code بأدواتك وبياناتك عبر Model Context Protocol.

انظر الـ PDF ←

الدورة

دورة Claude Mastery

12 وحدة · 5 لغات · شهادة · تجربة 3 أيام مجاناً.

الخطط ←
LinkedInX / TwitterBlueskyThreads