system-prompts-and-models-o.../dealix/docs/AI_OBSERVABILITY_AND_EVALS.md
2026-05-01 14:03:52 +03:00

915 B

المراقبة والتقييم — AI في Dealix

ماذا نتتبع

  • إصدارات الـ prompts والنماذج (عبر Langfuse لاحقاً).
  • تكلفة/سير عمل، زمن، معدل إكمال.
  • معدل موافقة على المسودات، معدل حظر إجراءات خطرة.
  • جودة العربية (عينة بشرية + قواعد).
  • امتثال الاتصال.
  • إسناد النتائج للإيرادات (عبر Revenue Memory).

ماذا لا نسجل

  • محتوى يحتوي أسراراً خام.
  • PII غير ضرورر في السجلات.

التوصية التقنية

  • Langfuse: prompts/evals/traces.
  • OpenAI Agents SDK: tracing لمسارات الوكلاء.
  • Sentry: استثناءات.
  • OpenTelemetry: طلبات API.

الكود الحالي: تكامل اختياري في api/main.py عند توفر dealix.observability.