system-prompts-and-models-o.../dealix/docs/AI_OBSERVABILITY_AND_EVALS.md

# المراقبة والتقييم — AI في Dealix

## ماذا نتتبع

- إصدارات الـ prompts والنماذج (عبر Langfuse لاحقاً).
- تكلفة/سير عمل، زمن، معدل إكمال.
- معدل موافقة على المسودات، معدل حظر إجراءات خطرة.
- جودة العربية (عينة بشرية + قواعد).
- امتثال الاتصال.
- إسناد النتائج للإيرادات (عبر Revenue Memory).

## ماذا لا نسجل

- محتوى يحتوي أسراراً خام.
- PII غير ضرورر في السجلات.

## التوصية التقنية

- **Langfuse**: prompts/evals/traces.
- **OpenAI Agents SDK**: tracing لمسارات الوكلاء.
- **Sentry**: استثناءات.
- **OpenTelemetry**: طلبات API.

الكود الحالي: تكامل اختياري في `api/main.py` عند توفر `dealix.observability`.