system-prompts-and-models-o.../dealix/docs/AI_OBSERVABILITY_AND_EVALS.md
2026-05-01 14:03:52 +03:00

25 lines
915 B
Markdown

# المراقبة والتقييم — AI في Dealix
## ماذا نتتبع
- إصدارات الـ prompts والنماذج (عبر Langfuse لاحقاً).
- تكلفة/سير عمل، زمن، معدل إكمال.
- معدل موافقة على المسودات، معدل حظر إجراءات خطرة.
- جودة العربية (عينة بشرية + قواعد).
- امتثال الاتصال.
- إسناد النتائج للإيرادات (عبر Revenue Memory).
## ماذا لا نسجل
- محتوى يحتوي أسراراً خام.
- PII غير ضرورر في السجلات.
## التوصية التقنية
- **Langfuse**: prompts/evals/traces.
- **OpenAI Agents SDK**: tracing لمسارات الوكلاء.
- **Sentry**: استثناءات.
- **OpenTelemetry**: طلبات API.
الكود الحالي: تكامل اختياري في `api/main.py` عند توفر `dealix.observability`.