system-prompts-and-models-o.../dealix/docs/AGENT_OBSERVABILITY_EVALS.md
Sami Assiri b13cb389cc feat(dealix): sync full Dealix package to repo
- API routers, ACA modules, integrations (draft operators)
- Docs, landing pages, scripts (launch readiness, scorecard)
- Tests and CI workflow updates for Dealix

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-05-01 21:01:17 +03:00

22 lines
987 B
Markdown

# Agent Observability and Evals (Growth Tower)
أشكال JSON للتقييم والتتبع تمهّد لربط **Langfuse** أو أدوات مماثلة في staging/production.
## كود
- `auto_client_acquisition/agent_observability/trace_events.py``build_trace_event`
- `safety_eval.py` — تقييم أمان بسيط على النص العربي
- `saudi_tone_eval.py` — ملاءمة نبرة سعودية شكلية
- `eval_cases.py` — حالات مرجعية (توسيع لاحقاً)
## API
- `GET /api/v1/agent-observability/demo`
- `POST /api/v1/agent-observability/eval/safety``{ "text_ar": "..." }`
- `POST /api/v1/agent-observability/eval/saudi-tone``{ "text_ar": "..." }`
- `POST /api/v1/agent-observability/trace/build` — حقول workflow، policy_result، tool_called، إلخ
## خطوة تالية
عند تفعيل Langfuse: إرسال نفس الحقول كـ span attributes؛ راجع [`OBSERVABILITY_ENV.md`](OBSERVABILITY_ENV.md).