Стейкхолдер ▾
Период: Последняя неделя ▾
| Стейкхолдер | Код требования | Название требования | Агенты с отклонениями |
|---|---|---|---|
| ▾AEF | AEF-1 | Обязательные HTTP-заголовки | 46 |
| ▾ДТН | ДТН-1 | Уникальная идентификация AI-агентов | 48 |
| ▾ДТН | ДТН-2 | Уникальная идентификация выполняемых агентами операций | 64 |
| ▾УЭК | УЭК-1 | Для всех операций, выполненных AI-агентом, должен проставляться признак агентности | 61 |
| ▾ДКА | ДКА-1 | Запрещается размещение нескольких ИИ-Агентов (Модулей) в одном namespace | 2 |
| ▾ДКА | ДКА-2 | Агент должен быть подключен к AEF | 410 |
| ▾ДКА | ДКА-3 | Архитектурная проверка признаков агента и ФП AEF Container в META | 178 |
| ДКА-3.1 | КЭ агента не найден в META | 2 | |
| ДКА-3.2 | Агент в META имеет неверный код «основной классификации», должен быть: M05.13.04 | 46 | |
| ДКА-3.3 | Агент не является «модулем» в META | 101 | |
| ДКА-3.4 | ФП типа AEF Container в META имеет неверный код «основной классификации», должен быть: M05.13.03 | 68 | |
| ДКА-3.5 | Не найден ФП типа AEF Container для Агента | 93 |
| Название guardrail | Версия | Команда владелец | Подключенные агенты |
|---|---|---|---|
| Детекция промпт инъекций | v0.3 | команда блока Риски | 1 |
| Детекция галюцинаций | v0.1 | команда БТР | 0 |
| Rean-only transactions | v0.1 | команда БТР | 0 |
Results List
Evaluation ▾
Период: 7 дней ▾
Статус: completed ▾
Trigger: manual ▾
Environment: prod ▾
| Run ID | Evaluation | AI агент | Период данных | Статус | Processed/Total | Final Score | Avg Confidence | Errors | Duration | Updated At | Actions |
|---|---|---|---|---|---|---|---|---|---|---|---|
| run_20260310_221 | Hallucination v1 | agent-aef-01 | 10.03 18:00–20:00 | Completed | 240/240 | 0.93 | 0.88 | 0 | 2m 14s | 10.03.2026 20:31 | Открыть · Экспорт |
| run_20260310_222 | Policy P1 | agent-aef-03 | 10.03 18:00–20:00 | Completed | 180/180 | 0.97 | 0.91 | 0 | 1m 49s | 10.03.2026 20:36 | Открыть · Сравнить |
| run_20260310_223 | Relevance #14 | agent-aef-07 | 10.03 19:00–20:00 | Failed | 112/160 | — | — | 7 | 3m 02s | 10.03.2026 20:41 | Открыть · Показать ошибку |
| run_20260310_224 | Safety Audit | agent-aef-02 | 10.03 17:00–18:00 | Canceled | 56/220 | — | — | 1 | 0m 47s | 10.03.2026 20:44 | Открыть · Экспорт |
«
‹
1
›
»
Всего записей: 1240 2050100
Result Details
LLM-as-a-Judge / Results List / run_20260310_221
Evaluation: Hallucination Check v1 (v3)
Status: Completed
AI агент: agent-aef-01
Trigger: scheduled
Started At: 10.03.2026 20:29
Finished At: 10.03.2026 20:31
Final Score
0.93
Avg Confidence
0.88
Processed/Total
240/240
Errors
0
Duration
2m 14s
Cost (est.)
$1.42
Prompt: all ▾
Score: all ▾
Confidence: all ▾
Errors only: off ▾
Schema parse: all ▾
| Trace ID | Agent | Prompt | Structured Score | Confidence | Contribution | Status | Errors | Latency | Tokens | Timestamp | Actions |
|---|---|---|---|---|---|---|---|---|---|---|---|
| tr_000912 | agent-aef-01 | hallucination | 0.96 | 0.90 | 0.32 | OK | 0 | 420ms | 1820 | 10.03 20:30 | Открыть · Trace |
| tr_000913 | agent-aef-01 | policy | 0.91 | 0.86 | 0.30 | OK | 0 | 510ms | 2044 | 10.03 20:30 | Открыть · Trace |
| tr_000914 | agent-aef-01 | relevance | 0.88 | 0.81 | 0.29 | Warn | 1 | 690ms | 2411 | 10.03 20:31 | Открыть · Raw |
Score Breakdown
| Prompt | Avg score | Weight | Contribution |
|---|---|---|---|
| hallucination | 0.96 | 35% | 0.34 |
| policy | 0.91 | 35% | 0.32 |
| relevance | 0.88 | 30% | 0.27 |
| Final Score | 0.93 | ||
«
‹
1
›
»
Всего trace: 240 2050100
Active Runs
Evaluation ▾
Статус: running ▾
Период запуска: сегодня ▾
Trigger: scheduled ▾
Environment: prod ▾
| Run ID | Evaluation | AI агент | Trigger | Статус | Progress | ETA | Errors | Started At | Updated At | Duration | Actions |
|---|---|---|---|---|---|---|---|---|---|---|---|
| run_20260310_224 | Guardrails Drift Monitor | agent-aef-07 | scheduled | Running | 124/320 (38%) | 4m 10s | 0 | 10.03.2026 20:58 | 10.03.2026 21:30 | 32m | Открыть · Отменить |
| run_20260310_225 | Answer Quality RU Benchmark | agent-aef-05 | manual | Running | 43/180 (24%) | 6m 40s | 1 | 10.03.2026 21:05 | 10.03.2026 21:30 | 25m | Открыть · Отменить |
| run_20260310_226 | Policy Consistency Live | agent-aef-01 | api | Queued | 0/240 (0%) | — | 0 | 10.03.2026 21:27 | 10.03.2026 21:30 | 3m | Открыть · Отменить |
«
‹
1
›
»
Всего активных: 37 2050100
Evaluations
Статус: active ▾
Scope: project ▾
Модель: GigaChat-2 Max ▾
Schedule: cron ▾
Has active runs ▾
| Evaluation ID | Название | Scope | Prompts | Model | Schedule | Статус | Last Run | Next Run | Updated At | Actions |
|---|---|---|---|---|---|---|---|---|---|---|
| eval_aaJ_001 | Hallucination Check v1 | project | 3 | GigaChat-2 Pro | 2h interval | Active | 10.03 20:31 | 10.03 22:31 | 10.03 20:35 | Открыть · Запустить |
| eval_aaJ_014 | Policy Compliance P1 | org | 2 | Llama 3.1 70B Instruct | cron 0 * * * * | Active | 10.03 20:36 | 10.03 21:00 | 10.03 20:40 | Открыть · Клонировать |
| eval_aaJ_023 | Answer Quality RU | agent | 1 | Qwen2.5 72B Instruct | manual | Draft | — | — | 10.03 21:12 | Открыть · Запустить |
| eval_aaJ_030 | Legacy Safety Suite | project | 4 | GigaChat-2 Max | paused | Archived | 09.03 18:17 | — | 09.03 18:20 | Открыть · Активировать |
«
‹
1
›
»
Всего записей: 286 2050100
Evaluation Editor