Add validator stats #277

stephen-ridges · 2025-12-16T21:47:40Z

test

curl 'localhost:8000/statistics/validator-stats' | jq

[
  {
    "validator_hotkey": "5Djyacas3eWLPhCKsS3neNSJonzfxJmD3gcrMTFDc4eHsn62",
    "num_evals": 29,
    "num_eval_runs": 870,
    "num_success_eval_runs": 660,
    "num_pass_eval_runs": 549,
    "num_fail_eval_runs": 111,
    "num_error_eval_runs": 210,
    "error_code_distribution": [
      {
        "error_code": 1010,
        "count": 17
      },
      {
        "error_code": 1030,
        "count": 5
      },
      {
        "error_code": 1040,
        "count": 6
      },
      {
        "error_code": 2030,
        "count": 19
      },
      {
        "error_code": 3010,
        "count": 162
      },
      {
        "error_code": 3040,
        "count": 1
      }
    ],
    "num_inferences": 43646,
    "num_embeddings": 0,
    "runtime_min": 52.752239,
    "runtime_q1": 236.52183825,
    "runtime_median": 389.8414945,
    "runtime_q3": 604.1585685,
    "runtime_max": 2019.011268,
    "runtime_mean": 503.9523834574713,
    "score_min": 0.6666666666666666,
    "score_q1": 0.7931034482758621,
    "score_median": 0.8275862068965517,
    "score_q3": 0.864367816091954,
    "score_max": 1.0,
    "score_mean": 0.8281472593175321
  },
  {
    "validator_hotkey": "5DP7gcGeTfGfmCzxVNCXQvWBxu58TrrkdikuHQNnGDYb7THU",
    "num_evals": 28,
    "num_eval_runs": 840,
    "num_success_eval_runs": 765,
    "num_pass_eval_runs": 596,
    "num_fail_eval_runs": 169,
    "num_error_eval_runs": 48,
    "error_code_distribution": [
      {
        "error_code": 1010,
        "count": 15
      },
      {
        "error_code": 1030,
        "count": 4
      },
      {
        "error_code": 1040,
        "count": 8
      },
      {
        "error_code": 2030,
        "count": 21
      }
    ],
    "num_inferences": 48293,
    "num_embeddings": 0,
    "runtime_min": 54.798956,
    "runtime_q1": 276.158653,
    "runtime_median": 499.452816,
    "runtime_q3": 942.801174,
    "runtime_max": 2016.261121,
    "runtime_mean": 625.9271380332103,
    "score_min": 0.13793103448275862,
    "score_q1": 0.7646551724137931,
    "score_median": 0.8,
    "score_q3": 0.8333333333333334,
    "score_max": 1.0,
    "score_mean": 0.7888139547006541
  },
  {
    "validator_hotkey": "5Eho9y6iF5aTdKS28Awn2pKTd4dFsJ2o3shGtj1vjnLiaKJ1",
    "num_evals": 26,
    "num_eval_runs": 780,
    "num_success_eval_runs": 708,
    "num_pass_eval_runs": 589,
    "num_fail_eval_runs": 119,
    "num_error_eval_runs": 53,
    "error_code_distribution": [
      {
        "error_code": 1010,
        "count": 9
      },
      {
        "error_code": 1030,
        "count": 2
      },
      {
        "error_code": 1040,
        "count": 3
      },
      {
        "error_code": 2030,
        "count": 4
      },
      {
        "error_code": 2050,
        "count": 1
      },
      {
        "error_code": 3010,
        "count": 34
      }
    ],
    "num_inferences": 46891,
    "num_embeddings": 0,
    "runtime_min": 52.655188,
    "runtime_q1": 257.920912,
    "runtime_median": 506.908415,
    "runtime_q3": 883.121004,
    "runtime_max": 1985.980096,
    "runtime_mean": 626.678842303548,
    "score_min": 0.7333333333333333,
    "score_q1": 0.8,
    "score_median": 0.8333333333333334,
    "score_q3": 0.8666666666666667,
    "score_max": 0.96,
    "score_mean": 0.8348007435731575
  },
  {
    "validator_hotkey": "5F4U4P2j3ctdDS45naSUCxzYAHWTHarsY5JQdcRmMkc8UQZM",
    "num_evals": 15,
    "num_eval_runs": 450,
    "num_success_eval_runs": 380,
    "num_pass_eval_runs": 309,
    "num_fail_eval_runs": 71,
    "num_error_eval_runs": 44,
    "error_code_distribution": [
      {
        "error_code": 1010,
        "count": 15
      },
      {
        "error_code": 1030,
        "count": 1
      },
      {
        "error_code": 1040,
        "count": 28
      }
    ],
    "num_inferences": 32182,
    "num_embeddings": 0,
    "runtime_min": 58.744692,
    "runtime_q1": 395.6401315,
    "runtime_median": 667.9119595,
    "runtime_q3": 1307.74835175,
    "runtime_max": 1457.701344,
    "runtime_mean": 786.1880111014151,
    "score_min": 0.5,
    "score_q1": 0.7666666666666667,
    "score_median": 0.8214285714285714,
    "score_q3": 0.875,
    "score_max": 1.0,
    "score_mean": 0.8043926954271784
  },
  {
    "validator_hotkey": "5FZ1BFw8eRMAFK5zwJdyefrsn51Lrm217WKbo3MmdFH65YRr",
    "num_evals": 28,
    "num_eval_runs": 840,
    "num_success_eval_runs": 794,
    "num_pass_eval_runs": 655,
    "num_fail_eval_runs": 139,
    "num_error_eval_runs": 46,
    "error_code_distribution": [
      {
        "error_code": 1010,
        "count": 12
      },
      {
        "error_code": 1030,
        "count": 3
      },
      {
        "error_code": 1040,
        "count": 25
      },
      {
        "error_code": 2030,
        "count": 6
      }
    ],
    "num_inferences": 42502,
    "num_embeddings": 0,
    "runtime_min": 64.820901,
    "runtime_q1": 271.2241785,
    "runtime_median": 451.784797,
    "runtime_q3": 816.11955375,
    "runtime_max": 2037.913946,
    "runtime_mean": 591.1523640119048,
    "score_min": 0.0,
    "score_q1": 0.7864942528735632,
    "score_median": 0.8333333333333334,
    "score_q3": 0.8620689655172413,
    "score_max": 0.9655172413793104,
    "score_mean": 0.8027460121979827
  },
  {
    "validator_hotkey": "5G8iwBWxPjCfu9Fc3jFP37j1Ax5KypDDmUPUSoS9aWAsSCGT",
    "num_evals": 5,
    "num_eval_runs": 150,
    "num_success_eval_runs": 148,
    "num_pass_eval_runs": 123,
    "num_fail_eval_runs": 25,
    "num_error_eval_runs": 2,
    "error_code_distribution": [
      {
        "error_code": 1010,
        "count": 2
      }
    ],
    "num_inferences": 9918,
    "num_embeddings": 0,
    "runtime_min": 101.742604,
    "runtime_q1": 472.8019265,
    "runtime_median": 732.8819715,
    "runtime_q3": 1063.87969725,
    "runtime_max": 1412.258963,
    "runtime_mean": 779.5809769266667,
    "score_min": 0.7666666666666667,
    "score_q1": 0.8275862068965517,
    "score_median": 0.8275862068965517,
    "score_q3": 0.8333333333333334,
    "score_max": 0.9,
    "score_mean": 0.8310344827586207
  },
  {
    "validator_hotkey": "5GgJptBaUiWwb8SQDinZ9rDQoVw47mgduXaCLHeJGTtA4JMS",
    "num_evals": 28,
    "num_eval_runs": 840,
    "num_success_eval_runs": 802,
    "num_pass_eval_runs": 635,
    "num_fail_eval_runs": 167,
    "num_error_eval_runs": 19,
    "error_code_distribution": [
      {
        "error_code": 1010,
        "count": 16
      },
      {
        "error_code": 1030,
        "count": 2
      },
      {
        "error_code": 1040,
        "count": 1
      }
    ],
    "num_inferences": 40165,
    "num_embeddings": 0,
    "runtime_min": 41.755376,
    "runtime_q1": 233.363499,
    "runtime_median": 410.551568,
    "runtime_q3": 795.735867,
    "runtime_max": 2014.430379,
    "runtime_mean": 554.8625626772229,
    "score_min": 0.21428571428571427,
    "score_q1": 0.775,
    "score_median": 0.8107142857142857,
    "score_q3": 0.8620689655172413,
    "score_max": 0.8666666666666667,
    "score_mean": 0.790580120937264
  },
  {
    "validator_hotkey": "5GuRsre3hqm6WKWRCqVxXdM4UtGs457nDhPo9F5wvJ16Ys62",
    "num_evals": 28,
    "num_eval_runs": 840,
    "num_success_eval_runs": 788,
    "num_pass_eval_runs": 646,
    "num_fail_eval_runs": 142,
    "num_error_eval_runs": 35,
    "error_code_distribution": [
      {
        "error_code": 1010,
        "count": 20
      },
      {
        "error_code": 1030,
        "count": 2
      },
      {
        "error_code": 1040,
        "count": 8
      },
      {
        "error_code": 2030,
        "count": 5
      }
    ],
    "num_inferences": 44132,
    "num_embeddings": 0,
    "runtime_min": 71.754419,
    "runtime_q1": 274.89471549999996,
    "runtime_median": 487.842983,
    "runtime_q3": 939.434906,
    "runtime_max": 1905.239704,
    "runtime_mean": 617.1634543487241,
    "score_min": 0.7333333333333333,
    "score_q1": 0.7864942528735632,
    "score_median": 0.8214285714285714,
    "score_q3": 0.8632183908045976,
    "score_max": 0.9583333333333334,
    "score_mean": 0.8223356690092073
  },
  {
    "validator_hotkey": "5HmkM6X1D3W3CuCSPuHhrbYyZNBy2aGAiZy9NczoJmtY25H7",
    "num_evals": 28,
    "num_eval_runs": 840,
    "num_success_eval_runs": 746,
    "num_pass_eval_runs": 586,
    "num_fail_eval_runs": 160,
    "num_error_eval_runs": 69,
    "error_code_distribution": [
      {
        "error_code": 1010,
        "count": 17
      },
      {
        "error_code": 1030,
        "count": 4
      },
      {
        "error_code": 1040,
        "count": 25
      },
      {
        "error_code": 2030,
        "count": 23
      }
    ],
    "num_inferences": 37334,
    "num_embeddings": 0,
    "runtime_min": 63.370002,
    "runtime_q1": 302.40956300000005,
    "runtime_median": 482.100486,
    "runtime_q3": 968.2666334999999,
    "runtime_max": 2021.478016,
    "runtime_mean": 637.6923888404908,
    "score_min": 0.1724137931034483,
    "score_q1": 0.789272030651341,
    "score_median": 0.8074074074074074,
    "score_q3": 0.8632183908045976,
    "score_max": 1.0,
    "score_mean": 0.783898923554096
  }
]

Add validator stats

95a8bce

stephen-ridges self-assigned this Dec 16, 2025

stephen-ridges marked this pull request as draft December 16, 2025 21:47

stephen-ridges marked this pull request as ready for review December 16, 2025 22:18

stephen-ridges force-pushed the add-validator-stats branch from b7ba543 to 2277c07 Compare December 17, 2025 15:41

clean

bd17078

stephen-ridges force-pushed the add-validator-stats branch from 2277c07 to bd17078 Compare December 17, 2025 15:42

Fix validator stats query

fa733d1

stephen-ridges force-pushed the add-validator-stats branch from 91250b9 to fa733d1 Compare December 19, 2025 21:53

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Add validator stats #277

Add validator stats #277

Uh oh!

stephen-ridges commented Dec 16, 2025 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Add validator stats #277

Are you sure you want to change the base?

Add validator stats #277

Uh oh!

Conversation

stephen-ridges commented Dec 16, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

stephen-ridges commented Dec 16, 2025 •

edited

Loading