mlcommons
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/accuracy.txt
+1-1 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/accuracy.txt
+1-1
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/baseline_accuracy.txt
+1-1 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/baseline_accuracy.txt
+1-1
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/compliance_accuracy.txt
+1-1 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/compliance_accuracy.txt
+1-1
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/mlperf_log_accuracy.json
+13-13 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/mlperf_log_accuracy.json
+13-13
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/performance/run_1/mlperf_log_detail.txt
+88-88 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/performance/run_1/mlperf_log_detail.txt
+88-88
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/performance/run_1/mlperf_log_summary.txt
+12-12 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/performance/run_1/mlperf_log_summary.txt
+12-12
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/verify_accuracy.txt
+3-3 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/verify_accuracy.txt
+3-3
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/verify_performance.txt
+2-2 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/verify_performance.txt
+2-2
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/accuracy/accuracy.txt
+1-1 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/accuracy/accuracy.txt
+1-1
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/accuracy/mlperf_log_accuracy.json
+6-6 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/accuracy/mlperf_log_accuracy.json
+6-6
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/performance/run_1/mlperf_log_detail.txt
+92-92 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/performance/run_1/mlperf_log_detail.txt
+92-92
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/performance/run_1/mlperf_log_summary.txt
+17-17 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/performance/run_1/mlperf_log_summary.txt
+17-17
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/verify_accuracy.txt
+2-2 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/verify_accuracy.txt
+2-2
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/verify_performance.txt
+2-2 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/verify_performance.txt
+2-2
diff --git a/‎closed/MLCommons/measurements/RTX4090x2-nvidia-gpu-TensorRT-default_config/README.md
+4-4 b/‎closed/MLCommons/measurements/RTX4090x2-nvidia-gpu-TensorRT-default_config/README.md
+4-4
diff --git a/‎closed/MLCommons/measurements/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/README.md
+2-2 b/‎closed/MLCommons/measurements/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/README.md
+2-2
@@ -1,2 +1,2 @@
 
-hash=ea3f356fca2cfea2b93131598739033cf0afa4f030ff951822a60acb2c787d7c
+hash=d6d57dfc881e436890fbe7b248bba63650116117012f5b4a0628346481f4ebdb
@@ -1,4 +1,4 @@
-{"exact_match": 25.97918637653737, "f1": 28.36486682551724}
+{"exact_match": 25.76158940397351, "f1": 27.99745717265541}
 Reading examples...
 No cached features at 'eval_features.pickle'... converting from examples...
 Creating tokenizer...
 
@@ -1,4 +1,4 @@
-{"exact_match": 25.97918637653737, "f1": 28.36486682551724}
+{"exact_match": 25.75212866603595, "f1": 27.995565025067897}
 Reading examples...
 Loading cached features from 'eval_features.pickle'...
 Loading LoadGen logs...
 
@@ -4,7 +4,7 @@ MLPerf Results Summary
 SUT name : BERT SERVER
 Scenario : Offline
 Mode     : PerformanceOnly
-Samples per second: 3336.41
+Samples per second: 8249
 Result is : VALID
   Min duration satisfied : Yes
   Min queries satisfied : Yes
@@ -13,21 +13,21 @@ Result is : VALID
 ================================================
 Additional Stats
 ================================================
-Min latency (ns)                : 1106035681
-Max latency (ns)                : 666942028563
-Mean latency (ns)               : 403174469057
-50.00 percentile latency (ns)   : 429281320374
-90.00 percentile latency (ns)   : 635878977169
-95.00 percentile latency (ns)   : 654301430601
-97.00 percentile latency (ns)   : 660400377264
-99.00 percentile latency (ns)   : 665211612256
-99.90 percentile latency (ns)   : 666796267079
+Min latency (ns)                : 1470245857
+Max latency (ns)                : 667411550599
+Mean latency (ns)               : 404693085129
+50.00 percentile latency (ns)   : 430908471157
+90.00 percentile latency (ns)   : 636414697498
+95.00 percentile latency (ns)   : 654750714519
+97.00 percentile latency (ns)   : 660774538506
+99.00 percentile latency (ns)   : 665604516280
+99.90 percentile latency (ns)   : 667266850144
 
 ================================================
 Test Parameters Used
 ================================================
-samples_per_query : 2225190
-target_qps : 3371.5
+samples_per_query : 5505476
+target_qps : 8341.63
 target_latency (ns): 0
 max_async_queries : 1
 min_duration (ms): 600000
 
@@ -4,9 +4,9 @@ Reading performance mode results...
 num_acc_log_entries = 10833
 num_acc_log_duplicate_keys = 0
 num_acc_log_data_mismatch = 0
-num_perf_log_entries = 4085
-num_perf_log_qsl_idx_match = 4085
-num_perf_log_data_mismatch = 51
+num_perf_log_entries = 4019
+num_perf_log_qsl_idx_match = 4019
+num_perf_log_data_mismatch = 22
 num_missing_qsl_idxs = 0
 TEST FAIL
 
@@ -1,4 +1,4 @@
 Verifying performance.
-reference score = 3338.12
-test score = 3336.41
+reference score = 8259.04
+test score = 8249
 TEST PASS
@@ -1,2 +1,2 @@
 
-hash=66666b875ec9add3cf67a97dcd7ec698343c18f39b71534a0bbbb93a5d1fbea5
+hash=aded1916a0bd347aa82fd4cb88eeda19fcca051529aa6f5667e44d1fa35ec704
@@ -4,38 +4,38 @@ MLPerf Results Summary
 SUT name : BERT SERVER
 Scenario : SingleStream
 Mode     : PerformanceOnly
-90th percentile latency (ns) : 2175885
+90th percentile latency (ns) : 1032715
 Result is : VALID
   Min duration satisfied : Yes
   Min queries satisfied : Yes
   Early stopping satisfied: Yes
 Early Stopping Result:
- * Processed at least 64 queries (390974).
- * Would discard 38660 highest latency queries.
- * Early stopping 90th percentile estimate: 2176629
- * Early stopping 99th percentile estimate: 2639196
+ * Processed at least 64 queries (633200).
+ * Would discard 62763 highest latency queries.
+ * Early stopping 90th percentile estimate: 1033384
+ * Early stopping 99th percentile estimate: 1212429
 
 ================================================
 Additional Stats
 ================================================
-QPS w/ loadgen overhead         : 651.62
-QPS w/o loadgen overhead        : 654.05
+QPS w/ loadgen overhead         : 1055.33
+QPS w/o loadgen overhead        : 1061.80
 
-Min latency (ns)                : 1166035
-Max latency (ns)                : 8220655
-Mean latency (ns)               : 1528935
-50.00 percentile latency (ns)   : 1444284
-90.00 percentile latency (ns)   : 2175885
-95.00 percentile latency (ns)   : 2364222
-97.00 percentile latency (ns)   : 2611718
-99.00 percentile latency (ns)   : 2638638
-99.90 percentile latency (ns)   : 2662118
+Min latency (ns)                : 852823
+Max latency (ns)                : 6205619
+Mean latency (ns)               : 941799
+50.00 percentile latency (ns)   : 923597
+90.00 percentile latency (ns)   : 1032715
+95.00 percentile latency (ns)   : 1140001
+97.00 percentile latency (ns)   : 1190451
+99.00 percentile latency (ns)   : 1212173
+99.90 percentile latency (ns)   : 1223493
 
 ================================================
 Test Parameters Used
 ================================================
 samples_per_query : 1
-target_qps : 1635.21
+target_qps : 2664.61
 target_latency (ns): 0
 max_async_queries : 1
 min_duration (ms): 600000
 
@@ -4,8 +4,8 @@ Reading performance mode results...
 num_acc_log_entries = 10833
 num_acc_log_duplicate_keys = 0
 num_acc_log_data_mismatch = 0
-num_perf_log_entries = 1626
-num_perf_log_qsl_idx_match = 1626
+num_perf_log_entries = 1656
+num_perf_log_qsl_idx_match = 1656
 num_perf_log_data_mismatch = 0
 num_missing_qsl_idxs = 0
 TEST PASS
 
@@ -1,4 +1,4 @@
 Verifying performance.
-reference score = 2176777
-test score = 2176629
+reference score = 1030312
+test score = 1033384
 TEST PASS
@@ -1,4 +1,4 @@
-| Model        | Scenario     |   Accuracy |   Throughput | Latency (in ms)   | Power Efficiency (in samples/J)   | TEST01   |
-|--------------|--------------|------------|--------------|-------------------|-----------------------------------|----------|
-| 3d-unet-99.9 | singlestream |    0.86236 |        2.32  | 431.066           |                                   | passed   |
-| 3d-unet-99.9 | offline      |    0.86236 |        8.318 | -                 |                                   | passed   |
+| Model   | Scenario     |   Accuracy |   Throughput | Latency (in ms)   | Power Efficiency (in samples/J)   | TEST01   |
+|---------|--------------|------------|--------------|-------------------|-----------------------------------|----------|
+| bert-99 | singlestream |    90.2668 |      970.874 | 1.03              |                                   | passed   |
+| bert-99 | offline      |    90.1528 |     8259.04  | -                 |                                   | passed   |
@@ -38,7 +38,7 @@ Platform: RTX4090x2-nvidia-gpu-TensorRT-default_config
 Model Precision: fp16
 
 ### Accuracy Results 
-`F1`: `90.88324`, Required accuracy for closed division `>= 90.78313`
+`F1`: `90.15279`, Required accuracy for closed division `>= 89.96526`
 
 ### Performance Results 
-`Samples per second`: `3338.12`
+`Samples per second`: `8259.04`
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,2 @@`
`1`	`1`
`2`		`-hash=ea3f356fca2cfea2b93131598739033cf0afa4f030ff951822a60acb2c787d7c`
	`2`	`+hash=d6d57dfc881e436890fbe7b248bba63650116117012f5b4a0628346481f4ebdb`
Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-{"exact_match": 25.97918637653737, "f1": 28.36486682551724}`
	`1`	`+{"exact_match": 25.76158940397351, "f1": 27.99745717265541}`
`2`	`2`	`Reading examples...`
`3`	`3`	`No cached features at 'eval_features.pickle'... converting from examples...`
`4`	`4`	`Creating tokenizer...`
Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-{"exact_match": 25.97918637653737, "f1": 28.36486682551724}`
	`1`	`+{"exact_match": 25.75212866603595, "f1": 27.995565025067897}`
`2`	`2`	`Reading examples...`
`3`	`3`	`Loading cached features from 'eval_features.pickle'...`
`4`	`4`	`Loading LoadGen logs...`
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,2 @@`
`1`	`1`
`2`		`-hash=66666b875ec9add3cf67a97dcd7ec698343c18f39b71534a0bbbb93a5d1fbea5`
	`2`	`+hash=aded1916a0bd347aa82fd4cb88eeda19fcca051529aa6f5667e44d1fa35ec704`