mlcommons
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/accuracy.txt
+1-1 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/accuracy.txt
+1-1
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/baseline_accuracy.txt
+1-1 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/baseline_accuracy.txt
+1-1
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/compliance_accuracy.txt
+1-1 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/compliance_accuracy.txt
+1-1
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/mlperf_log_accuracy.json
+13-13 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/accuracy/mlperf_log_accuracy.json
+13-13
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/performance/run_1/mlperf_log_detail.txt
+88-88 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/performance/run_1/mlperf_log_detail.txt
+88-88
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/performance/run_1/mlperf_log_summary.txt
+12-12 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/performance/run_1/mlperf_log_summary.txt
+12-12
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/verify_accuracy.txt
+3-3 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/verify_accuracy.txt
+3-3
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/verify_performance.txt
+2-2 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/TEST01/verify_performance.txt
+2-2
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/accuracy/accuracy.txt
+1-1 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/accuracy/accuracy.txt
+1-1
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/accuracy/mlperf_log_accuracy.json
+5-6 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/accuracy/mlperf_log_accuracy.json
+5-6
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/performance/run_1/mlperf_log_detail.txt
+92-92 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/performance/run_1/mlperf_log_detail.txt
+92-92
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/performance/run_1/mlperf_log_summary.txt
+17-17 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/performance/run_1/mlperf_log_summary.txt
+17-17
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/verify_accuracy.txt
+2-2 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/verify_accuracy.txt
+2-2
diff --git a/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/verify_performance.txt
+2-2 b/‎closed/MLCommons/compliance/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/singlestream/TEST01/verify_performance.txt
+2-2
diff --git a/‎closed/MLCommons/measurements/RTX4090x2-nvidia-gpu-TensorRT-default_config/README.md
+4-4 b/‎closed/MLCommons/measurements/RTX4090x2-nvidia-gpu-TensorRT-default_config/README.md
+4-4
diff --git a/‎closed/MLCommons/measurements/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/README.md
+2-2 b/‎closed/MLCommons/measurements/RTX4090x2-nvidia-gpu-TensorRT-default_config/bert-99/offline/README.md
+2-2
@@ -1,2 +1,2 @@
 
-hash=35db7a03c67c29becaa3263e5d287b1031864f223d313450b22fb18cf48a84a8
+hash=289414dd9663892ffd8b764efe21ff437be503c40aa575ec1cd79dc4d167cbed
@@ -1,4 +1,4 @@
-{"exact_match": 25.960264900662253, "f1": 28.345945349642122}
+{"exact_match": 25.808893093661304, "f1": 28.044760862343207}
 Reading examples...
 No cached features at 'eval_features.pickle'... converting from examples...
 Creating tokenizer...
 
@@ -1,4 +1,4 @@
-{"exact_match": 25.960264900662253, "f1": 28.345945349642122}
+{"exact_match": 25.799432355723745, "f1": 28.042868714755695}
 Reading examples...
 Loading cached features from 'eval_features.pickle'...
 Loading LoadGen logs...
 
@@ -4,7 +4,7 @@ MLPerf Results Summary
 SUT name : BERT SERVER
 Scenario : Offline
 Mode     : PerformanceOnly
-Samples per second: 3329.31
+Samples per second: 8270.02
 Result is : VALID
   Min duration satisfied : Yes
   Min queries satisfied : Yes
@@ -13,21 +13,21 @@ Result is : VALID
 ================================================
 Additional Stats
 ================================================
-Min latency (ns)                : 1149390628
-Max latency (ns)                : 667141156558
-Mean latency (ns)               : 403325233877
-50.00 percentile latency (ns)   : 429455065877
-90.00 percentile latency (ns)   : 636160704566
-95.00 percentile latency (ns)   : 654564440126
-97.00 percentile latency (ns)   : 660582964130
-99.00 percentile latency (ns)   : 665358746838
-99.90 percentile latency (ns)   : 667001952672
+Min latency (ns)                : 1463771512
+Max latency (ns)                : 662617361493
+Mean latency (ns)               : 401715159178
+50.00 percentile latency (ns)   : 427664906632
+90.00 percentile latency (ns)   : 631834726524
+95.00 percentile latency (ns)   : 649993042297
+97.00 percentile latency (ns)   : 656003034356
+99.00 percentile latency (ns)   : 660773702230
+99.90 percentile latency (ns)   : 662470889227
 
 ================================================
 Test Parameters Used
 ================================================
-samples_per_query : 2221117
-target_qps : 3365.33
+samples_per_query : 5479858
+target_qps : 8302.82
 target_latency (ns): 0
 max_async_queries : 1
 min_duration (ms): 600000
 
@@ -4,9 +4,9 @@ Reading performance mode results...
 num_acc_log_entries = 10833
 num_acc_log_duplicate_keys = 0
 num_acc_log_data_mismatch = 0
-num_perf_log_entries = 4085
-num_perf_log_qsl_idx_match = 4085
-num_perf_log_data_mismatch = 51
+num_perf_log_entries = 4026
+num_perf_log_qsl_idx_match = 4026
+num_perf_log_data_mismatch = 20
 num_missing_qsl_idxs = 0
 TEST FAIL
 
@@ -1,4 +1,4 @@
 Verifying performance.
-reference score = 3332.01
-test score = 3329.31
+reference score = 8220.61
+test score = 8270.02
 TEST PASS
@@ -1,2 +1,2 @@
 
-hash=8fc90737f9ae1234daaa9f03db7b400fae351bef18b74274522bf220323ed737
+hash=53ca0549508a27669a1500e5285aaef99354b5521e1382beac20dc0e89c1aa58
@@ -4,38 +4,38 @@ MLPerf Results Summary
 SUT name : BERT SERVER
 Scenario : SingleStream
 Mode     : PerformanceOnly
-90th percentile latency (ns) : 2168651
+90th percentile latency (ns) : 1028640
 Result is : VALID
   Min duration satisfied : Yes
   Min queries satisfied : Yes
   Early stopping satisfied: Yes
 Early Stopping Result:
- * Processed at least 64 queries (392387).
- * Would discard 38800 highest latency queries.
- * Early stopping 90th percentile estimate: 2169583
- * Early stopping 99th percentile estimate: 2637852
+ * Processed at least 64 queries (636833).
+ * Would discard 63125 highest latency queries.
+ * Early stopping 90th percentile estimate: 1029130
+ * Early stopping 99th percentile estimate: 1204811
 
 ================================================
 Additional Stats
 ================================================
-QPS w/ loadgen overhead         : 653.98
-QPS w/o loadgen overhead        : 656.68
+QPS w/ loadgen overhead         : 1061.39
+QPS w/o loadgen overhead        : 1068.05
 
-Min latency (ns)                : 1166039
-Max latency (ns)                : 3143287
-Mean latency (ns)               : 1522817
-50.00 percentile latency (ns)   : 1437568
-90.00 percentile latency (ns)   : 2168651
-95.00 percentile latency (ns)   : 2321822
-97.00 percentile latency (ns)   : 2609757
-99.00 percentile latency (ns)   : 2637407
-99.90 percentile latency (ns)   : 2661419
+Min latency (ns)                : 840385
+Max latency (ns)                : 1404272
+Mean latency (ns)               : 936287
+50.00 percentile latency (ns)   : 915873
+90.00 percentile latency (ns)   : 1028640
+95.00 percentile latency (ns)   : 1123549
+97.00 percentile latency (ns)   : 1184400
+99.00 percentile latency (ns)   : 1204405
+99.90 percentile latency (ns)   : 1219655
 
 ================================================
 Test Parameters Used
 ================================================
 samples_per_query : 1
-target_qps : 1643.27
+target_qps : 2667.11
 target_latency (ns): 0
 max_async_queries : 1
 min_duration (ms): 600000
 
@@ -4,8 +4,8 @@ Reading performance mode results...
 num_acc_log_entries = 10833
 num_acc_log_duplicate_keys = 0
 num_acc_log_data_mismatch = 0
-num_perf_log_entries = 1625
-num_perf_log_qsl_idx_match = 1625
+num_perf_log_entries = 1666
+num_perf_log_qsl_idx_match = 1666
 num_perf_log_data_mismatch = 0
 num_missing_qsl_idxs = 0
 TEST PASS
 
@@ -1,4 +1,4 @@
 Verifying performance.
-reference score = 2167999
-test score = 2169583
+reference score = 1030560
+test score = 1029130
 TEST PASS
@@ -1,4 +1,4 @@
-| Model        | Scenario     |   Accuracy |   Throughput | Latency (in ms)   | Power Efficiency (in samples/J)   | TEST01   |
-|--------------|--------------|------------|--------------|-------------------|-----------------------------------|----------|
-| 3d-unet-99.9 | singlestream |    0.86236 |        2.326 | 429.856           |                                   | passed   |
-| 3d-unet-99.9 | offline      |    0.86236 |        8.321 | -                 |                                   | passed   |
+| Model   | Scenario     |   Accuracy |   Throughput | Latency (in ms)   | Power Efficiency (in samples/J)   | TEST01   |
+|---------|--------------|------------|--------------|-------------------|-----------------------------------|----------|
+| bert-99 | singlestream |    90.2668 |      969.932 | 1.031             |                                   | passed   |
+| bert-99 | offline      |    90.1528 |     8220.61  | -                 |                                   | passed   |
@@ -38,7 +38,7 @@ Platform: RTX4090x2-nvidia-gpu-TensorRT-default_config
 Model Precision: fp16
 
 ### Accuracy Results 
-`F1`: `90.88324`, Required accuracy for closed division `>= 90.78313`
+`F1`: `90.15279`, Required accuracy for closed division `>= 89.96526`
 
 ### Performance Results 
-`Samples per second`: `3332.01`
+`Samples per second`: `8220.61`
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,2 @@`
`1`	`1`
`2`		`-hash=35db7a03c67c29becaa3263e5d287b1031864f223d313450b22fb18cf48a84a8`
	`2`	`+hash=289414dd9663892ffd8b764efe21ff437be503c40aa575ec1cd79dc4d167cbed`
Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-{"exact_match": 25.960264900662253, "f1": 28.345945349642122}`
	`1`	`+{"exact_match": 25.808893093661304, "f1": 28.044760862343207}`
`2`	`2`	`Reading examples...`
`3`	`3`	`No cached features at 'eval_features.pickle'... converting from examples...`
`4`	`4`	`Creating tokenizer...`
Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-{"exact_match": 25.960264900662253, "f1": 28.345945349642122}`
	`1`	`+{"exact_match": 25.799432355723745, "f1": 28.042868714755695}`
`2`	`2`	`Reading examples...`
`3`	`3`	`Loading cached features from 'eval_features.pickle'...`
`4`	`4`	`Loading LoadGen logs...`
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,2 @@`
`1`	`1`
`2`		`-hash=8fc90737f9ae1234daaa9f03db7b400fae351bef18b74274522bf220323ed737`
	`2`	`+hash=53ca0549508a27669a1500e5285aaef99354b5521e1382beac20dc0e89c1aa58`