From 3583f48b4e28e56c76db47b7b45ac47d0ae00f58 Mon Sep 17 00:00:00 2001
From: Hyunsu Cho <chohyu01@cs.washington.edu>
Date: Mon, 31 Jul 2023 23:35:16 +0000
Subject: [PATCH 1/2] Make the benchmark runnable on CPU-only instance; speed
 up CPU RF

---
 .../examples/xgboost-rf-gpu-cpu-benchmark/hpo.py | 16 ++++++++++------
 1 file changed, 10 insertions(+), 6 deletions(-)

diff --git a/source/examples/xgboost-rf-gpu-cpu-benchmark/hpo.py b/source/examples/xgboost-rf-gpu-cpu-benchmark/hpo.py
index 139b7b6b..b9cccaf4 100644
--- a/source/examples/xgboost-rf-gpu-cpu-benchmark/hpo.py
+++ b/source/examples/xgboost-rf-gpu-cpu-benchmark/hpo.py
@@ -4,12 +4,8 @@
 import time
 
 import dask
-import dask_cudf
 import optuna
 import xgboost as xgb
-from cuml.dask.common.utils import persist_across_workers
-from cuml.dask.ensemble import RandomForestClassifier as RF_gpu
-from cuml.metrics import accuracy_score as accuracy_score_gpu
 from dask.distributed import Client, LocalCluster, wait
 from dask_cuda import LocalCUDACluster
 from dask_ml.model_selection import train_test_split
@@ -40,6 +36,7 @@
 
 def ingest_data(mode):
     if mode == "gpu":
+        import dask_cudf
         dataset = dask_cudf.read_parquet(
             glob.glob("./data/*.parquet"),
             columns=feature_columns,
@@ -61,6 +58,7 @@ def preprocess_data(dataset, *, client, i_fold, mode):
     X_test, y_test = X_test.astype("float32"), y_test.astype("int32")
 
     if mode == "gpu":
+        from cuml.dask.common.utils import persist_across_workers
         X_train, y_train, X_test, y_test = persist_across_workers(
             client, [X_train, y_train, X_test, y_test], workers=client.has_what().keys()
         )
@@ -94,6 +92,7 @@ def train_xgboost(trial, *, dataset, client, mode):
         )
 
         if mode == "gpu":
+            from cuml.metrics import accuracy_score as accuracy_score_gpu
             params["tree_method"] = "gpu_hist"
             dtrain = xgb.dask.DaskDeviceQuantileDMatrix(client, X_train, y_train)
             dtest = xgb.dask.DaskDeviceQuantileDMatrix(client, X_test)
@@ -125,7 +124,6 @@ def train_randomforest(trial, *, dataset, client, mode):
         "n_estimators": trial.suggest_int("n_estimators", 100, 500, step=10),
         "criterion": trial.suggest_categorical("criterion", ["gini", "entropy"]),
         "min_samples_split": trial.suggest_int("min_samples_split", 2, 1000, log=True),
-        "n_bins": 256,
     }
 
     cv_fold_scores = []
@@ -135,14 +133,20 @@ def train_randomforest(trial, *, dataset, client, mode):
         )
 
         if mode == "gpu":
+            from cuml.metrics import accuracy_score as accuracy_score_gpu
+            from cuml.dask.ensemble import RandomForestClassifier as RF_gpu
+            params["n_bins"] = 256
             trained_model = RF_gpu(client=client, **params)
             accuracy_score_func = accuracy_score_gpu
         else:
+            params["n_jobs"] = -1
             trained_model = RF_cpu(**params)
             accuracy_score_func = accuracy_score_cpu
 
         trained_model.fit(X_train, y_train)
-        pred = trained_model.predict(X_test).compute()
+        pred = trained_model.predict(X_test)
+        if mode == "gpu":
+            pred = pred.compute()
         y_test = y_test.compute()
         score = accuracy_score_func(y_test, pred)
         cv_fold_scores.append(score)

From 7dbd95d6f77bcae6266bb0533d6907dcca5349fc Mon Sep 17 00:00:00 2001
From: Hyunsu Philip Cho <chohyu01@cs.washington.edu>
Date: Wed, 2 Aug 2023 13:11:16 -0700
Subject: [PATCH 2/2] Fix formatting

---
 source/examples/xgboost-rf-gpu-cpu-benchmark/hpo.py | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/source/examples/xgboost-rf-gpu-cpu-benchmark/hpo.py b/source/examples/xgboost-rf-gpu-cpu-benchmark/hpo.py
index b9cccaf4..7898974a 100644
--- a/source/examples/xgboost-rf-gpu-cpu-benchmark/hpo.py
+++ b/source/examples/xgboost-rf-gpu-cpu-benchmark/hpo.py
@@ -37,6 +37,7 @@
 def ingest_data(mode):
     if mode == "gpu":
         import dask_cudf
+
         dataset = dask_cudf.read_parquet(
             glob.glob("./data/*.parquet"),
             columns=feature_columns,
@@ -59,6 +60,7 @@ def preprocess_data(dataset, *, client, i_fold, mode):
 
     if mode == "gpu":
         from cuml.dask.common.utils import persist_across_workers
+
         X_train, y_train, X_test, y_test = persist_across_workers(
             client, [X_train, y_train, X_test, y_test], workers=client.has_what().keys()
         )
@@ -93,6 +95,7 @@ def train_xgboost(trial, *, dataset, client, mode):
 
         if mode == "gpu":
             from cuml.metrics import accuracy_score as accuracy_score_gpu
+
             params["tree_method"] = "gpu_hist"
             dtrain = xgb.dask.DaskDeviceQuantileDMatrix(client, X_train, y_train)
             dtest = xgb.dask.DaskDeviceQuantileDMatrix(client, X_test)
@@ -133,8 +136,9 @@ def train_randomforest(trial, *, dataset, client, mode):
         )
 
         if mode == "gpu":
-            from cuml.metrics import accuracy_score as accuracy_score_gpu
             from cuml.dask.ensemble import RandomForestClassifier as RF_gpu
+            from cuml.metrics import accuracy_score as accuracy_score_gpu
+
             params["n_bins"] = 256
             trained_model = RF_gpu(client=client, **params)
             accuracy_score_func = accuracy_score_gpu