Preload model to avoid race condition.

joyang-nv · joyang-nv · commit b2195e12f90a · 2025-10-02T22:13:20.000-07:00
Signed-off-by: Jonas Yang &lt;joyang@nvidia.com&gt;
diff --git a/examples/run_grpo_math.py b/examples/run_grpo_math.py
@@ -19,7 +19,7 @@
 from typing import Any, Optional
 
 from omegaconf import OmegaConf
-from transformers import PreTrainedTokenizerBase
+from transformers import AutoModel, PreTrainedTokenizerBase
 
 from nemo_rl.algorithms.grpo import MasterConfig, grpo_train, setup
 from nemo_rl.algorithms.utils import get_tokenizer
@@ -159,7 +159,17 @@ def main() -> None:
 
     init_ray()
 
-    # setup tokenizer
+    # setup tokenizer and preloading model to force HF to download the model and modules
+    # to avoid race condition inside generation/policy workers.
+    try:
+        _ = AutoModel.from_pretrained(
+            config["policy"]["model_name"], trust_remote_code=True
+        )
+        print(f"Model preloaded successfully: {config['policy']['model_name']}")
+    except Exception as e:
+        print("WARNIN: error in preloading model, in general it's not a problem: ")
+        print(e)
+
     tokenizer = get_tokenizer(config["policy"]["tokenizer"])
     assert config["policy"]["generation"] is not None, (
         "A generation config is required for GRPO"