yardenas
diff --git a/‎ss2r/benchmark_suites/__init__.py‎
Lines changed: 83 additions & 0 deletions b/‎ss2r/benchmark_suites/__init__.py‎
Lines changed: 83 additions & 0 deletions
diff --git a/‎ss2r/benchmark_suites/brax/cartpole/cartpole.py‎
Lines changed: 1 addition & 1 deletion b/‎ss2r/benchmark_suites/brax/cartpole/cartpole.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎ss2r/benchmark_suites/rccar/__init__.py‎ b/‎ss2r/benchmark_suites/rccar/__init__.py‎
@@ -0,0 +1,83 @@
+import functools
+
+import jax
+from brax import envs
+
+from ss2r.benchmark_suites.brax import randomization_fns
+from ss2r.benchmark_suites.rccar import rccar
+from ss2r.benchmark_suites.utils import get_domain_name, get_task_config
+
+
+def make(cfg):
+    domain_name = get_domain_name(cfg)
+    if domain_name == "brax":
+        return make_brax_envs(cfg)
+    elif domain_name == "rccar":
+        return make_rccar_envs(cfg)
+
+
+def make_rccar_envs(cfg):
+    task_cfg = dict(get_task_config(cfg))
+    train_car_params = task_cfg.pop("train_car_params")
+    eval_car_params = task_cfg.pop("eval_car_params")
+    train_env = rccar.RCCar(train_car_params, **task_cfg)
+    train_env = envs.training.wrap(
+        train_env,
+        episode_length=cfg.training.episode_length,
+        action_repeat=cfg.training.action_repeat,
+    )
+    eval_env = rccar.RCCar(eval_car_params, **task_cfg)
+    eval_env = envs.training.wrap(
+        eval_env,
+        episode_length=cfg.training.episode_length,
+        action_repeat=cfg.training.action_repeat,
+    )
+    return train_env, eval_env, None
+
+
+def make_brax_envs(cfg):
+    task_cfg = get_task_config(cfg)
+    train_env = envs.get_environment(
+        task_cfg.task_name, backend=cfg.environment.backend
+    )
+    eval_env = envs.get_environment(task_cfg.task_name, backend=cfg.environment.backend)
+    train_key, eval_key = jax.random.split(jax.random.PRNGKey(cfg.training.seed))
+
+    def prepare_randomization_fn(key, num_envs):
+        randomize_fn = lambda sys, rng: randomization_fns[task_cfg.task_name](
+            sys, rng, task_cfg
+        )
+        v_randomization_fn = functools.partial(
+            randomize_fn, rng=jax.random.split(key, num_envs)
+        )
+        vf_randomization_fn = lambda sys: v_randomization_fn(sys)[:-1]  # type: ignore
+        params_fn = lambda sys: v_randomization_fn(sys)[-1]
+        return vf_randomization_fn, params_fn
+
+    train_randomization_fn, params_fn = (
+        prepare_randomization_fn(train_key, cfg.training.num_envs)
+        if cfg.training.train_domain_randomization
+        else (None, None)
+    )
+    train_env = envs.training.wrap(
+        train_env,
+        episode_length=cfg.training.episode_length,
+        action_repeat=cfg.training.action_repeat,
+        randomization_fn=train_randomization_fn,
+    )
+    eval_randomization_fn, _ = prepare_randomization_fn(
+        eval_key, cfg.training.num_eval_envs
+    )
+    eval_env = envs.training.wrap(
+        eval_env,
+        episode_length=cfg.training.episode_length,
+        action_repeat=cfg.training.action_repeat,
+        randomization_fn=eval_randomization_fn
+        if cfg.training.eval_domain_randomization
+        else None,
+    )
+    if cfg.training.train_domain_randomization and cfg.training.privileged:
+        domain_parameters = params_fn(train_env.sys)
+    else:
+        domain_parameters = None
+    return train_env, eval_env, domain_parameters
@@ -9,7 +9,7 @@
 from brax.io import mjcf
 
 from ss2r.algorithms.state_sampler import StateSampler
-from ss2r.benchmark_suites.brax import rewards
+from ss2r.benchmark_suites import rewards
 
 
 def domain_randomization(sys, rng, cfg):