deploy: bf2b26e

FAIR-Chem · Jul 9, 2024 · f168547 · f168547
1 parent 0ef6752
commit f168547
Show file tree

Hide file tree

Showing 292 changed files with 7,242 additions and 1,716 deletions.
diff --git a/_downloads/5fdddbed2260616231dbf7b0d94bb665/train.txt b/_downloads/5fdddbed2260616231dbf7b0d94bb665/train.txt
diff --git a/_downloads/819e10305ddd6839cd7da05935b17060/mass-inference.txt b/_downloads/819e10305ddd6839cd7da05935b17060/mass-inference.txt
@@ -0,0 +1,131 @@
+2024-07-09 14:17:18 (INFO): Running in non-distributed local mode
+2024-07-09 14:17:19 (INFO): Project root: /home/runner/work/fairchem/fairchem/src/fairchem
+2024-07-09 14:17:20 (INFO): amp: true
+cmd:
+  checkpoint_dir: ./checkpoints/2024-07-09-14-17-36
+  commit: bf2b26e
+  identifier: ''
+  logs_dir: ./logs/tensorboard/2024-07-09-14-17-36
+  print_every: 10
+  results_dir: ./results/2024-07-09-14-17-36
+  seed: 0
+  timestamp_id: 2024-07-09-14-17-36
+  version: 0.1.dev1+gbf2b26e
+dataset: null
+evaluation_metrics:
+  metrics:
+    energy:
+    - mae
+    forces:
+    - forcesx_mae
+    - forcesy_mae
+    - forcesz_mae
+    - mae
+    - cosine_similarity
+    - magnitude_error
+    misc:
+    - energy_forces_within_threshold
+  primary_metric: forces_mae
+gp_gpus: null
+gpus: 0
+logger: tensorboard
+loss_functions:
+- energy:
+    coefficient: 1
+    fn: mae
+- forces:
+    coefficient: 1
+    fn: l2mae
+model: gemnet_t
+model_attributes:
+  activation: silu
+  cbf:
+    name: spherical_harmonics
+  cutoff: 6.0
+  direct_forces: true
+  emb_size_atom: 512
+  emb_size_bil_trip: 64
+  emb_size_cbf: 16
+  emb_size_edge: 512
+  emb_size_rbf: 16
+  emb_size_trip: 64
+  envelope:
+    exponent: 5
+    name: polynomial
+  extensive: true
+  max_neighbors: 50
+  num_after_skip: 2
+  num_atom: 3
+  num_before_skip: 1
+  num_blocks: 3
+  num_concat: 1
+  num_radial: 128
+  num_spherical: 7
+  otf_graph: true
+  output_init: HeOrthogonal
+  rbf:
+    name: gaussian
+  regress_forces: true
+noddp: false
+optim:
+  batch_size: 16
+  clip_grad_norm: 10
+  ema_decay: 0.999
+  energy_coefficient: 1
+  eval_batch_size: 16
+  eval_every: 5000
+  force_coefficient: 1
+  loss_energy: mae
+  loss_force: atomwisel2
+  lr_gamma: 0.8
+  lr_initial: 0.0005
+  lr_milestones:
+  - 64000
+  - 96000
+  - 128000
+  - 160000
+  - 192000
+  max_epochs: 80
+  num_workers: 2
+  optimizer: AdamW
+  optimizer_params:
+    amsgrad: true
+  warmup_steps: -1
+outputs:
+  energy:
+    level: system
+  forces:
+    eval_on_free_atoms: true
+    level: atom
+    train_on_free_atoms: true
+slurm: {}
+task:
+  prediction_dtype: float32
+test_dataset:
+  a2g_args:
+    r_energy: false
+    r_forces: false
+  format: ase_db
+  select_args:
+    selection: natoms>5,xc=PBE
+  src: data.db
+trainer: ocp
+val_dataset: null
+
+2024-07-09 14:17:20 (INFO): rank: 0: Sampler created...
+2024-07-09 14:17:20 (INFO): Batch balancing is disabled for single GPU training.
+2024-07-09 14:17:20 (INFO): Loading model: gemnet_t
+2024-07-09 14:17:22 (INFO): Loaded GemNetT with 31671825 parameters.
+2024-07-09 14:17:22 (WARNING): log_summary for Tensorboard not supported
+2024-07-09 14:17:22 (INFO): Loading checkpoint from: /tmp/ocp_checkpoints/gndt_oc22_all_s2ef.pt
+2024-07-09 14:17:22 (INFO): Overwriting scaling factors with those loaded from checkpoint. If you're generating predictions with a pretrained checkpoint, this is the correct behavior. To disable this, delete `scale_dict` from the checkpoint. 
+2024-07-09 14:17:22 (WARNING): Scale factor comment not found in model
+2024-07-09 14:17:22 (INFO): Predicting on test.
+device 0:   0%|                                           | 0/3 [00:00<?, ?it/s]/opt/hostedtoolcache/Python/3.11.9/x64/lib/python3.11/site-packages/torch_geometric/data/collate.py:145: UserWarning: TypedStorage is deprecated. It will be removed in the future and UntypedStorage will be the only storage class. This should only matter to you if you are using storages directly.  To access UntypedStorage directly, use tensor.untyped_storage() instead of tensor.storage()
+  storage = elem.storage()._new_shared(numel)
+/opt/hostedtoolcache/Python/3.11.9/x64/lib/python3.11/site-packages/torch_geometric/data/collate.py:145: UserWarning: TypedStorage is deprecated. It will be removed in the future and UntypedStorage will be the only storage class. This should only matter to you if you are using storages directly.  To access UntypedStorage directly, use tensor.untyped_storage() instead of tensor.storage()
+  storage = elem.storage()._new_shared(numel)
+device 0:  33%|███████████▋                       | 1/3 [00:02<00:04,  2.03s/it]device 0:  67%|███████████████████████▎           | 2/3 [00:04<00:02,  2.51s/it]device 0: 100%|███████████████████████████████████| 3/3 [00:06<00:00,  2.11s/it]device 0: 100%|███████████████████████████████████| 3/3 [00:06<00:00,  2.18s/it]
+2024-07-09 14:17:28 (INFO): Writing results to ./results/2024-07-09-14-17-36/ocp_predictions.npz
+2024-07-09 14:17:28 (INFO): Total time taken: 6.688116550445557
+Elapsed time = 13.0 seconds

diff --git a/...ebfda153643d4b11dc71a09f6161ce695c67c.png → ...26aa505675d316d1ade29791c024dcc3bfd3e.png b/...ebfda153643d4b11dc71a09f6161ce695c67c.png → ...26aa505675d316d1ade29791c024dcc3bfd3e.png
diff --git a/_images/1bd3f6f137572394f45b2bea46d8a5d05c74e922aca09434f2a962c660c36a98.png b/_images/1bd3f6f137572394f45b2bea46d8a5d05c74e922aca09434f2a962c660c36a98.png
diff --git a/_images/20119ebabd48f33476c0d005b06b2a0dd7a215cc88c5f66182ccd469bcff0e8a.png b/_images/20119ebabd48f33476c0d005b06b2a0dd7a215cc88c5f66182ccd469bcff0e8a.png
diff --git a/_images/2f5258505cbaf133d92a049e74a43d8084112179d0ac78623e14191fa46c4bff.png b/_images/2f5258505cbaf133d92a049e74a43d8084112179d0ac78623e14191fa46c4bff.png
diff --git a/_images/33e748c54c65bf2c62d880db6f712a27cf22f1a234bc72238947a7f83abc602c.png b/_images/33e748c54c65bf2c62d880db6f712a27cf22f1a234bc72238947a7f83abc602c.png
diff --git a/_images/41af445d4daca68a749345776ce0892ee5bce34b89af1d4aef5a7470ec70845e.png b/_images/41af445d4daca68a749345776ce0892ee5bce34b89af1d4aef5a7470ec70845e.png
diff --git a/_images/4c0a3eadc20e85c10fa416a87bd8a8e66ed2141f9d738463e7fc40ceaccf7418.png b/_images/4c0a3eadc20e85c10fa416a87bd8a8e66ed2141f9d738463e7fc40ceaccf7418.png
diff --git a/...05a2fef563d024b57288137bc0adf4344b0b9.png → ...4131fa3f13737244e437740ddae980ebd1e28.png b/...05a2fef563d024b57288137bc0adf4344b0b9.png → ...4131fa3f13737244e437740ddae980ebd1e28.png
diff --git a/_images/5bdd5d3f33a4524753684055a5fad4bd82a39e4c1cb11bce1b30401925c81ecf.png b/_images/5bdd5d3f33a4524753684055a5fad4bd82a39e4c1cb11bce1b30401925c81ecf.png
diff --git a/...fb6b0f7a36c57d7a4025b34de029233d8d3f8.png → ...36f0192d4cb2ec5cca76c32812c02f35ec424.png b/...fb6b0f7a36c57d7a4025b34de029233d8d3f8.png → ...36f0192d4cb2ec5cca76c32812c02f35ec424.png
diff --git a/...659b784f34bf0b8ebdceb934bee7ddc222d55.png → ...810cc5a44f1fce8c2eef3ccb492932b39d7ac.png b/...659b784f34bf0b8ebdceb934bee7ddc222d55.png → ...810cc5a44f1fce8c2eef3ccb492932b39d7ac.png
diff --git a/...4ef1566bd2800215484dd031eacea9d34b8ed.png → ...0c35167f5a303e78d4971c1eaf1382c82fe73.png b/...4ef1566bd2800215484dd031eacea9d34b8ed.png → ...0c35167f5a303e78d4971c1eaf1382c82fe73.png
diff --git a/...d59f84f0614aee01a6b563e2eda73664e980d.png → ...43b6141ad5db11591e03e0e91e693b2b18c4e.png b/...d59f84f0614aee01a6b563e2eda73664e980d.png → ...43b6141ad5db11591e03e0e91e693b2b18c4e.png
diff --git a/_images/94c2a08ab1ceaa205ecfb8d62e483d28be81d8c1237c2118d10d4eb766bec1fc.png b/_images/94c2a08ab1ceaa205ecfb8d62e483d28be81d8c1237c2118d10d4eb766bec1fc.png
diff --git a/...f84e52cbeee8ab9c16e8abc25a1c42d77bf2e.png → ...3c363a22e4ecfb8634852ceba0fb62f38ee76.png b/...f84e52cbeee8ab9c16e8abc25a1c42d77bf2e.png → ...3c363a22e4ecfb8634852ceba0fb62f38ee76.png
diff --git a/_images/aa9c48a376f197fd6af81fc45cf79b9b33cdda12a663b0d6738ebcb554964f0a.png b/_images/aa9c48a376f197fd6af81fc45cf79b9b33cdda12a663b0d6738ebcb554964f0a.png
diff --git a/...6a052f8635f048b5b7f495a17409cb544df72.png → ...61f8670209306f784fd9ebc25a09415ef715b.png b/...6a052f8635f048b5b7f495a17409cb544df72.png → ...61f8670209306f784fd9ebc25a09415ef715b.png
diff --git a/...f954270bca8b6e60d88b947cc42c8e7018929.png → ...93c1328bd0415fda521754b6761cbff57903e.png b/...f954270bca8b6e60d88b947cc42c8e7018929.png → ...93c1328bd0415fda521754b6761cbff57903e.png
diff --git a/_images/b8052939c33bb828c2eeea1d03c48c2129394702e972919142009dcc8bff305e.png b/_images/b8052939c33bb828c2eeea1d03c48c2129394702e972919142009dcc8bff305e.png
diff --git a/...aa56af0a05a83b148ec0823e6f4c10cf0cd88.png → ...5ad35ff59c61539962b4f9738817de79022ed.png b/...aa56af0a05a83b148ec0823e6f4c10cf0cd88.png → ...5ad35ff59c61539962b4f9738817de79022ed.png
diff --git a/_images/be0f87d705459fb656d44d6c1e42a8735e9356d6c7fbee9c46215d7a2682e1cb.png b/_images/be0f87d705459fb656d44d6c1e42a8735e9356d6c7fbee9c46215d7a2682e1cb.png
diff --git a/_images/c138d78d11c7e14374028e10ca0934ab2696fbf6aa9d2b45d44bcffabf6080e2.png b/_images/c138d78d11c7e14374028e10ca0934ab2696fbf6aa9d2b45d44bcffabf6080e2.png
diff --git a/...d67f42a28c228c33b7b8a35c33f393440382a.png → ...4f353e2623573ea3dd213d23a6b486bfbee9e.png b/...d67f42a28c228c33b7b8a35c33f393440382a.png → ...4f353e2623573ea3dd213d23a6b486bfbee9e.png
diff --git a/...034ec451475c82b447ad813ae1b9b24601637.png → ...cb29fb801535cb4cbcb2c830584b6c6ffc72d.png b/...034ec451475c82b447ad813ae1b9b24601637.png → ...cb29fb801535cb4cbcb2c830584b6c6ffc72d.png
diff --git a/_images/cfcdc7e302775579c03049aef09d50bcdd1691a83bfa4ec1a20e1ac8536e0ce7.png b/_images/cfcdc7e302775579c03049aef09d50bcdd1691a83bfa4ec1a20e1ac8536e0ce7.png
diff --git a/_images/d8f000c5866310197f993a7572f8fecc25292a36dab7b71d7508e7eec2cc2434.png b/_images/d8f000c5866310197f993a7572f8fecc25292a36dab7b71d7508e7eec2cc2434.png
diff --git a/_images/deabea6d50267eb0199707fd11c4215082556e20ab5e2e17344d1dde87586a2e.png b/_images/deabea6d50267eb0199707fd11c4215082556e20ab5e2e17344d1dde87586a2e.png
diff --git a/...41e648ebf742911fe25095bde7b712d7234d4.png → ...0b3979de3a415db6696093790df3189ca2edf.png b/...41e648ebf742911fe25095bde7b712d7234d4.png → ...0b3979de3a415db6696093790df3189ca2edf.png
diff --git a/...fab282da4371e89979a0744574aaa167e16fc.png → ...86a627492010be04a5f6c56083ee6b1ac9289.png b/...fab282da4371e89979a0744574aaa167e16fc.png → ...86a627492010be04a5f6c56083ee6b1ac9289.png
diff --git a/_images/ec3d78c828a48f27837aed2db2ea620c401fa3cc7fec032fead69ca09d84fb29.png b/_images/ec3d78c828a48f27837aed2db2ea620c401fa3cc7fec032fead69ca09d84fb29.png
diff --git a/_sources/autoapi/core/common/index.rst b/_sources/autoapi/core/common/index.rst
@@ -34,6 +34,7 @@ Submodules
    /autoapi/core/common/hpo_utils/index
    /autoapi/core/common/logger/index
    /autoapi/core/common/registry/index
+   /autoapi/core/common/test_utils/index
    /autoapi/core/common/transforms/index
    /autoapi/core/common/tutorial_utils/index
    /autoapi/core/common/typing/index

diff --git a/_sources/autoapi/core/common/logger/index.rst b/_sources/autoapi/core/common/logger/index.rst
@@ -34,7 +34,7 @@ Module Contents
    tensorboard, etc.
 
 
-   .. py:method:: watch(model)
+   .. py:method:: watch(model, log_freq: int = 1000)
       :abstractmethod:
 
 
@@ -72,7 +72,7 @@ Module Contents
    tensorboard, etc.
 
 
-   .. py:method:: watch(model) -> None
+   .. py:method:: watch(model, log_freq: int = 1000) -> None
 
       Monitor parameters and gradients.
 
@@ -102,7 +102,7 @@ Module Contents
    tensorboard, etc.
 
 
-   .. py:method:: watch(model) -> bool
+   .. py:method:: watch(model, log_freq: int = 1000) -> bool
 
       Monitor parameters and gradients.
 

diff --git a/_sources/autoapi/core/common/test_utils/index.rst b/_sources/autoapi/core/common/test_utils/index.rst
@@ -0,0 +1,88 @@
+core.common.test_utils
+======================
+
+.. py:module:: core.common.test_utils
+
+
+Classes
+-------
+
+.. autoapisummary::
+
+   core.common.test_utils.ForkedPdb
+   core.common.test_utils.PGConfig
+
+
+Functions
+---------
+
+.. autoapisummary::
+
+   core.common.test_utils.spawn_multi_process
+   core.common.test_utils._init_pg_and_rank_and_launch_test
+
+
+Module Contents
+---------------
+
+.. py:class:: ForkedPdb(completekey='tab', stdin=None, stdout=None, skip=None, nosigint=False, readrc=True)
+
+   Bases: :py:obj:`pdb.Pdb`
+
+
+   A Pdb subclass that may be used from a forked multiprocessing child
+   https://stackoverflow.com/questions/4716533/how-to-attach-debugger-to-a-python-subproccess/23654936#23654936
+
+   example usage to debug a torch distributed run on rank 0:
+   if torch.distributed.get_rank() == 0:
+       from fairchem.core.common.test_utils import ForkedPdb
+       ForkedPdb().set_trace()
+
+
+   .. py:method:: interaction(*args, **kwargs)
+
+
+.. py:class:: PGConfig
+
+   .. py:attribute:: backend
+      :type:  str
+
+
+   .. py:attribute:: world_size
+      :type:  int
+
+
+   .. py:attribute:: gp_group_size
+      :type:  int
+      :value: 1
+
+
+
+   .. py:attribute:: port
+      :type:  str
+      :value: '12345'
+
+
+
+   .. py:attribute:: use_gp
+      :type:  bool
+      :value: True
+
+
+
+.. py:function:: spawn_multi_process(config: PGConfig, test_method: callable, *test_method_args: Any, **test_method_kwargs: Any) -> list[Any]
+
+   Spawn single node, multi-rank function.
+   Uses localhost and free port to communicate.
+
+   :param world_size: number of processes
+   :param backend: backend to use. for example, "nccl", "gloo", etc
+   :param test_method: callable to spawn. first 3 arguments are rank, world_size and mp output dict
+   :param test_method_args: args for the test method
+   :param test_method_kwargs: kwargs for the test method
+
+   :returns: A list, l, where l[i] is the return value of test_method on rank i
+
+
+.. py:function:: _init_pg_and_rank_and_launch_test(rank: int, pg_setup_params: PGConfig, mp_output_dict: dict[int, object], test_method: callable, args: list[object], kwargs: dict[str, object]) -> None
+
diff --git a/_sources/autoapi/core/models/equiformer_v2/equiformer_v2_oc20/index.rst b/_sources/autoapi/core/models/equiformer_v2/equiformer_v2_oc20/index.rst
@@ -123,6 +123,14 @@ Module Contents
    :type load_energy_lin_ref: bool
 
 
+   .. py:method:: _init_gp_partitions(atomic_numbers_full, data_batch_full, edge_index, edge_distance, edge_distance_vec)
+
+      Graph Parallel
+      This creates the required partial tensors for each rank given the full tensors.
+      The tensors are split on the dimension along the node index using node_partition.
+
+
+
    .. py:method:: forward(data)
 
 

diff --git a/_sources/autoapi/core/models/equiformer_v2/index.rst b/_sources/autoapi/core/models/equiformer_v2/index.rst
@@ -136,6 +136,14 @@ Package Contents
    :type load_energy_lin_ref: bool
 
 
+   .. py:method:: _init_gp_partitions(atomic_numbers_full, data_batch_full, edge_index, edge_distance, edge_distance_vec)
+
+      Graph Parallel
+      This creates the required partial tensors for each rank given the full tensors.
+      The tensors are split on the dimension along the node index using node_partition.
+
+
+
    .. py:method:: forward(data)
 
 

diff --git a/_sources/autoapi/core/models/equiformer_v2/input_block/index.rst b/_sources/autoapi/core/models/equiformer_v2/input_block/index.rst
@@ -37,6 +37,6 @@ Module Contents
    :type rescale_factor: float
 
 
-   .. py:method:: forward(atomic_numbers, edge_distance, edge_index)
+   .. py:method:: forward(atomic_numbers, edge_distance, edge_index, num_nodes, node_offset=0)
 
 
diff --git a/_sources/autoapi/core/models/equiformer_v2/trainers/energy_trainer/index.rst b/_sources/autoapi/core/models/equiformer_v2/trainers/energy_trainer/index.rst
@@ -23,7 +23,7 @@ Classes
 Module Contents
 ---------------
 
-.. py:class:: EquiformerV2EnergyTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier, timestamp_id=None, run_dir=None, is_debug=False, print_every=100, seed=None, logger='wandb', local_rank=0, amp=False, cpu=False, slurm=None, noddp=False, name='ocp')
+.. py:class:: EquiformerV2EnergyTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier, timestamp_id=None, run_dir=None, is_debug=False, print_every=100, seed=None, logger='wandb', local_rank=0, amp=False, cpu=False, slurm=None, noddp=False, name='ocp', gp_gpus=None)
 
    Bases: :py:obj:`fairchem.core.trainers.OCPTrainer`
 

diff --git a/_sources/autoapi/core/models/equiformer_v2/trainers/forces_trainer/index.rst b/_sources/autoapi/core/models/equiformer_v2/trainers/forces_trainer/index.rst
@@ -23,7 +23,7 @@ Classes
 Module Contents
 ---------------
 
-.. py:class:: EquiformerV2ForcesTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier, timestamp_id=None, run_dir=None, is_debug=False, print_every=100, seed=None, logger='wandb', local_rank=0, amp=False, cpu=False, slurm=None, noddp=False, name='ocp')
+.. py:class:: EquiformerV2ForcesTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier, timestamp_id=None, run_dir=None, is_debug=False, print_every=100, seed=None, logger='wandb', local_rank=0, amp=False, cpu=False, slurm=None, noddp=False, name='ocp', gp_gpus=None)
 
    Bases: :py:obj:`fairchem.core.trainers.OCPTrainer`
 

diff --git a/_sources/autoapi/core/models/equiformer_v2/transformer_block/index.rst b/_sources/autoapi/core/models/equiformer_v2/transformer_block/index.rst
@@ -67,7 +67,7 @@ Module Contents
    :type alpha_drop: float
 
 
-   .. py:method:: forward(x: torch.Tensor, atomic_numbers, edge_distance: torch.Tensor, edge_index)
+   .. py:method:: forward(x: torch.Tensor, atomic_numbers, edge_distance: torch.Tensor, edge_index, node_offset: int = 0)
 
 
 .. py:class:: FeedForwardNetwork(sphere_channels: int, hidden_channels: int, output_channels: int, lmax_list: list[int], mmax_list: list[int], SO3_grid, activation: str = 'scaled_silu', use_gate_act: bool = False, use_grid_mlp: bool = False, use_sep_s2_act: bool = True)
@@ -158,6 +158,6 @@ Module Contents
    :type proj_drop: float
 
 
-   .. py:method:: forward(x, atomic_numbers, edge_distance, edge_index, batch)
+   .. py:method:: forward(x, atomic_numbers, edge_distance, edge_index, batch, node_offset: int = 0)
 
 
diff --git a/_sources/autoapi/core/trainers/base_trainer/index.rst b/_sources/autoapi/core/trainers/base_trainer/index.rst
@@ -23,7 +23,7 @@ Classes
 Module Contents
 ---------------
 
-.. py:class:: BaseTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier: str, timestamp_id: str | None = None, run_dir: str | None = None, is_debug: bool = False, print_every: int = 100, seed: int | None = None, logger: str = 'wandb', local_rank: int = 0, amp: bool = False, cpu: bool = False, name: str = 'ocp', slurm=None, noddp: bool = False)
+.. py:class:: BaseTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier: str, timestamp_id: str | None = None, run_dir: str | None = None, is_debug: bool = False, print_every: int = 100, seed: int | None = None, logger: str = 'wandb', local_rank: int = 0, amp: bool = False, cpu: bool = False, name: str = 'ocp', slurm=None, noddp: bool = False, gp_gpus: int | None = None)
 
    Bases: :py:obj:`abc.ABC`
 

diff --git a/_sources/autoapi/core/trainers/index.rst b/_sources/autoapi/core/trainers/index.rst
@@ -26,7 +26,7 @@ Classes
 Package Contents
 ----------------
 
-.. py:class:: BaseTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier: str, timestamp_id: str | None = None, run_dir: str | None = None, is_debug: bool = False, print_every: int = 100, seed: int | None = None, logger: str = 'wandb', local_rank: int = 0, amp: bool = False, cpu: bool = False, name: str = 'ocp', slurm=None, noddp: bool = False)
+.. py:class:: BaseTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier: str, timestamp_id: str | None = None, run_dir: str | None = None, is_debug: bool = False, print_every: int = 100, seed: int | None = None, logger: str = 'wandb', local_rank: int = 0, amp: bool = False, cpu: bool = False, name: str = 'ocp', slurm=None, noddp: bool = False, gp_gpus: int | None = None)
 
    Bases: :py:obj:`abc.ABC`
 
@@ -105,7 +105,7 @@ Package Contents
    .. py:method:: save_results(predictions: dict[str, numpy.typing.NDArray], results_file: str | None, keys: collections.abc.Sequence[str] | None = None) -> None
 
 
-.. py:class:: OCPTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier, timestamp_id=None, run_dir=None, is_debug=False, print_every=100, seed=None, logger='wandb', local_rank=0, amp=False, cpu=False, slurm=None, noddp=False, name='ocp')
+.. py:class:: OCPTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier, timestamp_id=None, run_dir=None, is_debug=False, print_every=100, seed=None, logger='wandb', local_rank=0, amp=False, cpu=False, slurm=None, noddp=False, name='ocp', gp_gpus=None)
 
    Bases: :py:obj:`fairchem.core.trainers.base_trainer.BaseTrainer`
 

diff --git a/_sources/autoapi/core/trainers/ocp_trainer/index.rst b/_sources/autoapi/core/trainers/ocp_trainer/index.rst
@@ -23,7 +23,7 @@ Classes
 Module Contents
 ---------------
 
-.. py:class:: OCPTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier, timestamp_id=None, run_dir=None, is_debug=False, print_every=100, seed=None, logger='wandb', local_rank=0, amp=False, cpu=False, slurm=None, noddp=False, name='ocp')
+.. py:class:: OCPTrainer(task, model, outputs, dataset, optimizer, loss_functions, evaluation_metrics, identifier, timestamp_id=None, run_dir=None, is_debug=False, print_every=100, seed=None, logger='wandb', local_rank=0, amp=False, cpu=False, slurm=None, noddp=False, name='ocp', gp_gpus=None)
 
    Bases: :py:obj:`fairchem.core.trainers.base_trainer.BaseTrainer`
 

diff --git a/_sources/core/fine-tuning/fine-tuning-oxides.md b/_sources/core/fine-tuning/fine-tuning-oxides.md
@@ -207,21 +207,23 @@ yml = generate_yml_config(checkpoint_path, 'config.yml',
                            'optim.loss_force', # the checkpoint setting causes an error
                            'dataset', 'test_dataset', 'val_dataset'],
                    update={'gpus': 1,
-                           'task.dataset': 'ase_db',
                            'optim.eval_every': 10,
                            'optim.max_epochs': 1,
                            'optim.batch_size': 4,
                             'logger':'tensorboard', # don't use wandb!
                            # Train data
                            'dataset.train.src': 'train.db',
+                           'dataset.train.format': 'ase_db',
                            'dataset.train.a2g_args.r_energy': True,
                            'dataset.train.a2g_args.r_forces': True,
                             # Test data - prediction only so no regression
                            'dataset.test.src': 'test.db',
+                           'dataset.test.format': 'ase_db',
                            'dataset.test.a2g_args.r_energy': False,
                            'dataset.test.a2g_args.r_forces': False,
                            # val data
                            'dataset.val.src': 'val.db',
+                           'dataset.val.format': 'ase_db',
                            'dataset.val.a2g_args.r_energy': True,
                            'dataset.val.a2g_args.r_forces': True,
                           })
Original file line number	Diff line number	Diff line change
Expand Up		@@ -37,6 +37,6 @@ Module Contents
		:type rescale_factor: float


		.. py:method:: forward(atomic_numbers, edge_distance, edge_index)
		.. py:method:: forward(atomic_numbers, edge_distance, edge_index, num_nodes, node_offset=0)