add transform for merging repeated measurements (#1606)

sdaulton · facebook-github-bot · commit 50b9951c4b1f · 2023-05-04T12:27:54.000-07:00
Summary: Pull Request resolved: #1606 Use inverse-variance weighting to merge repeated observations (e.g. across different trials) for a given arm. This ignores the trial_index and assumes stationarity. Reviewed By: Balandat Differential Revision: D45558427 fbshipit-source-id: b58d27c32b14e7612d7773010544074ac7c346bd
diff --git a/ax/modelbridge/tests/test_merge_repeated_measurements_transform.py b/ax/modelbridge/tests/test_merge_repeated_measurements_transform.py
@@ -0,0 +1,170 @@
+#!/usr/bin/env python3
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+#
+# This source code is licensed under the MIT license found in the
+# LICENSE file in the root directory of this source tree.
+
+import numpy as np
+from ax.core.observation import Observation, ObservationData, ObservationFeatures
+from ax.modelbridge.transforms.merge_repeated_measurements import (
+    MergeRepeatedMeasurements,
+)
+from ax.utils.common.testutils import TestCase
+
+
+def compare_obs(
+    test: TestCase, obs1: Observation, obs2: Observation, discrepancy_tol: float = 1e-8
+) -> None:
+    test.assertEqual(obs1.data.metric_names, obs2.data.metric_names)
+    test.assertTrue(np.array_equal(obs1.data.means, obs2.data.means))
+    discrep = np.max(np.abs(obs1.data.covariance - obs2.data.covariance))
+    test.assertTrue(discrep <= discrepancy_tol)
+    test.assertTrue(obs1.features.parameters == obs2.features.parameters)
+
+
+class MergeRepeatedMeasurementsTransformTest(TestCase):
+    def testTransform(self) -> None:
+        obs_feats1 = ObservationFeatures(parameters={"a": 0.0})
+        with self.assertRaises(RuntimeError):
+            # test that observations are required
+            MergeRepeatedMeasurements()
+        # test nan in covariance
+        observation = Observation(
+            data=ObservationData(
+                metric_names=["m1"],
+                means=np.array([1.0]),
+                covariance=np.array([[float("nan")]]),
+            ),
+            features=obs_feats1,
+        )
+        with self.assertRaises(NotImplementedError):
+            MergeRepeatedMeasurements(observations=[observation])
+        # test full covariance
+        observation = Observation(
+            data=ObservationData(
+                metric_names=["m1", "m2"],
+                means=np.array([1.0, 1.0]),
+                covariance=np.ones((2, 2)),
+            ),
+            features=obs_feats1,
+        )
+        with self.assertRaises(NotImplementedError):
+            MergeRepeatedMeasurements(observations=[observation])
+
+        # test noiseless, different means
+        zero_covar = np.zeros((1, 1))
+        observations = [
+            Observation(
+                data=ObservationData(
+                    metric_names=["m1"],
+                    means=np.array([1.0]),
+                    covariance=zero_covar,
+                ),
+                features=obs_feats1,
+            ),
+            Observation(
+                data=ObservationData(
+                    metric_names=["m1"],
+                    means=np.array([2.0]),
+                    covariance=zero_covar,
+                ),
+                features=obs_feats1,
+            ),
+        ]
+        with self.assertRaises(ValueError):
+            MergeRepeatedMeasurements(observations=observations)
+        # test noiseless, same means
+        observations = [
+            Observation(
+                data=ObservationData(
+                    metric_names=["m1"],
+                    means=np.array([1.0]),
+                    covariance=zero_covar,
+                ),
+                features=obs_feats1,
+            ),
+            Observation(
+                data=ObservationData(
+                    metric_names=["m1"],
+                    means=np.array([1.0]),
+                    covariance=zero_covar,
+                ),
+                features=obs_feats1,
+            ),
+            Observation(
+                data=ObservationData(
+                    metric_names=["m1"],
+                    means=np.array([2.0]),
+                    covariance=zero_covar,
+                ),
+                features=ObservationFeatures(parameters={"a": 2.0}),
+            ),
+        ]
+        t = MergeRepeatedMeasurements(observations=observations)
+        expected_obs = observations[-2:]
+        transformed_obs = t.transform_observations(observations)
+        for i in (0, 1):
+            compare_obs(
+                test=self,
+                obs1=expected_obs[i],
+                obs2=transformed_obs[i],
+                discrepancy_tol=0.0,
+            )
+
+        # basic test
+        obs_feat1 = ObservationFeatures(parameters={"a": 0.0, "b": 1.0})
+        obs1 = Observation(
+            data=ObservationData(
+                metric_names=["m1", "m2"],
+                means=np.array([1.0, 2.0]),
+                covariance=np.array(
+                    [
+                        [1.0, 0.0],
+                        [0.0, 2.0],
+                    ]
+                ),
+            ),
+            features=obs_feat1,
+        )
+        obs2 = Observation(
+            data=ObservationData(
+                metric_names=["m1", "m2"],
+                means=np.array([1.0, 1.0]),
+                covariance=np.array(
+                    [
+                        [1.0, 0.0],
+                        [0.0, 3.0],
+                    ]
+                ),
+            ),
+            features=obs_feat1,
+        )
+        # different arm
+        obs3 = Observation(
+            data=ObservationData(
+                metric_names=["m1", "m2"],
+                means=np.array([3.0, 1.0]),
+                covariance=np.array(
+                    [
+                        [4.0, 0.0],
+                        [0.0, 5.0],
+                    ]
+                ),
+            ),
+            features=ObservationFeatures(parameters={"a": 1.0, "b": 0.0}),
+        )
+        expected_obs = Observation(
+            data=ObservationData(
+                metric_names=["m1", "m2"],
+                means=np.array([1.0, 1.6]),
+                covariance=np.array([[0.5, 0.0], [0.0, 1.2]]),
+            ),
+            features=obs_feat1,
+        )
+        observations = [obs1, obs2, obs3]
+        t = MergeRepeatedMeasurements(observations=observations)
+        observations2 = t.transform_observations(observations)
+        compare_obs(
+            test=self, obs1=expected_obs, obs2=observations2[0], discrepancy_tol=1e-8
+        )
+        compare_obs(test=self, obs1=obs3, obs2=observations2[1], discrepancy_tol=0.0)
diff --git a/ax/modelbridge/transforms/merge_repeated_measurements.py b/ax/modelbridge/transforms/merge_repeated_measurements.py
@@ -0,0 +1,124 @@
+#!/usr/bin/env python3
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+#
+# This source code is licensed under the MIT license found in the
+# LICENSE file in the root directory of this source tree.
+
+from __future__ import annotations
+
+from collections import defaultdict
+from typing import DefaultDict, Dict, List, Optional
+
+import numpy as np
+from ax.core.arm import Arm
+from ax.core.observation import Observation, ObservationData, separate_observations
+from ax.core.search_space import SearchSpace
+from ax.modelbridge.base import ModelBridge
+from ax.modelbridge.transforms.base import Transform
+from ax.models.types import TConfig
+
+
+class MergeRepeatedMeasurements(Transform):
+    """Merge repeated measurements for to obtain one observation per arm.
+
+    Repeated measurements are merged via inverse variance weighting (e.g. over
+    different trials). This intentionally ignores the trial index and assumes
+    stationarity.
+
+    TODO: Support inverse variance weighting correlated outcomes (full covariance).
+
+    Note: this is not reversible.
+    """
+
+    def __init__(
+        self,
+        search_space: Optional[SearchSpace] = None,
+        observations: Optional[List[Observation]] = None,
+        modelbridge: Optional[ModelBridge] = None,
+        config: Optional[TConfig] = None,
+    ) -> None:
+        if observations is None:
+            raise RuntimeError("MergeRepeatedMeasurements requires observations")
+        # create a mapping of arm_key -> {metric_name: {means: [], vars: []}}
+        arm_to_multi_obs: DefaultDict[
+            str, DefaultDict[str, DefaultDict[str, List[float]]]
+        ] = defaultdict(lambda: defaultdict(lambda: defaultdict(list)))
+        observation_features, observation_data = separate_observations(observations)
+        #
+        for j, obsd in enumerate(observation_data):
+            # This intentionally ignores the trial index
+            key = Arm.md5hash(observation_features[j].parameters)
+            # TODO: support inverse variance weighting for multivariate distributions
+            # (full covariance)
+            diag = np.diag(np.diag(obsd.covariance))
+            if np.any(np.isnan(obsd.covariance)):
+                raise NotImplementedError("All metrics must have noise observations.")
+            elif ~np.all(obsd.covariance == diag):
+                raise NotImplementedError(
+                    "Only independent metrics are currently supported."
+                )
+            for i, m in enumerate(obsd.metric_names):
+                arm_to_multi_obs[key][m]["means"].append(obsd.means[i])
+                arm_to_multi_obs[key][m]["vars"].append(obsd.covariance[i, i])
+
+        self.arm_to_merged: DefaultDict[str, Dict[str, Dict[str, float]]] = defaultdict(
+            dict
+        )
+        for k, metric_dict in arm_to_multi_obs.items():
+            for m, v in metric_dict.items():
+                # inverse variance weighting
+                var = np.array(v["vars"])
+                means = np.array(v["means"])
+                noiseless = var == 0
+                if np.any(noiseless):
+                    noiseless_means = means[noiseless]
+                    if (noiseless_means.shape[0] > 1) and (
+                        not np.all(noiseless_means[1:] == noiseless_means[0])
+                    ):
+                        raise ValueError(
+                            "All repeated arms with noiseless measurements "
+                            "must have the same means."
+                        )
+                    self.arm_to_merged[k][m] = {
+                        "mean": noiseless_means[0],
+                        "var": 0.0,
+                    }
+                else:
+                    inv_var = 1 / np.array(var)
+                    inv_sum_inv_var = 1 / np.sum(inv_var)
+                    weights = inv_var * inv_sum_inv_var
+                    self.arm_to_merged[k][m] = {
+                        "mean": np.sum(means * weights),
+                        "var": inv_sum_inv_var,
+                    }
+
+    def transform_observations(
+        self,
+        observations: List[Observation],
+    ) -> List[Observation]:
+        # Transform observations
+        new_observations = []
+        observation_features, observation_data = separate_observations(observations)
+        for j, obsd in enumerate(observation_data):
+            key = Arm.md5hash(observation_features[j].parameters)
+            # pop to ensure that the resulting observations list has one
+            # observation per unique arm
+            metric_dict = self.arm_to_merged.pop(key, None)
+            if metric_dict is None:
+                continue
+            merged_means = np.zeros(len(obsd.metric_names))
+            merged_covariance = np.zeros(
+                (len(obsd.metric_names), len(obsd.metric_names))
+            )
+            for i, m in enumerate(obsd.metric_names):
+                merged_metric = metric_dict[m]
+                merged_means[i] = merged_metric["mean"]
+                merged_covariance[i, i] = merged_metric["var"]
+            new_obsd = ObservationData(
+                metric_names=obsd.metric_names,
+                means=merged_means,
+                covariance=merged_covariance,
+            )
+            new_obs = Observation(features=observation_features[j], data=new_obsd)
+            new_observations.append(new_obs)
+        return new_observations
diff --git a/sphinx/source/modelbridge.rst b/sphinx/source/modelbridge.rst
@@ -259,6 +259,14 @@ Transforms
     :undoc-members:
     :show-inheritance:
 
+`ax.modelbridge.transforms.merge_repeated_measurements`
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+.. automodule:: ax.modelbridge.transforms.merge_repeated_measurements
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
 `ax.modelbridge.transforms.metrics_as_task`
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~