evidentlyai · Liraim · Sep 19, 2025 · Sep 8, 2025 · Sep 8, 2025 · Sep 8, 2025
diff --git a/examples/cookbook/correlations_metrics.ipynb b/examples/cookbook/correlations_metrics.ipynb
diff --git a/examples/cookbook/metrics.ipynb b/examples/cookbook/metrics.ipynb
diff --git a/src/evidently/core/metric_types.py b/src/evidently/core/metric_types.py
@@ -24,6 +24,7 @@
 from typing import Union
 
 import numpy as np
+import pandas as pd
 import typing_inspect
 
 from evidently._pydantic_compat import BaseModel
@@ -460,6 +461,33 @@ def set_metric_location(self, metric: MetricConfig):
         self.std.metric_value_location = mean_std_value_location(metric, False)
 
 
+class DataframeValue(MetricResult):
+    value: pd.DataFrame
+
+    def set_metric_location(self, metric: MetricConfig):
+        self.metric_value_location = dataframe_value_location(metric)
+
+    def to_simple_dict(self) -> object:
+        return self.value.to_dict()
+
+    def iter_single_values(self) -> typing.Iterator[SingleValue]:
+        df = self.value
+        label_columns = df.select_dtypes(exclude=["number"]).columns.tolist()
+        value_columns = df.select_dtypes(include=["number"]).columns.tolist()
+        assert self.metric_value_location is not None
+        metric = self.metric_value_location.metric
+        for index, row in df.iterrows():
+            data = row.to_dict()
+            labels = {col: str(data[col]) for col in label_columns}
+            for column in value_columns:
+                value = data[column]
+                yield SingleValue(
+                    value=value,
+                    display_name=column,
+                    metric_value_location=MetricValueLocation(metric, {"column": column, **labels}),
+                )
+
+
 class DatasetType(enum.Enum):
     Current = "current"
     Reference = "reference"
@@ -473,6 +501,10 @@ def by_label_location(metric: MetricConfig, label: Label) -> MetricValueLocation
     return MetricValueLocation(metric, {"label": label})
 
 
+def dataframe_value_location(metric: MetricConfig) -> MetricValueLocation:
+    return MetricValueLocation(metric, {})
+
+
 ByLabelCountSlot = Union[Literal["count"], Literal["share"]]
 
 

diff --git a/src/evidently/core/registries/metric_results.py b/src/evidently/core/registries/metric_results.py
@@ -8,3 +8,5 @@
 register_type_alias(MetricResult, "evidently.core.metric_types.CountValue", "evidently:metric_result_v2:CountValue")
 register_type_alias(MetricResult, "evidently.core.metric_types.MeanStdValue", "evidently:metric_result_v2:MeanStdValue")
 register_type_alias(MetricResult, "evidently.core.metric_types.SingleValue", "evidently:metric_result_v2:SingleValue")
+
+register_type_alias(MetricResult, "evidently.core.metric_types.DataframeValue", "evidently:metric_result_v2:DataframeValue")
diff --git a/src/evidently/core/registries/metrics.py b/src/evidently/core/registries/metrics.py
@@ -88,3 +88,7 @@
 
 register_type_alias(Metric, "evidently.metrics.regression.MeanStdRegressionMetric", "evidently:metric_v2:MeanStdRegressionMetric")
 register_type_alias(Metric, "evidently.metrics.regression.SingleValueRegressionMetric", "evidently:metric_v2:SingleValueRegressionMetric")
+
+register_type_alias(Metric, "evidently.metrics.data_quality.ColumnCorrelations", "evidently:metric_v2:ColumnCorrelations")
+
+register_type_alias(Metric, "evidently.metrics.data_quality.DatasetCorrelations", "evidently:metric_v2:DatasetCorrelations")
diff --git a/src/evidently/legacy/ui/demo_projects/bikes.py b/src/evidently/legacy/ui/demo_projects/bikes.py
@@ -31,11 +31,19 @@ def create_data():
     if os.path.exists("Bike-Sharing-Dataset.zip"):
         with open("Bike-Sharing-Dataset.zip", "rb") as f:
             content = f.read()
+    elif os.path.exists("../../../../../test_data/bike_sharing_dataset.zip"):
+        with open("../../../../../test_data/bike_sharing_dataset.zip", "rb") as f:
+            content = f.read()
     else:
-        content = requests.get(
+        response = requests.get(
             "https://archive.ics.uci.edu/static/public/275/bike+sharing+dataset.zip",
             verify=False,
-        ).content
+        )
+        if response.status_code != 200:
+            raise ValueError(f"Could not download bike sharing dataset. {response.text}")
+        if response.status_code == 200 and response.headers["content-type"] != "application/zip":
+            raise ValueError(f"Invalid bike sharing dataset content type: {response.headers['content-type']}.")
+        content = response.content
     with zipfile.ZipFile(io.BytesIO(content)) as arc:
         raw_data = pd.read_csv(
             arc.open("hour.csv"),

diff --git a/src/evidently/metrics/__init__.py b/src/evidently/metrics/__init__.py
@@ -38,6 +38,8 @@
 from .column_statistics import SumValue
 from .column_statistics import UniqueValueCount
 from .column_statistics import ValueDrift
+from .data_quality import ColumnCorrelations
+from .data_quality import DatasetCorrelations
 from .dataset_statistics import AlmostConstantColumnsCount
 from .dataset_statistics import AlmostDuplicatedColumnsCount
 from .dataset_statistics import ColumnCount
@@ -142,4 +144,7 @@
     "DummyFPR",
     "DummyFNR",
     "DummyAccuracy",
+    # Data Quality
+    "ColumnCorrelations",
+    "DatasetCorrelations",
 ]
diff --git a/src/evidently/metrics/data_quality.py b/src/evidently/metrics/data_quality.py
@@ -0,0 +1,87 @@
+from typing import List
+from typing import Optional
+from typing import Sequence
+from typing import Tuple
+
+from evidently.core.metric_types import BoundTest
+from evidently.core.metric_types import DataframeValue
+from evidently.core.metric_types import Metric
+from evidently.core.report import Context
+from evidently.legacy.metrics.data_quality.column_correlations_metric import ColumnCorrelationsMetric
+from evidently.legacy.metrics.data_quality.column_correlations_metric import ColumnCorrelationsMetricResult
+from evidently.legacy.metrics.data_quality.dataset_correlations_metric import DatasetCorrelationsMetric
+from evidently.legacy.metrics.data_quality.dataset_correlations_metric import DatasetCorrelationsMetricResult
+from evidently.legacy.model.widget import BaseWidgetInfo
+from evidently.metrics._legacy import LegacyMetricCalculation
+
+
+class ColumnCorrelations(Metric):
+    column_name: str
+
+    def get_bound_tests(self, context: "Context") -> Sequence[BoundTest]:
+        return []
+
+
+class LegacyColumnCorrelationsCalculation(
+    LegacyMetricCalculation[
+        DataframeValue,
+        ColumnCorrelations,
+        ColumnCorrelationsMetricResult,
+        ColumnCorrelationsMetric,
+    ],
+):
+    def display_name(self) -> str:
+        return f"Correlations between {self.metric.column_name} column and all the other columns."
+
+    def calculate_value(
+        self, context: "Context", legacy_result: ColumnCorrelationsMetricResult, render: List[BaseWidgetInfo]
+    ) -> Tuple[DataframeValue, Optional[DataframeValue]]:
+        current_result = legacy_result.current
+        current_correlations = next(iter(current_result.values()))
+        current_df = current_correlations.get_pandas()
+        current_value = DataframeValue(display_name=self.display_name(), value=current_df)
+        current_value.widget = render
+        reference_value = None
+        if legacy_result.reference is not None:
+            reference_result = next(iter(legacy_result.reference.values()))
+            reference_df = reference_result.get_pandas()
+            reference_value = DataframeValue(display_name=self.display_name(), value=reference_df)
+            reference_value.widget = []
+        return current_value, reference_value
+
+    def legacy_metric(self) -> ColumnCorrelationsMetric:
+        return ColumnCorrelationsMetric(column_name=self.metric.column_name)
+
+
+class DatasetCorrelations(Metric):
+    def get_bound_tests(self, context: "Context") -> Sequence[BoundTest]:
+        return []
+
+
+class LegacyDatasetCorrelationsCalculation(
+    LegacyMetricCalculation[
+        DataframeValue,
+        DatasetCorrelations,
+        DatasetCorrelationsMetricResult,
+        DatasetCorrelationsMetric,
+    ],
+):
+    def legacy_metric(self) -> DatasetCorrelationsMetric:
+        return DatasetCorrelationsMetric()
+
+    def calculate_value(
+        self, context: "Context", legacy_result: DatasetCorrelationsMetricResult, render: List[BaseWidgetInfo]
+    ) -> Tuple[DataframeValue, Optional[DataframeValue]]:
+        current_result = legacy_result.current
+        current_df = next(iter(current_result.correlation.values()))
+        current_value = DataframeValue(display_name=self.display_name(), value=current_df)
+        current_value.widget = render
+        reference_value = None
+        if legacy_result.reference is not None:
+            reference_df = next(iter(legacy_result.reference.correlation.values()))
+            reference_value = DataframeValue(display_name=self.display_name(), value=reference_df)
+            reference_value.widget = []
+        return current_value, reference_value
+
+    def display_name(self) -> str:
+        return """Calculate different correlations with target, predictions and features"""
diff --git a/src/evidently/ui/service/storage/local/base.py b/src/evidently/ui/service/storage/local/base.py
@@ -18,6 +18,7 @@
 from evidently.core.metric_types import ByLabelCountValue
 from evidently.core.metric_types import ByLabelValue
 from evidently.core.metric_types import CountValue
+from evidently.core.metric_types import DataframeValue
 from evidently.core.metric_types import MeanStdValue
 from evidently.core.metric_types import SingleValue
 from evidently.core.serialization import SnapshotModel
@@ -296,6 +297,9 @@ def _add_snapshot_points_sync(self, project_id: ProjectID, snapshot_id: Snapshot
                     self._add_value(project_id, snapshot_id, snapshot.timestamp, value)
                 for value in result.shares.values():
                     self._add_value(project_id, snapshot_id, snapshot.timestamp, value)
+            elif isinstance(result, DataframeValue):
+                for value in result.iter_single_values():
+                    self._add_value(project_id, snapshot_id, snapshot.timestamp, value)
             else:
                 raise ValueError(f"type {type(result)} isn't supported")
 

diff --git a/test_data/bike_sharing_dataset.CITATION b/test_data/bike_sharing_dataset.CITATION
@@ -0,0 +1,25 @@
+=========================================
+License
+=========================================
+Use of this dataset in publications must be cited to the following publication:
+
+[1] Fanaee-T, Hadi, and Gama, Joao, "Event labeling combining ensemble detectors and background knowledge", Progress in Artificial Intelligence (2013): pp. 1-15, Springer Berlin Heidelberg, doi:10.1007/s13748-013-0040-3.
+
+@article{
+	year={2013},
+	issn={2192-6352},
+	journal={Progress in Artificial Intelligence},
+	doi={10.1007/s13748-013-0040-3},
+	title={Event labeling combining ensemble detectors and background knowledge},
+	url={http://dx.doi.org/10.1007/s13748-013-0040-3},
+	publisher={Springer Berlin Heidelberg},
+	keywords={Event labeling; Event detection; Ensemble learning; Background knowledge},
+	author={Fanaee-T, Hadi and Gama, Joao},
+	pages={1-15}
+}
+
+=========================================
+Contact
+=========================================
+
+For further information about this dataset please contact Hadi Fanaee-T ([email protected])
diff --git a/test_data/bike_sharing_dataset.zip b/test_data/bike_sharing_dataset.zip
diff --git a/tests/future/metrics/test_correlations.py b/tests/future/metrics/test_correlations.py
@@ -0,0 +1,56 @@
+import numpy as np
+import pandas as pd
+
+from evidently import BinaryClassification
+from evidently import DataDefinition
+from evidently import Dataset
+from evidently import Report
+from evidently.core.metric_types import DataframeValue
+from evidently.metrics import ColumnCorrelations
+from evidently.metrics.data_quality import DatasetCorrelations
+
+
+def test_column_correlations():
+    df = pd.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]})
+    ds = Dataset.from_pandas(df)
+
+    metric = ColumnCorrelations(column_name="a")
+    report = Report(metrics=[metric])
+
+    run = report.run(ds)
+
+    result = run.context.get_metric_result(metric)
+    assert isinstance(result, DataframeValue)
+    pd.testing.assert_frame_equal(result.value, pd.DataFrame([{"kind": "cramer_v", "column_name": "b", "value": 1.0}]))
+
+
+def test_dataset_correlations():
+    df = pd.DataFrame(
+        {
+            "my_target": [1, np.nan, 3] * 1000,
+            "my_prediction": [1, 2, np.nan] * 1000,
+            "feature_1": [1, 2, 3] * 1000,
+            "feature_2": ["a", np.nan, "a"] * 1000,
+        }
+    )
+    ds = Dataset.from_pandas(
+        df,
+        data_definition=DataDefinition(
+            classification=[BinaryClassification(target="my_target", prediction_labels="my_prediction")]
+        ),
+    )
+
+    metric = DatasetCorrelations()
+    report = Report(metrics=[metric])
+
+    run = report.run(ds)
+
+    result = run.context.get_metric_result(metric)
+    assert isinstance(result, DataframeValue)
+    pd.testing.assert_frame_equal(
+        result.value,
+        pd.DataFrame(
+            [{"my_target": 1, "my_prediction": np.nan}, {"my_target": np.nan, "my_prediction": 1}],
+            index=["my_target", "my_prediction"],
+        ),
+    )