aeon-toolkit · pattplatt · Nov 21, 2024 · Nov 21, 2024
@@ -12,6 +12,7 @@
     "CBLOF",
     "COPOD",
     "OneClassSVM",
+    "ROCKAD",
 ]
 
 from aeon.anomaly_detection._cblof import CBLOF
@@ -23,5 +24,6 @@
 from aeon.anomaly_detection._merlin import MERLIN
 from aeon.anomaly_detection._one_class_svm import OneClassSVM
 from aeon.anomaly_detection._pyodadapter import PyODAdapter
+from aeon.anomaly_detection._rockad import ROCKAD
 from aeon.anomaly_detection._stomp import STOMP
 from aeon.anomaly_detection._stray import STRAY
@@ -0,0 +1,301 @@
+"""ROCKAD anomaly detector."""
+
+__all__ = ["ROCKAD"]
+
+from typing import Optional
+
+import numpy as np
+import pandas as pd
+from sklearn.neighbors import NearestNeighbors
+from sklearn.preprocessing import PowerTransformer, StandardScaler
+from sklearn.utils import resample
+
+from aeon.anomaly_detection.base import BaseAnomalyDetector
+from aeon.transformations.collection.convolution_based import Rocket
+from aeon.utils.windowing import reverse_windowing, sliding_windows
+
+
+class ROCKAD(BaseAnomalyDetector):
+    """
+    ROCKET-based Anomaly Detector (ROCKAD).
+
+    ROCKAD leverages the ROCKET transformation for feature extraction from
+    time series data and applies the scikit learn k-nearest neighbors (k-NN)
+    approach with bootstrap aggregation for robust anomaly detection.
+
+    This class supports both univariate and multivariate time series and
+    provides options for normalizing features, applying power transformations,
+    and customizing the distance metric.
+
+    Parameters
+    ----------
+    n_estimators : int, default=10
+        Number of k-NN estimators to use in the bootstrap aggregation.
+    n_kernels : int, default=100
+        Number of kernels to use in the ROCKET transformation.
+    normalise : bool, default=True
+        Whether to normalize the ROCKET-transformed features.
+    n_neighbors : int, default=5
+        Number of neighbors to use for the k-NN algorithm.
+    n_jobs : int, default=1
+        Number of parallel jobs to use for the k-NN algorithm and ROCKET transformation.
+    metric : str, default="euclidean"
+        Distance metric to use for the k-NN algorithm.
+    power_transform : bool, default=True
+        Whether to apply a power transformation (e.g., Yeo-Johnson) to the features.
+    window_size : int, default=10
+        Size of the sliding window for segmenting input time series data.
+    stride : int, default=1
+        Step size for moving the sliding window over the time series data.
+    random_state : int, default=42
+        Random seed for reproducibility.
+
+    Attributes
+    ----------
+    rocket_transformer_ : Optional[Rocket]
+        Instance of the ROCKET transformer used to extract features, set after fitting.
+    estimator_ : Optional[NearestNeighbors]
+        k-NN estimator used for anomaly scoring, set after fitting.
+    scaler_ : StandardScaler
+        Scaler used for normalizing the ROCKET-transformed features.
+    power_transformer_ : PowerTransformer
+        Transformer used to apply power transformation to the features.
+    n_inf_cols_ : list
+        List of feature columns containing infinite values, identified during fitting.
+    """
+
+    _tags = {
+        "capability:univariate": True,
+        "capability:multivariate": True,
+        "capability:missing_values": False,
+        "fit_is_empty": False,
+    }
+
+    def __init__(
+        self,
+        n_estimators=10,
+        n_kernels=100,
+        normalise=True,
+        n_neighbors=5,
+        n_jobs=1,
+        metric="euclidean",
+        power_transform=True,
+        window_size: int = 10,
+        stride: int = 1,
+        random_state=42,
+    ):
+        super().__init__(axis=0)
+
+        self.n_estimators = n_estimators
+        self.n_kernels = n_kernels
+        self.normalise = normalise
+        self.n_neighbors = n_neighbors
+        self.n_jobs = n_jobs
+        self.metric = metric
+        self.power_transform = power_transform
+        self.window_size = window_size
+        self.stride = stride
+        self.random_state = random_state
+
+        self.rocket_transformer_: Optional[Rocket] = None
+        self.estimator_: Optional[NearestNeighbors] = None
+        self.scaler_: Optional[StandardScaler] = None
+        self.power_transformer_: Optional[PowerTransformer] = None
+        self.n_inf_cols_: Optional[list] = None
+
+    def _fit(self, X: np.ndarray, y: Optional[np.ndarray] = None) -> "ROCKAD":
+        self._check_params(X)
+
+        _X, _ = sliding_windows(
+            X, window_size=self.window_size, stride=self.stride, axis=0
+        )
+
+        self._inner_fit(_X)
+
+        return self
+
+    def _check_params(self, X: np.ndarray) -> None:
+        if self.window_size < 1 or self.window_size > X.shape[0]:
+            raise ValueError(
+                "The window size must be at least 1 and at most the length of the "
+                "time series."
+            )
+
+        if self.stride < 1 or self.stride > self.window_size:
+            raise ValueError(
+                "The stride must be at least 1 and at most the window size."
+            )
+
+    def _inner_fit(self, X: np.ndarray) -> None:
+        self.rocket_transformer_ = Rocket(
+            num_kernels=self.n_kernels,
+            normalise=self.normalise,
+            n_jobs=self.n_jobs,
+            random_state=self.random_state,
+        )
+
+        Xt = self.rocket_transformer_.fit_transform(X)
+        Xt = Xt.astype("float64")
+        self.Xtp = None  # X: values, t: (rocket) transformed, p: power transformed
+
+        if self.power_transform is True:
+            self.power_transformer_ = PowerTransformer(standardize=False)
+            Xtp = self.power_transformer_.fit_transform(Xt)
+
+            self.Xtp = pd.DataFrame(Xtp)
+
+        else:
+            self.Xtp = pd.DataFrame(Xt)
+
+        Xtp_scaled = None
+
+        if self.power_transform is True:
+            # Check for infinite columns and get indices
+            self.n_inf_cols_ = []
+            self._check_inf_values(self.Xtp)
+            # Remove infinite columns
+            self.Xtp = self.Xtp[
+                self.Xtp.columns[~self.Xtp.columns.isin(self.n_inf_cols_)]
+            ]
+
+            # Fit Scaler
+            self.scaler_ = StandardScaler()
+            Xtp_scaled = self.scaler_.fit_transform(self.Xtp)
+
+            Xtp_scaled = pd.DataFrame(Xtp_scaled, columns=self.Xtp.columns)
+
+            self._check_inf_values(Xtp_scaled)
+
+            Xtp_scaled = Xtp_scaled.astype(np.float64).to_numpy()
+
+        else:
+            Xtp_scaled = self.Xtp.astype(np.float64).to_numpy()
+
+        self.list_baggers = []
+
+        for idx_estimator in range(self.n_estimators):
+            # Initialize estimator
+            self.estimator = NearestNeighbors(
+                n_neighbors=self.n_neighbors,
+                n_jobs=self.n_jobs,
+                metric=self.metric,
+                algorithm="kd_tree",
+            )
+            # Bootstrap Aggregation
+            Xtp_scaled_sample = resample(
+                Xtp_scaled,
+                replace=True,
+                n_samples=None,
+                random_state=self.random_state + idx_estimator,
+                stratify=None,
+            )
+
+            # Fit estimator and append to estimator list
+            self.estimator.fit(Xtp_scaled_sample)
+            self.list_baggers.append(self.estimator)
+
+    def _predict(self, X) -> np.ndarray:
+
+        _X, padding = sliding_windows(
+            X, window_size=self.window_size, stride=self.stride, axis=0
+        )
+
+        point_anomaly_scores = self._inner_predict(_X, padding)
+
+        return point_anomaly_scores
+
+    def _fit_predict(self, X: np.ndarray, y: Optional[np.ndarray] = None) -> np.ndarray:
+        self._check_params(X)
+        _X, padding = sliding_windows(
+            X, window_size=self.window_size, stride=self.stride, axis=0
+        )
+
+        self._inner_fit(_X)
+        point_anomaly_scores = self._inner_predict(_X, padding)
+        return point_anomaly_scores
+
+    def _inner_predict(self, X: np.ndarray, padding: int) -> np.ndarray:
+
+        anomaly_scores = self._predict_proba(X)
+
+        point_anomaly_scores = reverse_windowing(
+            anomaly_scores, self.window_size, np.nanmean, self.stride, padding
+        )
+
+        point_anomaly_scores = (point_anomaly_scores - point_anomaly_scores.min()) / (
+            point_anomaly_scores.max() - point_anomaly_scores.min()
+        )
+
+        return point_anomaly_scores
+
+    def _predict_proba(self, X):
+        """
+        Predicts the probability of anomalies for the input data.
+
+        Parameters
+        ----------
+            X (array-like): The input data.
+
+        Returns
+        -------
+            np.ndarray: The predicted probabilities.
+
+        """
+        y_scores = np.zeros((len(X), self.n_estimators))
+        # Transform into rocket feature space
+        Xt = self.rocket_transformer_.transform(X)
+        Xtp_scaled = None
+
+        if self.power_transform is True:
+            # Power Transform using yeo-johnson
+            Xtp = self.power_transformer_.transform(Xt)
+            Xtp = pd.DataFrame(Xtp)
+
+            # Check for infinite columns and remove them
+            self._check_inf_values(Xtp)
+            Xtp = Xtp[Xtp.columns[~Xtp.columns.isin(self.n_inf_cols_)]]
+            Xtp_temp = Xtp.copy()
+
+            # Scale the data
+            Xtp_scaled = self.scaler_.transform(Xtp_temp)
+            Xtp_scaled = pd.DataFrame(Xtp_scaled, columns=Xtp_temp.columns)
+
+            # Check for infinite columns and remove them
+            self._check_inf_values(Xtp_scaled)
+            Xtp_scaled = Xtp_scaled[
+                Xtp_scaled.columns[~Xtp_scaled.columns.isin(self.n_inf_cols_)]
+            ]
+            Xtp_scaled = Xtp_scaled.astype(np.float64).to_numpy()
+
+        else:
+            Xtp_scaled = Xt.astype(np.float64)
+
+        for idx, bagger in enumerate(self.list_baggers):
+            # Get scores from each estimator
+            distances, _ = bagger.kneighbors(Xtp_scaled)
+            # Compute mean distance of nearest points in window
+            scores = distances.mean(axis=1).reshape(-1, 1)
+            scores = scores.squeeze()
+            y_scores[:, idx] = scores
+
+        # Average the scores to get the final score for each time series
+        y_scores = y_scores.mean(axis=1)
+        return y_scores
+
+    def _check_inf_values(self, X):
+        """
+        Check for infinite values in X and update the infinite columns list.
+
+        Parameters
+        ----------
+            X (array-like): The input data.
+
+        Returns
+        -------
+            bool: True if there are infinite values, False otherwise.
+
+        """
+        if np.isinf(X[X.columns[~X.columns.isin(self.n_inf_cols_)]]).any(axis=0).any():
+            self.n_inf_cols_.extend(X.columns.to_series()[np.isinf(X).any()])
+            self.fit_estimators()
+            return True
@@ -0,0 +1,67 @@
+"""Tests for the ROCKAD anomaly detector."""
+
+import numpy as np
+import pytest
+from sklearn.utils import check_random_state
+
+from aeon.anomaly_detection import ROCKAD
+
+
+def test_rockad_univariate():
+    """Test ROCKAD univariate output."""
+    rng = check_random_state(seed=2)
+    series = rng.normal(size=(100,))
+    series[50:58] -= 5
+
+    ad = ROCKAD(
+        n_estimators=100,
+        n_kernels=10,
+        normalise=True,
+        n_neighbors=9,
+        power_transform=True,
+        window_size=20,
+        stride=1,
+    )
+
+    pred = ad.fit_predict(series, axis=0)
+
+    assert pred.shape == (100,)
+    assert pred.dtype == np.float64
+    assert 50 <= np.argmax(pred) <= 58
+
+
+def test_rockad_multivariate():
+    """Test ROCKAD multivariate output."""
+    rng = check_random_state(seed=2)
+    series = rng.normal(size=(100, 3))
+    series[50:58, 0] -= 5
+    series[87:90, 1] += 0.1
+
+    ad = ROCKAD(
+        n_estimators=1000,
+        n_kernels=100,
+        normalise=True,
+        n_neighbors=20,
+        power_transform=True,
+        window_size=10,
+        stride=1,
+    )
+
+    pred = ad.fit_predict(series, axis=0)
+
+    assert pred.shape == (100,)
+    assert pred.dtype == np.float64
+    assert 50 <= np.argmax(pred) <= 58
+
+
+def test_rockad_incorrect_input():
+    """Test ROCKAD incorrect input."""
+    rng = check_random_state(seed=2)
+    series = rng.normal(size=(100,))
+
+    with pytest.raises(ValueError, match="The window size must be at least 1"):
+        ad = ROCKAD(window_size=0)
+        ad.fit_predict(series)
+    with pytest.raises(ValueError, match="The stride must be at least 1"):
+        ad = ROCKAD(stride=0)
+        ad.fit_predict(series)
diff --git a/docs/api_reference/anomaly_detection.rst b/docs/api_reference/anomaly_detection.rst
@@ -81,3 +81,4 @@ Detectors
     STRAY
     STOMP
     OneClassSVM
+    ROCKAD