From 386238796bb8e89048950a0f422046013be712e4 Mon Sep 17 00:00:00 2001
From: Sushobhan Parajuli <sp3886@gmail.com>
Date: Thu, 22 Jan 2026 19:34:02 +0000
Subject: [PATCH 1/2] remove decomposed meteric class and make changes to
 global metric class

---
 src/lenskit/metrics/_base.py | 70 +-----------------------------------
 1 file changed, 1 insertion(+), 69 deletions(-)

diff --git a/src/lenskit/metrics/_base.py b/src/lenskit/metrics/_base.py
index d637f7370..9ba518283 100644
--- a/src/lenskit/metrics/_base.py
+++ b/src/lenskit/metrics/_base.py
@@ -154,7 +154,7 @@ def summarize(
         }
 
 
-class GlobalMetric(Metric):
+class GlobalMetric:
     """
     Base class for metrics that measure entire runs at a time.
 
@@ -172,71 +172,3 @@ def measure_run(self, output: ItemListCollection, test: ItemListCollection, /) -
         Individual metric classes need to implement this method.
         """
         raise NotImplementedError()  # pragma: no cover
-
-    def measure_list(self, output: ItemList, test: ItemList, /) -> Any:
-        raise NotImplementedError("Global metrics don't support per-list measurement")
-
-    def summarize(self, values: list[Any] | pa.Array | pa.ChunkedArray, /) -> float:
-        raise NotImplementedError("Global metrics should implement measure_run instead")
-
-
-class DecomposedMetric(Metric):
-    """
-    Deprecated base class for decomposed metrics.
-
-    .. deprecated:: 2025.4
-        This class is deprecated and its functionality has been moved to :class:`Metric`.
-        It is scheduled for removal in 2026.
-
-    Base class for metrics that measure entire runs through flexible
-    aggregations of per-list intermediate measurements.  They can optionally
-    extract individual-list metrics from the per-list measurements.
-
-    Stability:
-        Full
-    """
-
-    def measure_list(self, output: ItemList, test: ItemList, /) -> Any:
-        return self.compute_list_data(output, test)
-
-    def extract_list_metrics(self, data: Any, /) -> float | None:
-        return self.extract_list_metric(data)
-
-    def summarize(self, values: list[Any] | pa.Array | pa.ChunkedArray, /) -> dict[str, float]:
-        if isinstance(values, (pa.Array, pa.ChunkedArray)):
-            values = values.to_pylist()
-        result = self.global_aggregate(values)
-        if isinstance(result, (float, int, np.floating, np.integer)):
-            return {"value": float(result)}
-        return result
-
-    @abstractmethod
-    def compute_list_data(self, output: ItemList, test: ItemList, /) -> Any:
-        """
-        Compute measurements for a single list.
-
-        Use `measure_list` in `Metric` for new implementations.
-        """
-        raise NotImplementedError()  # pragma: no cover
-
-    def extract_list_metric(self, data: Any, /) -> float | None:
-        """
-        Extract a single-list metric from the per-list measurement result (if
-        applicable).
-
-        Returns:
-            The per-list metric, or ``None`` if this metric does not compute
-            per-list metrics.
-
-        Implement :meth:`Metric.extract_list_metrics` in new implementations.
-        """
-        return None
-
-    @abstractmethod
-    def global_aggregate(self, values: list[Any], /) -> float | dict[str, float]:
-        """
-        Aggregate list metrics to compute a global value.
-
-        Implement :meth:`Metric.summarize` in new implementations.
-        """
-        raise NotImplementedError()  # pragma: no cover

From 5719fb251b4732ba8d0f265ea4937845e0d9f02f Mon Sep 17 00:00:00 2001
From: Sushobhan Parajuli <sp3886@gmail.com>
Date: Fri, 23 Jan 2026 19:25:11 +0000
Subject: [PATCH 2/2] clean up `DecomposedMetric` uses and tests

---
 src/lenskit/metrics/_collect.py          |  7 +--
 src/lenskit/metrics/predict.py           | 61 ++----------------------
 src/lenskit/metrics/ranking/_base.py     |  4 +-
 src/lenskit/metrics/ranking/_gini.py     | 12 ++---
 tests/eval/test_measurement_collector.py | 56 +---------------------
 5 files changed, 13 insertions(+), 127 deletions(-)

diff --git a/src/lenskit/metrics/_collect.py b/src/lenskit/metrics/_collect.py
index 0d99b2eee..100d03c2a 100644
--- a/src/lenskit/metrics/_collect.py
+++ b/src/lenskit/metrics/_collect.py
@@ -16,7 +16,7 @@
 
 from lenskit.data import ItemList, ItemListCollection
 
-from ._base import DecomposedMetric, GlobalMetric, ListMetric, Metric, MetricFunction
+from ._base import GlobalMetric, ListMetric, Metric, MetricFunction
 
 _log = logging.getLogger(__name__)
 K1 = TypeVar("K1", bound=tuple)
@@ -46,11 +46,6 @@ def is_global(self) -> bool:
         "Check if this metric is global."
         return isinstance(self.metric, GlobalMetric)
 
-    @property
-    def is_decomposed(self) -> bool:
-        "Check if this metric is decomposed."
-        return isinstance(self.metric, DecomposedMetric)
-
     def measure_list(self, list: ItemList, test: ItemList) -> Any:
         """Get intermediate measurement data from the metric."""
         if isinstance(self.metric, Callable):
diff --git a/src/lenskit/metrics/predict.py b/src/lenskit/metrics/predict.py
index ee86e8758..ae9fe6098 100644
--- a/src/lenskit/metrics/predict.py
+++ b/src/lenskit/metrics/predict.py
@@ -22,7 +22,7 @@
 from lenskit.data.adapt import ITEM_COMPAT_COLUMN, normalize_columns
 from lenskit.data.types import AliasedColumn
 
-from ._base import DecomposedMetric, ListMetric, Metric
+from ._base import ListMetric, Metric
 
 _log = logging.getLogger(__name__)
 
@@ -108,7 +108,7 @@ def align_scores(
         return pred_s, rate_s
 
 
-class RMSE(PredictMetric, ListMetric, DecomposedMetric):
+class RMSE(PredictMetric, ListMetric):
     """
     Compute RMSE (root mean squared error).  This is computed as:
 
@@ -131,36 +131,8 @@ def measure_list(self, predictions: ItemList, test: ItemList | None = None, /) -
         err *= err
         return np.sqrt(np.mean(err))
 
-    @override
-    def compute_list_data(self, output, test):
-        ps, ts = self.align_scores(output, test)
-        err = ps - ts
-        err *= err
-        return np.sum(err), len(err)
-
-    @override
-    def extract_list_metric(self, metric):
-        tot, n = metric
-        if n > 0:
-            return np.sqrt(tot / n)
-        else:
-            return np.nan
-
-    @override
-    def global_aggregate(self, values):
-        tot_sqerr = 0.0
-        tot_n = 0.0
-        for t, n in values:
-            tot_sqerr += t
-            tot_n += n
-
-        if tot_n > 0:
-            return np.sqrt(tot_sqerr / tot_n)
-        else:
-            return np.nan
-
 
-class MAE(PredictMetric, ListMetric, DecomposedMetric):
+class MAE(PredictMetric, ListMetric):
     """
     Compute MAE (mean absolute error).  This is computed as:
 
@@ -181,30 +153,3 @@ def measure_list(self, predictions: ItemList, test: ItemList | None = None, /) -
         ps, ts = self.align_scores(predictions, test)
         err = ps - ts
         return np.mean(np.abs(err)).item()
-
-    @override
-    def compute_list_data(self, output, test):
-        ps, ts = self.align_scores(output, test)
-        err = ps - ts
-        return np.sum(np.abs(err)), len(err)
-
-    @override
-    def extract_list_metric(self, metric):
-        tot, n = metric
-        if n > 0:
-            return tot / n
-        else:
-            return np.nan
-
-    @override
-    def global_aggregate(self, values):
-        tot_err = 0.0
-        tot_n = 0.0
-        for t, n in values:
-            tot_err += t
-            tot_n += n
-
-        if n > 0:
-            return tot_err / tot_n
-        else:
-            return np.nan
diff --git a/src/lenskit/metrics/ranking/_base.py b/src/lenskit/metrics/ranking/_base.py
index 20b56fbf4..efed4d68b 100644
--- a/src/lenskit/metrics/ranking/_base.py
+++ b/src/lenskit/metrics/ranking/_base.py
@@ -8,9 +8,9 @@
 
 from lenskit.data import ItemList
 
-from .._base import DecomposedMetric, GlobalMetric, ListMetric, Metric
+from .._base import ListMetric, Metric
 
-__all__ = ["Metric", "ListMetric", "GlobalMetric", "DecomposedMetric", "RankingMetricBase"]
+__all__ = ["Metric", "ListMetric", "RankingMetricBase"]
 
 
 class RankingMetricBase(Metric):
diff --git a/src/lenskit/metrics/ranking/_gini.py b/src/lenskit/metrics/ranking/_gini.py
index de6584a63..566ba74c8 100644
--- a/src/lenskit/metrics/ranking/_gini.py
+++ b/src/lenskit/metrics/ranking/_gini.py
@@ -16,13 +16,13 @@
 from lenskit.logging import get_logger
 from lenskit.stats import gini
 
-from ._base import DecomposedMetric, RankingMetricBase
+from ._base import RankingMetricBase
 from ._weighting import GeometricRankWeight, RankWeight
 
 _log = get_logger(__name__)
 
 
-class GiniBase(DecomposedMetric, RankingMetricBase):
+class GiniBase(RankingMetricBase):
     """
     Base class for Gini diversity / popularity concentration metrics.
     """
@@ -66,12 +66,12 @@ class ListGini(GiniBase):
     """
 
     @override
-    def compute_list_data(self, output: ItemList, test):
+    def measure_list(self, output: ItemList, test):
         recs = self.truncate(output)
         return recs.ids(format="arrow")
 
     @override
-    def global_aggregate(self, values: list[pa.Array]):
+    def summarize(self, values: list[pa.Array] | pa.ChunkedArray, /):
         log = _log.bind(metric=self.label, item_count=self.item_count)
         log.debug("aggregating for %d lists", len(values))
         chunked = pa.chunked_array(values)
@@ -119,13 +119,13 @@ def __init__(
         self.weight = weight
 
     @override
-    def compute_list_data(self, output: ItemList, test):
+    def measure_list(self, output: ItemList, test):
         recs = self.truncate(output)
         weights = self.weight.weight(np.arange(1, len(recs) + 1))
         return (recs.ids(format="arrow"), pa.array(weights, type=pa.float32()))
 
     @override
-    def global_aggregate(self, values: list[tuple[pa.Array, pa.FloatArray]]):
+    def summarize(self, values: list[tuple[pa.Array, pa.FloatArray]]):
         log = _log.bind(metric=self.label, item_count=self.item_count)
         log.debug("aggregating for %d lists", len(values))
         table = pa.Table.from_batches(
diff --git a/tests/eval/test_measurement_collector.py b/tests/eval/test_measurement_collector.py
index 56a551fb8..b119e08d3 100644
--- a/tests/eval/test_measurement_collector.py
+++ b/tests/eval/test_measurement_collector.py
@@ -15,7 +15,7 @@
 from lenskit.basic import PopScorer
 from lenskit.data import ItemList, ItemListCollection
 from lenskit.metrics import NDCG, Recall
-from lenskit.metrics._base import DecomposedMetric, GlobalMetric, ListMetric, Metric
+from lenskit.metrics._base import GlobalMetric, ListMetric, Metric
 from lenskit.metrics._collect import MeasurementCollector, MetricWrapper
 from lenskit.metrics.basic import ListLength
 from lenskit.splitting import split_temporal_fraction
@@ -270,28 +270,6 @@ def summarize(self, values):
 # metricWrapper properties and summarization
 
 
-def test_metricwrapper_is_decomposed_property():
-    class DummyDecomposed(DecomposedMetric):
-        label = "dummy_decomp"
-
-        def compute_list_data(self, recs, test):
-            return {"a": 1.0}
-
-        def global_aggregate(self, values):
-            return {"mean": 1.0}
-
-        def measure_list(self, recs, test):
-            return {"a": 1.0}
-
-        def summarize(self, values):
-            return {"mean": 1.0}
-
-    wrapper = MetricWrapper(DummyDecomposed(), "decomp")
-    assert wrapper.is_decomposed
-    wrapper_non = MetricWrapper(ListLength(), "len")
-    assert not wrapper_non.is_decomposed
-
-
 def test_measure_metric_with_none_summarize():
     """Test metric that returns None from summarize."""
 
@@ -347,25 +325,6 @@ def test_full_workflow_integration_improved(ml_ds):
                 assert 0 <= value <= 1
 
 
-# test that global metric raises errors for unsupported operations
-
-
-def test_global_metric_unsupported():
-    class AnotherGlobalMetric(GlobalMetric):
-        label = "global"
-
-        def measure_run(self, run, test):
-            return 1.0
-
-    metric = AnotherGlobalMetric()
-
-    with raises(NotImplementedError, match="Global metrics don't support per-list measurement"):
-        metric.measure_list(ItemList([1, 2]), ItemList([1]))
-
-    with raises(NotImplementedError, match="Global metrics should implement measure_run instead"):
-        metric.summarize([1, 2, 3])
-
-
 # test edge cases in Metric.summarize
 
 
@@ -390,19 +349,6 @@ def measure_list(self, output, test):
     assert result["std"] == 1.0
 
 
-def test_decomposed_metric_numeric_return():
-    class TestDecomposedMetric(DecomposedMetric):
-        def compute_list_data(self, output, test):
-            return len(output)
-
-        def global_aggregate(self, values):
-            return 5.0
-
-    metric = TestDecomposedMetric()
-    result = metric.summarize([1, 2, 3])
-    assert result == {"value": 5.0}
-
-
 def test_empty_intermediate_values():
     class TestMetric(Metric):
         label = "test"