JuliaDecisionFocusedLearning
diff --git a/‎src/DecisionFocusedLearningAlgorithms.jl‎
Lines changed: 3 additions & 3 deletions b/‎src/DecisionFocusedLearningAlgorithms.jl‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎src/algorithms/dagger.jl‎ ‎src/algorithms/supervised/dagger.jl‎src/algorithms/dagger.jl renamed to src/algorithms/supervised/dagger.jl
Lines changed: 2 additions & 3 deletions b/‎src/algorithms/dagger.jl‎ ‎src/algorithms/supervised/dagger.jl‎src/algorithms/dagger.jl renamed to src/algorithms/supervised/dagger.jl
Lines changed: 2 additions & 3 deletions
diff --git a/‎src/algorithms/fyl.jl‎ ‎src/algorithms/supervised/fyl.jl‎src/algorithms/fyl.jl renamed to src/algorithms/supervised/fyl.jl
Lines changed: 3 additions & 53 deletions b/‎src/algorithms/fyl.jl‎ ‎src/algorithms/supervised/fyl.jl‎src/algorithms/fyl.jl renamed to src/algorithms/supervised/fyl.jl
Lines changed: 3 additions & 53 deletions
diff --git a/‎src/algorithms/supervised/kleopatra.jl‎
Lines changed: 43 additions & 0 deletions b/‎src/algorithms/supervised/kleopatra.jl‎
Lines changed: 43 additions & 0 deletions
diff --git a/‎src/metrics/accumulators.jl‎
Lines changed: 29 additions & 37 deletions b/‎src/metrics/accumulators.jl‎
Lines changed: 29 additions & 37 deletions
@@ -13,14 +13,14 @@ using ValueHistories: MVHistory
 include("utils.jl")
 include("training_context.jl")
 
-# Metrics subsystem
 include("metrics/interface.jl")
 include("metrics/accumulators.jl")
 include("metrics/function_metric.jl")
 include("metrics/periodic.jl")
 
-include("algorithms/fyl.jl")
-include("algorithms/dagger.jl")
+include("algorithms/supervised/fyl.jl")
+include("algorithms/supervised/kleopatra.jl")
+include("algorithms/supervised/dagger.jl")
 
 export TrainingContext
 
 
@@ -35,8 +35,7 @@ function DAgger_train_model!(
             algorithm,
             model,
             maximizer,
-            dataset,
-            val_dataset;
+            dataset;
             epochs=fyl_epochs,
             metrics=metrics,
             maximizer_kwargs=maximizer_kwargs,
@@ -45,7 +44,7 @@ function DAgger_train_model!(
         # Merge iteration history into combined history
         for key in keys(iter_history)
             epochs, values = get(iter_history, key)
-            for i in 1:length(epochs)
+            for i in eachindex(epochs)
                 # Calculate global epoch number
                 if iter == 1
                     # First iteration: use epochs as-is [0, 1, 2, ...]
 
@@ -1,6 +1,4 @@
-# TODO: every N epochs
 # TODO: best_model saving method, using default metric validation loss, overwritten in dagger
-# TODO: Implement validation loss as a metric callback
 # TODO: batch training option
 # TODO: parallelize loss computation on validation set
 # TODO: have supervised learning training method, where fyl_train calls it, therefore we can easily test new supervised losses if needed
@@ -19,8 +17,7 @@ function train_policy!(
     algorithm::PerturbedImitationAlgorithm,
     model,
     maximizer,
-    train_dataset::AbstractArray{<:DataSample},
-    validation_dataset;
+    train_dataset::AbstractArray{<:DataSample};
     epochs=100,
     maximizer_kwargs=get_info,
     metrics::Tuple=(),
@@ -85,58 +82,11 @@ end
 function fyl_train_model(
     initial_model,
     maximizer,
-    train_dataset,
-    validation_dataset;
+    train_dataset;
     algorithm=PerturbedImitationAlgorithm(),
     kwargs...,
 )
     model = deepcopy(initial_model)
-    history = train_policy!(
-        algorithm, model, maximizer, train_dataset, validation_dataset; kwargs...
-    )
-    return history, model
-end
-
-function baty_train_model(
-    b::AbstractStochasticBenchmark{true};
-    epochs=10,
-    metrics::Tuple=(),
-    algorithm::PerturbedImitationAlgorithm=PerturbedImitationAlgorithm(),
-)
-    # Generate instances and environments
-    dataset = generate_dataset(b, 30)
-    train_instances, validation_instances, _ = splitobs(dataset; at=(0.3, 0.3))
-    train_environments = generate_environments(b, train_instances)
-    validation_environments = generate_environments(b, validation_instances)
-
-    # Generate anticipative solutions
-    train_dataset = vcat(
-        map(train_environments) do env
-            v, y = generate_anticipative_solution(b, env; reset_env=true)
-            return y
-        end...
-    )
-
-    val_dataset = vcat(map(validation_environments) do env
-        v, y = generate_anticipative_solution(b, env; reset_env=true)
-        return y
-    end...)
-
-    # Initialize model and maximizer
-    model = generate_statistical_model(b)
-    maximizer = generate_maximizer(b)
-
-    # Train with algorithm
-    history = train_policy!(
-        algorithm,
-        model,
-        maximizer,
-        train_dataset,
-        val_dataset;
-        epochs=epochs,
-        metrics=metrics,
-        maximizer_kwargs=get_state,
-    )
-
+    history = train_policy!(algorithm, model, maximizer, train_dataset; kwargs...)
     return history, model
 end
@@ -0,0 +1,43 @@
+function baty_train_model(
+    b::AbstractStochasticBenchmark{true};
+    epochs=10,
+    metrics::Tuple=(),
+    algorithm::PerturbedImitationAlgorithm=PerturbedImitationAlgorithm(),
+)
+    # Generate instances and environments
+    dataset = generate_dataset(b, 30)
+    train_instances, validation_instances, _ = splitobs(dataset; at=(0.3, 0.3))
+    train_environments = generate_environments(b, train_instances)
+    validation_environments = generate_environments(b, validation_instances)
+
+    # Generate anticipative solutions
+    train_dataset = vcat(
+        map(train_environments) do env
+            v, y = generate_anticipative_solution(b, env; reset_env=true)
+            return y
+        end...
+    )
+
+    val_dataset = vcat(map(validation_environments) do env
+        v, y = generate_anticipative_solution(b, env; reset_env=true)
+        return y
+    end...)
+
+    # Initialize model and maximizer
+    model = generate_statistical_model(b)
+    maximizer = generate_maximizer(b)
+
+    # Train with algorithm
+    history = train_policy!(
+        algorithm,
+        model,
+        maximizer,
+        train_dataset,
+        val_dataset;
+        epochs=epochs,
+        metrics=metrics,
+        maximizer_kwargs=get_state,
+    )
+
+    return history, model
+end
@@ -1,15 +1,13 @@
 """
-    LossAccumulator <: AbstractMetric
+$TYPEDEF
 
 Accumulates loss values during training and computes their average.
 
 This metric is used internally by training loops to track training loss.
 It accumulates loss values via `update!` calls and computes the average via `compute`.
 
 # Fields
-- `name::Symbol` - Identifier for this metric (e.g., `:training_loss`)
-- `total_loss::Float64` - Running sum of loss values
-- `count::Int` - Number of samples accumulated
+$TYPEDFIELDS
 
 # Examples
 ```julia
@@ -31,32 +29,27 @@ avg_loss = compute(metric)  # Automatically resets
 - [`update!`](@ref)
 - [`compute`](@ref)
 """
-mutable struct LossAccumulator <: AbstractMetric
+mutable struct LossAccumulator
+    "Identifier for this metric (e.g., `:training_loss`)"
     const name::Symbol
+    "Running sum of loss values"
     total_loss::Float64
+    "Number of samples accumulated"
     count::Int
 end
 
 """
-    LossAccumulator(name::Symbol=:training_loss)
+$TYPEDSIGNATURES
 
 Construct a LossAccumulator with the given name.
-
-# Arguments
-- `name::Symbol` - Identifier for the metric (default: `:training_loss`)
-
-# Examples
-```julia
-train_metric = LossAccumulator(:training_loss)
-val_metric = LossAccumulator(:validation_loss)
-```
+Initializes total loss and count to zero.
 """
 function LossAccumulator(name::Symbol=:training_loss)
     return LossAccumulator(name, 0.0, 0)
 end
 
 """
-    reset!(metric::LossAccumulator)
+$TYPEDSIGNATURES
 
 Reset the accumulator to its initial state (zero total loss and count).
 
@@ -74,14 +67,10 @@ function reset!(metric::LossAccumulator)
 end
 
 """
-    update!(metric::LossAccumulator, loss_value::Float64)
+$TYPEDSIGNATURES
 
 Add a loss value to the accumulator.
 
-# Arguments
-- `metric::LossAccumulator` - The accumulator to update
-- `loss_value::Float64` - Loss value to add
-
 # Examples
 ```julia
 metric = LossAccumulator()
@@ -96,7 +85,7 @@ function update!(metric::LossAccumulator, loss_value::Float64)
 end
 
 """
-    compute(metric::LossAccumulator; reset::Bool=true)
+$TYPEDSIGNATURES
 
 Compute the average loss from accumulated values.
 
@@ -130,12 +119,11 @@ Metric for evaluating Fenchel-Young Loss over a dataset.
 
 This metric stores a dataset and computes the average Fenchel-Young Loss
 when `evaluate!` is called. Useful for tracking validation loss during training.
+Can also be used in the algorithms to accumulate loss over training data.
 
 # Fields
-- `name::Symbol` - Identifier for this metric (e.g., `:validation_loss`)
 - `dataset::D` - Dataset to evaluate on (stored internally)
-- `total_loss::Float64` - Running sum during evaluation
-- `count::Int` - Number of samples evaluated
+- `accumulator::LossAccumulator` - Embedded accumulator holding `name`, `total_loss`, and `count`.
 
 # Examples
 ```julia
@@ -151,11 +139,9 @@ avg_loss = evaluate!(val_metric, context)
 - [`LossAccumulator`](@ref)
 - [`FunctionMetric`](@ref)
 """
-mutable struct FYLLossMetric{D} <: AbstractMetric
-    const name::Symbol
-    const dataset::D
-    total_loss::Float64
-    count::Int
+struct FYLLossMetric{D} <: AbstractMetric
+    dataset::D
+    accumulator::LossAccumulator
 end
 
 """
@@ -174,7 +160,7 @@ test_metric = FYLLossMetric(test_dataset, :test_loss)
 ```
 """
 function FYLLossMetric(dataset, name::Symbol=:fyl_loss)
-    return FYLLossMetric(name, dataset, 0.0, 0)
+    return FYLLossMetric(dataset, LossAccumulator(name))
 end
 
 """
@@ -183,8 +169,15 @@ end
 Reset the metric's accumulated loss to zero.
 """
 function reset!(metric::FYLLossMetric)
-    metric.total_loss = 0.0
-    return metric.count = 0
+    return reset!(metric.accumulator)
+end
+
+function Base.getproperty(metric::FYLLossMetric, s::Symbol)
+    if s === :name
+        return metric.accumulator.name
+    else
+        return getfield(metric, s)
+    end
 end
 
 """
@@ -204,8 +197,7 @@ Update the metric with a single loss computation.
 """
 function update!(metric::FYLLossMetric, loss::FenchelYoungLoss, θ, y_target; kwargs...)
     l = loss(θ, y_target; kwargs...)
-    metric.total_loss += l
-    metric.count += 1
+    update!(metric.accumulator, l)
     return l
 end
 
@@ -231,7 +223,7 @@ context = TrainingContext(model=model, epoch=5, maximizer=maximizer, loss=loss)
 avg_loss = evaluate!(val_metric, context)
 ```
 """
-function evaluate!(metric::FYLLossMetric, context)
+function evaluate!(metric::FYLLossMetric, context::TrainingContext)
     reset!(metric)
     for sample in metric.dataset
         θ = context.model(sample.x)
@@ -250,5 +242,5 @@ Compute the average loss from accumulated values.
 - `Float64` - Average loss (or 0.0 if no values accumulated)
 """
 function compute(metric::FYLLossMetric)
-    return metric.count == 0 ? 0.0 : metric.total_loss / metric.count
+    return compute(metric.accumulator)
 end