evaluation_adapter

`orchard.tasks.classification.evaluation_adapter` ¶

Classification Evaluation Pipeline Adapter.

Wraps :func:orchard.evaluation.evaluation_pipeline.run_final_evaluation to satisfy :class:~orchard.core.task_protocols.TaskEvalPipeline.

`ClassificationEvalPipelineAdapter` ¶

Orchestrates classification inference, visualization, and reporting.

`run_evaluation(model, test_loader, train_losses, val_metrics_history, class_names, paths, training, dataset, augmentation, evaluation, arch_name, aug_info='N/A', tracker=None)` ¶

Delegate to the existing final evaluation pipeline.

Parameters:

Name	Type	Description	Default
`model`	`Module`	Trained model (already on target device).	required
`test_loader`	`DataLoader[Any]`	DataLoader for test set.	required
`train_losses`	`list[float]`	Training loss history per epoch.	required
`val_metrics_history`	`list[Mapping[str, float]]`	Validation metrics history per epoch.	required
`class_names`	`list[str]`	List of class label strings.	required
`paths`	`RunPaths`	RunPaths for artifact output.	required
`training`	`TrainingConfig`	Training sub-config.	required
`dataset`	`DatasetConfig`	Dataset sub-config.	required
`augmentation`	`AugmentationConfig`	Augmentation sub-config.	required
`evaluation`	`EvaluationConfig`	Evaluation sub-config.	required
`arch_name`	`str`	Architecture identifier.	required
`aug_info`	`str`	Augmentation description string.	`'N/A'`
`tracker`	`TrackerProtocol \| None`	Optional experiment tracker for final metrics.	`None`

Returns:

Type	Description
`tuple[float, float, float]`	3-tuple of (macro_f1, test_acc, test_auc).

Source code in orchard/tasks/classification/evaluation_adapter.py

def run_evaluation(
    self,
    model: nn.Module,
    test_loader: DataLoader[Any],
    train_losses: list[float],
    val_metrics_history: list[Mapping[str, float]],
    class_names: list[str],
    paths: RunPaths,
    training: TrainingConfig,
    dataset: DatasetConfig,
    augmentation: AugmentationConfig,
    evaluation: EvaluationConfig,
    arch_name: str,
    aug_info: str = "N/A",  # pragma: no mutate
    tracker: TrackerProtocol | None = None,
) -> tuple[float, float, float]:
    """
    Delegate to the existing final evaluation pipeline.

    Args:
        model: Trained model (already on target device).
        test_loader: DataLoader for test set.
        train_losses: Training loss history per epoch.
        val_metrics_history: Validation metrics history per epoch.
        class_names: List of class label strings.
        paths: RunPaths for artifact output.
        training: Training sub-config.
        dataset: Dataset sub-config.
        augmentation: Augmentation sub-config.
        evaluation: Evaluation sub-config.
        arch_name: Architecture identifier.
        aug_info: Augmentation description string.
        tracker: Optional experiment tracker for final metrics.

    Returns:
        3-tuple of (macro_f1, test_acc, test_auc).
    """
    return run_final_evaluation(
        model=model,
        test_loader=test_loader,
        train_losses=train_losses,
        val_metrics_history=val_metrics_history,
        class_names=class_names,
        paths=paths,
        training=training,
        dataset=dataset,
        augmentation=augmentation,
        evaluation=evaluation,
        arch_name=arch_name,
        aug_info=aug_info,
        tracker=tracker,
    )

evaluation_adapter

orchard.tasks.classification.evaluation_adapter ¶

ClassificationEvalPipelineAdapter ¶

run_evaluation(model, test_loader, train_losses, val_metrics_history, class_names, paths, training, dataset, augmentation, evaluation, arch_name, aug_info='N/A', tracker=None) ¶

`orchard.tasks.classification.evaluation_adapter` ¶

`ClassificationEvalPipelineAdapter` ¶

`run_evaluation(model, test_loader, train_losses, val_metrics_history, class_names, paths, training, dataset, augmentation, evaluation, arch_name, aug_info='N/A', tracker=None)` ¶