refiners/tests/training_utils/test_trainer.py

import random
import warnings
from dataclasses import dataclass
from pathlib import Path
from typing import cast

import pytest
import torch
from pydantic import field_validator
from torch import Tensor, nn
from torch.optim import SGD

from refiners.fluxion import layers as fl
from refiners.fluxion.utils import norm
from refiners.training_utils.callback import Callback, CallbackConfig
from refiners.training_utils.clock import ClockConfig
from refiners.training_utils.common import (
    Epoch,
    Iteration,
    Step,
    TimeValue,
    TimeValueInput,
    count_learnable_parameters,
    human_readable_number,
    parse_number_unit_field,
    scoped_seed,
)
from refiners.training_utils.config import BaseConfig, ModelConfig
from refiners.training_utils.trainer import (
    Trainer,
    TrainingClock,
    WarmupScheduler,
    count_learnable_parameters,
    human_readable_number,
    register_callback,
    register_model,
)


@dataclass
class MockBatch:
    inputs: torch.Tensor
    targets: torch.Tensor


class MockModelConfig(ModelConfig):
    use_activation: bool


class MockCallbackConfig(CallbackConfig):
    on_batch_end_interval: Step | Iteration | Epoch
    on_batch_end_seed: int
    on_optimizer_step_interval: Iteration | Epoch

    @field_validator("on_batch_end_interval", "on_optimizer_step_interval", mode="before")
    def parse_field(cls, value: TimeValueInput) -> TimeValue:
        return parse_number_unit_field(value)


class MockConfig(BaseConfig):
    # we register the `early_callback` before the `clock` callback to test the callback ordering
    early_callback: CallbackConfig = CallbackConfig()
    clock: ClockConfig = ClockConfig()

    mock_model: MockModelConfig
    mock_callback: MockCallbackConfig


class MockModel(fl.Chain):
    def __init__(self):
        super().__init__(
            fl.Linear(10, 10),
            fl.Linear(10, 10),
            fl.Linear(10, 10),
        )

    def add_activation(self) -> None:
        self.insert(1, fl.SiLU())
        self.insert(3, fl.SiLU())


class MockCallback(Callback["MockTrainer"]):
    def __init__(self, config: MockCallbackConfig) -> None:
        self.config = config
        self.optimizer_step_count = 0
        self.step_end_count = 0
        self.optimizer_step_random_int: int | None = None
        self.step_end_random_int: int | None = None

    def on_init_begin(self, trainer: "MockTrainer") -> None:
        pass

    def on_optimizer_step_begin(self, trainer: "MockTrainer") -> None:
        if not trainer.clock.is_due(self.config.on_optimizer_step_interval):
            return
        self.optimizer_step_count += 1
        self.optimizer_step_random_int = random.randint(0, 100)

    def on_step_end(self, trainer: "MockTrainer") -> None:
        if not trainer.clock.is_due(self.config.on_batch_end_interval):
            return

        # We verify that this callback is always called before the clock is updated (see `_call_callbacks` in trainer.py)
        assert trainer.clock.step // 3 <= self.step_end_count

        self.step_end_count += 1
        with scoped_seed(self.config.on_batch_end_seed):
            self.step_end_random_int = random.randint(0, 100)


class EarlyMockCallback(Callback["MockTrainer"]):
    """
    A callback that will be registered before the Clock callback to test the callback ordering.
    """

    def on_train_begin(self, trainer: "MockTrainer") -> None:
        assert trainer.clock.start_time is not None, "Clock callback should have been called before this callback."


class MockTrainer(Trainer[MockConfig, MockBatch]):
    step_counter: int = 0
    model_registration_counter: int = 0

    @property
    def dataset_length(self) -> int:
        return 20

    def get_item(self, index: int) -> MockBatch:
        return MockBatch(inputs=torch.randn(1, 10), targets=torch.randn(1, 10))

    def collate_fn(self, batch: list[MockBatch]) -> MockBatch:
        return MockBatch(
            inputs=torch.cat([b.inputs for b in batch]),
            targets=torch.cat([b.targets for b in batch]),
        )

    @register_callback()
    def early_callback(self, config: CallbackConfig) -> EarlyMockCallback:
        return EarlyMockCallback()

    @register_callback()
    def mock_callback(self, config: MockCallbackConfig) -> MockCallback:
        return MockCallback(config)

    @register_model()
    def mock_model(self, config: MockModelConfig) -> MockModel:
        model = MockModel()
        if config.use_activation:
            model.add_activation()

        self.model_registration_counter += 1
        return model

    def compute_loss(self, batch: MockBatch) -> Tensor:
        self.step_counter += 1
        inputs, targets = batch.inputs.to(self.device), batch.targets.to(self.device)
        outputs = self.mock_model(inputs)
        return norm(outputs - targets)


@pytest.fixture
def mock_config() -> MockConfig:
    config = MockConfig.load_from_toml(Path(__file__).parent / "mock_config.toml")
    return config


@pytest.fixture
def mock_trainer(mock_config: MockConfig) -> MockTrainer:
    return MockTrainer(config=mock_config)


@pytest.fixture
def mock_trainer_short(mock_config: MockConfig) -> MockTrainer:
    mock_config_short = mock_config.model_copy(deep=True)
    mock_config_short.training.duration = Step(3)
    return MockTrainer(config=mock_config_short)


@pytest.fixture
def mock_model() -> fl.Chain:
    return MockModel()


def test_count_learnable_parameters_with_params() -> None:
    params = [
        nn.Parameter(torch.randn(2, 2), requires_grad=True),
        nn.Parameter(torch.randn(5), requires_grad=False),
        nn.Parameter(torch.randn(3, 3), requires_grad=True),
    ]
    # cast because of PyTorch 2.2, see https://github.com/pytorch/pytorch/issues/118736
    assert count_learnable_parameters(cast(list[nn.Parameter], params)) == 13


def test_count_learnable_parameters_with_model(mock_model: fl.Chain) -> None:
    assert count_learnable_parameters(mock_model.parameters()) == 330


def test_human_readable_number() -> None:
    assert human_readable_number(123) == "123.0"
    assert human_readable_number(1234) == "1.2K"
    assert human_readable_number(1234567) == "1.2M"


@pytest.fixture
def training_clock() -> TrainingClock:
    return TrainingClock(
        batch_size=10,
        training_duration=Epoch(5),
        gradient_accumulation=Step(1),
        lr_scheduler_interval=Epoch(1),
    )


def test_zero_batch_size_error():
    with pytest.raises(AssertionError):
        TrainingClock(
            batch_size=0,
            training_duration=Epoch(5),
            gradient_accumulation=Step(1),
            lr_scheduler_interval=Epoch(1),
        )


def test_timer_functionality(training_clock: TrainingClock) -> None:
    training_clock.start_timer()
    assert training_clock.start_time is not None
    training_clock.stop_timer()
    assert training_clock.end_time is not None
    assert training_clock.time_elapsed >= 0


def test_mock_trainer_initialization(mock_config: MockConfig, mock_trainer: MockTrainer) -> None:
    assert mock_trainer.config == mock_config
    assert isinstance(mock_trainer, MockTrainer)
    assert mock_trainer.optimizer is not None
    assert mock_trainer.lr_scheduler is not None
    assert mock_trainer.model_registration_counter == 1


def test_training_cycle(mock_trainer: MockTrainer) -> None:
    clock = mock_trainer.clock
    config = mock_trainer.config

    assert mock_trainer.step_counter == 0
    assert clock.epoch == 0

    mock_trainer.train()

    assert clock.epoch == config.training.duration.number
    assert mock_trainer.step_counter == mock_trainer.clock.step


def test_callback_registration(mock_trainer: MockTrainer) -> None:
    mock_trainer.train()

    # Check that the callback skips every other iteration
    assert mock_trainer.mock_callback.optimizer_step_count == mock_trainer.clock.iteration // 2
    assert mock_trainer.mock_callback.step_end_count == mock_trainer.clock.step // 3 + 1

    # Check that the random seed was set
    assert mock_trainer.mock_callback.optimizer_step_random_int == 93
    assert mock_trainer.mock_callback.step_end_random_int == 81


def test_training_short_cycle(mock_trainer_short: MockTrainer) -> None:
    clock = mock_trainer_short.clock
    config = mock_trainer_short.config

    assert mock_trainer_short.step_counter == 0
    assert mock_trainer_short.clock.epoch == 0

    mock_trainer_short.train()

    assert clock.step == config.training.duration.number


@pytest.fixture
def warmup_scheduler():
    optimizer = SGD([nn.Parameter(torch.randn(2, 2), requires_grad=True)], lr=0.1)
    scheduler = torch.optim.lr_scheduler.ConstantLR(optimizer, 1)
    return WarmupScheduler(optimizer, scheduler, warmup_scheduler_steps=100)


def test_initial_lr(warmup_scheduler: WarmupScheduler) -> None:
    optimizer = warmup_scheduler.optimizer
    for group in optimizer.param_groups:
        assert group["lr"] == 1e-3


def test_warmup_lr(warmup_scheduler: WarmupScheduler) -> None:
    with warnings.catch_warnings():
        warnings.filterwarnings(
            "ignore",
            category=UserWarning,
            message=r"Detected call of `lr_scheduler.step\(\)` before `optimizer.step\(\)`",
        )
        for _ in range(102):
            warmup_scheduler.step()
    optimizer = warmup_scheduler.optimizer
    for group in optimizer.param_groups:
        assert group["lr"] == 0.1


class MockTrainerWith2Models(MockTrainer):
    @register_model()
    def mock_model1(self, config: ModelConfig) -> MockModel:
        return MockModel()

    @register_model()
    def mock_model2(self, config: ModelConfig) -> MockModel:
        return MockModel()

    def compute_loss(self, batch: MockBatch) -> Tensor:
        self.step_counter += 1
        inputs, targets = batch.inputs.to(self.device), batch.targets.to(self.device)
        outputs = self.mock_model2(self.mock_model1(inputs))
        return norm(outputs - targets)


class MockConfig_2_Models(BaseConfig):
    mock_model1: ModelConfig
    mock_model2: ModelConfig


@pytest.fixture
def mock_config_2_models() -> MockConfig_2_Models:
    return MockConfig_2_Models.load_from_toml(Path(__file__).parent / "mock_config_2_models.toml")


@pytest.fixture
def mock_trainer_2_models(mock_config_2_models: MockConfig) -> MockTrainerWith2Models:
    return MockTrainerWith2Models(config=mock_config_2_models)


def test_optimizer_parameters(mock_trainer_2_models: MockTrainerWith2Models) -> None:
    assert len(mock_trainer_2_models.optimizer.param_groups) == 2
    assert mock_trainer_2_models.optimizer.param_groups[0]["lr"] == 1e-5
Implement EventConfig 2024-04-19 15:59:48 +00:00			`import random`
update deprecated validator for field_validator 2024-02-13 17:24:53 +00:00			`import warnings`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`from dataclasses import dataclass`
			`from pathlib import Path`
add support for pytorch 2.2 (2.1 is still supported) also bump all dev dependencies to their latest version 2024-01-31 11:15:46 +00:00			`from typing import cast`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00
			`import pytest`
			`import torch`
remove EventConfig This is a partial rollback of commit 5dde281 2024-04-24 16:25:55 +00:00			`from pydantic import field_validator`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`from torch import Tensor, nn`
Fix warmup steps calculation when gradient_accumulation is used 2024-01-25 10:36:58 +00:00			`from torch.optim import SGD`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00
			`from refiners.fluxion import layers as fl`
			`from refiners.fluxion.utils import norm`
Implement EventConfig 2024-04-19 15:59:48 +00:00			`from refiners.training_utils.callback import Callback, CallbackConfig`
update test_trainer.py 2024-04-25 13:07:40 +00:00			`from refiners.training_utils.clock import ClockConfig`
Refactor TimeValue 2024-04-18 14:41:57 +00:00			`from refiners.training_utils.common import (`
			`Epoch,`
			`Iteration,`
			`Step,`
remove EventConfig This is a partial rollback of commit 5dde281 2024-04-24 16:25:55 +00:00			`TimeValue,`
			`TimeValueInput,`
Refactor TimeValue 2024-04-18 14:41:57 +00:00			`count_learnable_parameters,`
			`human_readable_number,`
remove EventConfig This is a partial rollback of commit 5dde281 2024-04-24 16:25:55 +00:00			`parse_number_unit_field,`
			`scoped_seed,`
Refactor TimeValue 2024-04-18 14:41:57 +00:00			`)`
add @register_model and @register_callback decorators Refactor ClockTrainer to include Callback 2024-02-12 08:28:41 +00:00			`from refiners.training_utils.config import BaseConfig, ModelConfig`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`from refiners.training_utils.trainer import (`
			`Trainer,`
			`TrainingClock,`
Fix warmup steps calculation when gradient_accumulation is used 2024-01-25 10:36:58 +00:00			`WarmupScheduler,`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`count_learnable_parameters,`
			`human_readable_number,`
Implement EventConfig 2024-04-19 15:59:48 +00:00			`register_callback,`
add @register_model and @register_callback decorators Refactor ClockTrainer to include Callback 2024-02-12 08:28:41 +00:00			`register_model,`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`)`


			`@dataclass`
			`class MockBatch:`
			`inputs: torch.Tensor`
			`targets: torch.Tensor`


Enforce correct subtype for the config param in both decorators Also add a custom ModelConfig for the MockTrainer test Update src/refiners/training_utils/config.py Co-authored-by: Cédric Deltheil <355031+deltheil@users.noreply.github.com> 2024-02-12 14:53:24 +00:00			`class MockModelConfig(ModelConfig):`
			`use_activation: bool`


remove EventConfig This is a partial rollback of commit 5dde281 2024-04-24 16:25:55 +00:00			`class MockCallbackConfig(CallbackConfig):`
			`on_batch_end_interval: Step \| Iteration \| Epoch`
			`on_batch_end_seed: int`
			`on_optimizer_step_interval: Iteration \| Epoch`

			`@field_validator("on_batch_end_interval", "on_optimizer_step_interval", mode="before")`
			`def parse_field(cls, value: TimeValueInput) -> TimeValue:`
			`return parse_number_unit_field(value)`


add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`class MockConfig(BaseConfig):`
update test_trainer.py 2024-04-25 13:07:40 +00:00			# we register the `early_callback` before the `clock` callback to test the callback ordering
			`early_callback: CallbackConfig = CallbackConfig()`
			`clock: ClockConfig = ClockConfig()`

Enforce correct subtype for the config param in both decorators Also add a custom ModelConfig for the MockTrainer test Update src/refiners/training_utils/config.py Co-authored-by: Cédric Deltheil <355031+deltheil@users.noreply.github.com> 2024-02-12 14:53:24 +00:00			`mock_model: MockModelConfig`
remove EventConfig This is a partial rollback of commit 5dde281 2024-04-24 16:25:55 +00:00			`mock_callback: MockCallbackConfig`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00

			`class MockModel(fl.Chain):`
			`def __init__(self):`
			`super().__init__(`
			`fl.Linear(10, 10),`
			`fl.Linear(10, 10),`
			`fl.Linear(10, 10),`
			`)`

Enforce correct subtype for the config param in both decorators Also add a custom ModelConfig for the MockTrainer test Update src/refiners/training_utils/config.py Co-authored-by: Cédric Deltheil <355031+deltheil@users.noreply.github.com> 2024-02-12 14:53:24 +00:00			`def add_activation(self) -> None:`
			`self.insert(1, fl.SiLU())`
			`self.insert(3, fl.SiLU())`

add basic unit test for training_utils 2024-01-14 14:06:48 +00:00
Implement EventConfig 2024-04-19 15:59:48 +00:00			`class MockCallback(Callback["MockTrainer"]):`
remove EventConfig This is a partial rollback of commit 5dde281 2024-04-24 16:25:55 +00:00			`def __init__(self, config: MockCallbackConfig) -> None:`
			`self.config = config`
Implement EventConfig 2024-04-19 15:59:48 +00:00			`self.optimizer_step_count = 0`
batch to step 2024-04-24 16:27:43 +00:00			`self.step_end_count = 0`
Implement EventConfig 2024-04-19 15:59:48 +00:00			`self.optimizer_step_random_int: int \| None = None`
batch to step 2024-04-24 16:27:43 +00:00			`self.step_end_random_int: int \| None = None`
Implement EventConfig 2024-04-19 15:59:48 +00:00
			`def on_init_begin(self, trainer: "MockTrainer") -> None:`
			`pass`

			`def on_optimizer_step_begin(self, trainer: "MockTrainer") -> None:`
remove EventConfig This is a partial rollback of commit 5dde281 2024-04-24 16:25:55 +00:00			`if not trainer.clock.is_due(self.config.on_optimizer_step_interval):`
			`return`
Implement EventConfig 2024-04-19 15:59:48 +00:00			`self.optimizer_step_count += 1`
			`self.optimizer_step_random_int = random.randint(0, 100)`

batch to step 2024-04-24 16:27:43 +00:00			`def on_step_end(self, trainer: "MockTrainer") -> None:`
remove EventConfig This is a partial rollback of commit 5dde281 2024-04-24 16:25:55 +00:00			`if not trainer.clock.is_due(self.config.on_batch_end_interval):`
			`return`
fix clock 2024-04-24 16:42:30 +00:00
update test_trainer.py 2024-04-25 13:07:40 +00:00			# We verify that this callback is always called before the clock is updated (see `_call_callbacks` in trainer.py)
fix clock 2024-04-24 16:42:30 +00:00			`assert trainer.clock.step // 3 <= self.step_end_count`

batch to step 2024-04-24 16:27:43 +00:00			`self.step_end_count += 1`
remove EventConfig This is a partial rollback of commit 5dde281 2024-04-24 16:25:55 +00:00			`with scoped_seed(self.config.on_batch_end_seed):`
batch to step 2024-04-24 16:27:43 +00:00			`self.step_end_random_int = random.randint(0, 100)`
Implement EventConfig 2024-04-19 15:59:48 +00:00

update test_trainer.py 2024-04-25 13:07:40 +00:00			`class EarlyMockCallback(Callback["MockTrainer"]):`
			`"""`
			`A callback that will be registered before the Clock callback to test the callback ordering.`
			`"""`

			`def on_train_begin(self, trainer: "MockTrainer") -> None:`
			`assert trainer.clock.start_time is not None, "Clock callback should have been called before this callback."`


add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`class MockTrainer(Trainer[MockConfig, MockBatch]):`
			`step_counter: int = 0`
fix bug that was causing double registration 2024-02-13 06:29:55 +00:00			`model_registration_counter: int = 0`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00
Make Dataset part of the trainer 2024-02-07 14:35:26 +00:00			`@property`
			`def dataset_length(self) -> int:`
			`return 20`

change param name of abstract get_item method 2024-02-08 16:16:00 +00:00			`def get_item(self, index: int) -> MockBatch:`
Make Dataset part of the trainer 2024-02-07 14:35:26 +00:00			`return MockBatch(inputs=torch.randn(1, 10), targets=torch.randn(1, 10))`

			`def collate_fn(self, batch: list[MockBatch]) -> MockBatch:`
			`return MockBatch(`
			`inputs=torch.cat([b.inputs for b in batch]),`
			`targets=torch.cat([b.targets for b in batch]),`
			`)`

update test_trainer.py 2024-04-25 13:07:40 +00:00			`@register_callback()`
			`def early_callback(self, config: CallbackConfig) -> EarlyMockCallback:`
			`return EarlyMockCallback()`

Implement EventConfig 2024-04-19 15:59:48 +00:00			`@register_callback()`
remove EventConfig This is a partial rollback of commit 5dde281 2024-04-24 16:25:55 +00:00			`def mock_callback(self, config: MockCallbackConfig) -> MockCallback:`
			`return MockCallback(config)`
Implement EventConfig 2024-04-19 15:59:48 +00:00
add @register_model and @register_callback decorators Refactor ClockTrainer to include Callback 2024-02-12 08:28:41 +00:00			`@register_model()`
Enforce correct subtype for the config param in both decorators Also add a custom ModelConfig for the MockTrainer test Update src/refiners/training_utils/config.py Co-authored-by: Cédric Deltheil <355031+deltheil@users.noreply.github.com> 2024-02-12 14:53:24 +00:00			`def mock_model(self, config: MockModelConfig) -> MockModel:`
			`model = MockModel()`
			`if config.use_activation:`
			`model.add_activation()`
fix bug that was causing double registration 2024-02-13 06:29:55 +00:00
			`self.model_registration_counter += 1`
Enforce correct subtype for the config param in both decorators Also add a custom ModelConfig for the MockTrainer test Update src/refiners/training_utils/config.py Co-authored-by: Cédric Deltheil <355031+deltheil@users.noreply.github.com> 2024-02-12 14:53:24 +00:00			`return model`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00
			`def compute_loss(self, batch: MockBatch) -> Tensor:`
			`self.step_counter += 1`
			`inputs, targets = batch.inputs.to(self.device), batch.targets.to(self.device)`
			`outputs = self.mock_model(inputs)`
			`return norm(outputs - targets)`


			`@pytest.fixture`
make device and dtype work in Trainer class 2024-02-06 21:39:38 +00:00			`def mock_config() -> MockConfig:`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`config = MockConfig.load_from_toml(Path(__file__).parent / "mock_config.toml")`
			`return config`


			`@pytest.fixture`
			`def mock_trainer(mock_config: MockConfig) -> MockTrainer:`
			`return MockTrainer(config=mock_config)`


less than 1 epoch training duration 2024-02-08 18:20:31 +00:00			`@pytest.fixture`
			`def mock_trainer_short(mock_config: MockConfig) -> MockTrainer:`
test_trainer: use `model_copy` instead of `copy` The `copy` method has been deprecated. 2024-02-08 18:35:08 +00:00			`mock_config_short = mock_config.model_copy(deep=True)`
Refactor TimeValue 2024-04-18 14:41:57 +00:00			`mock_config_short.training.duration = Step(3)`
less than 1 epoch training duration 2024-02-08 18:20:31 +00:00			`return MockTrainer(config=mock_config_short)`


add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`@pytest.fixture`
			`def mock_model() -> fl.Chain:`
			`return MockModel()`


			`def test_count_learnable_parameters_with_params() -> None:`
			`params = [`
			`nn.Parameter(torch.randn(2, 2), requires_grad=True),`
			`nn.Parameter(torch.randn(5), requires_grad=False),`
			`nn.Parameter(torch.randn(3, 3), requires_grad=True),`
			`]`
add support for pytorch 2.2 (2.1 is still supported) also bump all dev dependencies to their latest version 2024-01-31 11:15:46 +00:00			`# cast because of PyTorch 2.2, see https://github.com/pytorch/pytorch/issues/118736`
			`assert count_learnable_parameters(cast(list[nn.Parameter], params)) == 13`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00

			`def test_count_learnable_parameters_with_model(mock_model: fl.Chain) -> None:`
			`assert count_learnable_parameters(mock_model.parameters()) == 330`


			`def test_human_readable_number() -> None:`
			`assert human_readable_number(123) == "123.0"`
			`assert human_readable_number(1234) == "1.2K"`
			`assert human_readable_number(1234567) == "1.2M"`


			`@pytest.fixture`
			`def training_clock() -> TrainingClock:`
			`return TrainingClock(`
			`batch_size=10,`
Refactor TimeValue 2024-04-18 14:41:57 +00:00			`training_duration=Epoch(5),`
remove dataset length 2024-04-24 16:50:27 +00:00			`gradient_accumulation=Step(1),`
Refactor TimeValue 2024-04-18 14:41:57 +00:00			`lr_scheduler_interval=Epoch(1),`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`)`


TrainerClock: assert dataset_length >= batch_size 2024-04-11 17:43:07 +00:00			`def test_zero_batch_size_error():`
			`with pytest.raises(AssertionError):`
			`TrainingClock(`
			`batch_size=0,`
Refactor TimeValue 2024-04-18 14:41:57 +00:00			`training_duration=Epoch(5),`
remove dataset length 2024-04-24 16:50:27 +00:00			`gradient_accumulation=Step(1),`
Refactor TimeValue 2024-04-18 14:41:57 +00:00			`lr_scheduler_interval=Epoch(1),`
TrainerClock: assert dataset_length >= batch_size 2024-04-11 17:43:07 +00:00			`)`


add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`def test_timer_functionality(training_clock: TrainingClock) -> None:`
			`training_clock.start_timer()`
			`assert training_clock.start_time is not None`
			`training_clock.stop_timer()`
			`assert training_clock.end_time is not None`
			`assert training_clock.time_elapsed >= 0`


			`def test_mock_trainer_initialization(mock_config: MockConfig, mock_trainer: MockTrainer) -> None:`
			`assert mock_trainer.config == mock_config`
			`assert isinstance(mock_trainer, MockTrainer)`
			`assert mock_trainer.optimizer is not None`
			`assert mock_trainer.lr_scheduler is not None`
fix bug that was causing double registration 2024-02-13 06:29:55 +00:00			`assert mock_trainer.model_registration_counter == 1`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00

			`def test_training_cycle(mock_trainer: MockTrainer) -> None:`
			`clock = mock_trainer.clock`
			`config = mock_trainer.config`

			`assert mock_trainer.step_counter == 0`
Implement EventConfig 2024-04-19 15:59:48 +00:00			`assert clock.epoch == 0`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00
			`mock_trainer.train()`

change TimeValue to a dataclass 2024-03-19 13:20:40 +00:00			`assert clock.epoch == config.training.duration.number`
add basic unit test for training_utils 2024-01-14 14:06:48 +00:00			`assert mock_trainer.step_counter == mock_trainer.clock.step`
Fix warmup steps calculation when gradient_accumulation is used 2024-01-25 10:36:58 +00:00

Implement EventConfig 2024-04-19 15:59:48 +00:00			`def test_callback_registration(mock_trainer: MockTrainer) -> None:`
			`mock_trainer.train()`

			`# Check that the callback skips every other iteration`
			`assert mock_trainer.mock_callback.optimizer_step_count == mock_trainer.clock.iteration // 2`
update test_trainer.py 2024-04-25 13:07:40 +00:00			`assert mock_trainer.mock_callback.step_end_count == mock_trainer.clock.step // 3 + 1`
Implement EventConfig 2024-04-19 15:59:48 +00:00
			`# Check that the random seed was set`
remove EventConfig This is a partial rollback of commit 5dde281 2024-04-24 16:25:55 +00:00			`assert mock_trainer.mock_callback.optimizer_step_random_int == 93`
batch to step 2024-04-24 16:27:43 +00:00			`assert mock_trainer.mock_callback.step_end_random_int == 81`
Implement EventConfig 2024-04-19 15:59:48 +00:00

less than 1 epoch training duration 2024-02-08 18:20:31 +00:00			`def test_training_short_cycle(mock_trainer_short: MockTrainer) -> None:`
			`clock = mock_trainer_short.clock`
			`config = mock_trainer_short.config`

			`assert mock_trainer_short.step_counter == 0`
			`assert mock_trainer_short.clock.epoch == 0`

			`mock_trainer_short.train()`

change TimeValue to a dataclass 2024-03-19 13:20:40 +00:00			`assert clock.step == config.training.duration.number`
less than 1 epoch training duration 2024-02-08 18:20:31 +00:00

Fix warmup steps calculation when gradient_accumulation is used 2024-01-25 10:36:58 +00:00			`@pytest.fixture`
			`def warmup_scheduler():`
			`optimizer = SGD([nn.Parameter(torch.randn(2, 2), requires_grad=True)], lr=0.1)`
			`scheduler = torch.optim.lr_scheduler.ConstantLR(optimizer, 1)`
			`return WarmupScheduler(optimizer, scheduler, warmup_scheduler_steps=100)`


			`def test_initial_lr(warmup_scheduler: WarmupScheduler) -> None:`
			`optimizer = warmup_scheduler.optimizer`
			`for group in optimizer.param_groups:`
			`assert group["lr"] == 1e-3`


			`def test_warmup_lr(warmup_scheduler: WarmupScheduler) -> None:`
update deprecated validator for field_validator 2024-02-13 17:24:53 +00:00			`with warnings.catch_warnings():`
			`warnings.filterwarnings(`
			`"ignore",`
			`category=UserWarning,`
			message=r"Detected call of `lr_scheduler.step\(\)` before `optimizer.step\(\)`",
			`)`
			`for _ in range(102):`
			`warmup_scheduler.step()`
Fix warmup steps calculation when gradient_accumulation is used 2024-01-25 10:36:58 +00:00			`optimizer = warmup_scheduler.optimizer`
			`for group in optimizer.param_groups:`
			`assert group["lr"] == 0.1`
lr, betas, eps, weight_decay at model level Co-authored-by: Cédric Deltheil <355031+deltheil@users.noreply.github.com> 2024-02-01 08:26:59 +00:00

			`class MockTrainerWith2Models(MockTrainer):`
add @register_model and @register_callback decorators Refactor ClockTrainer to include Callback 2024-02-12 08:28:41 +00:00			`@register_model()`
			`def mock_model1(self, config: ModelConfig) -> MockModel:`
lr, betas, eps, weight_decay at model level Co-authored-by: Cédric Deltheil <355031+deltheil@users.noreply.github.com> 2024-02-01 08:26:59 +00:00			`return MockModel()`

add @register_model and @register_callback decorators Refactor ClockTrainer to include Callback 2024-02-12 08:28:41 +00:00			`@register_model()`
			`def mock_model2(self, config: ModelConfig) -> MockModel:`
lr, betas, eps, weight_decay at model level Co-authored-by: Cédric Deltheil <355031+deltheil@users.noreply.github.com> 2024-02-01 08:26:59 +00:00			`return MockModel()`

			`def compute_loss(self, batch: MockBatch) -> Tensor:`
			`self.step_counter += 1`
			`inputs, targets = batch.inputs.to(self.device), batch.targets.to(self.device)`
			`outputs = self.mock_model2(self.mock_model1(inputs))`
			`return norm(outputs - targets)`


refactor register_model decorator 2024-02-12 13:17:51 +00:00			`class MockConfig_2_Models(BaseConfig):`
			`mock_model1: ModelConfig`
			`mock_model2: ModelConfig`


lr, betas, eps, weight_decay at model level Co-authored-by: Cédric Deltheil <355031+deltheil@users.noreply.github.com> 2024-02-01 08:26:59 +00:00			`@pytest.fixture`
refactor register_model decorator 2024-02-12 13:17:51 +00:00			`def mock_config_2_models() -> MockConfig_2_Models:`
			`return MockConfig_2_Models.load_from_toml(Path(__file__).parent / "mock_config_2_models.toml")`
lr, betas, eps, weight_decay at model level Co-authored-by: Cédric Deltheil <355031+deltheil@users.noreply.github.com> 2024-02-01 08:26:59 +00:00

			`@pytest.fixture`
			`def mock_trainer_2_models(mock_config_2_models: MockConfig) -> MockTrainerWith2Models:`
			`return MockTrainerWith2Models(config=mock_config_2_models)`


			`def test_optimizer_parameters(mock_trainer_2_models: MockTrainerWith2Models) -> None:`
add @register_model and @register_callback decorators Refactor ClockTrainer to include Callback 2024-02-12 08:28:41 +00:00			`assert len(mock_trainer_2_models.optimizer.param_groups) == 2`
lr, betas, eps, weight_decay at model level Co-authored-by: Cédric Deltheil <355031+deltheil@users.noreply.github.com> 2024-02-01 08:26:59 +00:00			`assert mock_trainer_2_models.optimizer.param_groups[0]["lr"] == 1e-5`