Source code for phitodeep.model

from . import loss as ls
from .optimization.training import train_loop
from .optimization import optimizers as o
from .optimization.initialization import He
from .layers import activation as a
from .layers import base as b



[docs]
class Sequential:
    def __init__(
        self,
        *layers,
        alpha=0.01,
        optimizer: o.Optimizer=o.Adam(),
        batch_size=None,
        epochs=1000,
        loss_class=ls.MeanSquaredError(),
    ) -> None:
        """
        Initialize with variable number of layers.

        Usage:
            model = Sequential(
                b.Dense(256, 128),
                a.ReLu(),
                b.Dense(128, 1),
                a.Sigmoid()
            )
        """
        self.layers = list(layers)
        self.alpha = alpha
        self.optimizer_type = optimizer
        self.batch_size = batch_size
        self.epochs = epochs
        self.loss_class = loss_class


[docs]
    def add(self, layer) -> None:
        """Add a layer to the network."""
        self.layers.append(layer)



[docs]
    def setoptimizer(self, optimizer):
        self.optimizer_type = optimizer



[docs]
    def setbatchsize(self, num):
        self.batch_size = num



[docs]
    def setloss(self, loss_class):
        self.loss_class = loss_class



[docs]
    def train(self, X, y, X_test, y_test):
        """
        Train the model using the specified optimizer and loss function.

        Args:
            X (np.ndarray): Training data.
            y (np.ndarray): Training labels.
            X_test (np.ndarray): Test data.
            y_test (np.ndarray): Test labels.

        Returns:
            list: A list of tuples containing the training and test losses for each epoch.
        """
        losses = train_loop(
            model=self,
            X=X,
            y=y,
            X_test=X_test,
            y_test=y_test,
            optimizer=self.optimizer_type,
            loss_class=self.loss_class,
            batch_size=self.batch_size,
            epochs=self.epochs,
        )

        print("Training complete.")
        print("-" * 60)
        print(
            f"Starting Training Loss: {losses[0][0]:.4f} | Starting Test Loss: {losses[0][1]:.4f}"
        )
        print(
            f"Final Training Loss: {losses[-1][0]:.4f} | Final Test Loss: {losses[-1][1]:.4f}"
        )
        print(
            f"Training Loss Improvement: {losses[0][0] - losses[-1][0]:.4f} | Test Loss Improvement: {losses[0][1] - losses[-1][1]:.4f}"
        )
        print("-" * 60)
        return losses



[docs]
    def predict(self, X):
        """
        Forward pass through all layers.

        Args:
            X: input array

        Returns:
            output after passing through all layers
        """
        output = X
        for layer in self.layers:
            output = layer.forward(output)
        return output



[docs]
    def backward(self, gradient):
        """
        Backward pass through all layers.

        Args:
            gradient: dL/dY from loss function (shape: batch_size x output_size)

        Propagates gradient backwards through all layers in reverse order.
        Each layer computes its parameter gradients, updates parameters,
        and returns the gradient for the previous layer.
        """
        # Start with gradient from loss and propagate backwards
        current_gradient = gradient

        # Iterate through layers in reverse order
        for layer in reversed(self.layers):
            # Pass gradient through layer and get gradient for previous layer
            current_gradient = layer.backward(current_gradient)



[docs]
    def __call__(self, X):
        """Allow model(X) syntax."""
        return self.predict(X)



[docs]
    def summary(self):
        """Print model architecture."""
        print("Model Summary:")
        print("-" * 60)
        print(
            f"Optimizer: {self.optimizer_type.name} | Learning Rate: {self.alpha} | Batch Size: {self.batch_size} \nEpochs: {self.epochs} | Loss: {self.loss_class.name}"
        )
        print("-" * 60)
        for i, layer in enumerate(self.layers):
            if isinstance(layer, b.Dense):
                print(
                    f"Layer {i}: {layer.name.upper():<10} | Input: {layer.input_size:<5} Output: {layer.output_size:<5}"
                )
            else:
                print(f"Layer {i}: {layer.name.upper():<10}")
        print("-" * 60)



[docs]
    def copy(self):
        """Return a copy of the model."""
        return Sequential(
            *[layer.copy() for layer in self.layers],
            alpha=self.alpha,
            optimizer=self.optimizer_type,
            batch_size=self.batch_size,
            epochs=self.epochs,
            loss_class=self.loss_class,
        )





[docs]
class SequentialBuilder:
    """Fluent API for building Sequential models."""

    def __init__(self):
        self.layers = []
        self.alpha_value = 1
        self.optimizer_type = o.Adam()
        self.batch_size = None
        self.epochs_value = 1000
        self.loss_class = ls.MeanSquaredError()


[docs]
    def flatten(self):
        """Add a Flatten layer."""
        self.layers.append(b.Flatten())
        return self



[docs]
    def dense(self, input_size, output_size, initializer=He()):
        """Add a Dense layer."""
        self.layers.append(b.Dense(input_size, output_size, initializer))
        return self



[docs]
    def relu(self):
        """Add a ReLU activation."""
        self.layers.append(a.ReLu())
        return self



[docs]
    def sigmoid(self):
        """Add a Sigmoid activation."""
        self.layers.append(a.Sigmoid())
        return self



[docs]
    def tanh(self):
        """Add a Tanh activation."""
        self.layers.append(a.Tanh())
        return self



[docs]
    def softmax(self):
        """Add a Softmax activation."""
        self.layers.append(a.Softmax())
        return self



[docs]
    def elu(self, alpha_activation=1.0):
        """Add an ELU activation."""
        self.layers.append(a.ELU(alpha_activation))
        return self



[docs]
    def optimizer(self, optimizer):
        """Set the optimizer."""
        self.optimizer_type = optimizer
        return self



[docs]
    def batch(self, num):
        """Set the batch size."""
        self.batch_size = num
        return self



[docs]
    def alpha(self, num):
        """Set the learning rate."""
        self.alpha_value = num
        return self



[docs]
    def epochs(self, num):
        """Set the number of epochs."""
        self.epochs_value = num
        return self



[docs]
    def loss(self, loss_class):
        """Set the loss function."""
        self.loss_class = loss_class
        return self



[docs]
    def build(self):
        """Build and return the Sequential model."""
        return Sequential(
            *[layer.copy() for layer in self.layers],
            alpha=self.alpha_value,
            optimizer=self.optimizer_type,
            batch_size=self.batch_size,
            epochs=self.epochs_value,
            loss_class=self.loss_class,
        )