[Feat]:

- Provide SGD implementation - Add momentum capability - Build ShallowNet for testing
ahmedelsayed968 · Mar 19, 2024 · c6aca28 · c6aca28
1 parent ee20f2a
commit c6aca28
Show file tree

Hide file tree

Showing 2 changed files with 96 additions and 0 deletions.
diff --git a/optimization/SGD.py b/optimization/SGD.py
@@ -0,0 +1,69 @@
+from typing import List, Optional
+
+import numpy as np
+import tensorflow as tf
+
+
+class SGDTrainer:
+    def __init__(
+        self,
+        model: tf.keras.models.Model,
+        x_train: tf.Tensor,
+        y_train: tf.Tensor,
+        epochs: int,
+        loss_fn: tf.keras.losses.Loss,
+        learning_schedule: Optional[List[int]] = [5, 50],
+        momentum: Optional[float] = None,
+    ) -> None:
+        self.model = model
+        self.x = x_train
+        self.y = y_train
+        self.epochs = epochs
+        self.loss_fn = loss_fn
+        self.lr_schedule = learning_schedule
+        self.momentum = momentum
+        self.training_examples = self.x.shape[0]
+        self.m = None
+
+    def learning_schedule(self, t):
+        return self.lr_schedule[0] / (t + self.lr_schedule[1])
+
+    def train(self):
+        losses = []
+
+        for epoch in range(self.epochs):
+            avg_loss = 0
+            for point_idx in range(self.training_examples):
+                random_idx = np.random.randint(0, self.training_examples)
+                x_random = self.x[random_idx : random_idx + 1]
+                y_random = self.y[random_idx : random_idx + 1]
+                lr = self.learning_schedule(epoch * self.training_examples + point_idx)
+
+                with tf.GradientTape(persistent=True) as t:
+                    predict = self.model(x_random)
+                    loss = self.loss_fn(y_random, predict)
+
+                gradients = t.gradient(loss, self.model.trainable_variables)
+                if not self.m:
+                    self.m = gradients
+                self._update_params(gradients, lr)
+
+                avg_loss += loss.numpy()
+                if point_idx % 10:
+                    losses.append(avg_loss / 10)
+                    avg_loss = 0
+                    print(
+                        "Epoch {}, Step {}, Loss: {:.4f}".format(
+                            epoch + 1, point_idx, loss.numpy()
+                        )
+                    )
+            return losses
+
+    def _update_params(self, gradients, lr):
+        if not self.momentum:
+            for var, grad in zip(self.model.trainable_variables, gradients):
+                var.assign_sub(lr * grad)
+        else:
+            self.m = [self.momentum * i - lr * j for i, j in zip(self.m, gradients)]
+            for var, m in zip(self.model.trainable_variables, self.m):
+                var.assign_add(m)
diff --git a/train/main.py b/train/main.py
@@ -0,0 +1,27 @@
+from typing import List, Tuple
+
+import numpy as np
+import tensorflow as tf
+from tensorflow.keras.layers import Dense, Input
+from tensorflow.keras.models import Model
+
+from optimization.SGD import SGDTrainer
+
+
+def get_model(input_shape: Tuple[int], neurons: List[int], output_neurons: int):
+    input_layer = Input(shape=input_shape)
+    x = input_layer
+
+    for i in neurons:
+        x = Dense(units=i, activation="relu")(x)
+    output = Dense(units=output_neurons, activation="linear")(x)
+    return Model(input_layer, output)
+
+
+X = np.linspace(1, 10000, num=10000)
+y = X**2
+y_train, x_train = tf.cast(y, dtype=tf.float32), tf.cast(X, dtype=tf.float32)
+
+model = get_model(input_shape=(1,), neurons=[10], output_neurons=1)
+loss_fn = tf.keras.losses.MeanSquaredError()
+trainer = SGDTrainer(model, x_train[:1000], y_train[:1000], 2, loss_fn, momentum=0.9)