Update

[beaver.git] / beaver.py
diff --git a/beaver.py b/beaver.py

index a289867..7adb804 100755 (executable)
--- a/beaver.py
+++ b/beaver.py
@@ -26,9 +26,7 @@ else:
  
  ######################################################################
  
-parser = argparse.ArgumentParser(
-    description="An implementation of GPT with cache to solve a toy geometric reasoning task."
-)
+parser = argparse.ArgumentParser(description="A maze shortest path solving with a GPT.")
  
  parser.add_argument("--log_filename", type=str, default="train.log")
  
@@ -196,7 +194,6 @@ class TaskMaze(Task):
          )
          mazes_train, paths_train = mazes_train.to(device), paths_train.to(device)
          self.train_input = self.map2seq(mazes_train, paths_train)
-        self.nb_codes = self.train_input.max() + 1
  
          mazes_test, paths_test = maze.create_maze_data(
              nb_test_samples,
@@ -208,6 +205,8 @@ class TaskMaze(Task):
          mazes_test, paths_test = mazes_test.to(device), paths_test.to(device)
          self.test_input = self.map2seq(mazes_test, paths_test)
  
+        self.nb_codes = self.train_input.max() + 1
+
      def batches(self, split="train", nb_to_use=-1):
          assert split in {"train", "test"}
          input = self.train_input if split == "train" else self.test_input
@@ -227,6 +226,7 @@ class TaskMaze(Task):
              result = input.clone()
              ar_mask = result.new_zeros(result.size())
              ar_mask[:, self.height * self.width :] = 1
+            result *= 1 - ar_mask
              masked_inplace_autoregression(model, self.batch_size, result, ar_mask)
              mazes, paths = self.seq2map(result)
              nb_correct += maze.path_correctness(mazes, paths).long().sum()
@@ -256,14 +256,14 @@ class TaskMaze(Task):
              input = self.test_input[:32]
              result = input.clone()
              ar_mask = result.new_zeros(result.size())
-
              ar_mask[:, self.height * self.width :] = 1
+            result *= 1 - ar_mask
              masked_inplace_autoregression(model, self.batch_size, result, ar_mask)
  
              mazes, paths = self.seq2map(input)
              _, predicted_paths = self.seq2map(result)
              maze.save_image(
-                f"result_{n_epoch:04d}.png",
+                os.path.join(args.result_dir, f"result_{n_epoch:04d}.png"),
                  mazes,
                  paths,
                  predicted_paths,