Update.
authorFrançois Fleuret <francois@fleuret.org>
Tue, 9 Jan 2024 18:09:33 +0000 (19:09 +0100)
committerFrançois Fleuret <francois@fleuret.org>
Tue, 9 Jan 2024 18:09:33 +0000 (19:09 +0100)
mygpt.py

index b885e21..bd870bc 100755 (executable)
--- a/mygpt.py
+++ b/mygpt.py
@@ -10,6 +10,8 @@
 # with a caching mechanism for keys and values to avoid a O(N^3) cost
 # for auto-regression.
 
+# This implementation is equipped with RNN layers to replace the MHA
+
 import math, warnings
 
 import torch, einops