af96ee9d73173cc05be312e3e4d0d95882a8f8ea
[culture.git] / README.txt
1
2 Trying to make GPTs build their own "culture".
3
4 * Motivation
5
6 The original motivation of this experiment is the hypothesis that
7 high-level cognition emerges from the competition among humans in the
8 space of language and ideas.
9
10 More precisely, communicating agents try to out-do competitors by
11 creating stuff that is smart but doable, e.g. some other agents get
12 it, but not all. Then, that smart thing is added to the "culture",
13 they all learn and get to understand it, and it repeats.
14
15 * Setup
16
17 It starts with a "world model" that they got before they communicate,
18 and from there, they try to "be smart" by proposing quizzes that can
19 be solved but not by everybody.
20
21 There are 5 competing GPTs.
22
23 The "world" is a 6x8 grid with one or two "birds" moving in a straight
24 line and bouncing on the world's borders. The colors correspond to a
25 fixed "z-buffer order". It could be another "world", but this one has
26 objectness, occlusion, and motion.
27
28 Given a random world state, and the state after two iterations of
29 birds moving, a "quiz" is to predict the second frame, given the
30 first, or the opposite.
31
32 My home-baked GPT-37M trained with 250k solves this with ~99% success.
33
34 At every iteration, we select the GPT with the lowest test accuracy,
35 and run one epoch. If its test accuracy got higher than 97.5%, it will
36 create new quizzes. To do so, it generates a large number of pairs of
37 frames, and checks which ones of these quizzes are hard but not too
38 hard, which means
39
40 [THIS IS THE IMPORTANT BIT]:
41
42 it can be solved, in both time directions, by all the other GPTs **but
43 one**
44
45 The both time directions is to avoid a simple type of quizzes which is
46 simply to deal with noise in the first frame.
47
48 The GPT generates 1000 of such quizzes, that are added to the
49 "culture", i.e. the training set.
50
51 Then training resumes.
52
53 The hope is that interesting concepts emerge (connectivity, symmetry,
54 interior/exterior, shape vocabulary, etc.)