Table 2.
Parameter Name | Value of Parameter |
---|---|
Number of Layers | 24 |
Hidden Size | 1024 |
Attention Heads | 16 |
Number of Parameters | 340M |
Parameter Name | Value of Parameter |
---|---|
Number of Layers | 24 |
Hidden Size | 1024 |
Attention Heads | 16 |
Number of Parameters | 340M |