Titre | How Many Layers and Why? An Analysis of the Model Depth in Transformers |
Publication Type | Article dans des actes |
Année de la conférence | 2021 |
Authors | Simoulin, Antoine, and Benoît Crabbé |
Nom de la conférence | Association of Computational Linguistics (student) |
Conference Location | Bangkok, Thailand |
URL | https://hal.archives-ouvertes.fr/hal-03601412 |