Tengo curiosidad sobre el proceso de generación de GPT.
Específicamente, quiero saber si produce resultados generando un token a la vez o si utiliza un enfoque diferente.
6 respuestas
Valentino
Sat Nov 16 2024
Un modelo GPT funciona utilizando un "pasaje de contexto" como entrada.
isabella_bailey_economist
Sat Nov 16 2024
Después de este proceso, el modelo genera un único token o, más exactamente, una matriz.
BlockchainMastermind
Sat Nov 16 2024
El tamaño de esta matriz corresponde al vocabulario utilizado por el modelo.
InfinityVoyager
Sat Nov 16 2024
Esta entrada luego se procesa convirtiendo las palabras en una secuencia de tokens numéricos.
Martino
Sat Nov 16 2024
Estos tokens se introducen en el modelo, que contiene múltiples capas de transformadores.