Pasar al contenido principal

Una introducción al modelo de red neuronal Transformer

Fecha de inicio
Fecha de fin

Seminario de Probabilidad y Estadística

Título: Una introducción al modelo de red neuronal Transformer

Expositor: Mathias Etcheverry (Inco Udelar)

Resumen: En los últimos años ha sido notable la popularidad de bots convesacionales basados en grandes modelos de lenguaje como chatGPT, Bard, LLaMA, PaLM, etc. Estos sistemas son capaces de responder a consultas y mantener conversaciones con un desempeño sorprendente. En esta sesión se pretende explicar como es el Transformer, el modelo que hace posible a estos chatbots. Se hará un recorrido por los modelos de lenguaje con redes neuronales, comenzando por redes completamente conectadas hasta llegar al Transfomer, pasando por redes recurrentes, mecanismos de atención y representaciones distribuidas de las palabras. 


Viernes 3/11 a las 10:30
Facultad de Ingeniería, salón 705 (salón marrón).

Contacto: Alejandro Cholaquidis - acholaquidis@hotmail.com


 

https://salavirtual-udelar.zoom.us/j/88544669179?pwd=UlBHdWRWdEZVMGw0ak…

 

Página del seminario: https://pye.cmat.edu.uy/seminario

 

Página del grupo: https://pye.cmat.edu.uy/home

 

Canal de youtube: https://www.youtube.com/channel/UCOPZEOrLSAYPz2qCAL-KqMg/about