LLMs

Este módulo explora los grandes modelos lingüísticos (LLM), centrándose en su desarrollo y aplicaciones. Abarca conceptos fundamentales del procesamiento del lenguaje natural, la arquitectura de modelos como el GPT (Generative Pre-trained Transformer) y sus aplicaciones en tareas como la generación de textos, la traducción y la creación de contenidos, junto con consideraciones éticas y posibles sesgos.

Curriculum Builder

Li, Yujia, David Choi, Junyoung Chung, Nate Kushman, Julian Schrittwieser, Rémi Leblond, Tom Eccles, et al. "Competition-Level Code Generation with AlphaCode". Science 378, no. 6624 (9 de diciembre de 2022): 1092-97.

https://doi.org/10.1126/science.abq1158

Stiennon, Nisan, Long Ouyang, Jeff Wu, Daniel M. Ziegler, Ryan Lowe, Chelsea Voss, Alec Radford, Dario Amodei y Paul Christiano. "Learning to Summarize from Human Feedback", arXiv, 15 de febrero de 2022.

http://arxiv.org/abs/2009.01325

Garg, Shivam, Dimitris Tsipras, Percy Liang y Gregory Valiant. "¿Qué pueden aprender los transformadores en contexto? A Case Study of Simple Function Classes" arXiv, 11 de agosto de 2023.

http://arxiv.org/abs/2208.01066

He, Junxian, Chunting Zhou, Xuezhe Ma, Taylor Berg-Kirkpatrick y Graham Neubig. "Towards a Unified View of Parameter-Efficient Transfer Learning" arXiv, 2 de febrero de 2022.

http://arxiv.org/abs/2110.04366

Zhang, Susan, Stephen Roller, Naman Goyal, Mikel Artetxe, Moya Chen, Shuohui Chen, Christopher Dewan, et al. "OPT: Open Pre-Trained Transformer Language Models" arXiv, 2022.

https://doi.org/10.48550/ARXIV.2205.01068

Clark, Kevin, Minh-Thang Luong, Quoc V. Le, y Christopher D. Manning. "ELECTRA: Pre-Training Text Encoders as Discriminators Rather Than Generators" arXiv, 2020.

https://doi.org/10.48550/ARXIV.2003.10555

Liu, Yinhan, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer y Veselin Stoyanov. "RoBERTa: A Robustly Optimized BERT Pretraining Approach" arXiv, 26 de julio de 2019.

http://arxiv.org/abs/1907.11692

Radford, Alec, y Karthik Narasimhan. "Improving Language Understanding by Generative Pre-Training", 2018.

https://www.semanticscholar.org/paper/Improving-Language-Understanding-by-Generative-Radford-Narasimhan/cd18800a0fe0b668a1cc19f2ec95b5003d0a5035

Peters, Matthew E., Mark Neumann, Mohit Iyyer, Matt Gardner, Christopher Clark, Kenton Lee y Luke Zettlemoyer. "Representaciones profundas de palabras contextualizadas" arXiv, 2018.

https://doi.org/10.48550/ARXIV.1802.05365

Manning, Christopher D. "Comprensión y razonamiento del lenguaje humano". Daedalus 151, no. 2 (1 de mayo de 2022): 127-38.

https://doi.org/10.1162/daed_a_01905

Gracias por suscribirse a nuestro boletín.

¡Gracias! RSVP recibido para Li, Yujia, David Choi, Junyoung Chung, Nate Kushman, Julian Schrittwieser, Rémi Leblond, Tom Eccles, et al. "Competition-Level Code Generation with AlphaCode". Science 378, no. 6624 (9 de diciembre de 2022): 1092-97.

Li, Yujia, David Choi, Junyoung Chung, Nate Kushman, Julian Schrittwieser, Rémi Leblond, Tom Eccles, et al. "Competition-Level Code Generation with AlphaCode". Science 378, no. 6624 (9 de diciembre de 2022): 1092-97.

Cargando...

Cargando...