LLM

Moduł ten bada duże modele językowe (LLM), koncentrując się na ich rozwoju i zastosowaniach. Obejmuje on podstawowe koncepcje przetwarzania języka naturalnego, architekturę modeli takich jak GPT (Generative Pre-trained Transformer) oraz ich zastosowania w zadaniach takich jak generowanie tekstu, tłumaczenie i tworzenie treści, a także kwestie etyczne i potencjalne uprzedzenia.

Kreator programów nauczania

Li, Yujia, David Choi, Junyoung Chung, Nate Kushman, Julian Schrittwieser, Rémi Leblond, Tom Eccles i in. "Generowanie kodu na poziomie konkurencji za pomocą AlphaCode". Science 378, nr 6624 (9 grudnia 2022): 1092-97.

https://doi.org/10.1126/science.abq1158

Stiennon, Nisan, Long Ouyang, Jeff Wu, Daniel M. Ziegler, Ryan Lowe, Chelsea Voss, Alec Radford, Dario Amodei i Paul Christiano. "Learning to Summarize from Human Feedback." arXiv, 15 lutego 2022 r.

http://arxiv.org/abs/2009.01325

Garg, Shivam, Dimitris Tsipras, Percy Liang i Gregory Valiant. "Czego transformatory mogą się nauczyć w kontekście? A Case Study of Simple Function Classes." arXiv, 11 sierpnia 2023 r.

http://arxiv.org/abs/2208.01066

He, Junxian, Chunting Zhou, Xuezhe Ma, Taylor Berg-Kirkpatrick i Graham Neubig. "Towards a Unified View of Parameter-Efficient Transfer Learning", arXiv, 2 lutego 2022 r.

http://arxiv.org/abs/2110.04366

Zhang, Susan, Stephen Roller, Naman Goyal, Mikel Artetxe, Moya Chen, Shuohui Chen, Christopher Dewan, et al. "OPT: Open Pre-Trained Transformer Language Models." arXiv, 2022.

https://doi.org/10.48550/ARXIV.2205.01068

Clark, Kevin, Minh-Thang Luong, Quoc V. Le i Christopher D. Manning. "ELECTRA: wstępne szkolenie koderów tekstu jako dyskryminatorów, a nie generatorów". arXiv, 2020.

https://doi.org/10.48550/ARXIV.2003.10555

Liu, Yinhan, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer i Veselin Stoyanov. "RoBERTa: A Robustly Optimized BERT Pretraining Approach." arXiv, 26 lipca 2019 r.

http://arxiv.org/abs/1907.11692

Radford, Alec i Karthik Narasimhan. "Poprawa rozumienia języka poprzez generatywne szkolenie wstępne", 2018.

https://www.semanticscholar.org/paper/Improving-Language-Understanding-by-Generative-Radford-Narasimhan/cd18800a0fe0b668a1cc19f2ec95b5003d0a5035

Peters, Matthew E., Mark Neumann, Mohit Iyyer, Matt Gardner, Christopher Clark, Kenton Lee i Luke Zettlemoyer. "Deep Contextualized Word Representations." arXiv, 2018.

https://doi.org/10.48550/ARXIV.1802.05365

Manning, Christopher D. "Rozumienie i rozumowanie języka ludzkiego". Daedalus 151, nr 2 (1 maja 2022): 127-38.

https://doi.org/10.1162/daed_a_01905

Dziękujemy za zapisanie się do naszego newslettera!

Dziękujemy! RSVP received for Li, Yujia, David Choi, Junyoung Chung, Nate Kushman, Julian Schrittwieser, Rémi Leblond, Tom Eccles, et al. "Competition-Level Code Generation with AlphaCode". Science 378, nr 6624 (9 grudnia 2022): 1092-97.

Li, Yujia, David Choi, Junyoung Chung, Nate Kushman, Julian Schrittwieser, Rémi Leblond, Tom Eccles i in. "Generowanie kodu na poziomie konkurencji za pomocą AlphaCode". Science 378, nr 6624 (9 grudnia 2022): 1092-97.

Ładowanie...

Ładowanie...