LLM

Šiame modulyje nagrinėjami dideli kalbų modeliai (LLM), daugiausia dėmesio skiriant jų kūrimui ir taikymui. Tai apima pagrindines natūralios kalbos apdorojimo koncepcijas, tokių modelių architektūrą kaip GPT (generacinis iš anksto apmokytas transformatorius) ir jų taikymą tokiose užduotyse kaip teksto generavimas, vertimas ir turinio kūrimas, taip pat etinius aspektus ir galimą šališkumą.

Mokymo programos kūrėjas

Li, Yujia, David Choi, Junyoung Chung, Nate Kushman, Julian Schrittwieser, Rémi Leblond, Tom Eccles ir kt. “Konkurso lygio kodo generavimas naudojant AlphaCode”. Mokslas 378, nr. 6624 (2022 m. gruodžio 9 d.): 1092–97.

https://doi.org/10.1126/science.abq1158

Stiennonas, Nisanas, Longas Ouyangas, Jeffas Wu, Danielis M. Ziegleris, Ryanas Lowe’as, Chelsea Vossas, Alecas Radfordas, Dario Amodei ir Paulas Christiano. “Mokymasis apibendrinti iš žmonių atsiliepimų.” arXiv, 2022 m. vasario 15 d.

http://arxiv.org/abs/2009.01325

Gargas, Šivamas, Dimitris Tsipras, Percy Liangas ir Gregory Valiantas. “Ko “Transformeriai” gali išmokti kontekste? Paprastų funkcijų klasių atvejo analizė.” arXiv, 2023 m. rugpjūčio 11 d.

http://arxiv.org/abs/2208.01066

Jis, Junxian, Chunting Zhou, Xuezhe Ma, Taylor Berg-Kirkpatrick ir Graham Neubig. “Vieningo parametrų efektyvaus perdavimo mokymosi požiūrio link.” arXiv, 2022 m. vasario 2 d.

http://arxiv.org/abs/2110.04366

Zhang, Susan, Stephen Roller, Naman Goyal, Mikel Artetxe, Moya Chen, Shuohui Chen, Christopher Dewan ir kt. “OPT: Open Pre-Trained Transformer Language Models.” arXiv, 2022.

https://doi.org/10.48550/ARXIV.2205.01068

Clark, Kevin, Minh-Thang Luong, Quoc V. Le ir Christopher D. Manning. “ELECTRA: išankstiniai mokymai teksto koduotojai kaip diskriminaciniai, o ne generatoriai.” arXiv, 2020.

https://doi.org/10.48550/ARXIV.2003.10555

Liu, Yinhan, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer ir Veselin Stoyanov. “RoBERTa: tvirtai optimizuotas BERT išankstinio mokymo metodas.” arXiv, 2019 m. liepos 26 d.

http://arxiv.org/abs/1907.11692

Radfordas, Alecas ir Karthikas Narasimhanas. “Kalbos supratimo gerinimas generatyviniu išankstiniu mokymu”, 2018 m.

https://www.semanticscholar.org/paper/Improving-Language-Understanding-by-Generative-Radford-Narasimhan/cd18800a0fe0b668a1cc19f2ec95b5003d0a5035

Petersas, Matthew E., Markas Neumannas, Mohitas Iyyeris, Mattas Gardneris, Christopheris Clarkas, Kentonas Lee ir Luke’as Zettlemoyeris. “Gilios kontekstualizuotos žodžių reprezentacijos.” arXiv, 2018.

https://doi.org/10.48550/ARXIV.1802.05365

Manning, Christopher D. “Žmogaus kalbos supratimas ir samprotavimas”. Daedalus 151, nr. 2 (2022 m. Gegužės 1 d.): 127–38.

https://doi.org/10.1162/daed_a_01905

Thank you for signing up to our newsletter!

Thank you! RSVP received for Li, Yujia, David Choi, Junyoung Chung, Nate Kushman, Julian Schrittwieser, Rémi Leblond, Tom Eccles ir kt. “Konkurso lygio kodo generavimas naudojant AlphaCode”. Mokslas 378, nr. 6624 (2022 m. gruodžio 9 d.): 1092–97.

Thank you for applying! We will be in touch.

Apply for: Li, Yujia, David Choi, Junyoung Chung, Nate Kushman, Julian Schrittwieser, Rémi Leblond, Tom Eccles ir kt. “Konkurso lygio kodo generavimas naudojant AlphaCode”. Mokslas 378, nr. 6624 (2022 m. gruodžio 9 d.): 1092–97.

Li, Yujia, David Choi, Junyoung Chung, Nate Kushman, Julian Schrittwieser, Rémi Leblond, Tom Eccles ir kt. “Konkurso lygio kodo generavimas naudojant AlphaCode”. Mokslas 378, nr. 6624 (2022 m. gruodžio 9 d.): 1092–97.

Pakraunama...

Pakraunama…