崗位職責(zé):
1. 研究強化學(xué)習(xí)以及類強化學(xué)習(xí)技術(shù),構(gòu)造偏好數(shù)據(jù)、訓(xùn)練大模型、設(shè)計新架構(gòu)。
2. 數(shù)據(jù)構(gòu)造及標(biāo)注管理
3. 完成大模型強化學(xué)習(xí)領(lǐng)域科技成果,包括但不限于論文和專利。
任職資格:
1. 人工智能、計算機、電子工程、自動化、數(shù)學(xué)、物理等相關(guān)專業(yè)畢業(yè),獲得碩士和博士學(xué)歷,以及優(yōu)秀本科畢業(yè)生。
2. 對以下方向中的至少其中一個有研究或項目經(jīng)驗:大模型、自然語言處理、深度學(xué)習(xí)、強化學(xué)習(xí)。熟悉分布式訓(xùn)練框架,如Megatron-LM和DeepSpeed,并具備多機多卡大模型訓(xùn)練經(jīng)驗者優(yōu)先考慮。
3. 優(yōu)秀的編程能力,ACM/ICPC、IOI等編程競賽獲獎?wù)邇?yōu)先。
4. 具有良好的英語讀寫能力,可以完成英文論文寫作。
5. 有高質(zhì)量論文發(fā)表者優(yōu)先 (如NIPS, ICLR, ACL, CVPR, ICCV, ECCV等),有較強學(xué)術(shù)比賽經(jīng)驗者,有在開源社區(qū)有較大影響力者優(yōu)先。
6. 理論基礎(chǔ)扎實,有創(chuàng)新精神和深入思考能力。