【崗位職責】
1.參與人工智能相關算法開發,包括大語言模型預訓練、全參數微調與高效參數微調訓練(如Lora、P-tuning等)、PPO/DPO等強化學習訓練;多模態大模型預訓練,深入理解多模態對齊融合機理,進行Qformer或mlp對齊實驗。
2.參與數據合成工作,包括SD圖像生成,深入理解擴散模型底層原理,有文生圖模型預訓練經驗。
3.負責進行前沿強化學習實驗,深入理解思維鏈、獎勵黑客等原理。
4.參與大模型訓練框架優化,熟練掌握Megatron,deepspeed等訓練框架,運用并調優數據并行、張量并行、流水線并行等多維度并行策略。
5. 參與大模型智能體開發、RAG開發優化、自然語言處理、計算機視覺等項目;
6.參與業務場景調研,進行具體算法優化及效果驗證;
7.參與模型推理部署,低精度量化等工作,與產品、后端配合,將算法封裝成服務,供用戶調用。
【任職要求】
1.擁有人工智能、大數據、數學、計算機科學與技術、軟件工程、電子信息等相關專業本科及以上學歷。擁有人工智能相關工作經驗5年及以上。
2.具備在大型科技公司或互聯網公司從業經驗,對算法有深刻理解,精通人工智能相關技術,包括但不限于機器學習,深度學習,自然語言處理、計算機視覺、大語言模型、多模態大模型、數字人等。
3.掌握Transformer基本原理,精通NLP、AIGC、語音識別等算法,熟悉知名開源大模型(如Llama、chatGLM、百川、Qwen等)設計流程優先。
4.具備大模型應用開發經驗,有RAG/NL2SQL/Agent等模塊開發與應用落地經驗。
5.精通大模型的分布式系統和多GPU優化。
6.熟練掌握python等編程語言,熟悉模型微調、推理部署、輕量化開發等流程,
7.熟練掌握Pytorch、Tensorflow等深度學習訓練框架,具有一定強化學習應用經驗。
8.具有較強的業務學習能力,能夠對復雜行業場景進行問題梳理,細化開發流程。
9.有較強的抗壓能力,能夠完成領導安排的其他工作。