崗位職責:
1.跟蹤主流開源大模型(如 GPT 、 LLaMA 、 DeepSeek 、 Qwen 等)技術演進,結合業務場景進行模型預訓練、微調與定制化開發;2.負責大模型在對話系統、代碼生成、知識問答、智能寫作等方向的應用落地;
3.與產品、工程、行業專家緊密協作,實現語言模型在實際業務中的高性能部署與持續優化;
任職要求:
1.本科及以上學歷,計算機、人工智能、數學等相關專業;
2.深入理解 Transformer 、 Attention 機制、預訓練﹣微調范式、指令微調、 RLHF 等語言模型核心技術;
3.有大模型訓練經驗,熟悉分布式訓練框架(如 Deepspeed 、 FSDP 、 Megatron );
4.至少有1個成功的大模型應用落地項目經驗,具備完整的工程與評估閉環;
5.熟悉中文語料構建與清洗,具備 Prompt 工程、 RAG 、長上下文建模等實踐經驗者優先;
6.具備優秀的技術文檔編寫能力與團隊溝通協作能力。
注:可購買深圳或成都的社保,但具體工作地點base潮州/德陽/南充。