崗位職責
1.主導代碼大模型的架構設計與研發工作,參與模型核心算法的迭代優化?;
2.深度參與大模型原理研究,制定針對性的微調策略,重點提升模型在代碼生成、邏輯推理、多語言支持等任務中的效果?;
3.負責模型訓練全流程管控,包括數據去重、預處理、訓練參數調優及算子優化等關鍵環節?;
4.推動研發成果在實際項目中的落地應用,跟進技術驗證與問題修復,確保模型性能達標。
任職要求
1.211/985 院校研究生及以上學歷(在讀、應屆或畢業五年內均可)計算機科學、人工智能、軟件工程等相關專業優先?;
2.具備代碼生成大模型或其他大模型微調相關項目經驗,熟悉模型訓練全流程(數據處理 - 模型調優 - 效果驗證)?;
3.?精通 Python/C++ 編程語言,能獨立完成算法代碼實現與工程化落地?
熟悉 CUDA、TVM 或 OpenCL 等加速框架,了解 GPU 并行計算原理?;擁有扎實的算法推導能力與工程實踐經驗,能解決模型訓練中的復雜技術問題?;
4.協作能力:具備優秀的遠程協作意識與獨立推進能力,能在無現場監督的情況下高效完成工作任務。
亮點
1.彈性工作時間,無需坐班,平衡工作與個人安排,遠程線上協作,通過視頻會議、即時通訊工具同步項目進展?;
2.清晰的任務目標與合理的交付周期,避免無效加班;
3.項目結束后可獲得項目參與證明,優秀貢獻者有機會建立長期合作關系。