崗位職責:
1. 參與研發企業級AI中臺系統,開發高性能RAG系統和大語言模型相關調優,推動核心場景的解決方案落地;
2. 構建面向多行業的智能決策系統,研發企業級供應鏈AI Agent體系,調優多智能體協同的調度系統,并將其融入到標準產品;
3. 建設自動化模型部署,實現算力監控、多模態模型推理框架整合調度系統的構建;
4. 推進大模型輕量化技術在邊緣端應用,熟悉模型蒸餾壓縮、邊緣設備適配及推理性能優化;
5. 參與業務系統集成方案設計,完成第三方系統對接、異構數據融合及全鏈路調優。
崗位要求:
1、碩士及以上學歷,計算機科學、數學或相關專業,3年以上相關工作經驗。
2、熟練掌握Python、C++等編程語言和PyTorch、TensorFlow、Mindspore等深度學習框架。
3、精通Transformer/BERT/GPT/MoE等大模型網絡架構,掌握LoRA/Adapter/SFT等微調技術,掌握PyTorch/TensorFlow框架。
4、具備模型蒸餾/ONNX轉換/量化壓縮實戰經驗,熟悉TensorRT/vLLM等開源推理引擎或優化技術。
5、熟悉模型推理部署相關封裝技術,如Docker容器化部署及CI/CD流水線設計。
6、積極擁抱開源,有良好的自我學習能力,及自驅力。細致,耐心。具備良好的問題解決能力和團隊合作精神。
7、熟悉Ascend相關技術棧者優先。