1、負責基于開源大模型的應用開發與優化,包括模型微調、性能優化以及在特定任務中的應用;
2、負責大模型在垂域和特定場景下的繼續訓練,包括研發繼續預訓練、全量/高效微調和強化學習算法;
3、負責落地大模型工業級應用算法,包括但不限于智能問答、RAG和Agent等;;
4、利用 Prompt 工程技術優化模型的輸出和交互效果,設計高效的 Prompt 模板以提升模型的任務執行能力.
任職要求:
1.計算機科學、人工智能、數學等相關專業本科及以上學歷,具備深厚的機器學習和深度學習理論基礎;學習態度、上進心強的畢業生可適當放寬。
2、熟練掌握NLP和ML基礎理論與算法,熟練掌握Transformer模型架構和原理;
3、熟悉大模型預訓練和微調框架,掌握Prompt Tuning、P-Tuning、LoRA中至少一種高效微調技術;
4、熟悉模型壓縮算法,包括但不限于模型蒸餾、量化、剪枝等技術;
5、極強的學習能力,能夠快速理解垂直領域的業務邏輯。