工作職責:
1.參與大規模預訓練語言模型的研發工作, 包括模型設計、數據集構建、超參數優化等;
2.研究和實現機器學習等相關技術,不斷提升大模型Agent應用的性能和用戶體驗;
3.追蹤學術界和工業界大模型最近的研究和應用, 在大模型預訓練、有監督微調、增強學習等方向的算法、數據、評測等維度進行持續的創新和優化;
4.參與算法和技術方案設計以及專利編寫。
任職要求:
1.相關專業碩士以上學歷, 如人工智能、數學、計算機、軟件工程等;
2.熟練使用Python進行代碼開發,熟悉LLM全流程的工作原理;
3.熟悉常用LLM,如ChatGPT,Claude,DeepSeek,Qwen等,熟悉LLM本地化部署,包括英偉達、華為芯片等部署環境;
4.熟悉AIGC的前沿應用,有Agent、MCP等相關開發經驗,了解目前LLM領域的前沿趨勢;
5.對大語言模型有著強烈的熱愛和興趣,并看好這個方向的發展。