大模型應用開發工程師
【工作職責】
1、基于常見開、閉源大模型,構建垂域生成式大模型能力,包括但不限于模型設計、prompt優化、預訓練、微調、RAG、Agent研發、模型加速等,解決訓練和離線推理過程中的技術和性能問題。
2、跟進解決相關業務問題,將大模型應用于政務領域,實現知識問答、數據分析、關聯推理、智能計算,確保項目按時、高質量交付。
3、跟蹤調研大模型的前沿技術,深入探索大模型的市民卡、工會、旅游等垂域應用場景,推動技術創新。
4、應用場景創新: 分析并識別新的應用場景,設計并實施模型優化策略,確保模型能夠有效解決復雜問題。
5、智能體開發與優化: 參與智能體項目的設計、開發與迭代,提升智能體的交互體驗、理解能力和自主決策能力。
6、技術研究與分享: 跟蹤最新的大模型技術動態,進行內部技術分享,提升團隊整體技術水平。
【任職要求】
1、本科及以上學歷,AI、計算機相關專業畢業,或有大語言模型應用落地經驗,具備良好的算法實現能力。
2、熟悉Java、C++或Python編程開發語言,熟悉分布式應用架構和主流中間件技術等,熟悉性能分析和優化等。
3、熟悉基礎的機器學習理論及常見的預訓練模型;熟悉常見的向量模型、大語言模型及相關技術。
4、掌握預訓練、微調、提示語工程、RAG技術、Agent等技術原理,具備相關流程開展經驗。
5、具備私有化模型部署能力,熟練掌握LangChain、DeepSpeek等開發框架。
6、具備良好的溝通和團隊協作能力,積極主動學習能力&技術深入探索能力。
工作時間:早九晚五,雙休,節假日正常放假