崗位職責:
大模型研發(fā)與優(yōu)化:
1、負責大模型(如Deepseek、Qwen、Llama等)的訓練、微調、蒸餾、優(yōu)化與調參工作,確保模型在業(yè)務場景中的高性能和可擴展性。
2、持續(xù)跟蹤學術界和工業(yè)界的大模型前沿技術,結合公司業(yè)務需求,引入先進算法并進行創(chuàng)新性改進。
場景落地與定制化開發(fā):
1、針對客戶的具體業(yè)務場景,進行大模型的定制化開發(fā)和場景落地,確保模型能夠有效解決客戶的痛點問題。
2、設計并開發(fā)基于大模型的智能化解決方案,提升客戶業(yè)務效率。
系統(tǒng)集成與部署:
1、負責大模型與現(xiàn)有業(yè)務系統(tǒng)的集成與部署,確保模型能夠無縫嵌入到客戶的生產(chǎn)環(huán)境中。
2、優(yōu)化模型推理性能,確保模型在高并發(fā)、大規(guī)模數(shù)據(jù)場景下的高效運行。
數(shù)據(jù)處理與特征工程:
1、處理大規(guī)模、多源異構數(shù)據(jù),進行數(shù)據(jù)清洗、特征提取和特征工程,提升模型的預測能力。
2、設計并實現(xiàn)高效的數(shù)據(jù)處理流程,確保數(shù)據(jù)質量和可用性。
團隊協(xié)作與技術指導:
1、與產(chǎn)品經(jīng)理、AI應用工程師、算法工程師、開發(fā)工程師等跨部門協(xié)作,確保項目按期交付。
2、指導其他工程師,分享技術經(jīng)驗,提升團隊整體技術水平。
文檔撰寫與知識沉淀:
1、撰寫技術文檔和開發(fā)手冊,確保項目的可維護性和可擴展性。
2、定期進行技術分享,總結經(jīng)驗教訓,推動團隊技術能力的持續(xù)提升。
任職要求:
1、教育背景:計算機科學、人工智能、機器學習、數(shù)據(jù)科學等相關領域的碩士或博士學歷,具備扎實的理論基礎。
2、技術經(jīng)驗:5年以上大模型或深度學習相關研發(fā)經(jīng)驗,具備豐富的模型訓練、優(yōu)化和調參經(jīng)驗。
3、熟悉主流的大模型架構(如Deepseek、Qwen、BERT、Transformer等),具備實際項目落地經(jīng)驗。
4、熟練使用深度學習框架(如PyTorch、TensorFlow等),具備大規(guī)模分布式訓練經(jīng)驗者為佳。
5、數(shù)據(jù)處理能力:具備大規(guī)模數(shù)據(jù)處理經(jīng)驗,熟悉數(shù)據(jù)清洗、特征工程、數(shù)據(jù)擴增等技術。熟悉主流數(shù)據(jù)庫和大數(shù)據(jù)處理工具(如Hadoop、Spark等)者為佳。
6、編程能力:精通Python,熟悉C++、Java等編程語言,具備良好的代碼編寫和調試能力。
7、具備大型軟件項目開發(fā)經(jīng)驗,熟悉軟件開發(fā)流程和工具(如Git、CI/CD等)。
8、業(yè)務理解:具備較強的業(yè)務理解能力,能夠快速理解央企的業(yè)務需求,并將其轉化為技術解決方案。
9、有采購領域相關項目背景者為佳。
10、軟技能:具備良好的溝通能力和團隊協(xié)作精神,能夠與不同背景的團隊成員有效合作。具備較強的學習能力和創(chuàng)新意識,能夠快速掌握新技術并將其應用到實際項目中。