一、崗位職責:
負責垂直行業(yè)大模型的設(shè)計、訓練、調(diào)優(yōu)與部署;
研究并實現(xiàn)面向特定行業(yè)的預訓練和微調(diào)方法,提升模型在具體場景下的性能;
構(gòu)建高質(zhì)量的行業(yè)數(shù)據(jù)集,完成數(shù)據(jù)清洗、標注、增強等工作;
參與模型壓縮、蒸餾、量化、推理加速等優(yōu)化工作;
與部門經(jīng)理、業(yè)務(wù)團隊協(xié)作,推動AI模型在實際業(yè)務(wù)中的落地應(yīng)用;
跟蹤前沿研究,持續(xù)優(yōu)化模型效果,提升系統(tǒng)整體智能化水平。
二、任職要求:
教育背景:
計算機科學、人工智能、數(shù)學、電子工程等相關(guān)專業(yè);
技術(shù)能力:
精通Python編程語言,熟悉TensorFlow/PyTorch等深度學習框架;
熟悉Transformer架構(gòu)及各類預訓練模型(如BERT、GPT、LLaMA、ChatGLM等);
有大規(guī)模語言模型訓練、微調(diào)、評估經(jīng)驗,掌握LoRA、Adapter、Prompt Tuning等參數(shù)高效訓練方法;
熟悉分布式訓練技術(shù)(如DeepSpeed、Megatron-LM、Horovod等),具備多GPU/TPU集群使用經(jīng)驗;
具備良好的算法基礎(chǔ)和扎實的機器學習/深度學習理論功底;
熟悉常見的模型評估指標(BLEU、ROUGE、F1、AUC等)和調(diào)優(yōu)策略;
有數(shù)據(jù)處理、文本生成、對話系統(tǒng)、知識融合、意圖理解等相關(guān)項目經(jīng)驗者優(yōu)先。
工程能力:
熟悉Linux環(huán)境開發(fā),了解Docker、Kubernetes等容器化部署工具;
有將模型部署上線的實際經(jīng)驗,熟悉ONNX、Triton、TensorRT等推理引擎者優(yōu)先;
有良好的代碼規(guī)范和文檔習慣,具備一定的工程交付能力。
項目經(jīng)驗:
至少參與過2個以上完整的大模型訓練或調(diào)優(yōu)項目,有從0到1構(gòu)建模型的經(jīng)驗;
有垂直行業(yè)(如金融、醫(yī)療、教育、政務(wù)等)模型定制化訓練經(jīng)驗者優(yōu)先;
軟技能:
具備良好的溝通能力和團隊合作精神;
對AI技術(shù)有強烈興趣,關(guān)注行業(yè)動態(tài),有自我驅(qū)動力;
能夠獨立思考并解決復雜問題,具備較強的邏輯思維能力;
英文文獻閱讀能力強,能快速復現(xiàn)最新研究成果。
三、加分項:
有NLP、CV、語音識別或跨模態(tài)研究背景者優(yōu)先。
熟悉Agent、RAG、檢索增強生成、多模態(tài)模型等技術(shù);
有開源社區(qū)貢獻經(jīng)歷(如HuggingFace、GitHub等);
熟悉AutoML、超參調(diào)優(yōu)、模型監(jiān)控、A/B測試等全流程;