崗位職責:
1.制定測試方案:根據智能體功能需求和架構設計,編寫測試用例并搭建測試環境,覆蓋系統功能、性能及多場景交互驗證。
2.對智能體的算法、模型性能(如意圖識別、任務規劃、多智能體協同等)進行自動化測試及評估。
3.開展可靠性測試(如穩定性、壓力測試)及邊界場景驗證,識別潛在缺陷并輸出分析報告。
4.自動化工具應用:開發并維護自動化測試腳本/代碼,提升測試效率;研究新技術框架(如深度學習工具鏈),優化測試流程。
5.模型與數據支持:參與數據收集與清洗,輔助模型訓練;評估算法效果,提出改進建議。
6.參與需求評審,推動開發團隊修復問題;協助產品經理優化智能體交互邏輯。崗位要求:
1.Agent測試或算法測試經驗
2.熟悉大模型能力各項能力 例如指令跟隨等
3.熟練智能體評估指標 BLEu和rouge等
4.針對RAG等精確率 準確率等測試方式 方法等
5.提示詞工程,在工作過程中可以熟練針對智能體搭建Prompt進行修改
6.對各項GPU等有了解
7.對智能體可進行調優