崗位職責
1.視頻智能檢測與分析
●負責計算機視覺相關算法的研發和優化,包括但不限于目標檢測、圖像分割、圖像分類等方向。
●參與基于深度學習的目標檢測模型(如YOLO系列)的開發、訓練、調優及部署。
●研發視頻理解模型,實現行為識別、異常事件檢測、場景語義理解、視頻摘要生成等任務。
2生成式AI開發與內容生成
●研發多模態生成式模型(文本/圖像/視頻生成),優化生成內容的多樣性、可控性與合規性。
●開發基于大模型的AIGC工具鏈,支持營銷素材、教育課件、影視腳本等內容的自動化生成。
3.AI生成結構化報表系統
●構建基于大模型的自動化報表生成系統,支持從多源數據(數據庫、日志、圖表)到結構化報告(文本+可視化圖表)的端到端生成。
●開發動態交互式報表系統,支持用戶自然語言查詢與報告內容實時更新。
4.智能體(Agent)系統開發
●構建基于大模型的自主智能體(如AutoGPT、MetaGPT),支持多工具調用(API、數據庫)、任務規劃與環境交互。
●設計智能體協作框架,實現多智能體間的競爭、協同與長期目標推理。
技術能力要求
深入掌握以下至少兩個方向技術:
1. 目標檢測與視頻動作分析
●精通Python,熟悉PyTorch/TensorFlow框架;開發優化YOLO系列模型,實現高精度實時目標檢測、工程服務的部署。
●開發行為識別模型(如TimeSformer、Video Swin Transformer),提升異常事件檢測精度。
2. 大模型知識庫與智能體
●掌握HuggingFace、LangChain、xinference等。構建基于GPT/LLaMA的知識庫問答系統,支持醫療健康領域智能咨詢。
●開發AutoGPT/MetaGPT智能體,實現多工具調用與任務規劃,應用于自動化數據處理。
3. 生成式AI
● 研發多模態生成模型(如Stable Diffusion、Sora),優化文本、圖像、視頻生成內容的多樣性與可控性。
● 掌握LoRA、P-Tuning等微調技術,提升生成模型在垂直領域(如醫療、教育)的表現。
加分項
●在生成式AI(ICLR、NeurIPS)、視頻理解(CVPR、ICCV)、智能體(AAMAS)等頂會發表論文或開源項目貢獻。
●有垂直領域(金融、醫療、工業)自動化報表生成系統落地經驗。
●熟悉多模態Agent框架(AutoGen、Microsoft Guidance)、或視頻生成技術(Runway ML、Pika)。
●掌握知識庫構建、Agent開發等技術,并有智能客服、智能營銷、運營等方面落地經驗。