機器學習算法工程師
關鍵詞
機器學習、深度學習、Python、Spark、Scala
崗位職責:
1、根據業務需求,設計并實現高效的數據挖掘與機器學習模型,包括但不限于風控、推薦、用戶行為分析等領域;
2、使用SQL進行特征開發,為機器學習算法模型提供高質量的特征輸入;
3、基于Spark和Scala技術棧在大規模數據集上進行模型訓練和優化,應用類似XGBoost、LightGBM等算法;
4、對用戶行為數據進行深入分析,通過Spark框架支持數據分析和決策制定,同時監控模型表現并持續優化;
5、參與整個模型生命周期的管理,從特征工程到模型部署,確保模型的準確性和穩定性。
崗位要求:
1、計算機科學、統計學、數學等相關專業本科及以上學歷,具有3年以上相關領域工作經驗;
2、精通數據挖掘和機器學習等算法,對深度學習有一定的了解以及應用,例如LR(邏輯回歸)、SVM(支持向量機)、XGBOOST、ANN(人工神經網絡)、RNN(循環神經網絡)、CNN(卷積神經網絡);
3、精通SQL用于特征開發,具備高效的數據處理和特征工程能力;熟練使用Spark和Scala進行大規模數據處理和模型開發;熟悉Hadoop、Hive、HBase等大數據生態圈工具,有實際項目經驗者優先;
4、具備Python編程能力,能夠在必要時使用Python進行算法研究或快速原型開發;
5、對數據敏感,熟悉數據分析流程,具備解決復雜業務問題的能力;
6、良好的溝通能力和團隊合作精神,能夠積極主動地發現問題并提出解決方案;
7、有撰寫科技專利或軟件著作權材料的經驗者更佳。
1是有傳統機器學習的應用能力,2是有大規模數據加工、處理經驗。目前主要是用xgboost、lightgbm這種經典算法,用SQL處理數據。有這2個能力即可,其他都是加分項