工作職責:
1.負責云業務的穩定性,主導監控告警、故障診斷、巡檢、應急預案等能力的建設
2.有開發經驗,能開發自動化運維系統或工具,制定標準運維流程提升效率
3.制定和改善線上變更、告警處理、問題復盤等體系和流程,并推動落地
任職要求:
1.良好的計算機專業基礎,包括計算機體系結構、操作系統、網絡、存儲、虛擬化等
2.熟悉云基礎產品服務架構,對云計算、云網絡、存儲、云原生有豐富的實踐經驗
3.掌握一門或者多門開發語吉Shell/Python/Golanq
4.能夠獨立完成工作,具有較強的綜合分析問題及解決問題的能力
5.熟悉DPU智能網卡軟硬件架構/可編程交換芯片架構者優先
6.熟悉前端框架(Reactue/AngularJS)者優先
需要以下兩個方向背景的候選人:
1.具備云環境下運維能力,尤其是有偏底層硬件實際問穎定位和問穎修復經驗
2.具備自動化運維工具或平臺開發能力例如python/golang開發運維平臺或接口經驗