1、按項目標準完成語音/文本數據標注、評測,通過全流程操作保障數據高效產出與質量達標;
2、自然對話音頻剪輯轉寫文本校對、拼音標注、模型評測、發音效果評測(語音準確性、停頓、擬人、情感等)、產品巡檢問題反饋、具有一定音色審美能力
3、及時溝通工作異常案例并跟進解決,主動發現流程痛點。
4、負責大模型相關語料和數據的撰寫與評估等工作,支持項目經理和產研團隊定義數據評測和標注環節的理想態;
5、承接業務與項目經理要求,結合PE工程、平臺工具等方式提升數據交付的質量和效率,并沉淀方法文檔;
6、深刻理解數據交付的需求,負責數據質量把控,梳理并分析數據質量的問題,并對市場上相關數據進行行業調研并輸出分析報告;
7、運用基本的數據分析方法和工具,對訓練數據進行統計和分析,提供有效的數據結論、數據支持和優化建議。
1、統科及以上學歷、語音學、漢語言相關專業、計算語言學、英語好;
2、參加過PromptEngineering或半自動標注生產的項目,掌握PE能力優先;3、有1年以上大語音模型任務評測或標注的經驗,有語義學、語用學、語音或者音系研究經驗者優先;
3、有TTS正則化、拼音標注、AI播客等任意經驗,TTS優質產品經驗優先,了解語音算法及模型訓練原理優先;
4、邏輯思維強,學習理解能力強,善于發現問題并反饋,對語音數據有敏銳感知和判別能力;
5、了解韓語基本拼音聲韻、因素、韻律等語言知識,并能在工作中進行相應的運用;
6、抗壓力好,靈活性高,能快速數量掌握各類標準判別標準,善于總結工作經驗,具有團隊意識。