1.
參與大語言模型在垂直領(lǐng)域的數(shù)據(jù)生產(chǎn)與優(yōu)化:負(fù)責(zé)通用主題問題的理解與邏輯拆解,明確任務(wù)目標(biāo)與關(guān)鍵信息;針對模型生成的初始回答,識(shí)別邏輯漏洞或語言不通順之處,進(jìn)行高質(zhì)量改寫,確保標(biāo)注數(shù)據(jù)的準(zhǔn)確性與實(shí)驗(yàn)有效性。
2.
從用戶視角理解并處理復(fù)雜開放式問題:具備良好的問題拆解與關(guān)鍵詞提取能力,邏輯清晰地補(bǔ)全思考鏈路;能夠自然流暢地組織信息,進(jìn)行事實(shí)、推理、觀點(diǎn)的區(qū)分與表達(dá);擅長識(shí)別模型輸出中的邏輯不一致與語義偏差;在歷史、科技、文化、社會(huì)等常見知識(shí)領(lǐng)域之一具備深入理解及信息整合能力。
3. 跨團(tuán)隊(duì)協(xié)作:與算法、產(chǎn)品等團(tuán)隊(duì)緊密配合,深入理解垂類方向用戶需求及模型特性,不斷迭代標(biāo)注標(biāo)準(zhǔn),提升數(shù)據(jù)質(zhì)量與準(zhǔn)確性。 4.
關(guān)注行業(yè)動(dòng)態(tài)與先進(jìn)實(shí)踐:持續(xù)關(guān)注大語言模型的發(fā)展趨勢,探索數(shù)據(jù)生產(chǎn)在模型能力提升中的作用,學(xué)習(xí)并應(yīng)用行業(yè)先進(jìn)的數(shù)據(jù)生產(chǎn)方法于標(biāo)注工作中。
對工作年限無強(qiáng)要求,如果面試人專業(yè)和學(xué)歷足夠優(yōu)秀(碩士,211
985代碼科班出身),精通python,僅有文本大模型、agent實(shí)習(xí)經(jīng)驗(yàn)的話,也可以推薦哈。