摘要: 3月11日消息,網易有道在公眾號推文宣布,已完成翻譯底層技術迭代,基于自主研發的子曰翻譯大模型2.0,翻譯質量在與國內外通用大模型的對比測試中展
3月11日消息,網易有道在公眾號推文宣布,已完成翻譯底層技術迭代,基于自主研發的子曰翻譯大模型2.0,翻譯質量在與國內外通用大模型的對比測試中展現了不錯的成績。
此次的突破,也標志著網易有道子曰大模型在專業領域取得實質性進展,通過數據、算法等技術創新,使得小參數垂類模型實現性能大幅提升。
據了解,搭載全新大模型的翻譯已在有道詞典、有道翻譯及有道翻譯官內上線,提供標準模型、高級模型兩種不同參數選擇,用戶可免費使用全新的AI翻譯功能。
同時,有道詞典筆X7系列也已升級為最新的翻譯大模型,其余型號將陸續更新。
據官方介紹,經歷了10個月的技術更迭,子曰翻譯大模型2.0從數據、算法、評估三個層面進行技術突破,最終以14B小參數垂類模型實現高水準的翻譯性能。

這也體現出有道在教育大模型發展上的垂直專業能力,驗證了“場景+數據”的護城河。
其中:
在數據層面,有道收集并嚴格清洗了高質量的翻譯語料數據,由英語專八認證人員及職業譯員進行精細化人工標注,使得模型擁有優質數據資源庫,增強其在多樣化翻譯場景的應對能力。
在算法層面,有道以子曰大模型為基礎,進行二次預訓練,進一步優化更具專業性與針對性的翻譯基座大模型,結合大模型蒸餾技術、大模型融合技術、Online DPO技術等多項手段,有效避免了大模型的災難性遺忘問題,并在運行效率、準確性、流暢性等翻譯性能上進行大幅提升。
在評估層面,借助翻譯數據沉淀,有道自主研發了翻譯評估模型Reward Model,為子曰翻譯大模型的性能評估提供可靠的量化依據及完善的人工評估方案,多維度對模型的翻譯結果進行評估和分析。
“通用大模型比的是參數大、算力強,但翻譯這件事,參數堆不出專業度;當通用大模型競逐參數規模時,我們還是更相信垂類模型的未來價值——用專業的垂直應用真正解決專業場景的痛點,這也正是我們持續努力和進化的方向。”網易有道相關負責人表示。





















