2011年,百度正式推出百度翻譯,入主在線翻譯。從2011年6月百度翻譯上線以來,憑借“翻譯質(zhì)量、產(chǎn)品功能、使用體驗”等方面的優(yōu)勢,備受用戶認可,在翻譯領(lǐng)域后來居上。最新數(shù)據(jù)顯示,百度每天還響應著300余萬來自網(wǎng)頁搜索的翻譯請求和600余萬的詞典翻譯請求。此外,百度翻譯還在2011年底新上線了中日翻譯,翻譯的語言種類逐步擴充。
不斷提升翻譯質(zhì)量 用效果贏取用戶
對于翻譯產(chǎn)品來說,翻譯的準確性與否是最重要的。百度翻譯在卓越的機器翻譯技術(shù)、領(lǐng)先的語料挖掘和過濾技術(shù)、強大的海量計算技術(shù)、可靠的web前端技術(shù)四大領(lǐng)先技術(shù)的支撐下,取得了“后發(fā)先至”的效果。以語料發(fā)掘和過濾技術(shù)為例,百度翻譯全新的互聯(lián)網(wǎng)雙語語料挖掘技術(shù)方案,使得1000萬句對被有效過濾為更加精準的400萬,從而幫助翻譯質(zhì)量得到明顯提升。
此前曾有一個試驗評測,通過選擇一個反應用戶需求的測試集,首先人工翻譯這個測試集的每個句子,得到多個人工翻譯結(jié)果,然后機器翻譯結(jié)果和人工翻譯結(jié)果比較,得分越高(BLEU值,0至1之間),翻譯質(zhì)量越好。在這方面,百度翻譯全面領(lǐng)先競爭對手,尤其在口語翻譯方面,優(yōu)勢更為明顯。
和試驗測評一樣,在實例翻譯中百度翻譯也有著更加精準的翻譯效果,尤其是在有明顯中國特色的成語、俗語、網(wǎng)絡流行語等方面。以“好好學習天天向上、有木有、我勒個去、神馬都是浮云”等為例,百度翻譯的翻譯結(jié)果分別是“Study hard and make progress every day、Yes or no、What the hell、Everything is nothing”,翻譯內(nèi)容可靠。
不僅如此,百度翻譯還在細節(jié)方面不斷優(yōu)化和提升,“投訴功能”讓每一個意見和建議都能得到及時回復;“雙語對照查看”,更加符合本土用戶的閱讀習慣;“分享收藏”則順應了社交時代的發(fā)展趨勢。
領(lǐng)先的研發(fā)團隊 兼具國際視野與本土執(zhí)行
在百度翻譯領(lǐng)先的產(chǎn)品質(zhì)量和翻譯效果的背后,是一支兼具國際視野與本土執(zhí)行的高戰(zhàn)斗力研發(fā)團隊。
據(jù)了解,百度翻譯研發(fā)團隊組建于2010年初,從最初的3名正式員工加上一個實習生的“編制”,不斷發(fā)展壯大成為了由世界級機器翻譯專家王海峰博士和吳華博士領(lǐng)銜,同時擁有眾多在機器翻譯、語料發(fā)掘、海量計算、Web前端技術(shù)等領(lǐng)域掌握核心技術(shù)、有著多年實戰(zhàn)經(jīng)驗的“精英團隊”。
以王海峰博士為例,作為百度基礎(chǔ)技術(shù)首席科學家,王海峰博士多年以來一直致力于搜索、自然語言處理、機器翻譯、語音技術(shù)、機器學習與數(shù)據(jù)挖掘、推薦及個性化等領(lǐng)域的研發(fā),其研究成果大量應用于眾多廣泛使用的產(chǎn)品中,也發(fā)表過大量一流國際期刊論文及頂級國際會議論文,并申請了中國、美國及日本等多個國家專利20余項。而且王海峰博士還是頂級國際學術(shù)組織ACL(The Association for Computational Linguistics)50年歷史上唯一當選副主席的華人。
頂級的領(lǐng)軍人物和強悍骨干成員,讓百度翻譯團隊不僅具備國際化的視野格局,同時還擁有本地化的執(zhí)行能力,這些保證了百度翻譯在不借助于任何外力和資金的情況下,完全依靠自主研發(fā)和自有技術(shù),在短短一年的時間內(nèi),就推出了有著優(yōu)異表現(xiàn)的高質(zhì)量翻譯產(chǎn)品。 |