本質(zhì)上,谷歌聲稱其可通過更好地理解句子中單詞之間的關(guān)系來提高搜索結(jié)果。谷歌研究員兼搜索業(yè)務(wù)副總裁潘杜·納亞克(Pandu Nayak)表示,老版谷歌搜索算法將句子分解成“一連串的單詞”,并分析重要單詞的意思,從而給出簡單的本地搜索結(jié)果。而新的算法能夠理解上下文語境,進而給出更精確準確的結(jié)果。
谷歌調(diào)整后的搜索算法基于語言表達模型BERT,即“Bidirectional Encoder Representations from Transformers”的縮寫,它將句子作為整體來看待,更注重句子的整體意義。谷歌高級研究員兼研究高級副總裁杰夫·迪恩(Jeff Dean)表示,隨著時間的推移,這種培訓在讓NLP模型“理解”上下文方面變得非常有效。
谷歌表示,它在過去幾天始終在推動算法改進,這應(yīng)該會影響到美國約10%的英語搜索查詢結(jié)果,其他語種的改進將在稍后討論。
對搜索的所有改進都會經(jīng)過一系列測試,以確保它們確實改善了查詢結(jié)果。其中一項測試涉及使用谷歌的核心人類評審員,他們通過對搜索結(jié)果的質(zhì)量進行評級來培訓公司的算法。此外,谷歌還會進行實時A/B測試。
當然,并不是每個查詢都會受到BERT的影響,這只是谷歌用來對搜索結(jié)果進行排名的諸多不同工具中最新的一個。這些工具到底是如何兼容工作的,這仍然是個謎。谷歌有意將其中某些過程保秘,以防止垃圾郵件發(fā)送者對其系統(tǒng)進行欺騙。
除此之外,保密的另一個重要原因是:當計算機使用機器學習技術(shù)做出決定時,很難知道它做出這些選擇的原因。機器學習的所謂“黑匣子”是個棘手問題,因為如果結(jié)果在某種程度上是錯誤的,那么很難診斷原因。
谷歌表示,該公司已經(jīng)努力確保在搜索算法中加入BERT后不會增加偏差,這是機器學習中的一個常見問題,機器學習的訓練模型本身也是存在偏差的。由于BERT是在巨大英語句子語料庫上訓練的,這些句子本身也是有偏見的,所以這是個需要密切關(guān)注的問題。
該公司還表示,預(yù)計其新算法在引導流量方面不會出現(xiàn)重大變化,至少對于大型出版商而言是這樣。每當谷歌發(fā)出改變其搜索算法的信號時,整個網(wǎng)絡(luò)都會加以密切關(guān)注,畢竟谷歌搜索排名的變化有時候決定了公司的生死存亡。
每個依靠網(wǎng)絡(luò)流量賺錢的人絕對應(yīng)該注意到這一點。當談到其搜索結(jié)果的質(zhì)量時,納亞克說:“這是我們在過去五年中經(jīng)歷的最積極的變化,也可能是公司成立以來最大的變化之一。”
[責任編輯:linlin]
宿州市埇橋區(qū)面對面幫助企業(yè)解決實際困難 增強企業(yè)發(fā)展信心
安徽合肥電網(wǎng)最大負荷達864.1萬千瓦打破紀錄 全力確保整體電網(wǎng)
安徽宣城努力打造安徽美食文化特色“名片” 開展校企合作培養(yǎng)人
安徽蕭縣多舉措落實放心家政暖民心行動 推動目標任務(wù)落地落實
安徽全面完成今年全省夏種糧食播種 重點作物全面落實
安徽出臺9條措施大力支持高校畢業(yè)生筑夢江淮 引導加大人才招聘
前5個月安徽新材料產(chǎn)業(yè)規(guī)上產(chǎn)值同比增長14.1% 雙招雙引成果豐碩
5月份安徽新增人民幣各項貸款708.66億 信貸結(jié)構(gòu)不斷優(yōu)化
黑龍江出臺一系列助企紓困政策 加大承保折扣力度
黑龍江哈爾濱出臺多項政策“促進四大經(jīng)濟發(fā)展” 強化核心共性技
安徽六安今年繼續(xù)加大農(nóng)村公路建設(shè)力度 推行鄉(xiāng)村道路專管員制度
安徽銅陵設(shè)置共計103個社區(qū)臨時蔬菜供應(yīng)點 方便群眾就近買菜