
谷歌今天在一篇博客文章中宣布,它正在改變其搜索應(yīng)用程序顯示結(jié)果的方式。去年,該公司推出了BERT模型的雙向編碼器表示。后者通過(guò)觀察單詞前后的單詞來(lái)找出單詞的意思。這有助于谷歌搜索找出問(wèn)題的真正含義。與其在句子中查看關(guān)鍵字并根據(jù)這些詞提供搜索結(jié)果,BERT還不如查看句子中這些詞的順序,以便更好地理解它們的意思。
谷歌說(shuō),他們?cè)诿绹?guó)使用的是最新的軟件和硬件。在美國(guó),每十個(gè)谷歌搜索請(qǐng)求中就有一個(gè)會(huì)因?yàn)锽ERT算法的存在而被更好地理解。該公司表示,隨著時(shí)間的推移,它將在更多的國(guó)家和更多的語(yǔ)言中使用BERT。這款應(yīng)用程序可以更好地理解那些更長(zhǎng)、更口語(yǔ)化的查詢,以及“for”和“to”這兩個(gè)詞對(duì)問(wèn)題意義有很大影響的查詢。
“不管你在尋找什么,或者你說(shuō)什么語(yǔ)言,我們希望你能夠放棄一些關(guān)鍵詞式的用詞,以一種你覺(jué)得自然的方式搜索。但是你還是會(huì)時(shí)不時(shí)地遇到谷歌。即使和伯特在一起,我們也不總是對(duì)的。如果你搜索“內(nèi)布拉斯加州以南是哪個(gè)州”,伯特的最佳猜測(cè)是一個(gè)叫做“南內(nèi)布拉斯加州”的社區(qū)。(如果你覺(jué)得它不在堪薩斯州,那你是對(duì)的。)語(yǔ)言理解仍然是一個(gè)持續(xù)的挑戰(zhàn),它使我們有動(dòng)力繼續(xù)改進(jìn)搜索。我們總是做得更好,并努力在你發(fā)送給我們的每一個(gè)查詢中找到意義以及最有幫助的信息。”
這是一個(gè)例子。有人在谷歌上搜索“2019年巴西赴美游客需要簽證”。谷歌承認(rèn),以前它使用的算法會(huì)返回美國(guó)公民前往巴西的結(jié)果。但與BERT一起,Search查看了“to”這個(gè)詞的用法,以幫助理解這是一個(gè)關(guān)于巴西人去美國(guó)旅行的問(wèn)題

在谷歌給出的另一個(gè)例子中,“審美師在工作中站得多嗎?”這產(chǎn)生的結(jié)果對(duì)個(gè)人的查詢沒(méi)有用處。但是有了BERT, Search就可以找出單詞“stand”的上下文,并意識(shí)到它與工作的物理需求有關(guān)。

最后一個(gè)例子是“你能幫藥房的人買到藥嗎?”谷歌再次承認(rèn),在過(guò)去,它完全錯(cuò)過(guò)了這個(gè)問(wèn)題的真正意義,并將提供一個(gè)關(guān)于填寫處方的一般反應(yīng)。感謝BERT,谷歌搜索理解了問(wèn)題的“for someone”部分,這意味著問(wèn)這個(gè)問(wèn)題的人想知道如何為他們?nèi)e人的處方。
