《 Google 》去與現在：我們持續改進搜尋的 5 種方式

2023年9月21日
讀畢需時 5 分鐘

搜尋永遠不是一個解決好的問題。讓我們來看看在建構和改進 Google 搜尋過程中，我們所取得的最大技術突破。

建立一個搜尋引擎需要付出許多努力。儘管看似簡單 —— 您輸入一個問題，然後我們找到相符的結果 —— 但我們已經應對了許多深度技術挑戰，使 Google 成為今天的樣貌。

事實上，搜尋從來都不是一個已解決的問題。舊有的挑戰不斷演變，新的挑戰也不斷浮現 —— 因為互聯網和世界總是在變化之中。

所以，讓我們回顧一下我們所取得的最大技術突破 —— 以及我們在建立和改進 Google 搜尋過程中，不斷挑戰創新極限的地方。

提供高質量的結果

重要的是，我們不僅根據您的查詢來排名訊息的相關性，還根據訊息的幫助性和可靠性來排名。這一洞察力是 Google 從一開始就脫穎而出的關鍵：我們的 PageRank 算法不僅僅考慮頁面上的文字是否匹配。它還根據網站之間的連接方式來判斷哪些頁面是重要或權威的線索。

多年來，隨著網絡的發展和技術的改進，我們已經調整了我們的技術。例如，隨著虛假訊息的增加，我們已經開發了方法來判斷某些話題是否更容易受到不可靠內容的影響，比如陰謀理論或醫學誤導訊息，並在這些時刻更加偏向權威性來進行排名。

每年我們進行數十萬次的質量評估，以確保我們達到高質量的標準。我們會定期對我們的系統進行廣泛的更新，稱為核心更新，以及更專門的更新，如我們有用內容的更新，以繼續提供有用的結果。

訊息質量存在著不斷演變和需要新方法的維度。例如，已知的一個挑戰是訊息空白，也稱為 "數據空隙"，即高質量的訊息可能並不可用。我們已經想出了一些方法，在主題迅速發展或我們對結果質量沒有高度信心時，顯示通知，提醒人們在使用這些結果時更加謹慎。我們還投資了其他訊息素養工具，幫助人們檢查來源並獲取背景訊息，以評估他們所找到的內容。

解讀意義

多年來，訊息理解一直是 Google 的關鍵重點領域，包括理解人們查詢背後的含義以及理解來自網路的文件。早期，我們的系統主要是建立在簡單的詞匹配基礎上的。但這就是拼寫等事物變得非常重要的地方。當時，如果您拼錯了單詞，您只會找到拼錯單詞的頁面！因此，我們在搜尋中建立了我們的第一個機器學習系統來應對這一挑戰。

多年來，我們的系統變得更加複雜，更好地理解同義詞和詞語的上下文。像知識圖譜（Knowledge Graph）這樣的突破性技術幫助我們理解世界上的人、地方和事物之間的關聯，更像人們的理解方式 —— 這樣我們就可以為您提供您所需要的精確訊息，甚至可以進一步提供幫助。例如，搜索最新熱門電影，可以獲得有關演員陣容、片長的訊息，以及您附近的影院和購票鏈接。

像 Google 研究團隊開發的 BERT 這樣的大型語言模型，已經幫助我們在解讀自然語言查詢和理解網絡文件方面取得了巨大的進展，因此我們可以在世界各地使用的多種語言中提供更相關的搜索結果。這些模型可以從一種語言中學到的教訓，應用到其他語言中，因此我們可以在 Search 提供的眾多語言中返回更好的結果。此外，我們還開發了像 Google 翻譯這樣的工具，以幫助人們消除語言障礙，讓他們能夠理解更多的世界訊息。

最新的生成式 AI 技術和大型語言模型可以幫助我們重新想像搜尋，解鎖新型問題類型，並改變我們組織訊息的方式。目前，我們正在通過 Search Labs 實驗將生成式 AI 應用到我們的搜索體驗中，並在探索可能性的過程中快速更新體驗。

理解圖像、影片等

世界上有很多不是文本的訊息，以及很多不是通過在搜索框中輸入文字來查詢的方式。

通過應用自然語言處理（NLP）的最新發展，我們在 2008 年推出了語音搜索的功能，使在移動設備上搜索變得更加自然。

2015 年，計算機視覺的進步使得使用 Lens 進行視覺搜索成為可能。我們將您的手機相機變成了一種探索和提問周圍世界的方式，這樣您就可以更多地了解您在社區散步時看到的花朵或昆蟲等事物。今天，每個月都有超過 120 億的視覺搜索使用 Lens。

去年，我們推出了多重搜索功能，將這些能力提升到了可以在視覺搜索中添加文本的程度。現在，您可以拍攝一張您喜歡的沙發的照片，添加 "椅子" 這個詞，Google 將使用圖像和詞語為您顯示相似的家居配件，以添加到您的客廳套裝中。

AI 的突破還使我們能夠理解影片的語義，自動識別關鍵時刻 —— 使您可以像閱讀書中的章節一樣導航這些時刻。無論您是在尋找家居翻新教程中的某一步，還是在精彩片段中尋找贏得比賽的一刻，您都可以找到您想要的。

辨識與制止垃圾訊息

任何曾經查看過電子郵件垃圾郵件文件夾的人都會欣賞到維護郵箱免受垃圾訊息干擾所付出的努力。在搜索方面，我們建立了先進的系統，以同樣的方式打擊垃圾訊息。如果沒有我們的高級保護措施，搜索結果將充斥著完全無關的訊息、釣魚攻擊和惡意軟件連結。

我們不斷開發新技術，並對我們的排名系統進行更新，以保護免受垃圾訊息的侵害。但垃圾訊息也在不斷適應和演變，需要我們團隊的持續關注。

近年來，我們應用了新的 AI 技術來進行垃圾訊息檢測，這有助於我們保持搜索結果超過 99% 無垃圾訊息。這仍然是我們的重要投資領域：只要人們使用 Google 尋找訊息，垃圾訊息制作者就會試圖繞過我們的保護措施，因此我們必須保持警惕，並走在前面。

使搜尋更安全

多年來，我們一直堅守著最大程度提供訊息訪問的原則，同時幫助人們保持安全並掌控自己的訊息。我們的目標是幫助人們找到在合法表達範圍內的訊息，同時不會不慎讓他們接觸到低質量或有害的內容，這些內容他們本來不希望看到。

為此，我們不僅擴展了我們的政策保護，以讓人們能夠刪除搜索結果中的敏感個人訊息，還通過考慮安全性和包容性來改進我們的排名系統。

例如，我們已經推出了改進措施，以減少不受歡迎的露骨內容在搜索中排名較高，並通過默認模糊露骨圖像以及改進排名來限制使用剝削性做法的網站的影響範圍。與此同時，我們已經更新了我們的政策，以便 18 歲以下的人可以刪除他們在搜索中的照片，並推出了新的工具，如 "有關您的搜索結果"，以輕鬆掌控個人訊息在搜索結果中的顯示方式。