作為一家以人工智慧為先的公司,我們經歷了七年的歷程,我們正處於一個令人興奮的轉捩點。我們有機會讓人工智慧對人、企業、社區和每個人更有説明。
一段時間以來,我們一直在應用人工智慧來使我們的產品從根本上更有説明。借助生成式 AI,我們正在邁出下一步。通過大膽而負責任的方法,我們正在重新構想所有核心產品,包括搜索。
我們產品中的人工智慧
Gmail 中的 “幫我寫”
有一些很好的例子說明生成式人工智慧如何幫助發展我們的產品,從 Gmail 開始。2017 年,我們推出了智能回復,只需按一下即可選擇簡短回復。接下來是智慧撰寫,它會在您鍵入時提供寫作建議。智慧撰寫帶來了由 AI 提供支援的更高級的書寫功能。僅在過去一年中,它們已在 Workspace 中使用了超過 180 億次。現在,有了更強大的生成模型,我們將在 Gmail 中邁出下一步,“幫我寫作”。
假設您收到一封電子郵件,告知您的航班已取消。航空公司已經發送了代金券,但您真正想要的是全額退款。你可以回復,並使用 “幫我寫”。
只需輸入您想要的內容的提示 - 一封要求全額退款的電子郵件 - 點擊創建,就會出現完整的草稿。它可以方便地從上一封電子郵件中提取航班詳細資訊。它看起來非常接近您想要發送的內容,但也許您想進一步完善它。在這種情況下,更詳細的電子郵件可能會增加獲得退款的機會。“幫我編寫” 將作為工作區更新的一部分開始推出。就像智慧撰寫一樣,隨著時間的推移,您會看到它變得更好。
地圖中路線的新沉浸式視圖
從街景早期開始,人工智慧已經將數十億張全景圖像拼接在一起,因此人們可以通過他們的設備探索世界。在去年的 I/O 中,我們引入了沉浸式視圖,它使用 AI 創建地點的高保真表示,因此您可以在訪問之前體驗它。
現在,我們正在擴展同樣的技術,以做地圖最擅長的事情:説明你到達你想去的地方。谷歌地圖每天提供 20 億公里的路線 - 這是很多旅行。現在想像一下,如果你能提前看到你的整個旅程。借助路線的沉浸式視圖,無論您是步行、騎自行車還是開車,都可以做到。
假設你在紐約市,你想騎自行車。地圖為您提供了幾個接近您所在位置的選項。海濱的那條看起來風景優美,但您想先感受一下它,因此按兩下「沉浸式檢視」以獲取路線。這是一種看待旅程的全新方式。您可以放大以獲得令人難以置信的騎行鳥瞰圖。
還有更多資訊可用。您可以檢查空氣品質,交通和天氣,並查看它們可能會如何變化。
路線的沉浸式視圖將於今年夏天開始推出,並在今年年底前在 15 個城市推出,包括倫敦,紐約,東京和三藩市。
照片 “中的全新魔術編輯器體驗
人工智慧使另一個更好的產品是谷歌相冊。我們於 2015 年在 I/O 上推出了它,它是我們首批 AI 原生產品之一。機器學習的突破使得在照片中搜索人物、日落或瀑布等內容成為可能。
當然,我們希望您做的不僅僅是搜索照片 - 我們還希望説明您使其更好。事實上,每個月,Google 相冊中都會編輯 1 億張圖片。人工智慧的進步為我們提供了更強大的方法來做到這一點。例如,首先在 Pixel 上推出的 Magic Eraser 使用 AI 驅動的計算攝影來消除不必要的干擾。今年晚些時候,使用語義理解和生成 AI 的組合,你可以通過一種名為 Magic Editor 的新體驗做更多的事情。
這裡有一個例子:這是一張很棒的照片,但作為父母,你可能希望你的孩子處於這一切的中心。看起來氣球在這個中被切斷了,所以你可以繼續重新定位生日男孩。魔術編輯器會自動重新創建原始鏡頭中未捕獲的長凳和氣球部分。作為點睛之筆,您可以衝上天空。這也會改變照片其餘部分的照明,使編輯感覺一致。這真的很神奇。我們很高興在今年晚些時候在 Google 相冊中推出魔術編輯器。
讓 AI 對每個人都更有説明
從 Gmail 和照片到地圖,這些只是 AI 如何在重要時刻為您提供説明的幾個範例。我們可以做更多的事情,在你熟悉和喜愛的產品中充分發揮人工智慧的潛力。
今天,我們有 15 種產品,每種產品都為超過 2 億人和企業提供服務。其中六款產品分別為超過億使用者提供服務。這給了我們很多機會來完成我們的使命 —— 組織世界資訊並使其普遍可用和有用。
這是一項永恆的使命,隨著時間的流逝,感覺越來越重要。展望未來,讓人工智慧對每個人都有幫助是我們推進使命的最深刻的方式。我們通過四個重要方式做到這一點:
首先,通過提高你的知識和學習,加深你對世界的理解。
其次,通過提高創造力和生產力,這樣你就可以表達自己並完成工作。
第三,使開發人員和企業能夠構建自己的變革性產品和服務。
最後,通過負責任地構建和部署人工智慧,讓每個人都能平等受益。
PaLM 2 和雙子座
我們對未來的機遇感到非常興奮。我們讓人工智慧對每個人都有説明的能力依賴於不斷推進我們的基礎模型。因此,我想花點時間分享一下我們是如何接近它們的。
去年,您聽到我們談論 PaLM,它為我們的產品帶來了許多改進。今天,我們準備宣佈我們最新的 PaLM 型號:PaLM 2。
PaLM 2 建立在我們的基礎研究和最新的基礎設施之上。它非常有能力執行各種任務,並且易於部署。我們今天宣佈推出超過 25 款由 PaLM 2 提供支援的產品和功能。
PaLM 2 型號可在各種尺寸上提供出色的基礎功能。我們親切地將它們命名為壁虎、水獺、野牛和獨角獸。Gecko 非常輕巧,可以在行動裝置上工作:速度足夠快,即使在離線時也能在設備上使用出色的互動式應用程式。PaLM 2 模型在邏輯和推理方面更強,這要歸功於對科學和數學主題的廣泛培訓。它還接受過多語言文本(跨越 100 多種語言)的訓練,因此它可以理解並生成細微的結果。
結合強大的編碼功能,PaLM 2 還可以幫助開發人員在世界各地進行協作。假設您正在與首爾的同事一起工作,並且正在調試代碼。您可以要求它修復錯誤並通過在代碼中添加韓語註釋來説明您的隊友。它首先識別代碼是遞迴的,然後提出修復建議。它解釋了修復背後的原因,並添加了您詢問的韓語評論。
雖然 PaLM 2 功能強大,但在對特定領域的知識進行微調時,它確實大放異彩。我們最近發佈了 Sec-PaLM,針對安全用例進行了微調。它使用 AI 來更好地檢測惡意腳本,並可以説明安全專家瞭解和解決威脅。
另一個例子是 Med-PaLM 2。在這種情況下,它是根據醫學知識微調的。與基本模型相比,這種微調將不準確的推理減少了 9 倍,接近回答同一組問題的臨床醫生專家的表現。事實上,Med-PaLM 2 是第一個在醫療執照考試式問題上以「專家」級別執行的語言模型,並且是目前最先進的語言模型。
我們還在努力為 Med-PaLM 2 添加功能,以便它可以合成來自醫學成像的資訊,如普通膠片和乳房 X 光檢查。你可以想像一個人工智慧合作者,説明放射科醫生解釋圖像並傳達結果。這些是 PaLM 2 在專業領域使用的一些示例。我們迫不及待地想看到它更多地使用,這就是為什麼我很高興地宣佈 PaLM 2 現在提供預覽版。
PaLM 2 是我們長達十年的旅程中的最新一步,旨在以負責任的方式將 AI 帶給數十億人。它建立在兩個世界級研究團隊 Brain Team 和 DeepMind 取得的進展之上。
回顧過去十年中決定性的人工智慧突破,這些團隊為其中做出了相當大的貢獻:AlphaGo,變形金剛,序列到序列模型等。所有這些都為我們今天所處的拐點奠定了基礎。
我們最近將這兩個團隊合併為一個單位,Google DeepMind。利用谷歌的計算資源,他們專注於安全、負責任地構建功能更強大的系統。
這包括我們的下一代基礎模型 Gemini,它仍在訓練中。Gemini 是從頭開始創建的,在工具和 API 集成方面具有多模式、高效性,旨在實現記憶體和規劃等未來創新。雖然還為時過早,但我們已經看到了以前模型中沒有的令人印象深刻的多模式功能。
一旦經過微調和嚴格的安全性測試,Gemini 將提供各種尺寸和功能,就像 PaLM 2 一樣。
AI 責任:識別生成內容的工具
隨著我們投資於更有能力的模型,我們也在深入投資人工智慧責任。這包括擁有在遇到合成生成內容時識別合成生成的內容的工具。
兩種重要的方法是浮浮浮浮水印將資訊直接嵌入到內容中,即使通過適度的圖像編輯也能保持這種方式。展望未來,我們正在構建我們的模型,從一開始就包括浮水印和其他技術。如果你看一個合成圖像,它看起來是多麼真實,所以你可以想像這在未來會有多重要。
元數據允許內容建立者將其他上下文與原始文件相關聯,從而在遇到圖像時為您提供更多資訊。我們將確保每個 AI 生成的圖像都具有該元數據。
對 Bard 和工作區的更新
隨著模型變得越來越好,能力越來越強,最令人興奮的機會之一是讓人們可以直接參與其中。
這就是我們與 Bard 合作的機會,這是我們在三月份推出的對話式AI實驗。我們一直在迅速發展 Bard。它現在支援廣泛的程式設計功能,並且在推理和數學提示方面變得更加智慧。而且,截至今天,它現在已經完全在 PaLM 2 上運行。閱讀有關最新巴德更新的更多資訊。
我們還為 Google Workspace 帶來了新功能。除了文檔和 Gmail 中的「幫我寫作」之外,Google Workspace 中的 Duet AI 還提供了一些工具,用於根據幻燈片和 Meet 中的文字說明生成圖片、在表格中創建自定義方案等。
介紹實驗室和我們新的搜索生成體驗
隨著 AI 的不斷快速改進,我們專注於為使用者提供有用的功能。從今天開始,我們將為你提供一種新的方式來預覽 Workspace 和其他產品中的一些體驗。它被稱為實驗室。我說的是新的,但谷歌在使用實驗室作為實現早期訪問和獲得反饋的一種方式方面有著悠久的歷史,你可以今天晚些時候開始註冊。
除了您剛剛看到的工作區功能外,您還可以在實驗室中測試的首批體驗之一涉及我們的創始產品 Google 搜索。我們多年前開始深入投資人工智慧的原因是,我們看到了讓搜索變得更好的機會。隨著每一次突破,我們都使它更加有用和直觀。
語言理解的改進讓我們更自然地提出問題,並訪問網路上最相關的內容。計算機視覺的進步引入了視覺搜索的新方法。現在,即使您沒有文字來描述您要查找的內容,也可以使用 Google Lens 搜索您看到的任何內容。事實上,Lens 每月用於超過 12 億次視覺搜索,在短短兩年內增長了 4 倍。鏡頭與多模態相結合導致了多重搜索,它允許您同時使用圖像和文本進行搜索。
展望未來,谷歌對資訊的深刻理解與生成式人工智慧的獨特功能相結合,可以再次改變搜索的工作方式,解鎖搜索可以回答的全新問題,並創造越來越有用的體驗,將您與豐富的網路聯繫起來。
當然,將生成式人工智慧應用於搜索仍處於早期階段。世界各地的人們在重要時刻都依賴搜索,我們知道正確做到這一點並繼續贏得他們的信任是多麼重要。那永遠是我們的北極星。
因此,我們以負責任的態度進行創新,從一開始就一如既往地努力實現資訊品質的最高標準。這就是我們首先在實驗室中為你帶來新的搜索生成體驗的原因。
讓他人輕鬆創新
人工智慧不僅是一個強大的推動者,也是一個重大的平台轉變。每個企業和組織都在考慮如何推動轉型。這就是為什麼我們專注於讓其他人能夠輕鬆且可擴展地使用 AI 進行創新。
這意味著提供最先進的計算基礎設施——包括最先進的 TPU 和 GPU——並擴大對谷歌最新基礎模型的訪問,這些模型已經在我們自己的產品中進行了嚴格測試。我們還致力於提供世界一流的工具,以便客戶可以訓練、微調和運行自己的模型,並具有企業級的安全性、安全性和隱私性。
利用 Android 推動進步
我們對人工智慧的大膽和負責任的方法可以釋放人們的創造力和潛力。我們還希望確保這種説明惠及盡可能多的人。我們通過 Android 等計算平臺做到這一點,今天我們分享了 AI 的進步如何使您的手機更加個人化,包括魔術作曲,電影壁紙和生成 AI 壁紙。
為您的口袋和家居推出全新 Pixel 設備
我們還推出了 Pixel 7a、Pixel Fold 和 Pixel Tablet ,用於由 Google 設計的 AI 設備的完整生態系統。Pixel 7a 從今天開始開放購買,Pixel Fold 和 Pixel Tablet 現已開放預訂。
共建未來
我一直在反思我們都參與的重大技術變革。人工智慧的轉變是巨大的,這就是為什麼我們讓人工智慧對每個人都有説明如此重要的原因。我們帶著興奮的心情大膽地接近它。我們以負責任的方式這樣做,強調了我們對把事情做好的深刻承諾。
沒有一家公司可以單獨做到這一點。我們的開發人員社區將是釋放未來巨大機遇的關鍵。我們期待著共同努力,共同建設。
以上內容來自 [ Google Blog ] blog.google/technology/ai/google-io-2023-keynote-sundar-pichai/#android-and-pixel