當?shù)貢r間5月14號下午,谷歌在美國山景城召開了年度I/O開發(fā)者大會。
在110分鐘的時間里,人工智能(AI)這個關鍵詞被提到了121次,展現(xiàn)了谷歌在人工智能領域全力以赴的姿態(tài)和顯而易見的野心。
作為谷歌的旗艦模型,Gemini及其各種迭代版本悉數(shù)亮相,搶盡了風頭。谷歌正在將其整合到幾乎所有自家產(chǎn)品中,包括安卓系統(tǒng)、搜索、瀏覽器和Gmail等等,各種演示看的人眼花繚亂。
此前,谷歌Gemini共有三個版本,分別是Ultra、Pro和Nano,尺寸不同,性能不同,應對的場景也有所差異。

現(xiàn)在,谷歌在大會上又推出了新版本,Gemini 1.5 Flash。谷歌表示,新的多模態(tài)模型與Gemini 1.5 Pro一樣強大,但針對“高頻、低延遲的任務”進行了優(yōu)化。這使得它能夠更好地產(chǎn)生快速響應。
谷歌還對Gemini 1.5進行了一些升級,據(jù)稱這將提高其翻譯、推理和編碼的能力。此外,谷歌表示,它已將Gemini 1.5 Pro的上下文窗口增加了一倍,從100萬個token增加到200萬個。
目前,Gemini 1.5 Pro和1.5 Flash均已開放公共預覽版。谷歌還披露,目前Gemini的開發(fā)者已經(jīng)超過150萬,超過20億用戶體驗到了Gemini的強大。
在Gemini的加持下,多款谷歌產(chǎn)品迎來了新功能。比如,谷歌照片將于今年晚些時候新增Ask Photos功能,現(xiàn)在可以更好地搜索照片,識別不同的照片背景,尋找照片或回答其他照片內(nèi)容問題。
谷歌CEO桑達爾·皮查伊表示,Gemini可以“將任何輸入轉(zhuǎn)化為任何輸出”,從文本、照片、音頻到實時視頻中提取信息并回答問題。

谷歌在大會上宣布將推出一款名為Astra的新系統(tǒng),承諾它將是谷歌迄今為止推出的最強大、最先進的人工智能助手。
當前一代的人工智能助手將重新命名為更先進的“代理”,據(jù)稱可以具備推理、計劃和記憶技能,并能夠采取多個步驟來執(zhí)行任務。
谷歌展示了人工智能代理對音頻和視頻輸入的響應方式,與競爭對手類似。用戶可以通過智能設備使用Astra,也在探索將其嵌入其他設備中。
在谷歌的演示視頻中,用戶使用智能設備進行攝像頭掃描和定位,人工智能系統(tǒng)能夠識別對象并進行記錄。
“我們正處于(人工智能代理開發(fā))的早期階段?!惫雀鐲EO皮查伊表示。
“想象一下,這些代理可以看到和聽到我們所做的事情,更好地了解我們所處的環(huán)境,并在對話中快速做出反應,使交互的速度和質(zhì)量更加自然。”
科技公司正在競爭人工智能領域的“霸主”地位,而大型科技公司為了表明他們正在推動技術前沿的發(fā)展,人工智能代理成為了它們的“寵兒”。
許多科技公司都把人工智能代理放到了敘事當中,這些公司的目標是構建通用人工智能(AGI),這是一種關于超級人工智能系統(tǒng)的想法,在很大程度上仍處在設想階段。
“最終,你將擁有一位真正了解你、可以為你做很多事情、可以跨多個任務和領域工作的代理?!苯淌诒硎?。
谷歌在I/O大會上推出了更多新的人工智能功能。它通過人工智能概述的新功能將人工智能更深入地集成到搜索引擎中,為用戶提供更具體答案。

給它一份食譜,Gemini將幫助用戶計劃需要做什么或者買什么。用戶還能與人工智能系統(tǒng)對話,要求它完成各種任務。
谷歌還推出了Veo,一個新的視頻生成人工智能系統(tǒng),能夠生成短視頻,并理解提示,讓用戶更好地控制視頻風格。
谷歌和OpenAI等公司正面臨作家和藝術家的訴訟,聲稱他們的知識產(chǎn)權被使用。
為了更好地區(qū)分人工智能生成內(nèi)容和真實內(nèi)容,谷歌擴展了SynthID水印工具,提供更多保護措施。
火星網(wǎng)校