當(dāng)前位置：首頁 >人工智能 >谷歌I/O大會，AI助手全面升級，Gemini家族壯大，Veo閃亮登場

谷歌I/O大會，AI助手全面升級，Gemini家族壯大，Veo閃亮登場

發(fā)布時間：2024-05-26 13:46:16 瀏覽量：101次

五月真熱鬧，OpenAI才開了春季發(fā)布會，谷歌I/O大會也如期召開了。

觀看主題演講直播的過程中，腦海不禁會浮現(xiàn)曾被谷歌內(nèi)部員工泄露的梗圖——谷歌AI產(chǎn)品和項目一個又一個不同又相似的名字令人頭大。

主題演講的關(guān)鍵詞仍舊是AI，谷歌還自己在現(xiàn)場給出了提到“AI”的次數(shù)，在120次以上。

在萬眾矚目的AI領(lǐng)域，谷歌宣布了若干新消息。

AI大模型升級了兩個，Gemini 1.5 Pro雙下文窗口拓展到200萬令牌、Gemini Nano增加多模態(tài)理解能力；新發(fā)布了三個，更輕更快的Gemini 1.5 Flash、新架下的Gemma 2.0，以及視覺語言模型PaliGemma。

另有文生圖模型迭代至Imagen 3，還新發(fā)布了一個文生視頻模型Veo。

AI的具體應(yīng)用延展上，谷歌這次憋了不少招。

谷歌的核心產(chǎn)品搜索中，發(fā)布AI Overviews，加強(qiáng)版AI搜索摘要功能將率先上架美國。谷歌搜索中還將加入制定計劃、視頻搜索等多重AI驅(qū)動的功能。

此外，Gemini還被塞進(jìn)谷歌照片以及即時通訊應(yīng)用Google Messages等產(chǎn)品中。

讓人聯(lián)想到OpenAI才發(fā)布的GPT-4o的，是谷歌旨在打造未來通用AI助理的新項目Project Astra，以及Gemin的新功能Live。Gemini Live支持與AI語音聊天，年內(nèi)預(yù)計加入相機(jī)功能，和AI實時“視頻通話”。

有點(diǎn)尷尬的是，在第三方拉流的直播間里，觀眾直呼“無聊”，并對眼花繚亂的名字感到困惑。CNET的評論員指出，谷歌需要精進(jìn)講故事的能力，而不是一上來就將各個部分盡數(shù)展開。

OpenAI趕在谷歌I/O大會前一天開春季發(fā)布會，原本盛傳的搜索產(chǎn)品沒來，但“人類級別響應(yīng)”的GPT-4o讓人一窺新一代AI助理大戰(zhàn)的輪廓。

難以想象要是沒有OpenAI的狙擊，谷歌會有多開朗。

本次谷歌I/O大會上，原本最具驚喜的也是AI助手方面的進(jìn)展。

首先，谷歌公布了一個新項目，名為Project Astra。用谷歌Deepmind負(fù)責(zé)人哈薩比斯（Demis Hassabis）的話說，這是真正通向AGI的萬能助手項目。

相比于谷歌上一代AI助手Google Assistant，Project Astra的AI助手模式多樣，且能實時交互。沒有煩人的喚醒詞，也沒有尷尬的延遲?？茨闼?，為你排憂解難。

在攝像頭匆匆掃過場景的情況下，用戶求助“眼鏡放在哪兒”，助手準(zhǔn)確識別并回答“你的眼鏡在紅蘋果的旁邊”。

去年12月，Gemini就曾發(fā)布通過視頻和AI互動的視頻，但事后承認(rèn)視頻經(jīng)過剪輯，谷歌為此沒少被戳脊梁骨。

有意思的是，這次在演示視頻的一開頭，谷歌就鄭重承諾，視頻是實時、一次性拍攝的。

不過，谷歌尚未針對Project Astra給出明確的時間線，只是含糊地表示今年晚些時候其中的一些功能將更新到Gemini及其他應(yīng)用中。

谷歌在AI助手方面還有更看得見、摸得著的進(jìn)展——Gemini Live，也就是對Gemini產(chǎn)品進(jìn)行多模態(tài)功能拓展。Gemini Advanced用戶將可以用語音和Gemini進(jìn)行對話，對話更流暢自然，延遲更低，可以隨時打斷，預(yù)計夏天上線。谷歌還表示，今年年內(nèi)將加入相機(jī)功能，實現(xiàn)實時視頻。

可以說這一次，谷歌被OpenAI精準(zhǔn)狙擊——GPT-4o不僅早一天發(fā)布，而且現(xiàn)場演示，未來幾周就會開放給全部用戶。

近日外界都在盛傳OpenAI將推出搜索類產(chǎn)品，與谷歌一戰(zhàn)，但這樣的情況并沒有發(fā)生，而谷歌自己也已經(jīng)馬不停蹄地升級了谷歌搜索。

搜索作為谷歌的核心產(chǎn)品，即將迎來一次大升級——搜索摘要功能AI Overview，同時包含多步推理功能Multi-Step Reasoning、在搜索中做計劃Planning in Search，以及用視頻提問Ask With Video。

AI Overview，顧名思義，是指用戶鍵入文本、點(diǎn)擊搜索之后，出現(xiàn)在最上方的將是AI幫忙整理的信息摘要。其中包含用自然語言對搜索結(jié)果的總結(jié)和概括，以及推薦的鏈接。從前這被谷歌稱為“搜索生成式體驗（SGE）”。

多步推理Multi-step reasoning則可以用來做計劃。當(dāng)用戶在搜索框鍵入“附近最好的瑜伽館”時，AI摘要會將附近瑜伽館依照評分、課程、距離等信息分類成塊，更清晰地展示給用戶。Planning in Search則允許用戶直接用谷歌搜索做計劃，如在搜索框中鍵入飲食計劃的需求，搜索引擎會給你自動生成一份。

想要搜索商品的時候，AI同樣會發(fā)揮作用，在搜索框鍵入“有上下坡的五英里通勤自行車”，搜索引擎會在上方給出選購自行車的思路建議，并給出若干商品推薦。

從一個又一個詳盡的演示不難看出，谷歌已經(jīng)下定決心重塑搜索體驗。

應(yīng)用生態(tài)的其他新動作更像是補(bǔ)齊，如Gmail郵箱、Google Messages通訊、谷歌照片等，Gemini逐漸拓展到越來越多的谷歌應(yīng)用中，大有“Gemini無處不在”的態(tài)勢。

AI背后的模型，谷歌這次也是大手一揮，升級的升級，新發(fā)布的新發(fā)布，Gemini家族不斷壯大。

三個月前發(fā)布的Gemini 1.5 Pro終于“發(fā)貨”了，即日起正式開放給訂閱了Gemini Advanced（類似ChatGPT Plus）的用戶。

Gemini 1.5 Pro支持100萬token的上下文窗口，今年晚些時候?qū)黾拥?00萬token。更形象地說，升級后的Gemini 1.5 Pro能同時處理22小時音頻、2小時視頻、超過60000行代碼或140萬個單詞。

新發(fā)布的模型中，Gemini 1.5 Flash原本有明星潛質(zhì)，但被OpenAI狙擊。GPT-4o驅(qū)動的ChatGPT狙擊Project Astra和Gemini Live，GPT-4o狙擊Gemini Flash。

Gemini 1.5 Flash主打更輕更快，反應(yīng)速度和效率是其主打特色，擁有多模態(tài)推理能力，擅長總結(jié)、聊天、圖像、文檔數(shù)據(jù)提取、視頻字幕等。但這些特點(diǎn)，顯然和GPT-4o撞車了。

除此之外，谷歌的開源模型Gemma也發(fā)布了新版本，Gemma 2.0有270億參數(shù)，并拓展出多模態(tài)版本PaliGemma。

多模態(tài)生成式模型，谷歌在I/O大會上公布了三個，涵蓋圖像、音樂和視頻。

文生圖模型谷歌此前就有，此次做了迭代，發(fā)布Imagen 3。Imagen 3對提示詞的理解更加準(zhǔn)確細(xì)致，可以生成更逼真的圖像。在演示中，Imagen3從一長段提示詞中提取了8個細(xì)節(jié)信息，并在生成的圖像中一一體現(xiàn)。

上一篇北師大未來設(shè)計學(xué)院在第六屆中國教博會發(fā)布五項PBL大挑戰(zhàn)項目

下一篇高考失利，如何調(diào)整心態(tài)？|新的風(fēng)貌 | 火星時代教育

熱門課程推薦

熱門資訊

1. 華為手機(jī)神奇“AI修圖”功能，一鍵消除衣服！原圖變身大V領(lǐng)深V！

最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議，通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎？點(diǎn)擊查看！
2. 四款值得推薦的AI以圖生圖軟件，有需要的趕緊來試試!

近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
3. 照片變漫畫效果，這4個方法操作簡單有效，快來試試吧！

想將照片變成漫畫效果？這篇文章分享了4個方法，包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖，簡單操作就能實現(xiàn)，快來嘗試一下吧！
4. 一款免費(fèi)無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程

人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點(diǎn)擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
5. 趕緊收藏好!這4個完全免費(fèi)的AI視頻制作網(wǎng)站和工具

以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。用戶可以使...
6. 零基礎(chǔ)10分鐘生成漫畫，教大家如何用AI生成自己的漫畫

接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 四款軟件讓你一鍵生成AI美女!

就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
8. AI視頻制作神器Viggle：讓靜態(tài)人物動起來，創(chuàng)意無限！

Viggle AI是一款免費(fèi)制作視頻的AI工具，能讓靜態(tài)人物圖片動起來，快來了解Viggle AI的功能和優(yōu)勢吧！
9. 10個建筑AI工具，從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的

講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器

這下LOGO設(shè)計徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...

亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

谷歌I/O大會，AI助手全面升級，Gemini家族壯大，Veo閃亮登場

請綁定手機(jī)號

亚洲AV免费看深爱成人|日韩av另类一级特黄片在线|中国免费一级黄片|国产av一二三区|亚洲有码AV在线|久久亚洲国产日韩欧美|成人免费AV网站|婷婷一区综合一区|亚洲AV无码导航|高级欧美成人网站

谷歌I/O大會，AI助手全面升級，Gemini家族壯大，Veo閃亮登場

請綁定手機(jī)號

谷歌I/O大會，AI助手全面升級，Gemini家族壯大，Veo閃亮登場