發(fā)布時間:2023-11-27 12:04:54 瀏覽量:112次
從技術優(yōu)化到團隊合作一應俱全
魚羊 克雷西 發(fā)自 凹非寺
|
ChatGPT產品打造的細節(jié),現在OpenAI自己交了個底。

并且這波干貨分享真是信息量滿滿,包括但不限于:

以上信息,依然來自今年的新晉“科技春晚”——OpenAI開發(fā)者日。
除了奧特曼驚艷全球的開幕演講,當天還有更多分組討論,視頻也陸續(xù)被官方上傳到了油管。
而這也算得上是OpenAI驚天抓馬之前,其團隊“內幕”的一次展示。
值得借鑒學習之處,我們已經整理好筆記,一起來看~
把時間拉回到2022年10月,OpenAI的研究團隊和產品團隊開始圍繞一個idea進行討論:為他們的基礎大模型,制作一個對話界面。
彼時還處在ChatGPT的早期階段,但研究團隊和產品團隊的緊密協作已然開始,它們之間相互的影響程度更是獨樹一幟。
或許這種團隊合作模式,可以成為其他公司參考借鑒的樣本。
用OpenAI模型行為產品負責人Joanne Jang的話說:
在OpenAI,研究團隊和產品團隊之間的相互影響,在業(yè)內已經達到了前所未有的程度。
ChatGPT本身,就是最明顯的例子。

OpenAI Post-Training團隊負責人Barret Zoph和Joanne共同分享了兩支團隊在ChatGPT開發(fā)和完善過程中的一些協作細節(jié)。
Barret團隊的主要職責,是在模型能力被加入到ChatGPT和API之前,對其進行調整。具體來說,ChatGPT后期增加的聯網、分析文件等功能,都是由Post-Training團隊負責的。
Barret重點提到的是,正是產品團隊的種種設計,讓研究團隊能夠及時get到什么樣的模型響應,對于現實世界中的用戶和開發(fā)人員是真正有用的。
比如ChatGPT的點贊點踩按鈕,就給研究本身帶來了很多價值:
我們可以根據這樣的反饋調整正在做的事情,了解哪些工作做得好,哪些做得不好,這樣一來,我們就能讓模型響應越來越適合用戶。
在研究中,我們通常用離線評估指標和基準去衡量模型的進展,但有時候這并非人們真正使用模型的方式。產品團隊的幫助,使得我們能夠確保自己正走在構建通用、強大系統(tǒng)的方向上。

而站在產品團隊的角度,Joanne同樣認為,OpenAI產品經理扮演的角色有獨特之處:
首先,在OpenAI做產品的目標不是收入、參與度、增長等傳統(tǒng)產品指標,而是打造造福全人類的通用人工智能。
其次,OpenAI的產品經理往往是從技術而非用戶問題的角度出發(fā),去設計產品功能的。
最后,OpenAI研究團隊和產品團隊相互影響的程度非常之高,在業(yè)內可以說達到了前所未有的程度。

還是以ChatGPT誕生的過程為例。從GPT-3,到InstructGPT,再到ChatGPT,研究團隊發(fā)現,直接在多輪對話上訓練模型,能讓教導模型新的行為這件事變得更加有效。
而具體教導(設計)模型行為的工作,就是靠產品團隊來參與完成的:比如說,當用戶告訴ChatGPT“你現在是一只貓”,ChatGPT應該表現出怎樣的默認行為?
產品團隊對此進行了大量的實驗,以找出適合大多數用戶的默認模式。
(p.s. 不過Joanne也提到,對于用戶而言,最好的模型是個性化的模型,這也是他們對未來大模型發(fā)展方向的預判之一。)
講完協同“內幕”,再來看技術細節(jié)。
在開發(fā)者日上,OpenAI的技術人員分享了GPT-4中使用的大模型優(yōu)化技術。
劃重點就是,采用非線性策略,具體包括兩個維度和四個象限。
OpenAI提出了一個多層次的非線性優(yōu)化框架,涉及到了提示工程、搜索增強生成(RAG)和微調這三種技術。
傳統(tǒng)的模型優(yōu)化方式往往以線性方式運用這三項技術,在OpenAI看來這種模式無法解決“真正需要解決的問題”。

OpenAI認為,大模型表現優(yōu)化分為兩個維度,一個是其本身的表現,一個是上下文。
根據這兩個維度需求程度的不同,就形成了四個象限。
具體來說,這兩個優(yōu)化方向的起點都是提示工程,但接下來要用RAG還是微調(或兩者兼用)則需要根據實際情況來選擇。

通過詳細比較這三項技術各自的優(yōu)勢,OpenAI的兩名技術人員分別做了具體解釋。
首先是提示工程,它被看作大模型優(yōu)化的起始點,通過設計提示詞來增強模型性能,可以測試和快速迭代。
具體的策略包括,將提示詞設計得更清晰、將復雜任務拆解,以及提供示例文本或調用外部工具等。

但對于讓模型學習新信息,或者復刻一種復雜的方法(如學習新的編程語言),則超出了提示工程的能力范疇。
此外,任務的細化也會帶來token的增加,所以提示工程對于減少token消耗來說也是不利的。

RAG和微調解決的問題則存在一些相似之處,二者的主要區(qū)別在于,RAG更適用于讓模型從給定信息中獲取答案(短期記憶),而微調的重點是模型的長期記憶。

RAG的核心優(yōu)勢是利用知識庫為模型提供上下文信息,從而減少模型幻覺。
但是這種知識信息通常局限于十分具體的領域,但對于寬泛的領域(如“法律”“醫(yī)學”等)作用并不明顯。
同時,提供大量上下文信息會帶來比提示工程更多的token消耗,對節(jié)約token同樣不利。

此外,過度應用RAG也有可能帶來反效果,比如有用戶要求GPT只利用文檔中的信息,然后發(fā)現模型出現了“幻覺”。
但事后分析發(fā)現,這并非是模型的幻覺現象,而是用戶提供的信息本身就存在錯誤。

而微調則是通過在小數據集上訓練模型,來提高性能和效率,或者修改輸出結構。
相比RAG,微調更側重于強調模型已有的知識,并提供復雜的任務指導,對于學習新知識或迭代到新用例則不是好的選擇。

總結下來就是,基于這些策略的特點和使用領域,根據實際需求有的放矢地選擇優(yōu)化策略。
這也是OpenAI調教GPT-4的法寶,具體到應用層面,OpenAI也為一眾創(chuàng)業(yè)者獻上了一份大禮。
OpenAI工程負責人和Applied團隊成員分享了如何將基于OpenAI模型搭建的應用從原型走向完整產品。
如果你也有興趣基于OpenAI的API搞一些應用創(chuàng)新,以下是官方分享的一些工程實踐經驗:
第一,打造以人為本的用戶體驗,即減少模型不確定性,增強模型的安全性和可控性。
第二,提供一致性體驗。比如利用知識庫等工具來減少模型的不一致性。工程師們提到,OpenAI通過控制seed來控制結果的可重現性,并且提供了當前系統(tǒng)的“指紋”來代表整個系統(tǒng)的狀態(tài)。
第三,重視性能評估。并且OpenAI發(fā)現,用大模型來代替人工進行性能評估效果顯著。
第四,管理延遲和成本。主要策略有兩種:首先是加入語義緩存,來減少真實API的訪問;其次是使用更便宜的模型,比如不直接使用GPT-4,而是用GPT-4的輸出來微調GPT-3.5 Turbo。

而具體到產品更新,新版API也值得關注,OpenAI的廣告詞是可以“在開發(fā)的應用中直接構建世界級的助手”。
新版API支持調用代碼解釋器和外部知識,OpenAI的API工程主管Michelle進行了現場演示。

此外,在函數(第三方API)調用方面也進行了改進,新增了JSON輸出模式,并允許同時調用多個函數。
順便提一嘴,開發(fā)者大會的開幕式上,OpenAI現場給每個人發(fā)放了500美元的賬戶余額,讓線下觀眾紛紛投來羨慕的目光。

不過實際上他們只賺了50,因為還要花450美元買門票。
按照最新的定價,50美元可以通過API處理500萬輸入token或166.6萬輸出token。

那么,今日份的干貨筆記就分享到這里了,想了解更多詳細內容,可以到官方回放中一睹為快。
— 完 —
熱門資訊
1. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現,快來嘗試一下吧!
4. 一款免費無限制的AI視頻生成工具火了!國內無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
以下是一些免費的AI視頻制作網站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉換為視頻。 用戶可以使...
6. 零基礎10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
就能快速生成一幅極具藝術效果的作品,讓現實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
8. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
9. 10個建筑AI工具,從設計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設計、建筑方案設計、住宅設計、管道設計、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產效率、還能做什么AI...
最新文章
同學您好!