發(fā)布時間:2024-03-13 20:40:04 瀏覽量:187次
人工智能的浪潮遍及各行各業(yè),隨著自然語言處理技術的發(fā)展,計算機對文字的處理也進展到了一個新的層次,什么是文本智能?怎樣在產品中找到人工智能可賦能的場景?當ai遇上產品設計,又將碰撞出怎樣的火花?


文本智能通俗來講,是計算機像人類一樣理解自然語言。
“冬天,能穿多少穿多少。夏天,能穿多少穿多少。”
“中國足球隊,誰都打不過。中國乒乓球隊,誰都打不過”。
人類看一眼就知道什么意思,對計算機來說則困難重重。因為人的表達方式千變萬化,短詞匯可以傳達非常寬泛的語義信息。

現(xiàn)在的文本智能處在什么層面?
文本也可以分成兩種類型:一種是書面文本,承載的形式為網頁、word、txt或pdf; 另外一種則是日常交流的口語形式。達觀專注于第一種。
一份簡歷、一份合同、一份上市公司的債券募集說明書、一條評論都可以算書面文本。
面對一篇文本,我們能做什么呢?

(1)拆解
像庖丁解牛一樣把文檔結構化。
簡歷的姓名、照片、工作經歷、教育背景;合同中交易的甲乙方、合同標的物、付款方式、條款;新聞的標題、摘要、來源、正文、關鍵人物、事件,組織機構名稱,都是對文本拆解后抽取到的信息。
抽取是文本處理中最重要和實用的技術。抽取出合同中的“付款方式”之后,業(yè)務方才能夠去進一步審核“付款方式”是否符合法律法規(guī)。
(2)聯(lián)接
對多個文本進行庖丁解牛式的拆解,相關知識就能聯(lián)接形成一個巨大的知識網。
對標到知識圖譜,新聞中的人、事、物、關系,公司年報中的出現(xiàn)的公司名稱及關系,都可以作為文本智能處理的大腦和背景知識,在知識網絡上進行邏輯推理和判斷。
(3)生成
生成是學術界研究的熱點,在當前階段是非常困難的事情。騰訊的Dreamwriter,今日頭條的xiaomingbot都在嘗試用機器創(chuàng)作短新聞。
接下來我們具體看一些文本智能的例子。

根據(jù)一篇新聞資訊,生成不同長度的摘要,主要有兩種技術手段:抽取式和生成式。
給定一個用戶評論,提取出標簽信息和觀點,屬于一個短文本處理。
文本分類和情感識別,在文本質量管控和輿情分析方面使用較多。
文本審核也是分類的一種,涉黃涉政及判斷是否是廣告,是每一個做互聯(lián)網產品的公司比較頭疼的事。
下面是金融行業(yè)的債券募集說明書。

這樣一個文檔中,行業(yè)研究人員比較關注公司高管信息,比如:姓名、公司職位。在債券募集說明書中收購標的是哪些,包括資產、標的業(yè)務、標的所在行業(yè)是否涉外、交易對手是否涉外、各類財務指標等。
一般債券募集說明書從100到500頁不等,讓人從這么長的文檔中找到這些關鍵信息,非常容易出錯。
在公開的金融資訊網站上,債券募集說明書非常多,一個金融從業(yè)人員不可能在短時間內把每篇文章內的信息都抽取出來。所以在整個領域來說,文本智能處理出現(xiàn)了非常大的機會。這也受益于算法的進步,特別是深度神經網絡從圖片識別領域到文本處理的遷移。

促成文本智能處理飛速發(fā)展的原因很多。
最近Google 的bert模型刷遍AI界朋友圈:NLP歷史突破,谷歌BERT模型狂破11項記錄,全面超越人類。
文本智能處理的需求遍及各行各業(yè)。只要存在文字處理工作的行業(yè),都有文本智能處理的需求,金融、法律、政府行業(yè),媒體、互聯(lián)網,大型企業(yè)等。


掌握AI算法和基于AI算法設計產品之間的距離是非常大的,如同從火藥到火藥槍、從鈾到核炸彈、從硝化甘油到C4的區(qū)別。

怎樣才能基于這個AI算法設計產品呢?
產品經理的思維是從用戶、場景和需求三要素出發(fā)。
要給客戶解決什么問題?目標客戶如何刻畫?客戶在什么樣的場景下會使用我們的產品?怎么用一系列問題,需要產品系統(tǒng)的思考。

設計思維的六個步驟重點包括:啟發(fā)、構思和實施。
機器學習的流程,是對要解決的問題定義好后,對數(shù)據(jù)加工處理,提取特征,進行算法選擇,從而確定可使用的模型。
當這些模型滿足上線要求或業(yè)務要求以后,我們把模型放到線上系統(tǒng)中。當新接受到的數(shù)據(jù)進行同樣的處理后,用訓練出來的模型來判斷是否屬于垃圾郵件。
算法接受不同的數(shù)據(jù)可以訓練出不同的模型。整個過程是迭代優(yōu)化,因為數(shù)據(jù)的分布和蘊含的特征可能隨著業(yè)務的不斷發(fā)展在產生改變。

兩者怎么樣進行深度的融合,是在人工智能時代下對產品經理能力模型的要求。

這兩年AI的宣傳,特別是AlphaGO的普及作用,我們感受到每一個行業(yè)都會被人工智能技術所影響,任何職業(yè)都會受到影響。
但AI到了無所不能的地步嗎?
顯然不是。

AI對行業(yè)或職業(yè)影響的有多大,很大程度上,是取決于這個領域技術的成熟度和邊界在哪。

比如文本處理領域,針對文本處理技術評估可以分為3類:可用 、基本可用、難以應用。
當產品經理在設計一個基于文本智能的產品時,要考慮這項技術處于什么類別。類別決定技術用到最真實場景時、場景對準確度的要求。例如:自動駕駛或無人駕駛,場景容錯率是零,因為輕則車毀,重則人亡。

保守一點講,我們還處于AI的初級階段,AI的常識邏輯和邏輯推理能力都還很弱,但在日常生活中人類已經享受到了AI帶來的價值。

那么,該如何找到AI賦能的場景,讓算法專家、行業(yè)專家和應用開發(fā)專家三種角色的合作使人工智能落地呢?
找到這個場景的前提是需要思考,運用AI產品和解決方案的本質什么。

首先,應用可以分為兩類:互聯(lián)網行業(yè)應用和企業(yè)級應用。
在互聯(lián)網行業(yè)應用,無論是搜索、推薦系統(tǒng)、廣告,提升的是過程中信息傳遞的效率。在企業(yè)級應用上,主要是提升生產效率和創(chuàng)造新價值。
提到AI產品和解決方案,當我們將它們服務于我們企業(yè)級場景的時候,它的核心是在提升生產效率。
產品需要找到在當前的業(yè)務流程中,生產效率到底出現(xiàn)什么問題,或哪個環(huán)節(jié)希望借助AI技術進行生產效率的提升、節(jié)省人力。

這些可以分四個步驟做,算法開發(fā)人員也是站在這四步實現(xiàn)代碼:
1)流程拆解
對當前的工作流程或業(yè)務場景進行詳細拆解,診斷阻礙生產效率的最大問題,對核心問題進行拆解。
2)數(shù)據(jù)評估
如果想解決問題,公司的哪些數(shù)據(jù)是跟這個問題相關的?
3)方案設計
方案設計是針對當前的數(shù)據(jù)現(xiàn)狀去完善基礎數(shù)據(jù),選擇可能存在的AI算法是什么。比如進行垃圾分類,有很多分類算法可以采納:貝葉斯模型、SVM邏輯回歸。
第三點比較重要,很多時候人不知道算法的效果怎樣,如果工具能夠幫助我們進行快速的測試,會很快的驗證和優(yōu)化方案。
4)有機整合
當設計好解決方案以后,準確率是可接受的,這時考慮這項服務或應用怎么跟現(xiàn)有的系統(tǒng)進行結合。
大體來看有兩種方式:
系統(tǒng)上線以后,怎么做模型升級、怎么做維護,也是我們面臨的挑戰(zhàn)的問題。概括來講,想找到AI能夠賦能或落地的場景,需要對流程進行拆解,然后評估數(shù)據(jù),進行AI方案的設計,最后和系統(tǒng)進行有機整合。

如果對差旅的報銷流程進行梳理,共有五個環(huán)節(jié):
對流程進行拆解,第一步,整理出差待報銷的發(fā)票。要先根據(jù)票據(jù)的類型進行分類,分好類分別計算各個票據(jù)的金額,交通、住宿,進行匯總。第四個環(huán)節(jié),財務部門需要核對申請表上的金額與提交的紙質票據(jù)的原件是否一致。
當對流程進行拆分以后,就可以進行AI技術的評估。比如:票據(jù)類型分類,能不能通過OCR技術。
當對進行各項金額計算時,能否通過文本關鍵信息提取技術把金額自動提取出來,進行匯總計算。填寫報銷申請表時,能否根據(jù)數(shù)據(jù)接口的方式自動傳達財務部門的審核系統(tǒng)中。同樣,通過文本內容關鍵信息提取技術,把提取出來的數(shù)字和用戶上傳過來的數(shù)字進行復核,來判斷是否通過。
這幾項AI技術幫助賦能,在這個環(huán)節(jié)中,我們需要哪些數(shù)據(jù)?
第一環(huán)節(jié)需要報銷的原件,第四個環(huán)節(jié)既需要原件,又需要申請表。通過這樣的方式,我們找到了AI落地的場景點,并明白了技術在里面可以做到什么程度,同時讓業(yè)務方也了解到了這項技術確實是可以落地的。
通過拆解可以發(fā)現(xiàn)三個場景充分利用文本智能技術:
找到這三個點以后,明確了提供AI產品價值是提升效率,幫助法務部門控制風險。
當我們找到可以AI賦能的場景后,我們需要遵循什么樣的原則去設計產品和解決方案呢?

我們先來看下傳統(tǒng)軟件設計和AI驅動軟件的差別。

傳統(tǒng)軟件設計,設計過程注重的因果、邏輯。設計一個OA系統(tǒng),要考慮員工辦公流程、每個流程要達到的目標是什么、功能實現(xiàn)最短路徑。如果有輸入不符合預期時,傳統(tǒng)軟件產品時,開發(fā)工程師比較容易重現(xiàn)BUG和解決問題。而AI驅動的軟件,重點需要考慮的是結果不確定性、逼近優(yōu)化目標。
比如合同條款讀取,通過歷史的合同數(shù)據(jù),已經能夠訓練出文本智能模型,可以對某些字段進行抽取。假對某個字段的抽取準確率是98%,在歷史合同數(shù)據(jù)中這個非常高的準確率了,站在業(yè)務方來評估,也基本能夠滿足上線要求。但當系統(tǒng)上線以后,對新的一份合同,也許沒有抽取出來。又來一份新的合同,也許就抽取正確了。
對AI算法來說,準確率98%是站在數(shù)據(jù)集的角度考慮的,但真正把模型或產品應用到業(yè)務系統(tǒng)中,業(yè)務人員面對的是一份一份的數(shù)據(jù)。
另外,優(yōu)化目標是個逼近的過程,過程是上下起伏的,總效果是逼近目標的。就像人喝醉酒后回家一樣,搖搖晃晃,有時多走了幾步,但是還是往家的方向走。
可這種情況,對產品的使用者怎么辦?
使用者知道產品在優(yōu)化,但使用過程中還是會出現(xiàn)錯誤。優(yōu)化的過程有起伏,使用者被告知針對目前的問題,上了一個新的版本,新版本的準確率由98%提升到99%,可在真正使用時,可能發(fā)現(xiàn)連續(xù)3份合同抽取錯誤了。這種情況下業(yè)務方很難接受,因為他們對AI算法本身不是太理解。作為產品經理,這是一個需要解決的問題。
對AI產品,大家總是期望主動表現(xiàn)出智能型,對于這種需求,UI設計和功能設計都是可以起到作用的。
對于功能性,有4點比較重要:

理想的結果是交付一個AI產品,可以不斷的優(yōu)化、迭代,越來越聰明,成為一個動態(tài)的AI系統(tǒng),而不是靜態(tài)的。
AI也重新定義了產品設計和開發(fā)流程。

圖的上面跟機器學習算法相關,識別問題、獲取數(shù)據(jù),進行模型訓練、模型管理。模型之間有不斷的版本迭代,我們要進行模型的部署,上線以后模型要去適應新數(shù)據(jù)的變化。
下面是站在開發(fā)角度,怎樣去進行需求建模、架構設計、軟件設計、怎樣對AI產品進行開發(fā)測試、上線以后的維護。
當系統(tǒng)上線后,用戶就是用來處理數(shù)據(jù)的,新的數(shù)據(jù)源源不斷,可能會出錯,系統(tǒng)會產生行為的異常,用戶看到錯誤時會跟系統(tǒng)進行人機交互,把自己的反饋提出來。
有時用戶有自己的專業(yè)知識、行業(yè)知識,把自己的行業(yè)知識傳授給AI系統(tǒng),讓它更加聰明。除了自我演化外,也通過接收外部信息的方式增強自己的智能。如果把這種視角加進來,可以讓AI產品站在宏觀角度把握各環(huán)節(jié),從而指導我們設計出更好的產品。
舉兩個例子展示,怎樣通過產品進行合同條款的抽取和進行規(guī)則審核。
共分為5步,前2步是預先做好的。根據(jù)客戶已有的歷史合同數(shù)據(jù)去訓練AI模型,讓AI模型識別不同類型的合同,就不同類型合同中的關鍵要素進行自動抽取,做好這2步后預置到產品平臺中去。
對使用者來說,是三步完成:上傳到合同文檔、機器進行自動關鍵詞提取、提取結果呈現(xiàn)。形成這樣一個關鍵信息抽取的報告,法務人員可以對報告一目了然。

前兩步也是預置到產品中,針對各個不同的合同類型,根據(jù)業(yè)務方設計合同審核項,對每個合同類型的風險點都配置好,機器模型可以自主的進行學習和訓練。
業(yè)務方上傳合同文檔,機器可以進行自動處理,并給出些建議。
審核結果中包含針對這個合同,有哪些是必改問題、有哪些是缺失條款、有哪些是建議優(yōu)化的,都可以滿足。

這是我們產品的全景圖,展示了AI的幾個不可缺失的關鍵要素,只有保證這幾個要素后,提供的產品時才能夠消除由AI算法帶來的不確定性。

客戶是不可能為不確定性買單的。如果交付了一個產品,客戶問準確率是多少,答“看數(shù)據(jù)情況吧”,客戶又問系統(tǒng)上線使用時撞戶率有多高,答“這個我也不清楚,需要新的線上數(shù)據(jù)判斷”,任何一個客戶都不會為不確定性的回答買單。
最后一部分,如何進行產品價值的評估。

針對上面的合同智能處理,我們了解到:
對不同的合同,原本通過人工閱讀的方式進行審核,處理時間基本是在小時級。引入智能合同審閱平臺以后,整個過程從待審閱合同、智能合同審閱到人工復查,從小時級變成分鐘級。

從價值來說:
合同評估對于AI產品有兩個層面:
算法層面的評估,更多的是面向AI算法和研發(fā)人員,比如:準確率、召回率、F1值。

機器翻譯、智能客服、多輪對話、搜索、推薦、文本抽取等在算法層面都有不同的指標,對業(yè)務方很難講明白準確率是多少,用戶很難把準確率和它的業(yè)務價值映射起來。
評價的維度也非常多,取決于業(yè)務方怎么看待這個產品以及通過這個產品達到什么目標。有時客戶的期望是通過AI的產品提升人員的工作效率、降低出錯。有的客戶使用AI的產品專注在創(chuàng)新。

不管做to C還是to B都是圍繞用戶進行服務的,有一個經典的模型叫“AARRR”:怎么獲取用戶、激活、留存、商業(yè)變現(xiàn)、用戶幫助評估。
在這個場景實現(xiàn)AI落地,針對這幾個不同的環(huán)節(jié),到底帶來哪些業(yè)務價值上的提升:是新的獲客數(shù)量增加了、轉化率提升了,還是某項產品的營業(yè)額收入增加了。
節(jié)省人力;創(chuàng)造新價值,這是我們希望AI產品能夠達到的理想目標。
以上是我想給大家分享的多年做AI產品設計和項目交付的經驗,謝謝大家!
作者:賈學鋒,達觀數(shù)據(jù)副總裁,負責AI解決方案及產品設計。
本文由 @賈學鋒 原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協(xié)議
熱門資訊
1. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
4. 一款免費無限制的AI視頻生成工具火了!國內無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
以下是一些免費的AI視頻制作網站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉換為視頻。 用戶可以使...
6. 零基礎10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
就能快速生成一幅極具藝術效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
8. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
9. 10個建筑AI工具,從設計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設計、建筑方案設計、住宅設計、管道設計、出渲染圖、3D掃...
10. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產效率、還能做什么AI...
最新文章
同學您好!