僅憑幾十個提示詞,就能生成一段流暢完整、視角多元的視頻,其內(nèi)容質(zhì)量幾乎能以假亂真,甚至不亞于專業(yè)拍攝團(tuán)隊,這就是OpenAI首款文生視頻產(chǎn)品Sora,一經(jīng)發(fā)布便激起千層浪,讓全球感受到新的AI震撼。 2024年的AI故事,伴隨著這款殺手級應(yīng)用的橫空出世拉開帷幕,Sora再度讓所有人注意到了AI的無限可能性,為略顯疲軟的市場再打了一針雞血。 回看2023年,AI產(chǎn)業(yè)迎來了空前發(fā)展,海內(nèi)外AI企業(yè)如雨后春筍,國內(nèi)更是迎來了聲勢浩大的“百模大戰(zhàn)”,通義千問、文心一言、智譜AI、盤古大模型.....卷多模態(tài)、卷算力、卷token,一時間百家爭鳴。 但一個核心的問題仍舊盤桓在所有人頭上:大模型產(chǎn)品到底如何實現(xiàn)商業(yè)落地?商業(yè)是技術(shù)發(fā)展的內(nèi)生動力之一,唯有業(yè)務(wù)飛輪轉(zhuǎn)動起來,才能讓企業(yè)們真正走向未來。 垂直大模型,走向落地 2023年的“百模大戰(zhàn)”到底為行業(yè)帶來了什么? 或許是一個清晰的商業(yè)認(rèn)知:垂直化,才是大模型走向落地的實際路徑。 “事實上AI大模型產(chǎn)業(yè)還處在一個很初級的階段,創(chuàng)造的內(nèi)容、解決的問題還相對比較初級。”初心資本合伙人李可佳向刺猬公社表示。 初心資本是國內(nèi)一家專注于人工智能、智能硬件、前沿科技及探索性投資的早期股權(quán)投資機構(gòu),對于AI產(chǎn)業(yè)有著較深的洞察。 李可佳用丹尼爾·卡尼曼《思考,快與慢》一書中的系統(tǒng)概念為我們解釋了目前大模型產(chǎn)業(yè)的發(fā)展階段: 丹尼爾·卡尼曼認(rèn)為,在人的大腦中有兩套系統(tǒng),系統(tǒng)1指的是快系統(tǒng),是一種涉及直覺的思維方式,用于快速決策。它做出決策的依據(jù)主要依賴于偏差、偏見和錯誤的啟發(fā)法,它是無意識且快速的;系統(tǒng)2則是一種慢系統(tǒng),它更為慢速和理性,負(fù)責(zé)對系統(tǒng)1進(jìn)行有意識的控制,特別是在涉及復(fù)雜問題的情形中,是否形成系統(tǒng)2也是區(qū)分人與動物的重要指標(biāo)。 “現(xiàn)在整個產(chǎn)業(yè)的發(fā)展仍處于系統(tǒng)1階段,在對創(chuàng)造力要求比較高的文科、藝術(shù)等領(lǐng)域,AI已經(jīng)有很好的表現(xiàn),它的泛化能力也非常強,但如果希望它能解決一些很實際復(fù)雜的技術(shù)問題、商業(yè)問題,我們?nèi)匀恍枰却?lsquo;系統(tǒng)2’的到來。” AI目前正處于互聯(lián)網(wǎng)的“雅虎時刻”,甚至還沒有發(fā)展到“谷歌崛起”。OpenAI Sora這樣的明星產(chǎn)品固然能讓人提振信心,但商業(yè)落地問題是全行業(yè)都要面對的問題: 目前人們已經(jīng)能與AI展開對話、通過AI生成文本、圖像、甚至高質(zhì)量的視頻,但問題在于,這些生成能力目前還處在較低水平,Sora還不夠多,當(dāng)幻覺與新鮮感散去,在C端難做突破的大模型們,該去哪里實現(xiàn)自己的價值? B端是較為實際的出路。 這也是李可佳口中的“系統(tǒng)2”發(fā)展方向,通過理性、高效的AI為商務(wù)、工業(yè)提供助力,從而深刻改變整個產(chǎn)業(yè),這也是大模型商業(yè)落地最實際的方向。但另一個事實是,通用大模型往往不能很高效快速地適配于企業(yè)的需要。 于是,大模型產(chǎn)業(yè)走向垂直化、細(xì)分化、專業(yè)化,已經(jīng)成為了未來最重要的趨勢之一。 無論是GPT還是其他基于Transformer架構(gòu)下的大模型產(chǎn)品,其生成反饋的原則都并非線性的邏輯思考,而是根據(jù)“學(xué)到的知識和規(guī)律”來進(jìn)行概率組合,這也是為何大模型學(xué)的越多越強悍的原因。 通用大模型的問題就是,它學(xué)習(xí)的主要是通用的、可公開的知識數(shù)據(jù),針對擁有信息壁壘的產(chǎn)業(yè)領(lǐng)域,通用大模型很難發(fā)揮作用。 這也是目前國內(nèi)外許多廠商在做的。在教育、政企服務(wù)、醫(yī)療等領(lǐng)域,許多大模型都開始了走向垂直化,包括網(wǎng)易的子曰教育大模型、專注政企客戶的雅意大模型、在金融、醫(yī)療等領(lǐng)域深耕的百川大模型等。 通過小而精的訓(xùn)練方法,不僅能夠突破大模型無法解決專業(yè)問題的阻礙,還能進(jìn)一步降低成本,讓大規(guī)模推廣成為可能。 “以前很多人都認(rèn)為,只要模型的規(guī)模夠大,過了多少億參數(shù),模型就能達(dá)到很強的能力,但其實其對于任務(wù)的理解能力還是比較淺顯的。” 在2023年底,雅意2.0大模型發(fā)布時,中科聞歌董事長王磊曾向刺猬公社表示,在他看來,垂直專業(yè)才是大模型發(fā)展的未來方向,雅意2.0大模型也同樣遵循了這樣一個方向,不再一味的追求規(guī)模與C端反饋,而是選擇摒棄娛樂向的內(nèi)容,將更多專業(yè)知識數(shù)據(jù)融入訓(xùn)練中,從而實現(xiàn)更好的政企服務(wù)。 那么有哪些產(chǎn)業(yè)能夠更快的實現(xiàn)“大模型化”呢? 李可佳認(rèn)為這主要看行業(yè)的容錯率與專業(yè)度。在智慧教育領(lǐng)域的多年深耕讓他認(rèn)識到,在容錯率相對較高、對專業(yè)精準(zhǔn)要求相對較低的領(lǐng)域,AI帶來的變革將更容易發(fā)生。“在拍搜、語言學(xué)習(xí)這些領(lǐng)域,大模型帶來的效率提升是非常顯著的。” 他認(rèn)為,醫(yī)療、金融等領(lǐng)域也正在產(chǎn)生變革,伴隨著大模型能力的不斷進(jìn)化,更多工業(yè)、科技領(lǐng)域的生產(chǎn)制造都會迎來一場AI改造。 AI Agent:突破AI需求困境 那么如何將大模型的能力更直接的運用到我們的生產(chǎn)過程中?AI Agent或許是一種更現(xiàn)實的路徑。 “可以這樣構(gòu)想一下,我還在做別的工作或是休息,在一個類似元宇宙的空間里,我的AI Agent(代理)與另外一位創(chuàng)業(yè)者的AI Agent相遇,它們聊的很開心,或許等我醒過來,我的AI Agent就拿著對方的商業(yè)計劃書來給我看了。” AI Agent在未來將成為人與AI大模型連接的工具,成為AI領(lǐng)域繼GPT、文心一言等大模型產(chǎn)品的下一個熱點,正在被越來越多人所認(rèn)同。 一位AI從業(yè)者向刺猬公社表示,AI Agent不僅僅會成為便利工作生活的工具,還能真正推動大模型從B端到C端的實際落地,推動AI產(chǎn)業(yè)的商業(yè)化成熟。 換言之,AI Agent是AI產(chǎn)品更成熟的形態(tài),它真正的使命就在于將AI能力封裝化,讓C端、B端用戶都能更便捷更直觀的運用,從而助力生產(chǎn)力的解放。如果說大模型產(chǎn)品只能被動的接收-生成,那么Agent的使命要復(fù)雜的多,它更類似智能助手,需要借助自身的AI能力幫助使用者解決切實問題。 “其實這是一種AI native的認(rèn)知。”李可佳表示,不同于很多企業(yè)+AI的思維,Agent事實上是一種AI+的邏輯。 “面對AI浪潮,我們不能只去想如何利用AI能力加持我們已有的業(yè)務(wù)形式。我就認(rèn)識很多創(chuàng)業(yè)者,希望通過大模型提升自己的Saas服務(wù)能力,比如做一個郵件營銷的生成式AI產(chǎn)品等等,但他們卻忽略了一點,以后有些SaaS類產(chǎn)品可能都直接autopilot了,這個產(chǎn)品對應(yīng)的環(huán)節(jié)可能都沒了。” Agent的意義就在于,它正在改變著人機協(xié)作的邏輯: 不僅僅是協(xié)助工作,AI就可以獨自幫助使用者完成任務(wù),它不需要事實的提示詞輸入,也不需要使用者一步步的繁雜操作,只需要一個指令,Agent就能幫你完成很多在過去時代無比復(fù)雜的工作,比如數(shù)據(jù)分析、廣告營銷投放、甚至是社交、銷售這樣主觀性很強的工作。 這幾乎是革命性的,在Agent日漸成熟的情況下,很多行業(yè)的許多環(huán)節(jié)都能夠被改寫,甚至取代。 GPTs就是OpenAI針對Agent概念推出的產(chǎn)品之一,定制化的GPT機器人、能夠滿足不同的使用需要、專注于不同的領(lǐng)域,GPTs的推出一度讓全球Agent企業(yè)大感危機。 目前來看,GPTs似乎還沒有達(dá)到Agent的程度,對于國內(nèi)外的許多AI 企業(yè)來說,機會仍然存在。 但Agent不是更智能的AI聊天機器人,其最主要的能力是主動調(diào)用AI工具,為使用者解決問題,想要實現(xiàn)這樣的能力,除了技術(shù)能力外,與Agent背后的大模型基底息息相關(guān),比如多模態(tài)的輸入輸出能力、幻覺問題、多輪交互的高效靠譜,都將影響Agent的表現(xiàn)。 更重要的是,Agent的應(yīng)用往往要與不同的產(chǎn)業(yè)領(lǐng)域、應(yīng)用場景相結(jié)合,這就與前面提到的垂直化趨勢深度相關(guān)。 現(xiàn)如今國內(nèi)也已經(jīng)出現(xiàn)了很多垂直領(lǐng)域的Agent產(chǎn)品,百度研發(fā)的營銷Agent輕舸、釘釘、飛書的AI辦公助理,這些企業(yè)從自身已有的產(chǎn)品和業(yè)務(wù)優(yōu)勢出發(fā),希望借助Agent創(chuàng)造新的產(chǎn)品邏輯,從而實現(xiàn)產(chǎn)品的二次成長。 以釘釘?shù)腁I Agent為例,其AI 助理可以與釘釘本身“融為一體”,根據(jù)用戶的指令,與平臺上的應(yīng)用和第三方插件、企業(yè)自建應(yīng)用等結(jié)合,對這些功能進(jìn)行調(diào)用。這樣一來,也讓釘釘龐大的插件和應(yīng)用庫變得簡單易用,用戶不再需要一個個找應(yīng)用,AI 助理就可以做到更符合用戶使用場景的匹配。 類似釘釘AI助理這樣的產(chǎn)品,正在解決大模型的“偽需求”困境,帶有強烈的“AI native”思維。當(dāng)更好用、更有效的Agent產(chǎn)品被用戶看見、使用,甚至解決工作生活中的種種痛點,大模型的商業(yè)落地難題也終將得到解決。 從娛樂需求,到更廣闊的世界 現(xiàn)如今整個產(chǎn)業(yè)到底還面臨著哪些問題? 最重要的仍是技術(shù)能力問題。“如果從創(chuàng)業(yè)的角度出發(fā)來看,或許你在進(jìn)行邏輯推演時,能夠獲得一個不錯的推算結(jié)果,但真正重要的還是能否讓用戶感受到‘神奇時刻’。”李可佳表示。 對于大模型產(chǎn)品來說,最重要的仍舊是通過技術(shù)解決用戶需求的能力,自ChatGPT橫空出世以來,無數(shù)人都認(rèn)為大模型產(chǎn)品將改變整個互聯(lián)網(wǎng)的生產(chǎn)邏輯,但未來的進(jìn)程似乎要遠(yuǎn)慢于我們的期望。 歸根結(jié)底,是大多數(shù)大模型產(chǎn)品的能力遠(yuǎn)沒有達(dá)到“神奇時刻”,簡單的多輪對話或許能為用戶帶來一刻的驚艷,但缺乏實際解決問題的能力。 “質(zhì)量信號沒有達(dá)到效果,還要看數(shù)量信號,也就是用戶的留存情況。”這也與產(chǎn)品的實用性相關(guān),GPT能夠在全球席卷上億用戶,除了出類拔萃的能力外,優(yōu)質(zhì)的交互體驗,不斷推出的多模態(tài)生成產(chǎn)品,都是關(guān)鍵因素。 有Sora這樣的殺手級應(yīng)用,OpenAI自然不會為用戶、商業(yè)化發(fā)愁,但對于其他玩家來說,除了在研發(fā)上下苦功外,垂直專業(yè)化、加強體驗、創(chuàng)建多元應(yīng)用場景就成為了重要的路徑。 除此之外,拋開大模型產(chǎn)品、Agent等固有思路,大模型還有許多新的機會。 作為早期投資市場的布局者,李可佳和所在的初心資本的投資邏輯可以概括為“兩橫三縱”,在這樣一個坐標(biāo)圖譜中,蘊含著初心觀察到的產(chǎn)業(yè)機會。 “兩橫分別是人才紅利和供應(yīng)鏈紅利,在過去十幾年中國移動互聯(lián)網(wǎng)的飛速發(fā)展之下,整個行業(yè)培養(yǎng)了大量的工程師、科研人員,在全球都有著不少的優(yōu)勢,另一方面,中國在制造業(yè)上擁有很強的優(yōu)勢,尤其是在3C硬件等領(lǐng)域,我們的制造業(yè)供應(yīng)鏈相當(dāng)完備。” 以這樣兩個紅利為基礎(chǔ),三縱則代表了幾個重要的技術(shù)變量,第一就是生成式AI,其余兩縱則為算力的性能躍遷和電動化到智能化的變遷。三縱與兩橫之間的許多交叉點則蘊含著新的機會,例如AI+硬件、AI+元宇宙、AI+XR等可能,都正被深切關(guān)注著。 在海外,Rabbit R1等AI Pin硬件令人關(guān)注,而在國內(nèi),榮耀、OPPO等廠商相繼推出AI產(chǎn)品、AI手機等,希望實現(xiàn)彎道超車;在XR領(lǐng)域,萬眾矚目的Vision Pro同樣與AI有著千絲萬縷的聯(lián)系,在AI大模型的支持下,新的世界圖景正在逐漸展開。 但最重要的仍舊是AI native思維。 “最讓我感覺興奮的是,在硅谷這些地方,我們接觸到了很多非常年輕的創(chuàng)業(yè)者,他們從不懷疑AI能否改變世界,他們的創(chuàng)業(yè)項目,都是基于AI時代已經(jīng)到來的前提下開展的。”李可佳向我們回憶,而這些AI native思維加持下的創(chuàng)業(yè)者,也讓他真正看到了未來的圖景。 “新的技術(shù)正在改變世界的每個角落,如果沉溺在舊世界里,很可能會被時代拋棄。” 本文來源:刺猬公社 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選