一塊錢買得到什么? 在15日上午召開的 2024 季春季火山引擎 Force 原動力大會上,火山引擎總裁譚待給出了一個意料之外的答案。 一元錢就能買到豆包主力模型的 125 萬 tokens,大約 200 萬個漢字,相當于生成三本《三國演義》。 價格戰(zhàn)開卷!字節(jié)發(fā)布豆包大模型家族 大模型場景落地的關鍵挑戰(zhàn)在于模型效果、推理成本以及落地難度。 為了幫助企業(yè)解決好這些挑戰(zhàn),用更好的模型、更低的成本和更易落地的方案幫助企業(yè)做好 AI 轉型,火山引擎今天正式推出新一代的全棧 AI 服務。 好的技術一定是在大規(guī)模的運用,在大量調用的情況下不斷打磨才能形成的。 一年前,原名「云雀」的豆包大模型成為國內首批通過算法備案的大模型之一。 經過一年的迭代發(fā)展,現(xiàn)在豆包大模型目前日均處理 1200 億 tokens 文本,生成超過 3000 萬張圖片。 從今天開始,豆包大模型將正式通過火山引擎對外提供服務。 本次發(fā)布的模型家族包括豆包通用模型 pro、通用模型 lite、角色扮演模型、語音識別模型、語音合成模型、文生圖模型等九款模型。 其中豆包模型的最強「選手」豆包通用模型 pro,在理解生成邏輯和記憶等多個維度上都有非常出色的性能,支持 128K 上下文窗口,能夠幫助用戶快速理解耳環(huán)總結高難度的長文本內容。 在某些場景里,對于延時和成本敏感的客戶來說,豆包通用模型 lite 則是更好的選擇。 得益于角色扮演模型的加持,無論是扮演四川話的老師,還是推動劇本殺的故事演繹,現(xiàn)場的實際演示都顯得游刃有余。 語音是與 AI 交互過程中的重要一環(huán)。 語音識別模型和語音合成模型能夠準確識別用戶的內容、語種和語境,并且通過對音色、語氣和語調的學習,可以讓大模型表達出真實的感情,讓 AI 實現(xiàn)仿若真人般的交流。 大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本。 火山引擎今天直接化身「價格屠夫」,給大模型市場帶來了億點點震撼。 市面上同規(guī)格模型的定價一般為 0.12元/千 Tokens,而豆包通用模型 pro-32k 模型推理輸入價格僅為 0.0008 元/千Tokens,比行業(yè)價格低 99.3%。 又或者,豆包通用模型 pro-128k 模型的輸入價格為 0.005 元/千Tokens,比行業(yè)價格低 95.8%,真正做到了「從分到厘」的價格內卷。 另外,為了幫助企業(yè)更好地落地應用大模型,譚待也宣布推出火山方舟 2.0 平臺并發(fā)布三個大模型插件: *聯(lián)網插件:從全網的數據中搜索出相關的數據信息 *內容插件:提供豐富的視頻和圖文內容 *知識庫插件:支持專有數據的精調,從而盡可能降低 AI 幻覺 應用為本,落地才是王道 通過 AI 原生的開發(fā)平臺,我們有機會讓每一個人都成為 AI 應用的開發(fā)者。 在發(fā)布會現(xiàn)場,譚待擲地有聲地作出了如上判斷。作為新一代 AI 應用搭建平臺,無論用戶是否具有編程基礎,都可以在扣子上快速搭建基于模型的各類 bot。 并且,用戶還能將 bot 發(fā)布到各種社交平臺、通訊軟件或部署到網站等其他渠道。 發(fā)布會的開場演示了一位五年級小朋友的 AI bot,它通過利用在學校學到的語文知識,打造了一個充當英語外教的 AI bot。 即便是面對應用場景能力要求更高的企業(yè)環(huán)境,bot 也足以應付自如。 海底撈使用扣子模擬顧客對話演練,幫助客服小姐姐提高服務水平;超級猩猩使用扣子給用戶提供健身方案;招商銀行基于扣子搭建了推薦餐飲優(yōu)惠門店的掌上生活優(yōu)惠 bot…… 扣子創(chuàng)建的 bot 支持文字、圖片、語音、視頻、GUI 卡片等多種模態(tài)的混合交互,用戶甚至可以像和真人聊天一樣跟 bot 進行語音交流。 另外,火山引擎還正式發(fā)布了扣子專業(yè)版——根據企業(yè)需求,以扣子平臺為基礎做進一步的封裝,支持更多高級的特性。 在過往的十多年里,最懂移動互聯(lián)網時代的字節(jié)跳動似乎總能做一個產品火一個,悄然成為如今的龐然巨獸。 而本次發(fā)布會最讓人印象深刻的,莫過于字節(jié)跳動對于模型時代下的產品應用與開發(fā)的經驗分享。 產品和戰(zhàn)略副總裁朱駿表示,比起在服務器端跑的代碼,更重要的是要創(chuàng)造出合適的產品形態(tài)和自然的交互方式,以滿足用戶的實際需求,讓用戶真正愿意使用這些產品。 在發(fā)布會現(xiàn)場,朱駿透露了豆包名字的來由。 看似和 AI 扯不上太多關系的「豆包」實則在最初起名時,首先確定下來的通用原則便是簡單、好讀、好記。 與此同時,為了拉近產品與用戶之間的距離,他們內部也為豆包這類產品定義了三個產品設計原則:擬人化、離用戶近,嵌入用戶的使用環(huán)境、個性化。 在過去的一年里,字節(jié)跳動在大模型應用的形態(tài)上做了很多的探索,而他最大的感受是跟 AI 時代之前相比,做應用既有共性,也有很大的差別。 那共性是什么呢?人的本質的需求其實沒有變化。比方說想要快速的、方便的獲取信息的需求沒有變化,在工作當中要給自己提效…… 在他看來,以往做產品之所以相對簡單,是因為至少底下的技術是成熟的,是穩(wěn)定的,所以只要發(fā)揮同理心去想用戶的需求,但大模型時代卻又截然不同。 它新的難度就是不僅要考慮大模型此時此刻能干啥,可能更重要的是要去猜測 3 個月、 6 個月、兩年以后能夠實現(xiàn)什么樣的新的用戶場景。 所以這是一個新的挑戰(zhàn),也是要在動態(tài)的技術演進下,不斷的去預測下一個產品的 PMF。 以 AI 搜索引擎為例,朱駿透露在去年上半年評測搜索的任務,往往 10 道題錯 6 道,這意味著搜索這個應用場景是完全不成立,但隨著模型能力的進化,如今 AI 搜索至少能為用戶提供可用的服務。 這種從無到有,從可用到優(yōu)化的轉變,不僅僅是技術層面的突破,更是對用戶需求深刻洞察的成果。 根據麥肯錫的報告,到 2030 年,大模型推動的全球經濟增量預計將達到 49 萬億元人民幣,其中中國部分的經濟增量將達到 14 萬億人民幣。 龐大的經濟增量既包括大模型對現(xiàn)有工作效率的提升,也包括新技術所帶的新場景和新業(yè)態(tài)。 字節(jié)跳動的探索,是 AI 應用落地的一個縮影,更是整個行業(yè)需要思考的共同課題。而這也正是譚待反復強調的觀點,好的模型一定要讓每一個人,每一家企業(yè)都用起來。 文章來源:APPSO |
原創(chuàng)欄目
IT百科
網友評論
聚超值•精選