雖然過去一年應接不暇的 AI 產品,已經不斷提高我們對新技術興奮的閾值,但這周的 AI 界依然瘋狂。 GPT-4o 讓 AI 與人類的對話水平像科幻電影一樣、Google 發(fā)布「AI 超級全家桶」、字節(jié)跳動豆包大模型祭出「白菜價」,「app 工廠」要以抖音的方式席卷 AI 市場。 上周,我們目睹了 AI 加速走向落地應用,也隱約窺見通用人工智能(AGI)的輪廓。 對于又一次占據先機的 OpenAI,則喜憂參半。首席科學家 Ilya Sutskever 的離職靴子落地,牽扯出 OpenAI 內部更大的矛盾!赋墝R」團隊的解散,離職協(xié)議的曝光,都說明去年的宮斗并沒有隨 Sam Altman 回歸而劇終。 Sam Altman 曾表示,從 OpenAI 成立到創(chuàng)造出 AGI,中間注定會有一連串瘋狂爆炸的事情發(fā)生,當中也被包括了對管理權的爭奪,而且未來也許還會有更多瘋狂爆炸的事情發(fā)生。 這一系列的爆炸性事件,或許只是 AGI 誕生前的插曲。 周一:零一萬物發(fā)布千億參數模型 Yi-Large ChatGPT 狂飆一年半,仍是無數 AI 企業(yè)的對標對象,沒有之一。 在成立一周年之際,零一萬物發(fā)布了全球 SOTA 千億參數閉源模型 Yi-Large,多項指標超越 GPT-4。并且,李開復還透露該公司下一代 Yi-XLarge MoE 模型訓練。 在開源領域,零一萬物將早先發(fā)布的 Yi-34B、Yi-9B、6B 中小尺寸開源模型版本升級為 Yi-1.5 系列,每個版本達到同尺寸中 SOTA 性能最佳。 零一萬物創(chuàng)始人李開復博士在發(fā)布會表示: 我覺得今天我們至少對齊 GPT-4,而且多項指標超過 GPT-4,這是絕對真實的事實,歡迎各位去各個不同的場景測試。 我們深深了解國外的大廠都在做更新的產品更新,包括 OpenAI 可能不久之后也會有發(fā)布,我們也不會認為今天并列世界第一已是終局,它其實只是一個開始。 周二:OpenAI 推出 GPT-4o,《她》來了 正當全世界 AI 模型還在「趕超 GPT-4」,OpenAI 從武器庫掏出了點真家伙——全新 AI 模型 GPT-4o。 后綴的「o」代表「omni」(即全面、全能的意思),這個模型同時具備文本、圖片、視頻和語音方面的能力,甚至就是 GPT-5 的一個未完成版。 新的 GPT-4o 模型打通任何文本、音頻和圖像的輸入,相互之間可以直接生成,無需中間轉換。 且 GPT-4o 語音延遲大幅降低,能在 232 毫秒內回應音頻輸入,平均為 320 毫秒,這與對話中人類的響應時間相似。GPT-4o 將向所有用戶開放,并且未來幾周內先向 ChatGPT Plus 推送。 如同電影《她》里的薩曼莎,它不只是產品,甚至比人類更懂人類,也更像人類自己 。在與 GPT-4o 的交流中,我們或許將逐漸忘記,它原來是一個 AI。 值得注意的是,在 GPT-4o 發(fā)布的當天,英偉達高級科學家 Jim Fan 發(fā)文表示: OpenAI 正在吃掉 Character AI 的午餐,形態(tài)重疊度幾乎達到 100%,并且有巨大的分發(fā)渠道。 這是向具有強烈個性的更情感化的 AI 轉變,這是 OpenAI 過去似乎一直在積極壓制的。 Google 的反擊 GPT-4o 前腳剛發(fā)布,后腳壓力便給到了晚一天召開的 Google I/O 大會。 頂著整個 AI 圈的冷嘲熱諷,Google 近兩個小時的暴力輸出頗有些要以量取勝的味道。 Project Astra 對轟 GPT-4o,打造通用 AI 助手;Veo 模型對標 Sora,支持生成 60 秒 1080p 規(guī)格視頻;Google Search AI 加強 AI 搜索概要功能;Imagen 3 創(chuàng)建逼真的畫像;Gemini 1.5 Pro 支持 2M 上下文窗口…… 老大哥 Google 在和 OpenAI 的同場競技中,整體的路數顯得有些局促謹慎。 例如,在實際的演示過程中,GPT-4o 是實時進行的,而 Project Astra 為了避免出錯僅僅放出錄制的視頻,生怕自家的股價重蹈覆轍,再次上演一夜閃崩。 又或者,同樣采用女聲,兩個語音助手在「性格」上也截然不同。 GPT-4o 加持下的 AI 語音助手主打的就是幽默風趣,力求做到比人更像人,仿佛電影《Her》里的薩曼莎走入現(xiàn)實。 而雷厲風行的 Project Astra 則更務實,專注于解決實際的任務,甚至在 Google 介紹 Astra 時,用到最頻繁的詞匯就是「助理」,這實際上也反映了兩家企業(yè)對于語音助手的不同定位。 如果產品的較量還只是潛藏于水面之下的激流,那么 OpenAI CEO Sam Altman 發(fā)布的推文則將「矛盾」擺在了明面上: 我盡量不去想太多競爭對手,但我卻無法停止思考 OpenAI 和 Google 之間的審美差異 Altman 言語之間按捺不住的得意也引起了 Google DeepMind 內部研究工程師的反嗆: 我盡量不去想太多關于競爭對手的事情,但有趣的是,你所有的發(fā)布都與我們保持同步。 其言外之意正是暗諷 OpenAI 定點狙擊 Google 新品發(fā)布的「綠茶」行為。 實際上,面對 OpenAI 的挑釁,Google CEO 皮查伊在發(fā)布會召開前的態(tài)度就已經展露無疑: 我們是搜索領域的先行者,也是電子郵件或瀏覽器的開創(chuàng)者。我相信,我們仍處于人工智能發(fā)展的初期階段。 翻譯過來就是,流水不爭先,爭的是滔滔不絕。OpenAI 在這場 AI 競賽中只是一時的領跑,而手握全球數十億用戶、擁有最廣泛消費場景的 Google 已經做好了長跑的準備。 OpenAI 首席科學家宣布離職 GPT-4o 的問世,不僅代表著 OpenAI 新生代的嶄露頭角,也觸發(fā)了新一輪人事地震。 不要再問 Ilya Sutskever 在哪兒了,因為剛為 GPT-4o 作出貢獻的他已經正式宣布從 OpenAI 離職。 不過,他口中所說的奔赴「下一個極具個人意義的項目」仍舊是個謎語。 連帶著 Ilya 親信 Leopold Aschenbrenner、超級對齊團隊負責人 Jan Leike 等人的相繼離職,AI 領域也將掀起新的波瀾。 遺憾的是,我們至今都不知道 Ilya 究竟「看到」了什么? 字節(jié)豆包大模型家族發(fā)布 「超級對齊」運動推行一個月后,大洋彼岸的字節(jié)跳動才剛剛開始小范圍邀請測試 AI 聊天機器人「豆包」。 就在超級對齊負責人 Jan Leike 宣布離職的當天,字節(jié)跳動火山引擎則正式宣布推出籌備許久的豆包大模型家族,涵蓋豆包通用模型 pro、通用模型 lite、角色扮演模型等九款模型。 并且,火山引擎直接化身「價格屠夫」,給大模型市場帶來了億點點震撼。 舉例來說,市面上同規(guī)格模型的定價一般為 0.12元/千 Tokens,而豆包通用模型 pro-32k 模型推理輸入價格僅為 0.0008 元/千Tokens,比行業(yè)價格低 99.3%。 字節(jié)跳動或許不是生成式 AI 領域技術上最領先的企業(yè),但作為移動互聯(lián)網最懂產品形態(tài)和交互方式的互聯(lián)網巨頭,親自下場 AI 大模型,其所掀起的波瀾注定舉足輕重。 而讓曾擔任 TikTok 產品技術負責人的朱文佳,來領軍字節(jié)跳動大模型,也足以窺見字節(jié)對 AI 產品的重視程度,以及野心。 迄今為止,字節(jié)已經推出了 11 款 AI 應用,其中豆包是字節(jié)跳動重點投入的大模型應用。在蘋果 App Store 和各大安卓應用市場,豆包 APP 的下載量在 AIGC 類應用中均排名第一。 C 端上的「捷報頻頻」也讓字節(jié)跳動得以抽出身來。 現(xiàn)在字節(jié)發(fā)起「卷上加卷」的價格戰(zhàn),顯然接下來是要在 B 端持續(xù)發(fā)力,無疑將進一步攪渾整個大模型競爭的市場格局。 周四:Stability AI 面臨資金危機,或考慮出售 人類的悲歡并不相通,有的企業(yè)剛剛亮相出場,春風得意;有的企業(yè)早已名聲在外,卻風雨飄揚。 據 The Information 報道,文生圖「扛把子」Stability AI 最近幾周至少與一些潛在買家展開了關于出售的討論。 報道稱,Stability AI 在 2024 年第一季度的營收不到 500 美元,虧損超過 3000 萬美元,并且還拖欠云計算供應商和其他公司近 1 億美元的賬單。 前不久,Stability AI 宣布宣布公司 CEO Emad Mostaque辭職。不過網友似乎更關心的是,說好開源的 Stable Diffusion 3 的事不會「泡湯」了吧。 那時,世界最大開源 AI 社區(qū) HuggingFace 的聯(lián)合創(chuàng)始人 Clément Delangue 半開玩笑地說:要不我們把 Stability 買下來,順帶把 Stable Diffusion 3 給開源了? 周五:世界最大開源 AI 社區(qū)免費提供 1000 萬美元共享 GPU 在這場 AI 浪潮中,總有一些企業(yè)在變革的浪潮中掙扎求存,而另一些也可以依靠社區(qū)的力量互助共進。 為了幫助開發(fā)者在 AI 創(chuàng)新更進一步,Hugging Face 日前宣布提供 1000 萬美元的免費共享 GPU 資源。 具體來說,該公司的目標是通過推出一項「ZeroGPU」的新計劃,將這些共享 GPU 捐贈給社區(qū),目的是幫助中小型初創(chuàng)企業(yè)對抗大型 AI 公司,避免 AI 進步陷入「集中化」。 Clément Delangue 在接受 The Verge 采訪時提到,公司之所以能夠做出這樣的投資,是因為 Hugging Face「已經實現(xiàn)了盈利,或正處于盈利的邊緣」。 星動紀元推出機器人手 XHand 在科技行業(yè),穩(wěn)健的財務狀況才能走得更遠。 僅用半年時間完成億元天使輪融資的星動紀元也為技術上的創(chuàng)新打下了基礎。本周五,這家國產人形機器人公司發(fā)布了一個名為 XHand 的機器人手。 據介紹,新發(fā)布的 XHand 擁有 12 個主動自由度,比特斯拉機器人 Optimus 手還多一個。 同時,其靈活程度也十分驚人,可以像人類一樣溫柔地撫摸貓咪、精確地操作剪刀、輕松拿捏雞蛋以及執(zhí)行各種復雜的任務,原速演示流暢程度堪比人類。 而在本周,宇樹科技也正式發(fā)布 Unitree G1 人形機器人,售價 9.9 萬元起。在官方發(fā)布的展示視頻中,Unitree G1 不僅能做「鯉魚打挺」,還能耍金箍棒、縮骨、砸核桃、顛勺、焊接。 瞧瞧這揮棒的靈活,力道十足的揮擊,真·一個打十個談及距離設想中的通用機器人還有多遠時,宇樹科技創(chuàng)始人兼 CEO 王興興表示: 目前大家在做的事情很簡單,就是把 AI 技術拿過來給機器人用。但我覺得目前 AI 跟機器人結合的技術臨界點還沒到,可能整個技術方案還沒跑通。 周六:Ilya 離職內幕曝光 正當你以為這瘋狂的一周要過去時,OpenAI 的「宮斗大戲」突然開啟第二季。 OpenAI 「超級對齊」團隊的負責人 Jan Leike 在離職后,沒有像 Ilya 那樣留下看似友好的告別,而是連發(fā) 13 條小作文自述在內部遭遇的打壓,包括被砍掉計算資源, Jan Leike 表示: 放棄這份工作是我人生中最艱難的決定之一,因為我們必須盡快找到方法來引導和控制那些遠比我們智能的 AI 系統(tǒng)。 與此同時,OpenAI 的離職協(xié)議也被媒體 Vox 曝光,協(xié)議禁止他們終生批評他們的前雇主,甚至承認 NDA 的存在也是違反協(xié)議的。 如果離職員工拒絕簽署文件,或違反文件,他們可能會失去在公司期間獲得的所有歸屬權益,這可能價值數百萬美元,報道中一位不愿透露姓名的公司內部人士表示: 這是一個信任一點一點崩潰的過程,就像多米諾骨牌一張一張倒下。 眼看事情要失控,Sam Altman 緊急發(fā)文回應。包括圖靈獎得主 Yann LeCun 也加入了這場關于人類命運安全的大論戰(zhàn)。這些回應在今天凌晨也已經發(fā)布。 Altman 在回應中承認了離職協(xié)議中確實包含股權取消的條款,但實際上從未收回過股權,自己此前也并不知情,同時表示可以為前員工修正這些離職協(xié)議。 這場宮斗似乎還沒劃上句號 每天來自四面八方的 AI 新聞如同密集的鼓點,都在持續(xù)不斷地敲打我們的神經。 而這一周,尤為特別。 一系列落地產品的推出傳達了最樸素卻深刻的道理——應用為王,落地為本。 在技術的狂潮中,那些能夠真正解決現(xiàn)實問題、服務于人類生活的應用,才是檢驗 AI 價值的最終標準,也讓我們的思維在這場狂轟濫炸的洗禮中逐漸變得清晰。 瘋狂還沒結束,下周的微軟 Build 開發(fā)者大會,下個月的蘋果 WWDC,還會帶來更多驚嘆,我們或許正在見證又一個科技史的轉折點。 文章來源:APPSO
|
原創(chuàng)欄目
IT百科
網友評論
聚超值•精選