“Oryon CPU 的開發(fā)進(jìn)度甚至超過了我們自己的預(yù)期。” 北京時(shí)間 10 月 25 日凌晨,高通驍龍技術(shù)峰會(huì)正式召開。不同于以往手機(jī)廠商們排隊(duì)搶首發(fā)的循規(guī)蹈矩,這次業(yè)界把焦點(diǎn)放在了高通專為 AI 打造的 PC 處理器驍龍 X Elite 上,一枚基于高通自研內(nèi)核“Oryon”的 CPU。 在介紹這枚芯片時(shí),高通 CEO 克里斯蒂亞諾·安蒙(Cristiano Amon)的喜悅之情也是溢于言表,蘋果的 M2 Max 和英特爾的 i9-13980HX 成為活動(dòng)現(xiàn)場(chǎng)的“對(duì)照組”,從單線程性能到峰值性能功耗,再到 GPU 算力和 AI 處理速度,安蒙試圖用數(shù)據(jù)證明驍龍 X Elite 是一款全方位領(lǐng)先的產(chǎn)品。 在移動(dòng)旗艦芯片方面,雖然全新驍龍 8Gen 3 被 X Elite 搶了風(fēng)頭,但憑借“首款專為生成式 AI 打造的移動(dòng)平臺(tái)”這一名頭,依舊在發(fā)布會(huì)上博得滿堂彩。 通過一場(chǎng)發(fā)布會(huì),高通搖身一變成為“終端 AI”的代表,成功讓人們忽視了英特爾才是最早主張 AI 端側(cè)計(jì)算的企業(yè)。 而就在高通技術(shù)峰會(huì)召開前的一天,10 月 24 日,路透社報(bào)道稱,英偉達(dá)和 AMD 正在開發(fā)能夠用于 Windows 系統(tǒng)的 PC 處理器。雖然還不清楚上述產(chǎn)品的研發(fā)進(jìn)展,但可以確定的是,兩家公司的 PC 處理器同驍龍 X Elite 一樣采用 ARM 架構(gòu)。 英特爾曾憑借 x86 架構(gòu)壟斷 PC 處理器市場(chǎng)三十余年,但眼下英特爾的行業(yè)霸主地位,似乎在一夜之間迎來變數(shù)。 高通的蛻變,有多徹底? 在發(fā)布會(huì)開始,安蒙介紹了在端側(cè)完成 AI 計(jì)算的必要性,基本還是那些老生常談的觀點(diǎn):低成本、低時(shí)延、安全性高。但令人驚喜的是,高通把移動(dòng)端平臺(tái)的生成式 AI 能力抬上了一個(gè)新的高度。 相較上代產(chǎn)品,驍龍 8Gen 3 的 CPU 性能提升了 30%,GPU 性能提升了 25%,NPU 性能提升 25%,目前驍龍 8Gen 3 已支持運(yùn)行 100 億參數(shù)的生成式 AI 模型。如果使用搭載 8Gen 3 平臺(tái)的智能手機(jī)運(yùn)行 Stable Diffusion,只需不到 1 秒就可以用文本生成圖像。 圖片來源:高通 如果只對(duì)比參數(shù),100 億模型參數(shù)要較 GPT 4 和 Llama2 等云端模型少了幾個(gè)數(shù)量級(jí),但對(duì)于手機(jī)廠商而言,這樣的硬件能力在現(xiàn)階段已基本夠用。 以小米為例,該公司在今年 4 月完成了大模型團(tuán)隊(duì)的搭建,8 月成功在端側(cè)跑通 13 億參數(shù)大模型,但目前還未正式進(jìn)入公測(cè)階段。以此推斷,在下一代驍龍移動(dòng)旗艦平臺(tái)發(fā)布之前,驍龍 8Gen 3 足以應(yīng)對(duì)手機(jī)端的訓(xùn)練需要。 另外,在發(fā)布會(huì)現(xiàn)場(chǎng),高通還拉出一票軟件公司站臺(tái),并表示驍龍平臺(tái)現(xiàn)已支持微軟、Meta、OpenAI、安卓、百度等公司的端側(cè)大模型。根據(jù)此前高通與 Meta 的合作計(jì)劃,最早在明年應(yīng)該就能看到 Llama 2 模型在驍龍平臺(tái)上運(yùn)行。 相較于多模態(tài)生成式 AI 能力,驍龍 8Gen 3 在其他方面則稍顯平庸,只能算是中規(guī)中矩的常規(guī)升級(jí),但眼下行業(yè)內(nèi)似乎也并不關(guān)心驍龍新的移動(dòng)平臺(tái),在游戲、影像等場(chǎng)景下有多少提升,全場(chǎng)的關(guān)注點(diǎn)都集中在驍龍 X Elite 上。 圖片來源:高通 高通方面表示,這個(gè)專為 AI 打造的驍龍 X Elite 其 AI 處理能力是競(jìng)品的 4.5 倍,異構(gòu) AI 引擎性能可達(dá) 75TOPS,支持在端側(cè)運(yùn)行超過 130 億個(gè)參數(shù)的生成式 AI 模型,當(dāng)使用基于 70 億參數(shù)的端側(cè)聊天助手時(shí),每秒可處理 30 個(gè) Token。 雖然發(fā)布會(huì)現(xiàn)場(chǎng)高通并沒有標(biāo)注這個(gè)“競(jìng)品”是哪款 CPU,但還是以數(shù)據(jù)的形式展示了下 Oryon 內(nèi)核的“基礎(chǔ)能力”:?jiǎn)尉程性能超過蘋果的 M2 Max 和英特爾的 i9-13980HX,峰值功耗比 M2 Max 少 30%,比 i9-13980HX 少 70%。而在多線程方面,高通還對(duì)比了英特爾的 i7-1355U,稱驍龍 X Elite 的性能可達(dá)其兩倍,且峰值功耗減少 68%。 圖片來源:高通 即便這種對(duì)比方式稍有“田忌賽馬”之嫌,但不得不說,作為 Oryon 內(nèi)核的首代商用產(chǎn)品,驍龍 X Elite 的表現(xiàn)遠(yuǎn)超過行業(yè)預(yù)期。 實(shí)際上,在 Oryon 項(xiàng)目上,高通某種意義上是沾了蘋果的光。 2021 年 3 月,高通收購了初創(chuàng)芯片設(shè)計(jì)公司 Nuvia,這家公司的主營業(yè)務(wù)就是打造高性能 ARM 架構(gòu)芯片,其創(chuàng)始人團(tuán)隊(duì)包括蘋果前 CPU 首席架構(gòu)師 Gerard Williams 以及曾參與蘋果 A7-A14 芯片研發(fā)的 John Bruno、Manu Gulati 等人。 在完成對(duì) Nuvia 收購后,高通在 Oryon 項(xiàng)目上進(jìn)展神速,并于去年驍龍技術(shù)峰會(huì)上宣布推出 Oryon 內(nèi)核。 值得一提的是,在高通 2022 年三季度財(cái)報(bào)發(fā)布后的電話會(huì)議上,安蒙曾表示過,“我們預(yù)計(jì),2024 年驍龍 Windows PC 將出現(xiàn)拐點(diǎn)。”但在當(dāng)時(shí),考慮到高通在 PC 市場(chǎng)少得可憐的占有率,這句話并沒有引起行業(yè)太多的關(guān)注。 三家分 Intel? 驍龍 X Elite 芯片的推出,讓高通在 PC 領(lǐng)域的野心暴露無遺。盡管這家公司一度憑借手機(jī)芯片成為全球最大的 Fabless 廠商,但在 PC 行業(yè),高通始終默默無名。 在 2018 年,高通曾在驍龍 855 芯片的基礎(chǔ)上,推出了面向 PC 端的驍龍 8cx 處理器,但性能十分羸弱,甚至不及當(dāng)時(shí) iPhone 上的 A12 芯片。以至于當(dāng)時(shí)有種觀點(diǎn)認(rèn)為,驍龍 8cx 存在的意義就是為了證明,ARM 架構(gòu)不適合作為電腦處理器,它注定只能是移動(dòng)端架構(gòu)。 此后,鮮有芯片廠商再進(jìn)行 ARM 架構(gòu)在 PC 上的嘗試。直到 2020 年,基于 ARM 架構(gòu)的蘋果 M1 芯片問世,人們才發(fā)現(xiàn) ARM 架構(gòu)在功耗大幅領(lǐng)先 x86 架構(gòu)處理器的同時(shí),性能同樣可以有不俗的表現(xiàn)。 反映在市場(chǎng)表現(xiàn)上,根據(jù) CouterPoint Research 的統(tǒng)計(jì)數(shù)據(jù),自 2020 年蘋果推出 M1 芯片后,截至 2022 年底,全球基于 ARM 架構(gòu)處理器的筆記本市場(chǎng)份額從 2% 迅速增長至 12% 以上,其中 90% 都是蘋果的產(chǎn)品。 需要說明的是,除了英特爾和 AMD 外,大部分廠商根本沒有 x86 架構(gòu)授權(quán),此前連進(jìn)入 PC 市場(chǎng)的資格都沒有,而蘋果憑借 ARM 架構(gòu)在 PC 市場(chǎng)上取得的成功,給許多芯片設(shè)計(jì)廠商打入了一針強(qiáng)心劑。 與此同時(shí),在“端側(cè) AI”概念興起的當(dāng)下,廠商們發(fā)現(xiàn) ARM 架構(gòu)芯片的另外一個(gè)優(yōu)勢(shì)非常適合端側(cè)大模型的場(chǎng)景——低功耗。 相較于云端大模型,端側(cè)大模型最大的意義在于可以在離線狀態(tài)下使用,而在日常應(yīng)用場(chǎng)景中,涉及到離線使用的基本都是筆記本電腦、平板電腦等便攜式設(shè)備,這類產(chǎn)品往往因?yàn)槔m(xù)航的需求對(duì) CPU 功耗有著很高的要求。 因此,過去被 x86 架構(gòu)“卡脖子”的芯片廠商們,現(xiàn)在都心照不宣的開始了對(duì) ARM 架構(gòu)的研發(fā)工作,試圖在“端側(cè) AI”時(shí)代從英特爾嘴里搶下一塊肉。 值得一提的是,過去被認(rèn)為和英特爾組成“Wintel 聯(lián)盟”的微軟,在“Arm on Windows”這件事上表現(xiàn)得甚至比芯片廠商還要積極。10 月 17 日,微軟宣布了一項(xiàng)名為“ARM 咨詢服務(wù)”的計(jì)劃,以幫助開發(fā)者開發(fā)基于 ARM 的應(yīng)用程序。 這其實(shí)也不難理解,雖然有著聯(lián)盟之名,但長久以來,微軟始終希望能夠擺脫單一合作方的束縛。 從上述背景來看,眼下開發(fā)基于 ARM 架構(gòu)的 PC 處理器,似乎占盡了天時(shí)、地利、人和。 不過,現(xiàn)在還遠(yuǎn)沒有到能危及英特爾的時(shí)候。一方面,英特爾代表的 x86 PC 處理器市場(chǎng)仍然有著絕對(duì)的領(lǐng)先優(yōu)勢(shì)。 另一方面,英特爾在端側(cè) AI 上的努力同樣不遑多讓,在前不久的 Intel On 大會(huì)上,英特爾宣布年底推出的代號(hào)為“Meteor Lake 的酷睿 Ultra 處理器,將全系集成神經(jīng)網(wǎng)絡(luò)處理單元(NPU),而且還準(zhǔn)備通過 OpenVINO 套件,幫助開發(fā)者進(jìn)行 AI 訓(xùn)練、測(cè)試,及模型優(yōu)化工作。 但無論如何,友商們通過 ARM 架構(gòu)來描述端側(cè) AI 的藍(lán)圖,對(duì)于英特爾來說絕對(duì)是個(gè)值得警醒的信號(hào)。 本文來源:虎嗅 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選