DeepSeek-R1蔓延速度之快,讓偉大的前輩ChatGPT都成了“老爺車”。 DeepSeek-R1憑借其特有的"認(rèn)知預(yù)判"架構(gòu),在2025年率先實(shí)現(xiàn)了生成質(zhì)量與推理速度的平衡,成為有史以來增速最快的大模型。 而且單代AI技術(shù)整體的“領(lǐng)先有效期”越來越短,對企業(yè)形成愈加頻繁地強(qiáng)烈沖擊。 在這種形勢下,一方面企業(yè)要持續(xù)跟蹤最新的技術(shù),另一方面同時(shí)還要保證自己AI應(yīng)用落地的效果——這已經(jīng)成為企業(yè)在AI上的巨大挑戰(zhàn)。 DeepSeek-R1強(qiáng),讓企業(yè)更焦慮 DeepSeek-R1比較容易產(chǎn)生“幻覺”,恰恰是源于其關(guān)鍵創(chuàng)新:正式回答前的深度思考。 這個(gè)類似于人類在回答復(fù)雜問題前,會(huì)先在腦海中梳理思路,內(nèi)容更有條理性和邏輯性。因其生成文字的能力足夠強(qiáng),邏輯足夠強(qiáng)大,這些幻想出來的“假話”往往還非常難分辨。 要么讓它負(fù)責(zé)前期思考,提供解決問題的框架;要么在完成資料搜集后,利用它強(qiáng)大的語言能力進(jìn)行內(nèi)容整合輸出。最終結(jié)合部分其他大模型的成果,實(shí)現(xiàn)總體效果的最佳化。 對需要產(chǎn)生商業(yè)價(jià)值的企業(yè)級生成式AI應(yīng)用來說,這完全不可接受。這就是生成式AI著名的“不可能三角”:準(zhǔn)確、性能、成本。 這三方面的綜合要求,最終轉(zhuǎn)化為了AI應(yīng)用搭建、知識儲(chǔ)備、模型訓(xùn)練與部署等環(huán)節(jié)中的復(fù)雜挑戰(zhàn)。即使那些已完成數(shù)字化轉(zhuǎn)型的企業(yè),也常在這些環(huán)節(jié)中偏離正軌,最終導(dǎo)致投入大量資金卻未能獲得預(yù)期效果。 “解藥”,藏在誰手里? 答案其實(shí)很明確,在云廠商手里。 今天凌晨,亞馬遜云科技宣布在Amazon Bedrock平臺(tái)上推出全托管、無服務(wù)器的DeepSeek-R1模型,是首個(gè)提供DeepSeek-R1作為全托管、正式商用模型的海外云廠商。所以,對于出海企業(yè)而言,DeepSeek on Bedrock是一個(gè)絕佳的選擇。 DeepSeek-R1作為Amazon Bedrock上首個(gè)完全托管的中國大模型,在今年1月底的部署版DeepSeek-R1上線之后就獲得了企業(yè)客戶的好評,數(shù)千用戶已經(jīng)Amazon Bedrock的自定義模型導(dǎo)入功能進(jìn)行了部署。 此次更新的完全托管版相比之前的部署版,能夠進(jìn)一步使用Amazon Bedrock上所有功能,包括模型蒸餾、安全防護(hù)、數(shù)據(jù)加密、模型評估以及開箱即用的工具。 亞馬遜云科技這一次的更新,從事實(shí)上證明了云計(jì)算廠商在AI大模型時(shí)代依舊具有明確的競爭優(yōu)勢: 1、更準(zhǔn)確——云端大模型商店,匯聚全球最領(lǐng)先的AI大模型,供企業(yè)快速調(diào)用;企業(yè)數(shù)據(jù)全面防護(hù),驅(qū)動(dòng)大模型訓(xùn)練和運(yùn)轉(zhuǎn); 2、更強(qiáng)性能——云原生架構(gòu)方便多種模型和海量Agent協(xié)作;大規(guī)模GPU計(jì)算基礎(chǔ)設(shè)施,隨時(shí)調(diào)用; 3、更低成本——減少企業(yè)自身使用大模型、蒸餾小模型的工作量;靈活調(diào)用的計(jì)算資源,可以從根本上減少計(jì)算花費(fèi)。 絕大多數(shù)企業(yè)無法擁有機(jī)器學(xué)習(xí)專家、數(shù)據(jù)科學(xué)家和語言模型專家,人才成本、人才累積都無法承受。 云計(jì)算廠商,則可以在人才和基礎(chǔ)設(shè)施方面進(jìn)行更積極的投入,更好、更快地挖掘技術(shù)潛力。同時(shí)還能積極推進(jìn)與全球多家最領(lǐng)先AI創(chuàng)業(yè)公司合作。生態(tài)化的合作方式,讓眾多客戶企業(yè)能夠享受到全球最領(lǐng)先的AI人才、AI創(chuàng)業(yè)公司的技術(shù)成果。 亞馬遜云科技通過與Anthropic、DeepSeek、Cohere等頭部AI創(chuàng)業(yè)公司深度合作,讓Amazon Bedrock上可選基礎(chǔ)大模型來到180多款,其中50款可以云原生部署,比如Claude3.7 Sonnet、DeepSeek-R1、Llama 3.3、Nova系列模型、Mistral Large等。 相比大模型的“有無問題”,云計(jì)算廠商還是有更進(jìn)幾步的思考: 一、多模型的選擇和部署 根據(jù)國際知名咨詢機(jī)構(gòu)Gartner的最新預(yù)測:因?yàn)閱我荒P蜔o法同時(shí)滿足企業(yè)的所有功能性和非功能性要求,所以到2027年,中國80%的企業(yè)將使用多模型生成式人工智能策略來實(shí)現(xiàn)多樣化的模型功能,來獲得成本效益。 但想要完成復(fù)雜的多模型部署與應(yīng)用協(xié)調(diào)并非易事,在打造專用模型的過程中,企業(yè)還很可能因?yàn)樽陨聿]有足夠龐大且高質(zhì)量的數(shù)據(jù)集來訓(xùn)練和優(yōu)化,導(dǎo)致效果不佳。最終出現(xiàn)落地進(jìn)程比不過技術(shù)快速迭代的速度,導(dǎo)致“技術(shù)落地即過時(shí)! Amazon Bedrock的多種大模型的同平臺(tái)、同Marketplace搭載,就為企業(yè)多模型組合使用創(chuàng)造了便利。企業(yè)完全可以根據(jù)自己的需求特點(diǎn),實(shí)現(xiàn)云上多模型策略:根據(jù)自己的具體場景需求,把多個(gè)大模型,按照“高級的高性能安全模型、中級的平衡型模型、Good-Enough便宜大碗好用模型”雇傭一組不同學(xué)歷和資歷的AI員工,兼顧場景、性能、準(zhǔn)確和成本。 例如亞馬遜云科技自己的Nova模型,就是典型的“便宜大碗安全好用型”,本身就涵蓋了多個(gè)版本,在各類基準(zhǔn)測試中表現(xiàn)持平來自于Google的Gemini 1.5 Flash,同時(shí)比后者還有更快的輸出速度和性價(jià)比,適用于企業(yè)客服、內(nèi)容生成、簡單數(shù)據(jù)分析、企業(yè)內(nèi)部自動(dòng)化等場景。就非常適合當(dāng)做“Good-Enough”模型,企業(yè)可以拿它與Claude 3.7 Sonnect、DeepSeek-R1這樣的強(qiáng)模型組合,形成高低搭配。 二、能落地、上生產(chǎn),才是好模型 企業(yè)客戶需要趁手的開發(fā)平臺(tái)、工具、功能,實(shí)現(xiàn)真正的從技術(shù)落地到上生產(chǎn)的老大難問題。 Amazon SageMaker AI,讓用戶可以在集成式開發(fā)環(huán)境高效地構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型。Amazon Bedrock自帶防護(hù)機(jī)制中的“自動(dòng)推理檢查”功能,則可以從根源上盡可能消除大模型運(yùn)行過程中的“幻覺”問題。 云計(jì)算結(jié)合大模型的解決方案,正在全面推動(dòng)云計(jì)算再次成為企業(yè)IT基礎(chǔ)設(shè)施的最佳選擇。 在知名咨詢機(jī)構(gòu)PWC的一份關(guān)于領(lǐng)先企業(yè)在云計(jì)算和AI領(lǐng)域的投入調(diào)研中,有92%的行業(yè)領(lǐng)先企業(yè)都正在計(jì)劃增加自己的云預(yù)算,其中63%更是將云預(yù)算的增長提升了6%以上。 越來越多的企業(yè)正在通過AI驅(qū)動(dòng)的云架構(gòu)加速數(shù)據(jù)現(xiàn)代化,將IT能力與AI緊密結(jié)合,從而在行業(yè)中獲得領(lǐng)先地位。 亞馬遜云科技,企業(yè)AI時(shí)代的“僚機(jī)” 亞馬遜云科技CEO Matt Garman在一次采訪中明確指出AI時(shí)代云計(jì)算廠商的核心任務(wù)——持續(xù)走在企業(yè)前列,幫助客戶捕捉關(guān)鍵選擇。 他以兩個(gè)例子來說明這一觀點(diǎn):第一,為用戶提供最先進(jìn)的技術(shù)和產(chǎn)品,例如推理能力更強(qiáng)的DeepSeek-R1大模型;第二,打造有競爭力的AI計(jì)算基礎(chǔ),例如亞馬遜云科技專門為人工智能訓(xùn)練和推理設(shè)計(jì)的Tranium2人工智能芯片。 Garman特別強(qiáng)調(diào),云計(jì)算廠商并非像其他公司一樣急于推出聊天機(jī)器人,而是基于客戶需求,打造一個(gè)聚合平臺(tái),提供多種大模型和各環(huán)節(jié)工具,幫助客戶將新技術(shù)真正應(yīng)用于業(yè)務(wù),讓AI成為企業(yè)的關(guān)鍵競爭優(yōu)勢。 亞馬遜云科技的實(shí)踐與傳統(tǒng)云計(jì)算時(shí)代并無本質(zhì)不同——始終走在技術(shù)探索的前沿,在掌握新技術(shù)后,將成果反饋給客戶。 為了確保領(lǐng)先,亞馬遜還在不斷增加投入。根據(jù)第三方研究機(jī)構(gòu)的統(tǒng)計(jì),亞馬遜繼續(xù)在基礎(chǔ)設(shè)施的支出上領(lǐng)銜全球云廠商,2024年AI基礎(chǔ)設(shè)施投資更是推動(dòng)了資本支出的大幅增加。亞馬遜CEO Andy Jassy在此前的第四季度財(cái)報(bào)會(huì)上專門指出:亞馬遜第四季度263億美元資本支出的"絕大部分"用于亞馬遜云科技的AI投資。 "開放的多贏邏輯"、"保持技術(shù)實(shí)力的絕對優(yōu)勢"、"只盯著客戶的需求"——這是亞馬遜云科技在生成式AI時(shí)代走向新高度背后的邏輯。 本文來源:虎嗅 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選