首頁(yè) > 科技要聞 > 科技> 正文

OpenAI 突然發(fā)布 GPT-4o mini !更快更便宜,人人免費(fèi)可用,GPT-3.5 成為歷史

appso 整合編輯:吳利虹 發(fā)布于:2024-07-19 07:59

今天起,ChatGPT 正式進(jìn)入「4」時(shí)代。就在剛剛,OpenAI 官宣推出 GPT-3.5 Turbo 的替代品——GPT-4o mini,顧名思義,這是 GPT-4o 更小參數(shù)量的簡(jiǎn)化版本。即日起,ChatGPT 的免費(fèi)用戶、Plus 用戶和 Team 用戶都能夠使用 GPT-4o mini。下周,企業(yè)版客戶也將獲得使用 GPT-4o mini 的權(quán)限。OpenAI 官方表示,「這一變化符合我們讓所有用戶都能享受到 AI 技術(shù)好處的目標(biāo)!

主打低成本和快速響應(yīng)能力的 GPT-4o mini 適用于多種應(yīng)用場(chǎng)景。例如,它可以支持需要連續(xù)或同時(shí)調(diào)用多個(gè)模型的應(yīng)用程序(如同時(shí)調(diào)用多個(gè) API),能夠處理大量上下文信息(如完整的代碼庫(kù)或?qū)υ捰涗洠,以及通過(guò)快速實(shí)時(shí)的文本回復(fù)與客戶進(jìn)行互動(dòng)(如客戶服務(wù)聊天機(jī)器人)。具體來(lái)說(shuō),GPT-4o mini 目前在 API 中提供了文本和圖像處理功能,后續(xù)還將逐步增加對(duì)視頻和音頻的支持。該模型能夠處理多達(dá) 128K token 的長(zhǎng)上下文,知識(shí)庫(kù)截止日期為 2023 年 10 月份,并且對(duì)非英文內(nèi)容的支持更友好。

ChatGPT 截圖從 OpenAI 分享的基準(zhǔn)測(cè)試結(jié)果來(lái)看,GPT-4o mini 在推理基準(zhǔn)結(jié)果 MMLU 上得分為 82%,而 Gemini Flash 為 77.9%,此前主打極高性價(jià)比的 Claude Haiku 為 73.8%。GPT-4o mini 在數(shù)學(xué)推理和編程任務(wù)方面也同樣表現(xiàn)出色,遠(yuǎn)超市場(chǎng)上的其他小型模型。在 MGSM 數(shù)學(xué)推理能力基準(zhǔn)測(cè)試中,GPT-4o mini 得分達(dá)到了 87.0%,而 Gemini Flash 的得分為 75.5%,Claude Haiku 的得分為 71.7%。GPT-4o mini 在 HumanEval 基準(zhǔn)測(cè)試中同樣再次展現(xiàn)優(yōu)勢(shì),得分達(dá)到 87.2%,而 Gemini Flash 的得分為 71.5%,Claude Haiku 的得分為 75.9%。

而在多模態(tài)推理 MMMU 中,GPT-4o mini 也表現(xiàn)出色,得分為 59.4%,而 Gemini Flash 得分為 56.1%,Claude Haiku 得分為 50.2%。尤為顯眼的是,GPT-3.5 Turbo 在這些基準(zhǔn)測(cè)試中的得分均不如 GPT-4o mini,甚至可以說(shuō)被全面碾壓。此外,GPT-4o mini 在大模型盲測(cè)競(jìng)技場(chǎng) LMSYS 中的表現(xiàn)也要優(yōu)于 GPT-4T 01-25。除了性能上的增強(qiáng),GPT-4o mini 也化身價(jià)格屠夫,要給 API 市場(chǎng)帶來(lái)小小的震撼。@ArtificialAnlys 在 X 上發(fā)布了一些模型的價(jià)格對(duì)比,足以看出其價(jià)位水準(zhǔn):

OpenAI 表示,GPT-4o mini 現(xiàn)在可在 Assistant API、Chat Completions API 和 Batch API 中作為文本和視覺模型使用。GPT-4o mini 每100 萬(wàn)輸入 token 價(jià)格為 15 美分,每 100 萬(wàn)輸出 token 價(jià)格為 60 美分,比 GPT-3.5 Turbo 便宜超過(guò) 60%。也就是說(shuō),GPT-4o mini 生成一本 2500 頁(yè)的書,價(jià)格只需要 60 美分。對(duì)于 GPT-4o mini 的到來(lái),OpenAI CEO Sam Altman 在 X 平臺(tái)發(fā)文感慨:回顧 2022 年,當(dāng)時(shí)世界上最先進(jìn)的模型是 text-davinci-003。與現(xiàn)在的新模型相比,它的性能要差得多。而且,它的使用成本比現(xiàn)在的新模型高出 100 倍。

另外,考慮到模型的安全性問(wèn)題,OpenAI 還邀請(qǐng)了 70 多位來(lái)自社會(huì)心理學(xué)和錯(cuò)誤信息研究等領(lǐng)域的專家對(duì) GPT-4o 的潛在風(fēng)險(xiǎn)進(jìn)行了測(cè)試并根據(jù)反饋結(jié)果進(jìn)行改進(jìn)。同時(shí)基于這些經(jīng)驗(yàn),OpenAI 還采用一些新的技術(shù)來(lái)增強(qiáng)對(duì) GPT-4o mini 越獄攻擊等防御能力,使其在大規(guī)模應(yīng)用中更加安全,也更加穩(wěn)定可靠。今年以來(lái),國(guó)內(nèi)外掀起了新一輪大模型價(jià)格戰(zhàn),但沒想到的是,OpenAI 也用響應(yīng)速度更快、成本更低的 GPT-4o mini 模型加入了本就亂成一鍋粥的戰(zhàn)局。

Altman 更是將其形容為「towards intelligence too cheap to meter」。作為 GPT-3.5 Turbo 的免費(fèi)替代品,GPT-4o mini 在性能方面也沒落下,甚至也比同量級(jí)的 Claude 3 Haiku 和 Gemini 1.5 Flash 還要好。不少網(wǎng)友在體驗(yàn)過(guò)后也都給出了一致好評(píng)。值得一提的是,關(guān)于我們心心念念的 GPT-4o 語(yǔ)音模式,Altman 也透露將在本月晚些時(shí)候到來(lái)。

文章來(lái)源:APPSO

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
  • 漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢(shì)不可擋
    漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢(shì)不可擋

    作為美國(guó)百年家電品牌,HamiltonBeach漢美馳在美國(guó)市場(chǎng)處于行業(yè)領(lǐng)導(dǎo)地位,在本屆AWE展會(huì)上,漢美馳與太平洋網(wǎng)絡(luò)合作,展出了他們的三個(gè)主打品類:破壁機(jī)、慢燉鍋和空氣炸鍋,其中,破壁機(jī)屬于攪拌類小家電,漢美馳是這個(gè)品類的開創(chuàng)者;慢燉鍋是美國(guó)家庭的必需品,就像我們中國(guó)家庭的電飯煲一樣,漢美馳慢燉鍋累計(jì)在美國(guó)的銷量超過(guò)3000萬(wàn)臺(tái),是這個(gè)品類的領(lǐng)導(dǎo)品牌;漢美馳的這款HALO空氣炸鍋剛剛獲得了全球頂級(jí)設(shè)計(jì)大獎(jiǎng)——iF設(shè)計(jì)獎(jiǎng)。 今年,漢美馳在國(guó)內(nèi)市場(chǎng)的動(dòng)作很多,包括:推出了家電行業(yè)第一款應(yīng)用chatGPT的AI牛排機(jī),全球首發(fā)煙灶產(chǎn)品,全球首發(fā)中式廚電產(chǎn)品,自建抖音、淘寶直播間,與頭部主播烈兒寶貝等合作……這些經(jīng)營(yíng)動(dòng)作的背后,漢美馳有怎樣的戰(zhàn)略規(guī)劃?他們對(duì)中國(guó)市場(chǎng)有些什么樣的判斷?他們的優(yōu)勢(shì)有哪些?請(qǐng)看PConline獨(dú)家專訪漢美馳中國(guó)營(yíng)銷中心總經(jīng)理李梟雄先生。

    呼倫 呼倫 2023-05-05 00:03
  • 二維碼 回到頂部