深度求索新出的MoE大模型V2,這價(jià)格低得讓我懷疑人生
這年月,AI公司們都在拼誰(shuí)更會(huì)省銀子,深度求索直接亮出一張王牌:V2模型性能跟GPT-4有得一拼,可價(jià)格卻只要它的百分之一。這操作,簡(jiǎn)直就像在菜市場(chǎng)砍價(jià),老板一激動(dòng),直接給你來(lái)了個(gè)骨折優(yōu)惠。
性能強(qiáng)到離譜
V2那家伙參數(shù)高達(dá)2360億,結(jié)果活躍的才210億,這就像學(xué)霸考試時(shí)只使出了三成功力就秒殺了所有人。中文能力那叫一個(gè)杠杠的,直接跟GPT-4-Turbo和文心4.0一較高下AI模型,至于英文,那更是吊打當(dāng)前最火的開源模型。
練了8.1萬(wàn)億個(gè)token,結(jié)果算力才Llama 3 70B的五分之一。這就像你花五毛錢搞了個(gè)好萊塢大片級(jí)別的特效,讓隔壁Meta那幫人看了都得趕緊改PPT,連夜加班。
價(jià)格低到谷底
V2的API收費(fèi)版只要GPT-4的百分之一那么貴開源大模型新秀DeepSeek-V2發(fā)布,媲美GPT-4且價(jià)格僅百分之一,而且還能白嫖五百個(gè)token。這定價(jià),搞不好其他公司的銷售團(tuán)隊(duì)都開始琢磨改行賣紅薯去了。
有網(wǎng)友一算,一臺(tái)服務(wù)器每小時(shí)能賺個(gè)七成,這東西根本不是什么AI公司,簡(jiǎn)直就是個(gè)活脫脫的印鈔機(jī)附體。深度求索這幫家伙,估計(jì)是想用低價(jià)策略直接把競(jìng)爭(zhēng)對(duì)手干趴下,畢竟在科技圈里,“薄利多銷”這招還是挺管用的。
技術(shù)騷操作一堆
為了省點(diǎn)小錢,V2這小子搞了個(gè)低秩鍵值壓縮技術(shù),給數(shù)據(jù)來(lái)了個(gè)減肥大法。MoE架構(gòu)這東西也來(lái)個(gè)新把戲,16路并行訓(xùn)練搞出多線程的感覺(jué),通信成本還低得跟啥似的。
這東西簡(jiǎn)直逆天,居然能跟OpenAI的API無(wú)縫對(duì)接,用戶連代碼都省得動(dòng)一根指頭。這操作就像你去麥當(dāng)勞點(diǎn)了個(gè)漢堡,服務(wù)員直接給你端來(lái)一整份肯德基全家桶,還笑嘻嘻地說(shuō):“湊合吃,反正都一個(gè)味兒?!?/p>
開源界的攪局者
現(xiàn)在這開源模型圈兒,簡(jiǎn)直跟手機(jī)圈兒那小米年代似的:性能跟頂級(jí)旗艦杠上,價(jià)格直接殺到最低點(diǎn)。V2那中文資料庫(kù),比Llama 3豐富多了,質(zhì)量也是杠杠的AI模型,簡(jiǎn)直給老外開了個(gè)中文速成班。
這AI圈的內(nèi)卷速度,簡(jiǎn)直比網(wǎng)紅過(guò)氣還猛。今天個(gè)V2風(fēng)光無(wú)限,明兒個(gè)說(shuō)不定就被哪個(gè)車庫(kù)里的創(chuàng)業(yè)小公司給超越了。畢竟在這行,最厲害的模型永遠(yuǎn)是那個(gè)“下一款”。
商業(yè)邏輯被顛覆
老式的靠高價(jià)API撈金的玩法,現(xiàn)在讓V2給整了個(gè)大翻車。毛利率高達(dá)70%開源大模型新秀DeepSeek-V2發(fā)布,媲美GPT-4且價(jià)格僅百分之一,這數(shù)據(jù)說(shuō)明技術(shù)降價(jià)比漲價(jià)更能讓用戶掏腰包。其他廠商要么學(xué)學(xué)降價(jià),要么就只能拿“我們更安全”這種玄乎其玄的賣點(diǎn)來(lái)唬人。
這深度探索的招數(shù),跟用拼多多那套玩法打高端局似的。以后要是投資大佬問(wèn)“你們這跟GPT-4有啥不一樣”,創(chuàng)業(yè)小能手們估計(jì)都得齊聲答:“咱們這更實(shí)惠?!?/p>
這事挺棘手的:咱們公司要是打算搞個(gè)大模型API,是得選那個(gè)性能超群、價(jià)格卻讓人心疼的GPT-4,還是選那個(gè)價(jià)格親民、量又足的V2?這倆家伙,一個(gè)貴得要死,一個(gè)便宜得要命,真是讓人頭大。
還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...