中國(guó)不僅有DeepSeek，阿里除夕夜拋出重磅新模型，是時(shí)候整體重估中國(guó)AI資產(chǎn)了嗎？

時(shí)間：2025-01-31 03:38:54 作者：147小編點(diǎn)擊：次

源自：華爾街見(jiàn)聞

源自：硬AI

當(dāng)阿里云展現(xiàn)出“強(qiáng)大模型+充足算力+完整云平臺(tái)”的組合優(yōu)良時(shí)，是不是印證了類似去年北美云計(jì)算服務(wù)商的投資規(guī)律？

農(nóng)歷除夕夜，在全世界華人喜迎新春之時(shí)，紐約證券交易所的電子屏上，阿里巴巴美股股價(jià)在收盤前顯現(xiàn)明顯異動(dòng)——從漲幅1%快速拉升至6.7%。

行情異動(dòng)的背面，是一場(chǎng)無(wú)硝煙的技術(shù)奇襲。

1月29日凌晨，阿里通義千問(wèn)團(tuán)隊(duì)悄然上線的大模型Qwen2.5-Max，在多個(gè)權(quán)威基準(zhǔn)測(cè)試中展現(xiàn)出與全世界頂級(jí)模型比肩的性能。

繼DeepSeek之后，Qwen2.5-Max的發(fā)布是中國(guó)AI陣營(yíng)在高性能、低成本技術(shù)路線上的又一重要突破。

市場(chǎng)人士分析叫作，此前過(guò)度聚焦DeepSeek，卻忽略了包含阿里通義在內(nèi)的中國(guó)AI整體性追趕。行業(yè)媒介《信息平權(quán)》暗示，若阿里Qwen-2.5-max這次的確性能超過(guò)V3，能夠對(duì)其RL推理模型給予更大期待。

進(jìn)一步，當(dāng)阿里云展現(xiàn)出“強(qiáng)大模型+充足算力+完整云平臺(tái)”的組合優(yōu)良時(shí)，是不是印證了類似去年北美云計(jì)算服務(wù)商的投資規(guī)律？倘若美股因AI整體增值10萬(wàn)億美元，中國(guó)AI資產(chǎn)的重估機(jī)會(huì)是不是已至？

全面對(duì)標(biāo)全世界頂級(jí)模型，百萬(wàn)token里程碑

Qwen2.5-Max采用超大規(guī)模MoE（混合專家）架構(gòu)，基于超過(guò)20萬(wàn)億token的預(yù)訓(xùn)練數(shù)據(jù)。

在測(cè)試大學(xué)水平知識(shí)的MMLU-Pro、評(píng)定編程能力的LiveCodeBench、綜合能力評(píng)定的LiveBench，以及近似人類偏好的Arena-Hard等多個(gè)權(quán)威評(píng)測(cè)中，該模型均展現(xiàn)出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩，乃至領(lǐng)先的性能。

阿里團(tuán)隊(duì)暗示，隨著后訓(xùn)練技術(shù)的持續(xù)進(jìn)步，下一個(gè)版本將有望達(dá)到更高水平。

Qwen2.5團(tuán)隊(duì)同步發(fā)布了兩個(gè)創(chuàng)新型號(hào)：Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。這些開(kāi)源模型支持高達(dá)100萬(wàn)token的上下文窗口，作為業(yè)內(nèi)首個(gè)達(dá)到此規(guī)模的公開(kāi)可用模型。

這些模型運(yùn)用稀疏重視力，只關(guān)注上下文中最重要的部分。這種辦法處理百萬(wàn)token輸入的速度比傳統(tǒng)辦法快3到7倍，輸出長(zhǎng)度達(dá)到8000個(gè)token。然而，這需要模型識(shí)別上下文文檔中的關(guān)鍵段落——這是當(dāng)前語(yǔ)言模型經(jīng)常難以完成的任務(wù)。

在測(cè)試中，14B型號(hào)和Qwen2.5-Turbo在查詢非常長(zhǎng)的文檔中的隱匿數(shù)字時(shí)都達(dá)到了完美的準(zhǔn)確性。較小的7B型號(hào)亦表現(xiàn)良好，僅有輕微的錯(cuò)誤。

在RULER、LV-Eval和LongbenchChat等需求更高的繁雜的上下文測(cè)試中，百萬(wàn)token模型的表現(xiàn)優(yōu)于128K token模型，尤其是在超過(guò)64K token的序列中，14B型號(hào)乃至在RULER中得分超過(guò)90分——這是Qwen系列的第1次——在多個(gè)數(shù)據(jù)集上連續(xù)擊敗gpt - 4o mini。

是時(shí)候整體重估中國(guó)AI資產(chǎn)了嗎？

倘若說(shuō)DeepSeek V3的橫空出世展現(xiàn)了中國(guó)AI的銳度，那樣這次阿里的突破則表現(xiàn)了產(chǎn)業(yè)生態(tài)的深度進(jìn)化。

在Qwen2.5-Max發(fā)布當(dāng)天，阿里云百煉平臺(tái)同步開(kāi)放了完整的工具鏈支持，研發(fā)者能夠直接在云端調(diào)用。這種“超算集群+開(kāi)源生態(tài)+云原生”的三位一體架構(gòu)，與北美AWS、Azure、GCP三大云服務(wù)商的商場(chǎng)模式形成鏡像。

另外，按照咱們之前說(shuō)到的摩根士丹利最新研報(bào)，低成本高性能模型亦將重塑數(shù)據(jù)中心和軟件行業(yè)格局：

針對(duì)中國(guó)數(shù)據(jù)中心而言，短期內(nèi)，倘若大型科技機(jī)構(gòu)采用類似技術(shù)路線，可能減少AI訓(xùn)練關(guān)聯(lián)需要。但從長(zhǎng)遠(yuǎn)來(lái)看，低成本模型將推動(dòng)推理需要增長(zhǎng)，對(duì)一線城市數(shù)據(jù)中心形成好處；針對(duì)中國(guó)軟件行業(yè)，AI模型成本的降低將降低應(yīng)用程序運(yùn)行AI功能的門檻，從供給側(cè)改善行業(yè)環(huán)境。

倘若阿里Qwen-2.5-max的性能確實(shí)展現(xiàn)出預(yù)期水平，加之其低成本優(yōu)良與完整云生態(tài)，或誘發(fā)DeepSeek之后的中國(guó)AI資產(chǎn)新一輪重估。返回外鏈論壇： http://www.fok120.com，查看更加多

免責(zé)聲明：部分文章信息來(lái)源于網(wǎng)絡(luò)以及網(wǎng)友投稿，本網(wǎng)站只負(fù)責(zé)對(duì)文章進(jìn)行整理、排版、編輯，是出于傳遞更多信息之目的，并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真

實(shí)性，如本站文章和轉(zhuǎn)稿涉及版權(quán)等問(wèn)題，請(qǐng)作者在及時(shí)聯(lián)系本站，我們會(huì)盡快刪除處理問(wèn)答，若不聯(lián)系則默認(rèn)允許本站轉(zhuǎn)載。

上一篇：原創(chuàng) 340萬(wàn)噸伊朗石油滯留中國(guó)港口六年，美國(guó)暗中動(dòng)作頻頻，中國(guó)怎么樣巧解僵局？

下一篇：女演員金晨春晚出狀況？最新回復(fù)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

亚洲免费人成在线视频观看,久久丫精品国产亚洲av,乱码午夜-极国产极内射,熟女俱乐部五十路二区av,无码少妇一区二区三区芒果,国产95在线 | 欧美,抽插丰满内射高潮视频,久久免费看少妇高潮v片特黄,日韩精品一区二区三区在线观看,色老汉免费网站免费视频

中國(guó)不僅有DeepSeek，阿里除夕夜拋出重磅新模型，是時(shí)候整體重估中國(guó)AI資產(chǎn)了嗎？

友情鏈接 / LINKS

中國(guó)不僅有DeepSeek，阿里除夕夜拋出重磅新模型，是時(shí)候整體重估中國(guó)AI資產(chǎn)了嗎？