A. 爭光了!中國AI大模型全球排名第一
關注盧鬆鬆,會經常給你分享一些我的經驗和觀點。
首先,我們應該感謝OpenAI的額外措施。
前兩天OpenAI剛宣布說要封禁中國地區的API調用,第二天,全球著名開源平台Hugging Face(笑臉)發布了一個AI開源大模型排行榜單,直接宣告:中國AI大模型全球排名第一。
這下就有意思了,梳理整件事情,我也來談談我的看法。
從這份開源大模型排行榜可以看到,阿里通義千問大模型 Qwen2-72B 再次登頂,成為全球開源大模型排行榜的NO.1!排名第二是的臉書的llama3。而讓人震驚的是,阿里之前開源的Qwen1.5基礎和Chat版本也都上榜了。
也就是說,這份榜單的前10名中,阿里就佔了4個,這份榜單,直接讓中國的AI開源大模型揚眉吐氣。
肯定有人問了,為什麼沒有網路的大模型呢?因為網路的AI大模型不開源啊,人家也測不了,只能測開源的,所以最後的結論是阿里的AI大模型排第一。
值得一提的是,這次他們的評測流程也發生巨大變化: Hugging Face提出了更有挑戰性的V2榜單,基於未受污染、高質量數據集的新基準,運用可靠的度量標准。V2榜單涵蓋的一般任務包括:知識測試、短文本和長文本的理解推理、復雜的數學能力,以及與人類偏好高度相關的任務如指令遵循。榜單內的測試集,更難、更好、更快、更強對模型的考察也更有說服力。 因為之前的V1榜單,被過度使用,而且題目相對簡單,一些新近出現的模型出現數據污染跡象;所以老的評測方法不用了。
而且這次他們用了整整300塊英偉達H100顯卡,對全球100多個主流開源大模型都做了測試。也就是說,截止到目前,Hugging Face是全球最權威的開源模型榜單了。
英偉達H100顯卡,在日本大概21.6萬元一個(國內不讓賣),那300塊H100是多少錢?看來Hugging Face還挺有錢的,能搞到這么多資源。
同時Hugging Face的聯合創始人Clem還發了推特(現在叫X):阿里最新開源的通義千問Qwen2-72B指令微調版本衛冕冠軍,繼續位列全球開源模型排行榜第一名。
中國在全球開源大模型領域處於領導地位!!這條推特也印證了Hugging Face官方對阿里AI開源大模型是認可的。
Hugging Face自己本身也是一家開源模型庫網站平台,它是大模型時代的「github」,對於做AI的人來說,Hugging Face就是個寶藏庫,裡面超多好用的東西,所以他搞的開源模型排行榜很有公信力。 國內很多公司也是這樣模式,搞榜單,增強自己權威性。當年,某公司搞了個自媒體排行榜,在科技自媒體領域,盧鬆鬆也榮幸有了排名,然後就接到廣告了,可以說對雙方都有好處,其實我一直很感激它呢。
好了,上面有些揣測的意思,接下來我也談談我的看法:
(1)這份榜單的意義是什麼? 相當於給國內很多套殼AI工具的企業打了一針興奮劑,意思是就告訴諸位:除了OpenAI之外,我們自己的AI工具也可以用。
自從OpenAI屏蔽中國使用API介面後,中國那些大模型企業瞬間就興奮起來了,因為沒辦法用OpenAI做套殼應用了,但對國內AI大模型是利好消息。而這份榜單的推出,也是對OpenAI封禁最好的回應。
我們應該感謝OpenAI的封禁啊!
如果您對 通義千問Qwen2-72B 感興趣的,也想做個AI工具,這里可以下載: huggingface.co/Qwen/Qwe...
(2)目前中國的AI實力到底如何? 美國的AI因為有晶元、算力、人才等因素的影響,所以美國的AI更側重於底層架構。上層建築你隨便怎麼用,但地基必須是我的。
而中國的因為老美的出口管制,所以我們大部分的AI應用側重於「應用層面」,比如應用到醫療、港口、礦場等領域。當然我們普通人接觸最多少還是用AI寫文章、寫論文。比如鬆鬆最近就用AI智能體給客戶寫行業文章,也算是AI應用的一種吧。
而中國AI的格局已初步形成: 以AI開源為主的阿里,同時還不斷投資各種AI大模型,C端層面以通義系類、百煉平台為主。以閉源為主的網路,能力未知。C端層面以文心一言、蘿卜快跑為主。
兩家巨頭,阿里和網路走了兩條截然相反的路。
那目前中國的AI實力到底如何呢?我感覺目前還沒人說到清楚,有一點是可以肯定的,就靠用戶量和收入說話。在應用層面、盈利模式、用戶體量三個維度去判斷的。
寫作最後: 目前中國的AI實力還是可以的,只是很多人不認可,而這次的排行榜阿里用實力告訴大夥,中國AI技術並不比國外的差,甚至還遙遙領先。
現在AI開源大模型阿里已經的排名第一了,雖然OpenAI不讓你用,但相信在不久的將來,會有越來越的人使用阿里的通義千問Qwen2-72B。
希望阿里也能頂住壓力,砥礪前行,更上一層樓吧。
關注盧鬆鬆,一個在北京的互聯網創業者,歡迎大家關注一下!因為你關注的人,決定你看到的世界!