春節(jié)期間,DeepSeek無疑是最火爆的話題之一。在DeepSeek旗下大模型DeepSeek-R1“爆火”后,多個云平臺宣布上線DeepSeek旗下模型。
另外,近日OpenAI CEO奧爾特曼表示,該公司沒有計劃起訴DeepSeek。
北京時間2月4日凌晨,中國常駐聯(lián)合國代表傅聰在紐約聯(lián)合國總部舉行記者會,介紹中國本月輪值安理會主席期間的主要議程設(shè)置。當(dāng)被問到中國人工智能企業(yè)深度求索(DeepSeek)發(fā)布的模型以及中美人工智能合作問題時,傅聰強調(diào),“永遠不要低估中國科研人員的聰明才智。DeepSeek引發(fā)全球轟動和一些人的焦慮恐慌,說明技術(shù)遏制和技術(shù)限制無法奏效,這是全世界、特別是美國需要學(xué)習(xí)的一課”。
DeepSeek持續(xù)火爆多個云平臺上線相關(guān)模型
2月4日,火山引擎宣布,將支持V3、R1等不同尺寸的DeepSeek開源模型,可以通過在火山引擎機器學(xué)習(xí)平臺veMLP中部署和在火山方舟中調(diào)用模型兩種方式使用模型。
2月2日,騰訊云宣布騰訊云高性能應(yīng)用服務(wù)HAI支持DeepSeek-R1一鍵部署,2月4日又宣布騰訊云TI上架DeepSeek系列模型。
2月3日晚,百度智能云則宣布,百度智能云千帆平臺已正式上架DeepSeek-R1和DeepSeek-V3模型。
阿里云PAI Model Gallery目前也已經(jīng)支持DeepSeek-V3、DeepSeek-R1以及所有蒸餾小參數(shù)模型(DeepSeek-R1-Distill)的一鍵部署。
DeepSeek-R1是一款開源模型,也提供了API(接口)調(diào)用方式。據(jù) DeepSeek介紹,DeepSeek-R1后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù),在只有極少標注數(shù)據(jù)的情況下提升了模型推理能力,該模型性能對標OpenAl o1 正式版。DeepSeek-R1推出后,該模型熱度持續(xù)攀升。
在這背后,是云廠商們不愿在DeepSeek的火爆中缺席,賣起了自身的產(chǎn)品、服務(wù)以及算力。盡管DeepSeek-R1 是開源模型,但云廠商們在各自平臺提供的適配服務(wù),可以讓用戶更輕松地實現(xiàn)從訓(xùn)練到部署再到推理的全過程,簡化模型開發(fā)流程,“收攏”部分DeepSeek用戶的需求。
OpenAI奧爾特曼:DeepSeek令人印象深刻
2月4日,據(jù)參考消息援引德國之聲電臺網(wǎng)站2月3日報道,美國開放人工智能研究中心(OpenAI)首席執(zhí)行官奧爾特曼2月3日表示,該公司沒有計劃起訴中國AI初創(chuàng)公司杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(DeepSeek),“我們打算繼續(xù)打造出色的產(chǎn)品,并在模型能力方面引領(lǐng)世界,我認為這樣會很好。”
奧爾特曼稱:“DeepSeek是一個令人印象深刻的模型,但我們相信我們會繼續(xù)開拓前沿并推出出色的產(chǎn)品,所以很高興能有另一個競爭對手。”
他表示:“我們之前有過很多競爭對手,我認為繼續(xù)推進并保持引領(lǐng)地位符合每個人的利益。”
此前,OpenAI在1月29日表示,有證據(jù)表明DeepSeek使用OpenAI專有模型來訓(xùn)練自己的模型,并暗示這可能違反了OpenAI服務(wù)條款,但沒有進一步提出證據(jù)。
在1月27日的一次采訪中,奧爾特曼表示,DeepSeek的“這種性能并不新穎,我們早已具備這一水平的模型,今后將持續(xù)開發(fā)更先進的模型”。
當(dāng)?shù)貢r間1月31日,奧爾特曼在回答網(wǎng)友問題時坦言,DeepSeek讓OpenAI的領(lǐng)先優(yōu)勢將不會像前幾年那么大了,并稱個人認為在開源權(quán)重模型和研究成果的問題上,OpenAI已經(jīng)站在了歷史的錯誤一邊,需要制定不同的開源策略。
年薪百萬!DeepSeek“招兵買馬”
據(jù)媒體此前報道,目前DeepSeek約有150名員工,但正在迅速擴張。
某招聘平臺顯示,杭州深度求索人工智能(AI)基礎(chǔ)技術(shù)研究有限公司即DeepSeek(以下簡稱深度求索公司)發(fā)布了多個崗位的招聘信息。
根據(jù)公開信息,深度求索公司有52個在招職位,涵蓋深度學(xué)習(xí)研究員、核心系統(tǒng)研發(fā)工程師及資深UI設(shè)計師等,工作城市是北京或杭州。
薪酬方面,從正式員工崗位的招聘信息看,DeepSeek對員工薪酬采取“14薪”的模式,也就是每個自然年度發(fā)放14個月的薪水。在Deepseek掛出的職位中,大部分崗位的起薪在2萬元以上,不少年薪能夠達到百萬元級別。
其中,年薪最高的職位是“深度學(xué)習(xí)研究員-AGI”,月薪水平為8萬—11萬元,年薪最高可達154萬元。同時,深度學(xué)習(xí)研究員也是Deepseek唯一開放的實習(xí)職位。
此崗位要求顯示,需要精通機器學(xué)習(xí)(深度學(xué)習(xí)),具備創(chuàng)新研究能力;編程能力出色,熟練掌握至少兩種編程語言;有豐富的研究成果,在國際頂會或期刊發(fā)表相關(guān)論文;在領(lǐng)域內(nèi)知名比賽取得優(yōu)異成績者優(yōu)先。
此外,核心系統(tǒng)研發(fā)工程師(校招)的薪資范圍為6萬元至9萬元,按一年14薪估算后,可達最高126萬元的年薪。大模型全棧工程師的薪資范圍為5萬元至8萬元,可達最高112萬元的年薪。
而深度學(xué)習(xí)研發(fā)工程師、資深UI設(shè)計師(負責(zé)APP應(yīng)用程序的視覺層面的設(shè)計)等崗位的月薪范圍在3萬元至7萬元,年薪最高可達98萬元。
數(shù)據(jù)架構(gòu)工程師、全棧開發(fā)工程師、客戶端研發(fā)工程師的最高年薪分別達到91萬元、84萬元、56萬元。
值得一提的是,上述估算年薪均為稅前薪酬,而且崗位都面向應(yīng)屆生開放。部分崗位的招聘月薪,針對不同學(xué)歷的應(yīng)聘者會有差別,而且很多崗位校招薪酬更高。
除正式員工外,DeepSeek也正在招聘實習(xí)生,包括AGI大模型實習(xí)生和AGI實習(xí)生。
其中,AGI大模型實習(xí)生的工資為500元/天—990元/天,數(shù)據(jù)百曉生實習(xí)生為500元/天—510元/天。
來源:每日經(jīng)濟新聞、新華社、央視新聞、中國基金報