1 月 27 日消息,據 Information 網站,Facebook 母公司 Meta 成立了四個專門研究小組來研究量化巨頭幻方量化旗下的國產大模型 DeepSeek 的工作原理,并基于此來改進旗下大模型 Llama。

其中兩個小組正在試圖了解幻方量化如何降低訓練和運行 DeepSeek 的成本;第三個研究小組則正在研究幻方量化可能使用了哪些數據來訓練其模型;第四個小組正在考慮基于 DeepSeek 模型屬性重構 Meta 模型的新技術。
1 月 20 日,DeepSeek-R1 推理大模型正式發布。據官方介紹,DeepSeek-R1 在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。
注意到,今日 Deepseek 應用已登頂蘋果中國地區和美國地區應用商店免費 App 下載排行榜,在美區下載榜上超越了 ChatGPT。
本文鏈接:http://www.rrqrq.com/showinfo-45-10248-0.html消息稱 Meta 成立 4 個小組研究 DeepSeek,基于此來改進自家 Llama
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:[email protected]