国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 科技  > 網絡

DeepSeek昨天開源的新模型 有點邪門

來源: 責編: 時間:2025-10-22 13:25:10 46觀看
導讀 DeepSeek 又整出新東西來了,只用到原本十分之一 token,就能存下幾乎一樣的文字信息,這壓縮比,香農看了都要流淚,馮·諾伊曼看了都要沉默。更是直接把一堆老外給釣成了翹嘴。昨天,DeepSeek 發布了新模型 Dee

DeepSeek 又整出新東西來了,只用到原本十分之一 token,就能存下幾乎一樣的文字信息,這壓縮比,香農看了都要流淚,馮·諾伊曼看了都要沉默。zbw28資訊網——每日最新資訊28at.com

更是直接把一堆老外給釣成了翹嘴。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

昨天,DeepSeek 發布了新模型 DeepSeek-OCR,OCR 這東西咱們都熟悉,就是把圖片里的文字給識別出來。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

經常用微信的差友應該知道,微信客戶端里的圖片,被咱們點開后,是可以直接復制文字的。zbw28資訊網——每日最新資訊28at.com

沒錯,這就是一種 OCR 技術的應用。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

但是 DeepSeek 這次的 「技能 OCR」則是剛好相反,它可以把大量文字變成一張圖片,作為 AI 的“記憶載體”。zbw28資訊網——每日最新資訊28at.com

是的,用文字來存儲信息,已經不夠滿足它了。zbw28資訊網——每日最新資訊28at.com

過去的大模型,不管是什么 ChatGPT、Gemini、Llama、Qwen、還是 DeepSeek 過去的自己,在讀取數據的用的都是一種方式:文字,也就是平時常說的 token。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

我們寫的 Prompt,會被轉換成一大堆的 token 給大模型,我們提供的參考資料,會被轉換成一大堆的 token 給大模型,就算是能識別圖像的多模態的大模型,也是要先把圖片轉換成了一段文字描述,來交給大模型來做辨認才行。zbw28資訊網——每日最新資訊28at.com

但文字 token 真的就是大模型理解世界的唯一方式么?zbw28資訊網——每日最新資訊28at.com

DeepSeek 決定試一試新的路子,畢竟,如果咱們把一張圖片和一段文字放在一起,前者明顯可以包含下更多的信息。zbw28資訊網——每日最新資訊28at.com

比如這個描述,就不夠全面zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

既然如此,那我們能不能直接用圖片來訓練大模型?zbw28資訊網——每日最新資訊28at.com

于是 DeepSeek 就開始整,結果發現這個用圖片訓練出來的模型,既中看,又中用。zbw28資訊網——每日最新資訊28at.com

一方面,它可以用更少的 token,來記住更多的內容。zbw28資訊網——每日最新資訊28at.com

在測試文檔理解能力的任務里,DeepSeek-OCR 只用了 100 個視覺 token, 就超過了需要 256 個 token 的 GOT-OCR 2.0。zbw28資訊網——每日最新資訊28at.com

再放狠點,它用 不到 800 個視覺 token, 就吊打了平均要 6000+ token 的 MinerU 2.0。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

這就意味著、當我們讓大模型開始使用圖像的這種方式來記住數據了之后,模型就有能力用更少的token資源,來取得更好的表達效果。zbw28資訊網——每日最新資訊28at.com

另外,DeepSeek-OCR 還支持多種分辨率和壓縮模式,來適應不同復雜度的文檔:zbw28資訊網——每日最新資訊28at.com

比如說一張只有圖片背景和標題文案的 PPT,可能只需要 64 個 視覺token 就足夠表示了。zbw28資訊網——每日最新資訊28at.com

如果這頁的文字內容比較多,那就會自動切換到 Large 模式,用上多 400 個 視覺token 來記錄。zbw28資訊網——每日最新資訊28at.com

如果覺得還不夠的話,DeepSeek-OCR 還能支持動態調整的 Gundam 模式來記憶圖片,主打一個應記就記,分清輕重緩急的記。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

而且比起過去只能識別文字的傳統模型來說,DeepSeek-OCR 能記住的數據還會更多。zbw28資訊網——每日最新資訊28at.com

論文里的一張柱狀體,DeepSeek-OCR 能夠自動把它給識別成 Excel 格式給保存下來。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

文章里出現的有機化合物的分子結構圖片,也能自動轉化為標準的 SMILES(簡化分子線性輸入規范)格式存儲。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

不但能記住圖片本身,DeepSeek-OCR 還會同時記住這張圖片的位置,記住圖片附近的文字在寫些什么東西。。。zbw28資訊網——每日最新資訊28at.com

過去很多看不到的二維信息,都會被 DeepSeek-OCR 給再次捕獲。zbw28資訊網——每日最新資訊28at.com

這玩意的價值有多大,可能大家一下都還沒意識到。zbw28資訊網——每日最新資訊28at.com

這兩年做大模型,除了顯卡不夠之外的大問題,就是沒有訓練的數據了。zbw28資訊網——每日最新資訊28at.com

常規的數據集之前都用過了,想要再搞點高質量的數據集,要么偷偷去網上爬,要么花大價錢去買,再要么就是想辦法自己合成。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

但現在,很多過去沒采集到的數據,就可以在二維信息里被采集到了。zbw28資訊網——每日最新資訊28at.com

就比如說很多論文文件,過去,大模型只能學到里面的文字信息,但是里面的各種圖表,插圖那都是兩眼一摸黑。zbw28資訊網——每日最新資訊28at.com

但用上了 DeepSeek-OCR 之后,就可以把之前缺的這部分給無痛補上了。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

實際上 DeepSeek 也是這么想的,在論文里還特意提了一嘴,說這個新模型在一張 A100 上,一天可以給大模型采集出 20 萬頁以上的訓練數據。zbw28資訊網——每日最新資訊28at.com

所以說,在有了 DeepSeek-OCR 之后,過去的所有數據都值得用它來再識別一遍。zbw28資訊網——每日最新資訊28at.com

毫無疑問,這些數據,又會成為下一個大模型的養料。zbw28資訊網——每日最新資訊28at.com

另一方面,用二維的方式來存儲數據后,整個模型運行起來也變得更省資源了。zbw28資訊網——每日最新資訊28at.com

咱都知道,我們在用大模型的時候,聊天聊的越久、上下文越長,這個模型就越容易出 bug。zbw28資訊網——每日最新資訊28at.com

這是因為大模型在運行的時候,要處理每一個單詞,和其他所有單詞的關系。zbw28資訊網——每日最新資訊28at.com

你把對話的長度增加一倍,整個模型的計算量就增加了四倍,增加了兩倍,那整個模型的計算量就變成了原本的九倍。zbw28資訊網——每日最新資訊28at.com

這也是為啥現在大模型廠商都在給你限制上下文長度的原因之一,你要是在一個對話里聊的太嗨了的話,成本要直接卷上天去了。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

而在用上了圖像記憶之后,DeepSeek 可以把 token 的數量,壓縮到原本的十分之一。。。zbw28資訊網——每日最新資訊28at.com

同時,還不會讓性能有太大的損失。zbw28資訊網——每日最新資訊28at.com

在論文里可以看到,初出茅廬的 DeepSeek-OCR,就能用原本 1/10 的token 數量,達到原模型 96.5%的準確率。zbw28資訊網——每日最新資訊28at.com

即使哥們再狠點,給它壓縮個20倍,模型的準確率,也還能保持個六成左右。。。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

同時,DeepSeek 的研究人員還發現了一件好玩的事情。zbw28資訊網——每日最新資訊28at.com

他們會感覺大模型通過不同的清晰度來存儲圖像的方式,其實和我們人類遺忘信息的方式很像。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

對我們人類來說,遺忘是一個循序漸進的過程。zbw28資訊網——每日最新資訊28at.com

剛發生的事情,就有點像是 DeepSeek 用 Gundam 模式存下來的數據,清晰。zbw28資訊網——每日最新資訊28at.com

而隨著時間的推移,這件事的重要性也會逐漸降低,存儲它的格式也會從大的 Gundam 一路降級,從 Large 一路降到小的 Tiny,占用的 token 數量也會越來越少。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

把這個概念引入到大模型里的話,咱們就可以把近的聊天記錄,用“4K HDR藍光” 的格式來存儲,而那些早年不太重要的聊天記錄,則是給壓縮成 480P 的文件保存。zbw28資訊網——每日最新資訊28at.com

通過這種主動遺忘的方式,是否能讓大模型的上下文能力變得更強呢?zbw28資訊網——每日最新資訊28at.com

這個想法很有意思,只不過目前就連 DeepSeek 自己也沒能給出一個明確的答案。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

不過好在 DeepSeek-OCR 還是和過去一樣開源的,相信這個問題,要不了多久就會變成熱門,整出不少新東西來。zbw28資訊網——每日最新資訊28at.com

后,提到開源,我還注意到另外一件事。。。zbw28資訊網——每日最新資訊28at.com

這次研究不但是 DeepSeek 自己的成果,也是開源社區集體的勝利zbw28資訊網——每日最新資訊28at.com

比如訓練數據里,用到了 華為的 Wukong 數據集,在生成樣本文字時,借助了 百度的 PaddleOCR,而在圖像特征提取部分,核心組件竟然是 Meta 開源的 SAM,在視覺語義理解層面,還整合了 OpenAI 的 CLIP 模型。zbw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門zbw28資訊網——每日最新資訊28at.com

正是這些來自全球的開源成果,被 DeepSeek 重新編織成了一個能“用圖片思考”的 AI。zbw28資訊網——每日最新資訊28at.com

所以,R2 什么時候會來呢。zbw28資訊網——每日最新資訊28at.com


文章出處:差評

本文鏈接:http://www.rrqrq.com/showinfo-17-184425-0.htmlDeepSeek昨天開源的新模型 有點邪門

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI也缺卡!僧多粥少 自曝內部搶卡搶到發瘋

下一篇: 又菜又愛玩的荷蘭人 在安世半導體上翻車了

標簽:
  • 熱門焦點
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
亚洲精品国产精品国自产观看| 免费人成在线不卡| 成人黄色a**站在线观看| 欧美亚洲另类激情小说| 蜜桃视频免费观看一区| 欧美日韩综合在线免费观看| 美女脱光内衣内裤视频久久影院| 欧美中文日韩| 久久国产尿小便嘘嘘| 欧美高清你懂得| 欧美a级片一区| 亚洲综合区在线| 欧美在线观看一区| proumb性欧美在线观看| 国产精品午夜电影| 国产乱人伦精品一区二区| 日本成人中文字幕| 国内外成人在线| 亚洲激情av| 日本aⅴ免费视频一区二区三区 | 亚洲成人久久影院| 美女精品在线| 成人精品视频一区二区三区 | 国产在线看一区| 久久久久久久久久久久久女国产乱| 国产精品igao视频网网址不卡日韩| 综合久久给合久久狠狠狠97色 | av成人免费在线观看| 一个色综合av| 日韩视频123| 国产视频不卡| 91麻豆精东视频| 五月激情综合色| 欧美精品一区在线| 久久久亚洲国产美女国产盗摄| 亚洲少妇在线| 91在线视频观看| 激情小说欧美图片| 亚洲一区二区三区四区五区午夜| 免费观看在线综合| 一区二区三区在线免费| 久久久久久久综合日本| 色婷婷精品大在线视频| 亚洲主播在线观看| 美女成人午夜| 亚洲精品字幕| 亚洲激情欧美| 久久婷婷亚洲| 伊人夜夜躁av伊人久久| 精品成人a区在线观看| 91精品视频网| 欧美日韩一区二区电影| 色8久久精品久久久久久蜜| 亚洲日本视频| 亚洲一区二区三区精品动漫| 国产精品对白刺激久久久| 91免费小视频| 亚洲激情图片qvod| 国产精品成人一区二区三区夜夜夜| 精品福利在线导航| 国产日韩精品一区二区浪潮av | 欧美人xxxx| 欧美xfplay| 一区二区三区免费看| 亚洲国产免费| 免费国产自线拍一欧美视频| 午夜一区二区三视频在线观看| 亚洲综合丁香| 欧美亚洲综合色| 欧美一二区视频| 久久久一区二区三区捆绑**| 国产欧美日韩一区二区三区| 国产精品美女久久久| 色婷婷国产精品综合在线观看| 91激情五月电影| 日韩欧美成人一区二区| 国产视频视频一区| 亚洲影院在线观看| 国产一区二区三区综合| 成人的网站免费观看| 亚洲免费高清| 国产福利一区二区三区视频在线| 大美女一区二区三区| 亚洲视频综合| 欧美日韩二区三区| 亚洲欧洲国产日韩| 久久电影网电视剧免费观看| 91麻豆.com| 久久欧美肥婆一二区| 久久综合九色综合97婷婷女人| 亚洲自拍与偷拍| 91丨porny丨首页| 精品国产乱码久久久久久久| 国产精品日产欧美久久久久| 日韩精品成人一区二区三区| 北岛玲一区二区三区四区 | 亚洲欧洲精品天堂一级 | 69av一区二区三区| 伊人婷婷欧美激情| 午夜国产一区| 欧美大黄免费观看| 欧美裸体一区二区三区| 亚洲精品少妇30p| 女人色偷偷aa久久天堂| 岛国精品一区二区| 在线观看成人免费视频| 亚洲国产日韩精品| 欧美色欧美亚洲另类七区| 欧美精品 日韩| 日本伊人色综合网| 亚洲国产一区在线| 久久久91精品国产一区二区三区| 精品福利在线导航| 高清不卡一区二区| 777色狠狠一区二区三区| 男人操女人的视频在线观看欧美| 国产日本精品| 亚洲成人在线观看视频| 中文一区在线| 亚洲在线视频免费观看| 天天操天天综合网| 久久网站免费| 韩日精品视频一区| 欧美美女一区二区在线观看| 蜜桃精品视频在线| www.爱久久.com| 欧美一卡二卡三卡四卡| 国产成人高清视频| 国产精品女人毛片| 国产午夜精品一区二区三区欧美 | 91亚洲大成网污www| 国产精品国产自产拍高清av | 久久网站热最新地址| 欧美连裤袜在线视频| 伊人性伊人情综合网| 欧美电视剧在线看免费| 欧美暴力喷水在线| 午夜久久电影网| 欧美高清激情brazzers| 91在线看国产| 亚洲午夜国产一区99re久久| 欧美在线观看一区| 91香蕉视频mp4| 亚洲二区在线视频| 日韩欧美精品三级| 亚洲人成网站在线观看播放| 毛片不卡一区二区| 日本一区二区三区电影| 美女被久久久| 欧美日韩系列| 国产在线国偷精品免费看| 中文字幕免费在线观看视频一区| 久久午夜电影| 欧美日韩综合久久| 欧美va在线播放| 欧美亚洲自偷自偷| 欧美1级日本1级| 国产精品一区一区| 91精品国产综合久久久久久久久久 | 国产一区二区三区免费在线观看| 国产精品高潮呻吟久久| 欧美日韩小视频| 欧美亚洲三区| 在线日韩欧美| 欧美成人一区二免费视频软件| 国产自产v一区二区三区c| 亚洲国产精品综合| 国产精品国产三级国产专区53| 高清久久久久久| 国产一区久久久| 男人操女人的视频在线观看欧美| 亚洲综合在线观看视频| 一区二区中文字幕在线| 久久先锋影音av| 日韩美女天天操| 欧美一区二区三区四区视频 | 麻豆一区二区在线| 日本伊人精品一区二区三区观看方式| 亚洲蜜桃精久久久久久久| 亚洲女人的天堂| 一区二区三区在线视频免费| 亚洲美女少妇撒尿| 亚洲国产精品久久人人爱| 欧美在线免费观看视频| 久久av一区二区三区| 久久午夜激情| 69堂精品视频| 久久精品视频免费| 亚洲特级片在线| 天天综合网天天综合色| 另类人妖一区二区av| 韩国三级中文字幕hd久久精品| 国产一区在线精品| 91在线观看污| 色综合久久88色综合天天免费| 欧美中文一区二区三区| 欧美mv和日韩mv国产网站| 欧美国产欧美亚州国产日韩mv天天看完整 | 欧美精品xxxxbbbb| 麻豆精品在线播放|