国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當(dāng)前位置:首頁(yè) > 元宇宙 > AI

大模型破譯甲骨文創(chuàng)下新 SOTA,復(fù)旦團(tuán)隊(duì)推出新框架

來(lái)源: 責(zé)編: 時(shí)間:2025-09-11 11:27:28 68觀看
導(dǎo)讀 讓大模型破譯從未見過(guò)的甲骨文,準(zhǔn)確率拿下新 SOTA!來(lái)自復(fù)旦大學(xué)的研究人員提出了一種基于部首和象形分析的可解釋甲骨文破譯框架 —— 不僅在公開基準(zhǔn)數(shù)據(jù)集 HUST-OBC 和 EV-OBC 上,達(dá)到最先進(jìn)的 Top-10 識(shí)別準(zhǔn)

讓大模型破譯從未見過(guò)的甲骨文,準(zhǔn)確率拿下新 SOTA!boP28資訊網(wǎng)——每日最新資訊28at.com

來(lái)自復(fù)旦大學(xué)的研究人員提出了一種基于部首和象形分析的可解釋甲骨文破譯框架 —— 不僅在公開基準(zhǔn)數(shù)據(jù)集 HUST-OBC 和 EV-OBC 上,達(dá)到最先進(jìn)的 Top-10 識(shí)別準(zhǔn)確率以及優(yōu)異的零樣本破譯能力。boP28資訊網(wǎng)——每日最新資訊28at.com

而且面對(duì)未破譯甲骨文,所提方法也能夠輸出可解釋性的分析文本,從而為考古破譯工作提供潛在幫助。boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

事實(shí)上,作為最古老的成熟文字系統(tǒng),甲骨文長(zhǎng)期以來(lái)因其稀有性、抽象性和象形多樣性,給考古破譯工作帶來(lái)了重大挑戰(zhàn)。boP28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)前基于深度學(xué)習(xí)的方法在甲骨文破譯任務(wù)上取得了令人鼓舞的進(jìn)展,但現(xiàn)有方法往往忽視了甲骨文字形與語(yǔ)義之間的復(fù)雜關(guān)聯(lián)。boP28資訊網(wǎng)——每日最新資訊28at.com

這導(dǎo)致了有限的泛化能力和可解釋性,尤其是在處理零樣本場(chǎng)景和未破譯的甲骨文時(shí)。boP28資訊網(wǎng)——每日最新資訊28at.com

為此,本文提出了一種基于大型視覺語(yǔ)言模型的可解釋甲骨文破譯方法,該方法通過(guò)聯(lián)合部首分析與象形語(yǔ)義理解,彌合了甲骨文字形與語(yǔ)意之間的鴻溝。boP28資訊網(wǎng)——每日最新資訊28at.com

下面具體來(lái)看 ——boP28資訊網(wǎng)——每日最新資訊28at.com

首個(gè)象形解析甲骨文破譯數(shù)據(jù)集

概括而言,團(tuán)隊(duì)提出了一種漸進(jìn)式訓(xùn)練策略,引導(dǎo)模型從部首識(shí)別和部首分析,過(guò)渡到象形分析,最后進(jìn)行部首-象形交互分析,從而實(shí)現(xiàn)從字形到字意的推理。boP28資訊網(wǎng)——每日最新資訊28at.com

論文還設(shè)計(jì)了基于分析結(jié)果的“部首-象形雙重匹配機(jī)制”,顯著提升了模型的零樣本破譯性能。boP28資訊網(wǎng)——每日最新資訊28at.com

為便于模型訓(xùn)練,論文提出了包含 47,157 個(gè)漢字的象形破譯甲骨文數(shù)據(jù)集,其中部分漢字具有相應(yīng)甲骨文圖像和古代字體圖像,所有漢字都具備現(xiàn)代楷書圖像、部首分析和象形分析標(biāo)注。boP28資訊網(wǎng)——每日最新資訊28at.com

先說(shuō)數(shù)據(jù)集。boP28資訊網(wǎng)——每日最新資訊28at.com

盡管現(xiàn)有視覺語(yǔ)言大模型在多種任務(wù)上表現(xiàn)優(yōu)異,但仍難以直接應(yīng)用于甲骨文破譯任務(wù)。boP28資訊網(wǎng)——每日最新資訊28at.com

為解決這一挑戰(zhàn),論文提出了象形破譯甲骨文(PD-OBS)數(shù)據(jù)集,用于訓(xùn)練具備甲骨文象形分析能力的視覺語(yǔ)言大模型,這對(duì)甲骨文破譯任務(wù)具有重要意義。boP28資訊網(wǎng)——每日最新資訊28at.com

PD-OBS 數(shù)據(jù)集共包含 47,157 個(gè)漢字。其中,3173 個(gè)漢字與從公開的 HUST-OBC 和 EVOBC 數(shù)據(jù)集收集的甲骨文圖像相關(guān)聯(lián);10,968 個(gè)漢字提供了來(lái)自字形庫(kù)的古代隸書圖像;所有漢字均配有來(lái)自《漢典》的現(xiàn)代楷書圖像。boP28資訊網(wǎng)——每日最新資訊28at.com

除圖像數(shù)據(jù)外,每個(gè)漢字均通過(guò)文本形式標(biāo)注了部首分析和象形分析,這兩者均與漢字的語(yǔ)義含義密切相關(guān)。boP28資訊網(wǎng)——每日最新資訊28at.com

標(biāo)注過(guò)程分為三個(gè)階段,如圖 1 所示。boP28資訊網(wǎng)——每日最新資訊28at.com

首先,通過(guò)漢典從《說(shuō)文解字》(一部古代漢語(yǔ)詞典)中檢索每個(gè)漢字的部首標(biāo)簽、定義及解釋。boP28資訊網(wǎng)——每日最新資訊28at.com

其次,將獲取的部首標(biāo)簽及其解釋與每個(gè)漢字的現(xiàn)代、古代字體和甲骨文圖像關(guān)聯(lián)。接著,利用 GPT-4.1 基于參考的字形圖像豐富部首標(biāo)簽,并總結(jié)分析內(nèi)容。boP28資訊網(wǎng)——每日最新資訊28at.com

最后,通過(guò) GPT-4.1 進(jìn)行自我檢查和人工修正來(lái)確保數(shù)據(jù)集的整體質(zhì)量。boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

基于部首和象形分析的可解釋甲骨文破譯視覺語(yǔ)言大模型1、模型整體結(jié)構(gòu)

整體框架基于 Qwen2.5-VL-7B 構(gòu)建,共享相同的視覺編碼器和大型語(yǔ)言模型(LLM)。boP28資訊網(wǎng)——每日最新資訊28at.com

如圖 2 所示,研究人員引入了一個(gè)空間 patch 合并模塊作為視覺適配器,以及一個(gè)分類器來(lái)預(yù)測(cè)部首標(biāo)簽,并且還提出了部首 LoRA 和象形 LoRA 模塊來(lái)分析相應(yīng)的信息。boP28資訊網(wǎng)——每日最新資訊28at.com

此外,研究人員設(shè)計(jì)了一種漸進(jìn)式訓(xùn)練方法,從部首識(shí)別開始,接著進(jìn)行部首和象形分析,最終實(shí)現(xiàn)聯(lián)合分析,以逐步引導(dǎo)模型完成甲骨文破譯任務(wù)。boP28資訊網(wǎng)——每日最新資訊28at.com

還提出了一個(gè)新穎的部首-象形雙重匹配機(jī)制,以從數(shù)據(jù)庫(kù)中選擇最合適的字符。boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

2、部首識(shí)別

在本階段,研究人員的目標(biāo)是將視覺編碼器適配于甲骨文的獨(dú)特視覺風(fēng)格,并預(yù)測(cè)用于下游推理的關(guān)鍵信息 —— 部首標(biāo)簽。boP28資訊網(wǎng)——每日最新資訊28at.com

為此,團(tuán)隊(duì)設(shè)計(jì)了一個(gè)空間 patch 合并模塊作為視覺適配器,該適配器將高維視覺特征壓縮并聚合為預(yù)設(shè)維度的特征向量,作為甲骨文的抽象表示。boP28資訊網(wǎng)——每日最新資訊28at.com

此外,研究人員基于歐式距離設(shè)計(jì)了一個(gè)三元組損失函數(shù),以明確提升不同部首特征向量之間的區(qū)分度。boP28資訊網(wǎng)——每日最新資訊28at.com

具體而言,團(tuán)隊(duì)實(shí)施了一種采樣策略,確保每個(gè)批次中每個(gè)部首類別至少包含兩個(gè)樣本。boP28資訊網(wǎng)——每日最新資訊28at.com

在訓(xùn)練過(guò)程中,對(duì)于批次中的每個(gè)樣本,將它的特征向量 Vn 指定為錨點(diǎn),然后選擇一個(gè)正樣本(即具有相同根部標(biāo)簽的樣本)和一個(gè)負(fù)樣本(即具有不同根部標(biāo)簽的樣本)。boP28資訊網(wǎng)——每日最新資訊28at.com

三元組損失如下:boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

關(guān)于分類器,研究人員使用交叉熵?fù)p失來(lái)優(yōu)化它。因此,本階段的整個(gè)損失函數(shù)可以表示如下:boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

3、部首-象形聯(lián)合分析

為了在甲骨文中實(shí)現(xiàn)字形與意義的關(guān)聯(lián),研究人員設(shè)計(jì)了一個(gè)漸進(jìn)式的字形分析過(guò)程,以促進(jìn)破譯任務(wù)的完成。boP28資訊網(wǎng)——每日最新資訊28at.com

在甲骨文和古代漢字中,部首通常決定了字的基本語(yǔ)義,如圖 3 中的 Q1&A1 所示。boP28資訊網(wǎng)——每日最新資訊28at.com

因此,團(tuán)隊(duì)利用 PD-OBS 數(shù)據(jù)集構(gòu)建的大量部首分析問答對(duì)對(duì)模型進(jìn)行部首分析能力的訓(xùn)練。boP28資訊網(wǎng)——每日最新資訊28at.com

接下來(lái)引導(dǎo)模型對(duì)整個(gè)字符進(jìn)行象形分析,以分析字形蘊(yùn)含的語(yǔ)意,如圖 3 中的 Q2&A2 所示。boP28資訊網(wǎng)——每日最新資訊28at.com

最后,研究人員設(shè)計(jì)了一個(gè)聯(lián)合分析步驟,以解決僅憑象形分析可能無(wú)法直接預(yù)測(cè)正確對(duì)應(yīng)現(xiàn)代漢字的情況。此步驟通過(guò)部首分析的結(jié)果指導(dǎo)象形分析,從而獲得更準(zhǔn)確的漢字含義,如圖 3 中的 Q3&A3 所示。此階段通過(guò)交叉熵?fù)p失來(lái)優(yōu)化模型。boP28資訊網(wǎng)——每日最新資訊28at.com

以下為部首-象形聯(lián)合分析示意圖:boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

4、部首-象形雙重匹配機(jī)制

經(jīng)過(guò)前兩個(gè)階段后,團(tuán)隊(duì)為每個(gè)測(cè)試字符生成了四個(gè)中間結(jié)果:預(yù)測(cè)的部首標(biāo)簽、部首分析、象形分析以及聯(lián)合分析結(jié)果。boP28資訊網(wǎng)——每日最新資訊28at.com

研究人員提出了一種基于詞典的雙重匹配機(jī)制用于破譯。給定來(lái)自 PD-OBS 數(shù)據(jù)集的候選詞典 D,該機(jī)制的工作流程如下:boP28資訊網(wǎng)——每日最新資訊28at.com

首先,根據(jù)預(yù)測(cè)的部首標(biāo)過(guò)濾候選項(xiàng),然后根據(jù)象形分析之間的語(yǔ)義相似性選擇前 k 個(gè)條目。boP28資訊網(wǎng)——每日最新資訊28at.com

其次,將預(yù)測(cè)的部首分析與部首信息增強(qiáng)的象形分析結(jié)果進(jìn)行拼接,并通過(guò)相似性進(jìn)行排序。boP28資訊網(wǎng)——每日最新資訊28at.com

最后,將這些候選集合并并重新排序,以獲得前 k 個(gè)現(xiàn)代漢字作為破譯結(jié)果。boP28資訊網(wǎng)——每日最新資訊28at.com

所有步驟和符號(hào)在圖 4 中詳細(xì)說(shuō)明。boP28資訊網(wǎng)——每日最新資訊28at.com

值得注意的是,團(tuán)隊(duì)采用匹配機(jī)制而非直接輸出破譯結(jié)果,這有助于緩解模型在零樣本設(shè)置下因訓(xùn)練數(shù)據(jù)中缺乏此類甲骨文而導(dǎo)致的泛化能力不足問題,以及未破譯甲骨文帶來(lái)的影響。boP28資訊網(wǎng)——每日最新資訊28at.com

以下為部首象形雙重匹配算法:boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

實(shí)驗(yàn)結(jié)果1、驗(yàn)證集和零樣本設(shè)定下的破譯

研究人員在 HUST-OBC 和 EV-OBC 數(shù)據(jù)集上對(duì)所提方法和現(xiàn)有方法進(jìn)行了評(píng)估,從每個(gè)數(shù)據(jù)集中選取 200 個(gè)字符類別作為零樣本測(cè)試集。boP28資訊網(wǎng)——每日最新資訊28at.com

剩余數(shù)據(jù)以 9:1 的比例隨機(jī)劃分為訓(xùn)練集和驗(yàn)證集,以評(píng)估新框架及現(xiàn)有方法的甲骨文識(shí)別能力。boP28資訊網(wǎng)——每日最新資訊28at.com

與先前研究一致,團(tuán)隊(duì)采用 Top-1 和 Top-10 準(zhǔn)確率作為評(píng)估指標(biāo),該指標(biāo)通常用于各類分類任務(wù)。boP28資訊網(wǎng)——每日最新資訊28at.com

為了系統(tǒng)地評(píng)估新方法在甲骨文破譯中的有效性,團(tuán)隊(duì)在兩個(gè)基準(zhǔn)數(shù)據(jù)集 HUST-OBC 和 EV-OBC 進(jìn)行了全面比較,分別在驗(yàn)證集和零樣本設(shè)置下進(jìn)行,如表 1 所示。boP28資訊網(wǎng)——每日最新資訊28at.com

注意,每個(gè)單元格分別顯示 Top-1(左)和 Top-10(右)的準(zhǔn)確率(%)。最佳結(jié)果和次佳結(jié)果分別以粗體和下劃線標(biāo)注。boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

團(tuán)隊(duì)采用 InceptionV3、ViT 和 PyGT 作為基于分類模型的代表方法,以及 OBSD 和 BBDM 作為基于擴(kuò)散模型的代表方法。由于缺乏開源實(shí)現(xiàn)和數(shù)據(jù)集設(shè)置的不一致,現(xiàn)有基于組成式的方法目前未被納入比較方法。boP28資訊網(wǎng)——每日最新資訊28at.com

作為替代,研究人員納入了強(qiáng)大的商用 LVLM,GPT-4.1 和 Qwen-VL-Max 用于比較。boP28資訊網(wǎng)——每日最新資訊28at.com

相比之下,商用 LVLM 在兩種設(shè)置下表現(xiàn)不佳,Top-1 準(zhǔn)確率始終低于 6%,這說(shuō)明了其理解古代文字視覺結(jié)構(gòu)的能力受限。boP28資訊網(wǎng)——每日最新資訊28at.com

在驗(yàn)證集上,盡管新方法的 Top-1 準(zhǔn)確率略低于最佳分類模型基線(如 PyGT),但它實(shí)現(xiàn)了最高的 Top-10 準(zhǔn)確率,展示了生成高質(zhì)量候選項(xiàng)的優(yōu)越能力,并提供了更大的實(shí)際用途。boP28資訊網(wǎng)——每日最新資訊28at.com

在更具挑戰(zhàn)性的零樣本場(chǎng)景中,新方法表現(xiàn)出顯著的優(yōu)異性能:boP28資訊網(wǎng)——每日最新資訊28at.com

在 Top-1 準(zhǔn)確率方面仍具競(jìng)爭(zhēng)力,并在 Top-10 準(zhǔn)確率方面顯著超越所有方法,在 HUST-OBC 數(shù)據(jù)集上比第二好的方法高出 26.2%,在 EV-OBC 數(shù)據(jù)集上則高出 13.6%。boP28資訊網(wǎng)——每日最新資訊28at.com

這些結(jié)果證實(shí)了新方法在未見過(guò)的甲骨文上的強(qiáng)泛化能力和可遷移性,突顯了其在考古研究中輔助識(shí)別未破譯甲骨文方面的潛在價(jià)值。boP28資訊網(wǎng)——每日最新資訊28at.com

2、破譯的可解釋性評(píng)估

為了定量評(píng)估新方法生成的部首分析和象形分析的準(zhǔn)確率,研究人員采用 BERT-Score 來(lái)衡量 Top-1 輸出與字典 D 中真實(shí)分析標(biāo)注之間的相似性。boP28資訊網(wǎng)——每日最新資訊28at.com

團(tuán)隊(duì)還評(píng)估了其他大型視覺語(yǔ)言模型,包括 GPT-4.1、Qwen-VL-Max 和 Qwen2.5-VL-7B,并比較了它們?cè)?HUST-OBC 和 EVOBC 數(shù)據(jù)集的驗(yàn)證集和零樣本測(cè)試集的平均 BERT-Score。boP28資訊網(wǎng)——每日最新資訊28at.com

如表 2 所示,新方法在驗(yàn)證集和零樣本設(shè)置下,分別平均比最先進(jìn)的 LVLM 模型 GPT-4.1 高出 21.60% 和 12.95%,在兩個(gè)數(shù)據(jù)集上。boP28資訊網(wǎng)——每日最新資訊28at.com

這一結(jié)果表明,新框架生成的分析結(jié)果更加可靠。boP28資訊網(wǎng)——每日最新資訊28at.com

下表為,不同方法在驗(yàn)證集上獲得的 Bert-Score(%)。Valid.和 S 分別表示驗(yàn)證集和零樣本測(cè)試集。boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

3、消融實(shí)驗(yàn)

為了評(píng)估設(shè)計(jì)的部首識(shí)別階段的有效性,研究人員以 Qwen2.5-VL-7B 的原始視覺編碼器作為基線,并分別集成部首識(shí)別模塊以及基于 LoRA 的識(shí)別方法。boP28資訊網(wǎng)——每日最新資訊28at.com

其識(shí)別準(zhǔn)確率在 HUST-OBS 數(shù)據(jù)集上進(jìn)行了驗(yàn)證,并包含驗(yàn)證集和零樣本設(shè)置。boP28資訊網(wǎng)——每日最新資訊28at.com

新方法在基線視覺編碼器上引入了空間補(bǔ)丁合并和損失函數(shù) Ltrip,分別在驗(yàn)證集和零樣本設(shè)置下實(shí)現(xiàn)了 0.9% 和 1.2% 的準(zhǔn)確率提升。boP28資訊網(wǎng)——每日最新資訊28at.com

基于 LoRA 的識(shí)別方法將識(shí)別階段與部首分析過(guò)程合并,并采用基于 LoRA 的微調(diào)進(jìn)行訓(xùn)練。boP28資訊網(wǎng)——每日最新資訊28at.com

實(shí)驗(yàn)結(jié)果表明,該方法導(dǎo)致部首識(shí)別準(zhǔn)確率顯著下降,從而在部首分析中引入大量錯(cuò)誤,因此研究人員在框架中將部首識(shí)別保留為獨(dú)立階段。boP28資訊網(wǎng)——每日最新資訊28at.com

下表為,關(guān)于部首識(shí)別的消融實(shí)驗(yàn)結(jié)果:boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

為了驗(yàn)證團(tuán)隊(duì)提出的模塊和策略的有效性,他們以 Qwen2.5-VL-7B 作為基線,并逐步添加每個(gè)組件以形成最終模型。boP28資訊網(wǎng)——每日最新資訊28at.com

在驗(yàn)證集和零樣本設(shè)置下的 Top-1 和 Top-10 性能如表 4 所示。boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

結(jié)果表明,LoRA 微調(diào)(+LoRA)在驗(yàn)證集上實(shí)現(xiàn)了基本的破譯能力,但在零樣本場(chǎng)景下仍缺乏泛化能力。boP28資訊網(wǎng)——每日最新資訊28at.com

引入部首-象形互分析與部首識(shí)別后,模型在驗(yàn)證集上的準(zhǔn)確率持續(xù)提升,但零樣本能力的提升仍非常有限。boP28資訊網(wǎng)——每日最新資訊28at.com

主要原因在于通過(guò) LoRA 基于監(jiān)督式微調(diào)訓(xùn)練的模型缺乏足夠的泛化能力,常無(wú)法生成罕見字符 —— 這是零樣本場(chǎng)景中的常見挑戰(zhàn)。boP28資訊網(wǎng)——每日最新資訊28at.com

為解決此問題,團(tuán)隊(duì)引入了部首-象形雙匹配機(jī)制,以替代直接預(yù)測(cè)。boP28資訊網(wǎng)——每日最新資訊28at.com

該策略不僅顯著提升了模型的零樣本性能,還增強(qiáng)了甲骨文中與語(yǔ)義無(wú)關(guān)的部首的魯棒性,確保了解碼結(jié)果的可靠性和可驗(yàn)證性。boP28資訊網(wǎng)——每日最新資訊28at.com

4、定性實(shí)驗(yàn)

圖 5 展示了新方法以及 OBSD 方法在三種設(shè)置下的定性結(jié)果:驗(yàn)證集、零樣本和未破譯的甲骨文。boP28資訊網(wǎng)——每日最新資訊28at.com

如圖所示,團(tuán)隊(duì)的模型在驗(yàn)證集上展現(xiàn)出強(qiáng)大的識(shí)別能力,并在零樣本設(shè)置下對(duì)未見過(guò)的甲骨文也具有良好的泛化能力。boP28資訊網(wǎng)——每日最新資訊28at.com

更值得注意的是,對(duì)于人類專家尚未破譯的字符,模型能夠生成語(yǔ)義上合理的預(yù)測(cè),并附帶可解釋的分析。boP28資訊網(wǎng)——每日最新資訊28at.com

其設(shè)計(jì)的部首-象形相互分析在其中發(fā)揮了關(guān)鍵作用:部首分析追溯部首的結(jié)構(gòu)起源,并解釋其在當(dāng)前字符形式中的象征功能。boP28資訊網(wǎng)——每日最新資訊28at.com

同時(shí),象形形式分析基于字符的整體形狀和隱含意義,提供了一個(gè)整體的視覺-語(yǔ)義映射。boP28資訊網(wǎng)——每日最新資訊28at.com

這些互補(bǔ)的分析共同形成了一條雙重推理路徑,提升了模型生成語(yǔ)義基礎(chǔ)且可解釋輸出的能力,即使對(duì)于尚未破譯的字符也是如此。boP28資訊網(wǎng)——每日最新資訊28at.com

下表為,破譯結(jié)果和可解釋性過(guò)程展示:boP28資訊網(wǎng)——每日最新資訊28at.com

boP28資訊網(wǎng)——每日最新資訊28at.com

小結(jié)一下,在本研究中,團(tuán)隊(duì)提出了一種基于部首和象形分析的可解釋甲骨文破譯框架。boP28資訊網(wǎng)——每日最新資訊28at.com

該框架通過(guò)三個(gè)階段將字形與意義相連:部首識(shí)別與分析、象形分析以及相互分析。boP28資訊網(wǎng)——每日最新資訊28at.com

借助提出的部首-象形雙重匹配機(jī)制,其模型可根據(jù)分析結(jié)果從字典中篩選出合適的破譯候選集,取代直接輸出破譯結(jié)果,從而實(shí)現(xiàn)更優(yōu)的零樣本性能。boP28資訊網(wǎng)——每日最新資訊28at.com

此外,生成的文本分析可作為可解釋內(nèi)容,為未破譯的甲骨文字符提供參考,因此在考古應(yīng)用中具有巨大潛力。boP28資訊網(wǎng)——每日最新資訊28at.com

為支持訓(xùn)練,他們構(gòu)建了 PD-OBS 數(shù)據(jù)集,包含 47,157 個(gè)注釋有甲骨文圖像和象形文字分析文本的漢字,為未來(lái)研究提供了寶貴資源。boP28資訊網(wǎng)——每日最新資訊28at.com

實(shí)驗(yàn)結(jié)果表明,其方法在破譯準(zhǔn)確性、泛化能力和可解釋性方面均表現(xiàn)出強(qiáng)勁性能。boP28資訊網(wǎng)——每日最新資訊28at.com

論文地址:https://arxiv.org/abs/2508.10113boP28資訊網(wǎng)——每日最新資訊28at.com

項(xiàng)目地址:https://github.com/PKXX1943/PD-OBSboP28資訊網(wǎng)——每日最新資訊28at.com

本文來(lái)自微信公眾號(hào):量子位(ID:QbitAI),作者:復(fù)旦大學(xué)團(tuán)隊(duì),原標(biāo)題《大模型破譯甲骨文創(chuàng)下新 SOTA!復(fù)旦團(tuán)隊(duì)推出新框架》boP28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.rrqrq.com/showinfo-45-27449-0.html大模型破譯甲骨文創(chuàng)下新 SOTA,復(fù)旦團(tuán)隊(duì)推出新框架

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 為動(dòng)畫長(zhǎng)片提供工具和資源支持,力圖證明 AI“拍電影”比好萊塢更快更便宜

下一篇: 英偉達(dá)推出通用深度研究系統(tǒng):可接入任何 LLM,支持個(gè)人定制

標(biāo)簽:
  • 熱門焦點(diǎn)
  • AI大模型“戰(zhàn)火”燒到了教育領(lǐng)域

    作者:劉曠自2023年開年以來(lái),AI大模型這股風(fēng)是越吹越猛烈了。隨著ChatGPT的出圈爆火,再度掀起了一波AI熱浪,無(wú)論是在國(guó)內(nèi)還是國(guó)外都有不少企業(yè)宣布入局或者跟進(jìn)AI大模型領(lǐng)域。與
  • 中國(guó)區(qū)塊鏈產(chǎn)業(yè)生態(tài)地圖報(bào)告(2021)

    區(qū)塊鏈?zhǔn)羌夹g(shù)整合創(chuàng)新、金融創(chuàng)新、組織方式創(chuàng)新、產(chǎn)業(yè)應(yīng)用創(chuàng)新的多維度創(chuàng)新,以服務(wù)實(shí)體經(jīng)濟(jì)、政務(wù)民生以及公共服務(wù)等領(lǐng)域?yàn)槁淠_點(diǎn),以期實(shí)現(xiàn)整個(gè)地區(qū)和產(chǎn)業(yè)的資
  • 元宇宙是推動(dòng)NFT發(fā)展的初始家園

    現(xiàn)在大家都知道了什么是NFT,但好像離自己的生活還有一定距離。隨著我們與NFT 接觸增加,該如何將這些數(shù)字資產(chǎn)帶入我們的日常生活?NFT還是主流嗎?如果我們將“主流
  • 就業(yè)年齡歧視如何解決?來(lái)Web3看看

    上周,我突然想到我的第一份工作實(shí)際上是在為一家失敗的航空公司制定破產(chǎn)退出計(jì)劃,那年我們的協(xié)議實(shí)習(xí)生剛出生。在一陣恐慌后,我又花了一點(diǎn)時(shí)間反思我這個(gè)擁有近1
  • 知識(shí)產(chǎn)權(quán)可能在元宇宙中“消失”?

    開篇老雅痞先來(lái)劃重點(diǎn):一些公司開始采取積極的方式來(lái)保護(hù)他們?cè)谠钪娴闹R(shí)產(chǎn)權(quán)。耐克、愛馬仕和米拉麥克斯最近提起訴訟,聲稱NFT侵犯了他們的知識(shí)產(chǎn)權(quán)。Inside
  • 以太坊面臨來(lái)自Fantom的巨大挑戰(zhàn)

    眾所周知,區(qū)塊鏈和加密貨幣項(xiàng)目經(jīng)常因其對(duì)環(huán)境的影響而受到批評(píng)。但是有一個(gè)非營(yíng)利性的加密貨幣和區(qū)塊鏈項(xiàng)目說(shuō)它比其他的更環(huán)保。今天老雅痞就給大家聊一聊加
  • FTX 加密貨幣交易所開始向游戲公司提供加密服務(wù)

    據(jù)媒體報(bào)道,業(yè)內(nèi)領(lǐng)先的加密貨幣交易所FTX宣布將涉足游戲領(lǐng)域。該公司表示,計(jì)劃推出自己的游戲部門作為中介,專注于為傳統(tǒng)游戲公司提供加密相關(guān)服務(wù)。此舉將有助于
  • NFT高玩必備:NFT分析工具大盤點(diǎn)

    NFT市場(chǎng)的火熱讓越來(lái)越多的投資者投身其中,但當(dāng)前的 NFT 生態(tài)系統(tǒng)存在幾個(gè)問題卻困擾了大多數(shù)人,如難以準(zhǔn)確評(píng)估 NFT 項(xiàng)目的資產(chǎn)價(jià)格、缺乏 NFT 市場(chǎng)動(dòng)態(tài)信息、
  • 從NFT數(shù)字收藏,洞察數(shù)字音樂版權(quán)市場(chǎng)發(fā)展趨勢(shì)

    去年8月9日,騰訊音樂布局NFT數(shù)字收藏,在騰訊應(yīng)用寶發(fā)布幻核app,騰訊音樂的提前布局示意著未來(lái)區(qū)塊鏈技術(shù)將對(duì)數(shù)字音樂版權(quán)市場(chǎng)進(jìn)行改造升級(jí)。作者從深層測(cè)分析為
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
美女视频网站黄色亚洲| 国产精品裸体一区二区三区| 欧美日韩国产精品一区二区亚洲| 91久久黄色| 欧美日韩一级片在线观看| 国产亚洲一区字幕| 丝袜美腿亚洲一区二区图片| 丁香天五香天堂综合| 99热免费精品| 日韩天堂在线观看| 亚洲激情男女视频| 成人国产精品免费网站| 亚洲一区二区网站| 久久亚洲精品小早川怜子| 亚洲国产成人av| eeuss鲁片一区二区三区在线看| 国产精品人人爽人人做我的可爱| 日韩精品一区二区三区中文精品| 亚洲专区一二三| 91亚洲精品久久久蜜桃网站| 色噜噜狠狠成人中文综合| 欧美激情一区二区三区蜜桃视频| 免费日本视频一区| 亚洲激情一区| 精品sm捆绑视频| 精品一区二区三区在线播放视频| 亚洲成人在线| 久久久噜噜噜久久中文字幕色伊伊 | 国产精品免费av| 国产精品一区二区在线观看网站| 国产日韩精品一区观看| 久久蜜桃av一区二区天堂| 国内成人自拍视频| 麻豆九一精品爱看视频在线观看免费| 国产女人aaa级久久久级| 国产成人精品免费在线| 日本高清不卡视频| 亚洲一二三四在线观看| 亚洲国产合集| 欧美精彩视频一区二区三区| 成人国产在线观看| 制服丝袜国产精品| 麻豆精品蜜桃视频网站| 香蕉精品999视频一区二区| 综合在线观看色| 国产精品二区在线| 日韩国产欧美一区二区三区| 欧美日韩网址| 亚洲国产精品激情在线观看| 99久久综合国产精品| 日韩女同互慰一区二区| 国产制服丝袜一区| 欧美亚洲禁片免费| 婷婷激情综合网| 欧美一级视频| 午夜影院在线观看欧美| 久久精品一区二区国产| 五月综合激情日本mⅴ| 免费视频一区二区三区在线观看| 亚洲综合久久久久| 亚洲欧美日韩国产一区二区| 夜夜嗨av一区二区三区网页| 国产日韩精品久久| 亚洲成人7777| 在线视频你懂得一区| 麻豆国产91在线播放| 欧美美女直播网站| 国产不卡在线一区| 久久一夜天堂av一区二区三区 | 中文字幕av资源一区| 欧美精品麻豆| 亚洲欧美偷拍卡通变态| 国产欧美日韩综合一区在线播放 | 欧美高清视频一二三区 | 亚洲精品国产高清久久伦理二区| 亚洲黄色高清| 五月天视频一区| 欧美三级一区二区| 国产a精品视频| 国产情人综合久久777777| 欧美日本高清| 亚洲香肠在线观看| 欧美日韩中文精品| 成人蜜臀av电影| 中文字幕中文字幕一区二区| 国产精品一国产精品k频道56| 午夜视频一区在线观看| 欧美人xxxx| 99精品热视频| 亚洲精品乱码久久久久久黑人| 久久午夜视频| 成人性生交大片| 中文字幕亚洲欧美在线不卡| 久久精品男女| 成人性生交大片免费看视频在线| 国产精品乱码久久久久久| 久久久夜夜夜| 成人免费视频app| ●精品国产综合乱码久久久久| 色呦呦国产精品| 成人午夜精品在线| 亚洲免费视频成人| 欧美精品1区2区| 海角社区69精品视频| 亚洲18女电影在线观看| 五月激情丁香一区二区三区| 欧美伦理视频网站| 红桃视频国产一区| 激情亚洲综合在线| 国产精品久线在线观看| 欧美性生活一区| 韩国欧美一区| 亚洲一区激情| 国产精品资源在线| 亚洲欧美在线另类| 91精品午夜视频| 国产精品婷婷| 91最新地址在线播放| 午夜久久久久久| 欧美国产精品一区二区三区| 91精彩视频在线| 在线精品一区二区| 成人免费毛片片v| 免费欧美高清视频| **欧美大码日韩| 欧美大片一区二区| 久久激情视频| 一区久久精品| 成人黄色网址在线观看| 国产拍欧美日韩视频二区| 色综合天天综合网天天看片| 久久婷婷国产综合精品青草| 91激情五月电影| 亚洲免费激情| caoporn国产精品| 激情综合五月天| 亚洲国产成人精品视频| 国产精品久久久久一区二区三区共| 欧美日韩国产美| 久久精品一区二区国产| 最近看过的日韩成人| 色综合中文字幕国产 | 欧美日韩美少妇| 午夜一级久久| 亚洲精品乱码| 欧美日韩日本国产亚洲在线| 成人午夜看片网址| 激情五月激情综合网| 天堂精品中文字幕在线| 亚洲你懂的在线视频| 国产精品欧美一区喷水| 精品国产一二三区| 宅男在线国产精品| 欧美色爱综合网| 色久综合一二码| 久久不射中文字幕| 亚洲永久视频| 国产一区二区三区的电影| 在线成人亚洲| 一区精品久久| 亚洲精品一级| 日韩亚洲国产欧美| 亚洲久久一区| 亚洲国产精品一区二区第一页 | 午夜精品一区二区三区三上悠亚 | 欧美午夜影院一区| 91福利国产精品| 欧美在线高清视频| 精品视频资源站| 欧美日韩黄色影视| 欧美日韩亚洲国产综合| 欧洲精品视频在线观看| 欧洲精品一区二区| 制服视频三区第一页精品| 91精品欧美一区二区三区综合在| 亚洲国产一区在线观看| 国产精品成人网| 亚洲精品国产视频| 亚洲午夜三级在线| 奇米精品一区二区三区在线观看一| 日本免费在线视频不卡一不卡二| 奇米色一区二区| 国产成人av影院| 97se亚洲国产综合自在线观| 女同性一区二区三区人了人一 | 亚洲成年人影院| 久久福利视频一区二区| 国产精品一品二品| 97aⅴ精品视频一二三区| 亚洲私人影院| 另类天堂av| 欧美久久一区二区| 久久综合色8888| 综合av第一页| 日本特黄久久久高潮| 国产激情视频一区二区在线观看| 91亚洲国产成人精品一区二区三| 一区在线播放| 欧美亚洲禁片免费| 久久久午夜精品|