【新智元導讀】谷歌的 Gemma 2 剛剛發布,清華和北航的兩名博士生就已經成功推出了指令微調版本,顯著增強了 Gemma 2 9B / 27B 模型的中文通用對話、角色扮演、數學、工具使用等能力。
眾所周知,很多國外 LLM 一直存在非英語歧視問題,英語和其他語言在 LLM 中存在的性能差距有時可以用懸殊來形容。
之前就有網友發現,GPT-4o 分詞器語料庫中,中文數據污染非常嚴重,賭博色情網站是一個也不少,嚴重影響了我們用中文和 AI 機器人好好聊天。
最近發布的 Gemma 2 模型雖然既開源又強悍,但比較遺憾的是,其中文水平相較英文水平還有一定的距離。
不過,我們可以用微調來解決,Fine-tune it!
7 月 1 日,Gemma 2 剛發布 4 天,清華大學的一名人工智能博士生王慎執就在 X 上隆重推出了一款微調模型 Gemma-2-9B-Chinese-Chat。
鄭耀威
鄭耀威目前仍在北航讀博,他曾以第一作者在 CVPR、AAAI、WWW 等頂會發表多篇論文,并擔任 AAAI、EMNLP、Neural Computation 等會議和期刊審稿人。
他也是大模型微調框架 LLaMA Factory 的發起人和主要開發者,GitHub 開源項目獲得超過 2 萬星標。
在這些優秀的貢獻者的不斷努力之下,開源模型之路會越走越寬廣,模型的中文能力也會逐漸增強。
參考資料:
https://x.com/ShenzhiWang_THU/status/1807640624402923779
https://huggingface.co/shenzhi-wang/Gemma-2-9B-Chinese-Chat
https://huggingface.co/shenzhi-wang/Gemma-2-27B-Chinese-Chat
本文來自微信公眾號:新智元(ID:AI_era)
本文鏈接:http://www.rrqrq.com/showinfo-45-5050-0.html清華北航博士生「強迫」Gemma-2 說中文!弱智吧、角色扮演、數學問題表現驚喜
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:[email protected]