国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 科技  > 網絡

數據標注員什么時候會被AI替代?谷歌:現在就行

來源: 責編: 時間:2023-09-11 22:31:26 417觀看
導讀 似乎自ChatGPT進入大眾視野起,需要依靠人工進行數據標注,就成為人們對大語言模型(LLM)根深蒂固的印象之一。從兩個以上大模型針對同一個問題給出的不同回答里,找到當中的語病、邏輯和事實錯誤,標記不同的錯誤類型

似乎自ChatGPT進入大眾視野起,需要依靠人工進行數據標注,就成為人們對大語言模型(LLM)根深蒂固的印象之一。MeE28資訊網——每日最新資訊28at.com

從兩個以上大模型針對同一個問題給出的不同回答里,找到當中的語病、邏輯和事實錯誤,標記不同的錯誤類型,再對這些回答按照質量分別進行打分等,這些都是大模型數據標注員要干的事情。MeE28資訊網——每日最新資訊28at.com

這個過程被叫做RLHF(Reinforcement Learning from Human Feedback),即基于人類反饋的強化學習。RLHF也是被ChatGPT、Bard和LLaMA等新興大模型帶火的模型訓練方法,它大的好處就在于能夠將模型和人類的偏好對齊,讓大模型給出更符合人類表達習慣的回答。MeE28資訊網——每日最新資訊28at.com

不過近發布在arXiv的一份論文表明,這份看起來只有人類能做的工作,也能被AI取代!MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

AI也取代了RLHF中的“H”,誕生了一種叫做“RLAIF”的訓練方法。MeE28資訊網——每日最新資訊28at.com

這份由谷歌研究團隊發布的論文顯示,RLAIF能夠在不依賴數據標注員的情況下,表現出能夠與RLHF相媲美的訓練結果——MeE28資訊網——每日最新資訊28at.com

如果拿傳統的監督微調(SFT)訓練方法作為基線比較,比起SFT,1200個真人“評委”對RLHF和RLAIF給出答案的滿意度都超過了70%(兩者差距只有2%);另外,如果只比較RLHF和RLAIF給出的答案,真人評委們對兩者的滿意度也是對半分。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

這里的“勝率”體現了文中的“滿意度”MeE28資訊網——每日最新資訊28at.com

需要說明的是,谷歌的這篇論文也是第一個證明了RLAIF在某些任務上能夠產生與RLHF相當的訓練效果的研究。MeE28資訊網——每日最新資訊28at.com

早提出讓AI反饋代替人類反饋用于強化學習訓練的研究,是來自2022年Bai et al. 發布的一篇論文。這篇論文也首次提出了RLAIF的概念,并發現了AI標注的“天賦”,不過研究者在當時還并沒有將人類反饋和AI反饋結果進行直接比較。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

總之谷歌的這一研究成果一旦被更多人接受,將意味著不用人類指點,AI也能訓練自己的同類了。MeE28資訊網——每日最新資訊28at.com

下面可以來看看RLAIF具體是怎么做的。MeE28資訊網——每日最新資訊28at.com

我們知道,RLHF的方法大致可以分為三個步驟:預訓練一個監督微調LLM,收集數據訓練一個獎勵模型(RM),以及用強化學習(RL)方式微調模型。MeE28資訊網——每日最新資訊28at.com

從論文給出的圖示看,AI和人類標注員發揮作用的環節,主要是在訓練獎勵模型(RM)并生成反饋內容這里。你可以把“獎勵”理解為,讓人/AI來告訴模型哪種回答更好,答得更好就能有更多獎勵(所以也能理解人工標注存在的必要)。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

接著研究人員主要就“根據一段文字生成摘要”這一任務,展示了RLAIF的標記方法。MeE28資訊網——每日最新資訊28at.com

下面的表格比較完整地展示了RLAIF方法的輸入結構:MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

首先是序言(Preamble),用來介紹和描述手頭任務的說明。比如描述說,好的摘要是一段較短的文字,具有原文的精髓…給定一段文本和兩個可能的摘要,輸出1或2來指示哪個摘要符合上述定義的連貫性、準確性、覆蓋范圍和整體質量。MeE28資訊網——每日最新資訊28at.com

其次是樣本示例(1-Shot Exemplar)。比如給到一段“我們曾是超過四年的好朋友……”的文本,接著給到兩個摘要,以及“摘要1更好”的偏好判斷,讓AI學著這個示例對接下來的樣本做標注。MeE28資訊網——每日最新資訊28at.com

再者就是給出所要標注的樣本(Sample to Annotate),包括一段文本和一對需要標記的摘要。MeE28資訊網——每日最新資訊28at.com

后是結尾,用于提示模型的結束字符串。MeE28資訊網——每日最新資訊28at.com

論文介紹到,為了讓RLAIF方法中AI標注更準確,研究者也加入了其他方法以獲取更好的回答。譬如為了避免隨機性問題,會進行多次選擇,其間還會對選項的順序進行交換;此外還用到了思維鏈(CoT)推理,來進一步提升與人類偏好的對齊程度。MeE28資訊網——每日最新資訊28at.com

從原始prompt到輸出的完整流程如下圖所示:MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

能看到,就像人類標注員會給不同的回答打分一樣(比如滿分5分),AI也會依據偏好給每個摘要打分,相加起來是1分。所以這個分數就可以理解為上文提到的獎勵。MeE28資訊網——每日最新資訊28at.com

以上就是RLAIF方法大致會經歷的過程。MeE28資訊網——每日最新資訊28at.com

而在評價RLAIF方法的訓練結果到底好不好時,研究人員使用了三個評估指標,分別是AI標簽對齊度(AI Labeler Alignment)、配對準確度(Pairwise Accuracy)和勝率(Win Rate)。MeE28資訊網——每日最新資訊28at.com

簡單理解三個指標,AI標簽對齊度指的就是AI偏好相對于人類偏好的精確程度,配對準確度指訓練好的獎勵模型與人類偏好數據集的匹配程度,勝率則是人類在RLAIF和RLHF生成結果之間的傾向性。MeE28資訊網——每日最新資訊28at.com

研究人員在依據評估指標進行了繁雜的計算之后,終得出了RLAIF和RLHF“打平手”的結論。MeE28資訊網——每日最新資訊28at.com

當然也有一些非量化的定性分析。譬如研究發現,RLAIF似乎比RLHF更不容易出現“幻覺”,下表所示幾個例子中標紅部分便是RLHF的幻覺,盡管看上去是合理的:MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

而在另一些例子里,RLAIF的語法表現似乎又比RLHF差不少(標紅為RLAIF的語法問題):MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

盡管如此,RLAIF和RLHF整體來說生成高質量摘要的能力還是旗鼓相當的。MeE28資訊網——每日最新資訊28at.com

該論文的發布很快收獲了不少關注。比如有從業者評論道,等到GPT-5可能就不需要人類數據標注員了。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

也有網友貼圖打趣,用AI來訓練同類的做法就好比是這張梗圖。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

不過針對谷歌這篇論文中用到的研究方法,身為著名軟件工程師、AI專家的Evan Saravia也認為,研究人員只在論文中分析了RLAIF和RLHF在“生成摘要”這一任務上的表現,其他更加泛化的任務表現如何還有待觀察。MeE28資訊網——每日最新資訊28at.com

此外,研究人員也沒有將人工標注和使用AI成本的因素考慮在內。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

其實以上網友預測未來的大模型將不再需要人類標注員,也側面體現出目前RLHF方法因為過于依賴人工而遇到的瓶頸:大規模高質量的人類標注數據可能會非常難以獲取——MeE28資訊網——每日最新資訊28at.com

大模型數據標注員往往是流動性非常高的工種,并且由于數據標注很多時候非常依賴標注員的主觀偏好,也就更加考驗標注員的自身素質。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

短期內也許會像這位從業者說的,“我不會說這(RLAIF)降低了人工標注的重要性,但有一點可以肯定,人工智能反饋的RL可以降低成本。人工標注對于泛化仍然極其重要,而RLHF+RLAIF混合方法比任何單一方法都要好。”MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com


文章出處:品玩網

本文鏈接:http://www.rrqrq.com/showinfo-17-9219-0.html數據標注員什么時候會被AI替代?谷歌:現在就行

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 網約車老師傅們的“反擊”

下一篇: 搶“.AI”域名 成了3000萬美元的大生意

標簽:
  • 熱門焦點
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
成人欧美一区二区三区| 狠狠色丁香久久综合频道| 成人av集中营| 亚洲人成网站在线观看播放| 蜜桃视频一区| 精品久久久久香蕉网| 亚洲女人小视频在线观看| 日本怡春院一区二区| 91麻豆精品视频| 色婷婷精品大视频在线蜜桃视频| 精品久久久久久亚洲综合网 | 亚洲综合在线免费观看| 亚洲色图视频网| 丰满亚洲少妇av| 麻豆91精品91久久久的内涵| 美女诱惑一区二区| 国产精品影视天天线| 成人综合日日夜夜| 99re成人精品视频| 91色乱码一区二区三区| 91在线高清观看| 亚洲高清资源| 久久久蜜桃一区二区人| 欧美日本一区二区三区四区| 日韩一区二区三区四区| 久久精品一区二区三区不卡| 国产精品久久久久影视| 亚洲国产乱码最新视频 | 91视频www| 亚洲精品看片| 色婷婷精品久久二区二区蜜臂av | 99xxxx成人网| 91黄色免费观看| 精品日韩一区二区三区| 亚洲日韩欧美一区二区在线| 日韩—二三区免费观看av| 国产91露脸合集magnet | 制服.丝袜.亚洲.中文.综合| 国产日韩欧美一区二区三区综合| 亚洲乱码国产乱码精品精98午夜| 美日韩一区二区| 99re热视频精品| 校园春色综合网| 欧美大片国产精品| 亚洲欧洲精品一区二区三区波多野1战4| 欧美一区二区三区人| 久久精品国产精品亚洲红杏| 亚洲一区二区三区精品动漫| 亚洲伦理在线免费看| 欧美极品一区二区三区| 久久久亚洲欧洲日产国码αv| 国产精品一品视频| 欧美裸体一区二区三区| 久久精品国产亚洲一区二区三区| 久久字幕精品一区| 亚洲一区二区三区视频在线| 一区二区免费在线视频| 中文字幕一区在线观看| 激情文学一区| 国产精品久久久久aaaa| 亚洲欧洲精品一区| 亚洲男人的天堂一区二区| 国产精品igao视频网网址不卡日韩| 欧美无乱码久久久免费午夜一区| 国产精品初高中害羞小美女文| 精品一区二区三区在线观看国产| 黄色日韩精品| 精品久久久网站| 在线精品一区| 欧美日本不卡视频| 亚洲综合男人的天堂| 91偷拍与自偷拍精品| 欧美日韩一二区| 亚洲综合男人的天堂| 欧美国产另类| 日韩欧美亚洲国产另类| 日韩av中文在线观看| 亚洲精选一区| 国产欧美一区二区精品秋霞影院| 国产伦精品一区二区三区在线观看| 翔田千里一区二区| 亚洲天堂av一区| 欧美一区二视频在线免费观看| 欧美一区二区三区喷汁尤物| 麻豆精品一区二区综合av| 免费一级欧美片在线播放| 亚洲婷婷综合色高清在线| 91免费国产在线| 精品捆绑美女sm三区| 国产成人鲁色资源国产91色综| 色就色 综合激情| 亚洲丶国产丶欧美一区二区三区| 亚洲黄色影片| 国产精品国产三级国产aⅴ中文| 91视频精品在这里| 久久综合九色综合欧美就去吻| 国产成人精品一区二区三区四区 | 亚洲精品菠萝久久久久久久| 欧美日韩一区在线播放| 国产午夜亚洲精品午夜鲁丝片| 国产成人在线视频免费播放| 欧美精品三级日韩久久| 国产精品一二三区| 在线播放国产精品二区一二区四区| 精品一区二区影视| 欧美日韩在线观看一区二区| 加勒比av一区二区| 亚洲午夜久久久| 日韩精品影音先锋| 一本一本久久a久久精品综合妖精| 精品亚洲国产成人av制服丝袜| 国产欧美日韩在线观看| 久久综合福利| 欧美激情视频一区二区三区免费| 午夜精品在线看| 久久综合九色综合97婷婷女人| 亚洲免费成人| 国产精品18久久久久久久久久久久| 国产精品网站在线观看| 欧美在线小视频| 韩国在线一区| 国产经典欧美精品| 一区二区免费看| 2023国产精品自拍| 久久尤物视频| 国产综合欧美| 国产成人一区二区精品非洲| 粉嫩绯色av一区二区在线观看| 欧美日韩国产另类一区| 成人免费黄色大片| 国产精品久久99| 久久久久高清| 亚洲人成免费| 久久国产精品色婷婷| 欧美精品一区二区三区很污很色的 | 在线成人av网站| 亚洲欧美一级二级三级| 亚洲一区二区三区在线看| 欧美日韩一区二区三区高清| 972aa.com艺术欧美| 一区二区三区在线观看动漫| 欧美亚洲国产一区二区三区va| av在线这里只有精品| 亚洲精选视频在线| 欧美美女黄视频| 亚洲国产精品第一区二区三区 | 欧美日韩精品免费观看视一区二区| 亚洲欧美日韩一区二区三区在线观看| 色哟哟一区二区在线观看 | 日韩欧美国产精品| 亚洲激情女人| 国产曰批免费观看久久久| 国产精品丝袜91| 欧美色涩在线第一页| 欧美日韩妖精视频| 精东粉嫩av免费一区二区三区 | 国产综合亚洲精品一区二| 日产精品久久久久久久性色| 国产日产欧美一区二区视频| 快she精品国产999| 欧美一区综合| 国产在线不卡一区| 亚洲曰韩产成在线| 日韩精品一区二区三区swag| 久久黄色小说| 国产精品jizz在线观看美国| 国产一区二区视频在线播放| 一区二区不卡在线播放| 久久久精品综合| 欧美日本国产视频| 免费亚洲网站| 亚洲二区在线| 91欧美一区二区| 久久国产精品免费| 亚洲高清视频的网址| 国产亚洲女人久久久久毛片| 欧美精品在线观看播放| 免费国产一区二区| 精品91免费| 99国产一区二区三精品乱码| 国产精品资源网站| 日本aⅴ精品一区二区三区| 亚洲欧美日韩电影| 久久亚洲私人国产精品va媚药| 亚洲国产成人av网| 国产精品每日更新在线播放网址| 国产精品久久久久天堂| 一区二区三区中文免费| 午夜精品福利视频网站 | 日韩久久精品一区| 久久亚洲精品小早川怜子| 国产精品女人毛片| 亚洲五月六月丁香激情| 麻豆精品在线看| 成人免费视频视频| 欧美色123| 久久国产主播精品| 欧美一区二区三区电影| 欧美韩日一区二区三区四区| 一区二区三区日韩精品|