国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 元宇宙 > AI

菲爾茲獎得主親測 GPT-4o,經典過河難題破解失敗

來源: 責編: 時間:2024-07-03 17:11:58 251觀看
導讀 編輯:桃子喬楊【新智元導讀】LLM 能否解決「狼-山羊-卷心菜」經典過河難題?最近,菲爾茲獎得主 Timothy Gowers 分享了實測 GPT-4o 的過程,模型在最簡單的題目上竟然做錯了,甚至網友們發現,就連 Claude 3.5 也無法幸

IEz28資訊網——每日最新資訊28at.com

編輯:桃子喬楊IEz28資訊網——每日最新資訊28at.com

【新智元導讀】LLM 能否解決「狼-山羊-卷心菜」經典過河難題?最近,菲爾茲獎得主 Timothy Gowers 分享了實測 GPT-4o 的過程,模型在最簡單的題目上竟然做錯了,甚至網友們發現,就連 Claude 3.5 也無法幸免。IEz28資訊網——每日最新資訊28at.com

在經典的「狼-山羊-卷心菜」過河問題上,如今所有的 LLM 都失敗了!IEz28資訊網——每日最新資訊28at.com

幾天前,菲爾茲獎得主、劍橋大學研究主任 Timothy Gowers 直接拿 GPT-4o 開刀,去解決動物過河難題。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

在此,他給出了一個新的基準 —— 廢話比率(crapness ratio),即 LLM 給出的總答案與正確答案之間的比率。IEz28資訊網——每日最新資訊28at.com

經過測試,Gowers 發現大模型的廢話比率可以達到 5 倍。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

一開始,他先給出了一個農民帶 2 只雞過河,一只船只能容納一個人和 2 個動物,那么農夫帶著兩只雞渡河所需的最少渡河次數是多少?IEz28資訊網——每日最新資訊28at.com

別說成年人了,就拿低幼小孩子來說,一聽完題目,就立馬給出正確的答案。IEz28資訊網——每日最新資訊28at.com

搞笑的是,ChatGPT 的回答分解了 5 個步驟,讓人看著極其愚蠢荒謬。IEz28資訊網——每日最新資訊28at.com

第一次渡河:農夫帶著兩只雞一起過河;現狀:農夫和兩只雞在河對岸。IEz28資訊網——每日最新資訊28at.com

第二次渡河:農夫把兩只雞留在對岸,然后獨自返回;現狀:農夫在起始岸,兩只雞在對岸。IEz28資訊網——每日最新資訊28at.com

第三次渡河:農夫帶一只雞過河;現狀:農夫和一只雞在對岸,一只雞在起始岸。IEz28資訊網——每日最新資訊28at.com

第四次渡河:農夫把雞留在對岸,獨自返回;現狀:農夫在起始岸,一只雞在對岸。IEz28資訊網——每日最新資訊28at.com

第五次渡河:農夫帶著第二只雞過河。現狀:農夫和兩只雞都在對岸。IEz28資訊網——每日最新資訊28at.com

因此,農夫帶兩只雞過河所需的最少次數是 5 次。IEz28資訊網——每日最新資訊28at.com

這里,ChatGPT 必須在邏輯上把「農民」和人聯系起來,把「雞」和動物聯系起來,然后規劃出最佳的過河次數。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

對此,LeCun 表示,大模型全新基準 —— 廢話比率。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

當然,也有為 LLM 打抱不平的網友。IEz28資訊網——每日最新資訊28at.com

他表示,你可以對任何人做類似的事情。如果你愿意,可以讓任何一個人不及格。LLM 與人類的智商相去甚遠,但把它們放在極端的測試中不會很好地評估它們。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

還有人勸誡道,朋友們,現在辭職太早了。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

加大難度:100、1000 只雞如何?

為了得到較大的比率,Gowers 這次給出了 100 只雞過河的問題。IEz28資訊網——每日最新資訊28at.com

這里雖沒有放出具體的解題過程,不過,Gowers 表示,GPT-4o 竟答對了。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

接下來,再次加大難度,一個農民帶 1000 只雞過河,模型表現怎么樣?IEz28資訊網——每日最新資訊28at.com

提示是,1000 只雞在河的一邊,農夫需要將 999 只雞移到河的另一邊,留下 1 只雞在起點。IEz28資訊網——每日最新資訊28at.com

然而,他的船上有一個洞,所以在每次渡河開始時,他可以帶上十只雞。但到渡河快結束時,船里進了太多水,如果不想讓任何雞溺水,就只能容納兩只雞。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

為了實現目標而不讓任何雞溺亡,農民最少需要渡河幾次?IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

Gowers 表示,這次的廢話比率是 125 倍。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

隨后,Gowers 展示了相當長的例子,卻發現 ChatGPT 的答案比正確答案呈指數級增長。(然而,這更多與它的數學能力有關,所以有點取巧。)IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

在網友測試的一個案例中,即使被告知農夫根本不需要過河,GPT-4o 仍提出了一個 9 次渡河的復雜解決方案。IEz28資訊網——每日最新資訊28at.com

而且它忽視了重要的約束條件,比如不能讓雞單獨和狼在一起,這本來是完全可行的,因為農夫根本不需要過河。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

Claude 3.5 也失敗了

在接下來的討論中,網友用 Claude 3.5 進行了測試,得到了 3 倍的比率。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

Gowers 稱,這算是輸了。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

另一個測試題中,「一個農夫帶著一只羊站在河邊。河上有一條船,可以容納一個人和一只羊。農夫怎樣才能用最少的船把自己和羊送到河對岸?」IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

Claude 3.5 依舊答錯了。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

LeCun 在此嘲諷大模型一番,大模型竟可以推理...?IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

問題在于,LLM 沒有常識,不理解現實世界,也不會規劃和推理。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

LLM 行不行,就看提示了

一位網友分析總結了,以上 LLM 失敗的原因。他表示,LLM 本身就是個「啞巴」,所以需要很好的提示。上面的提示方式提供了太多不必要的信息,使得 token 預測變得更加困難。如果給出更清晰的提示,LLM 就能提供更清晰的解決方案。所以,不用擔心 AGI 會很快出現。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

另一位網友同樣發現,如果用「動物」代替「雞」,那么 Claude 3.5 Sonnet 一下子就解決了這個問題。IEz28資訊網——每日最新資訊28at.com

對于「狼-山羊-卷心菜」問題也是如此,需要用「通用名稱」替換「實體名稱」。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

如下是另一個名詞替換的例子。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

或許是模型的訓練數據誤導了自己,讓問題變得過于復雜。IEz28資訊網——每日最新資訊28at.com

對于雞的問題,在相同的提示下一遍又一遍地重復問題會讓它更好地理解它。網友重復了 5 次,試了 15 次才得到正確的答案。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

菲爾茲獎得主發現 LLM 數學缺陷

值得一提的是,發出渡河問題帖子的這位 Timothy Gowers 不僅是劍橋大學三一學院的教授。早在 1998 年,他就因為將泛函分析和組合學聯系在一起的研究獲得了菲爾茲獎。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

近些年來,他的研究工作開始關注 LLM 在數學推理任務中的表現。IEz28資訊網——每日最新資訊28at.com

去年他與別人合著的一篇論文就指出了當今 LLM 評估數學任務的缺陷。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

論文地址:https://www.pnas.org/ doi / 10.1073 / pnas.2318124121

文章表示,目前評估 LLM 的標準方法是依賴靜態的輸入-輸出對,這與人類使用 LLM 的動態、交互式情境存在較大的差異。IEz28資訊網——每日最新資訊28at.com

靜態的評估限制了我們理解 LLM 的工作方式。為此,作者構建了交互式評估平臺 CheckMate 和評分數據集 MathConverse。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

在對 GPT-4、InstructGPT 和 ChatGPT 嘗試進行評估的過程中,他們果然探測到了 LLM 犯數學錯誤的一個可能原因 —— 模型似乎傾向于依賴記憶解題。IEz28資訊網——每日最新資訊28at.com

在數學領域,記住概念和定義是必不可少的,但具體問題的解決更需要一種通用、可概括的理解。IEz28資訊網——每日最新資訊28at.com

這對于人均做過奧數題的中國人來說并不難理解。除非考試出原題,單純把例題背下來沒有任何益處,有時候還會誤導思路、適得其反。IEz28資訊網——每日最新資訊28at.com

作者提出,雖然沒有辦法看到 GPT-4 的訓練數據,但是從行為來看,強烈懷疑模型是「死記硬背」了看似合理的示例或者解題模式,因而給出了錯誤答案。IEz28資訊網——每日最新資訊28at.com

他們也發現,在 LLM 對數學問題的回答中,人類感知到的「有用性」和答案本身的「正確性」,這兩個指標高度相關,皮爾遜相關系數高達 0.83。IEz28資訊網——每日最新資訊28at.com

也許這就是為什么 Gowers 在推文中會用「廢話比率」來調侃 LLM。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

其他測試

事實上,大模型被詬病推理能力已經不是一天兩天了。IEz28資訊網——每日最新資訊28at.com

就在幾周前,研究人員發現,能用一句話描述的簡單推理問題,就能讓各路大模型以花樣百出的方式翻車。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

論文地址:https://arxiv.org/ abs / 2406.02061

「愛麗絲有 M 個兄弟,N 個姐妹,請問愛麗絲的兄弟有幾個姐妹?」IEz28資訊網——每日最新資訊28at.com

如果你的答案是 N+1,那么恭喜你。你的推理能力已經超越了當今的幾乎所有 LLM。IEz28資訊網——每日最新資訊28at.com

推特網友還發現了另一個絆倒幾乎所有 LLM 的簡單問題:(劇透,只有 Claude 3.5 Sonnet 答對了)IEz28資訊網——每日最新資訊28at.com

「你有一個 3 加侖的水壺和一個 5 加侖的水壺,還有無限量的水。如何準確測量 5 加侖的水?」IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

他總結道,如果想要羞辱 LLM 的推理能力,只需要挑一些流行的推理 / 邏輯謎題,稍微修改一下語言表述,你就能搬起小板凳狂笑了。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

OpenAI CTO 曾放話說 GPT-4 已經達到了「聰明高中生」的智力水平,下一代模型要達到博士水平… 這番言論放在眾多 LLM 失敗案例面前顯得格外諷刺。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

我們之所以會如此震驚于 LLM 在簡單的推理任務上翻車,不僅僅是因為與語言任務的慘烈對比,更是因為這與各種基準測試的結果大相徑庭。IEz28資訊網——每日最新資訊28at.com

從下面這張圖中可以看到,LLM 在各種基準測試上的飽和速度越來越快。IEz28資訊網——每日最新資訊28at.com

幾乎是每提出一個新的測試集,模型就能迅速達到人類水平(圖中 0.0 邊界)甚至超越,其中不乏非常有挑戰性的邏輯推理任務,比如需要復雜多步驟推理的 BBH(Big-Bench Hard)和數學應用題測試集 GSK8k。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

其中的 HellaSwag 測試集,由華盛頓大學和 Allen AI 在 2019 年推出,專門針對人類擅長但 LLM 一塌糊涂的常識推理問題。IEz28資訊網——每日最新資訊28at.com

剛剛發布時,人類在 HellaSwag 上能達到超過 95% 的準確率,SOTA 分數卻始終難以超過 48%。IEz28資訊網——每日最新資訊28at.com

但這種情況并沒有持續很久。各個維度的分數持續猛漲,2023 年 3 月,GPT-4 在 HellaSwag 上的各項得分就逼近,甚至超過了人類水平。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

https://rowanzellers.com/hellaswag/

為什么在基準測試上如此驚艷的模型,一遇到現實的數學問題就翻車?由于我們對 LLM 的工作原理知之甚少,這個問題的答案也是眾說紛紜。IEz28資訊網——每日最新資訊28at.com

目前的大部分研究依舊假設 LLM 有這方面的潛力,因此從調整模型架構、增強數據、改進訓練或微調方法等方面「多管齊下」,試圖解鎖模型在非語言任務上的能力。IEz28資訊網——每日最新資訊28at.com

比如上面那個提出用「裝水問題」測試 LLM 的 Rolf 小哥就表示,根本原因是模型的過度訓練(也可以理解為過擬合),需要引入多樣化的推理任務。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

也有人從基準測試的角度出發,認為是數學、推理等任務的測試集設計得不夠好,IEz28資訊網——每日最新資訊28at.com

Hacker News 論壇上曾有數學家發文,表示 GSK8k 這種小學數學應用題級別的測試根本不能衡量 LLM 的實際數學能力。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

此外,測試數據泄露也是不可忽視的因素。HellaSwag 或者 GSK8k 這樣的公開測試集一旦發布,很難不流入互聯網(Reddit 討論、論文、博客文章等等),進而被抓取并納入到 LLM 的訓練數據中。IEz28資訊網——每日最新資訊28at.com

Jason Wei 在上個月發表的討論 LLM 基準測試的博客就專門討論了這個問題。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

文章地址:https://www.jasonwei.net/blog/evals

最極端的一派當屬 LeCun 等人了,他們堅稱自回歸 LLM 發展下去沒有任何出路。IEz28資訊網——每日最新資訊28at.com

現在的模型沒法推理、規劃,不能理解物理世界也沒有持久記憶,智能水平還趕不上一只貓,回答不了簡單的邏輯問題實屬意料之中。IEz28資訊網——每日最新資訊28at.com

IEz28資訊網——每日最新資訊28at.com

LLM 的未來究竟走向何處?最大的未知變量也許就在于,我們是否還能發現類似思維鏈(CoT)這種解鎖模型性能的「大殺器」了。IEz28資訊網——每日最新資訊28at.com

參考資料:IEz28資訊網——每日最新資訊28at.com

https://the-decoder.com/llms-give-ridiculous-answers-to-a-simple-river-crossing-puzzle/IEz28資訊網——每日最新資訊28at.com

https://www.pnas.org/doi/10.1073/pnas.2318124121IEz28資訊網——每日最新資訊28at.com

https://claude101.com/llm-large-language-model-benchmarks/IEz28資訊網——每日最新資訊28at.com

本文來自微信公眾號:新智元(ID:AI_era)IEz28資訊網——每日最新資訊28at.com

本文鏈接:http://www.rrqrq.com/showinfo-45-4913-0.html菲爾茲獎得主親測 GPT-4o,經典過河難題破解失敗

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:[email protected]

上一篇: 幫你寫腳本、剪片、找素材,谷歌 AI 視頻編輯應用 Google Vids 上線測試

下一篇: 微軟 Copilot for Microsoft 365 下月將迎新功能,設計、寫作全面賦能

標簽:
  • 熱門焦點
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
青青青伊人色综合久久| 国产精品二区三区四区| 人人爽香蕉精品| 午夜精品福利视频网站| 亚洲a一区二区| 日韩va亚洲va欧美va久久| 亚洲二区在线视频| 青娱乐精品视频| 国产又粗又猛又爽又黄91精品| 国产在线一区观看| 成人丝袜高跟foot| 欧美精品一卡| 一本久道久久久| 日本道色综合久久| 欧美美女激情18p| 久久亚洲私人国产精品va媚药| 国产欧美日韩不卡免费| 亚洲欧洲日韩女同| 亚洲国产一区二区视频| 久久国产精品一区二区| 国产成人在线观看| 国产综合第一页| 久久人人97超碰国产公开结果| 国产精品一区二区a| 一本大道久久a久久综合婷婷| 欧美日韩国产精品成人| 久久精品欧美日韩| 亚洲一区二区欧美日韩 | 欧美人成在线| 麻豆久久婷婷| 欧美成人性福生活免费看| 国产女人18水真多18精品一级做| 一区二区三区中文免费| 久久97超碰国产精品超碰| 成人av网站在线| 国产亚洲午夜| 日韩一区二区三免费高清| 国产精品短视频| 日韩av一级片| 色综合色综合色综合| 免费看亚洲片| 日韩午夜在线播放| 亚洲精品欧美专区| 国产精品自在欧美一区| 亚洲国产一区二区三区高清| 欧美午夜精品一区二区三区| 国产亚洲精品精华液| 午夜精品福利一区二区三区av| 成人在线视频一区| 噜噜噜久久亚洲精品国产品小说| 精品欧美久久久| 日韩主播视频在线| 国内精品久久久久久久影视蜜臀 | 影音先锋久久精品| 3atv一区二区三区| 亚洲午夜激情网站| 91尤物视频在线观看| 在线视频国产一区| 亚洲欧美日韩在线不卡| 成人中文字幕合集| 91国产免费看| 亚洲六月丁香色婷婷综合久久| 国产东北露脸精品视频| 媚黑女一区二区| 国产精品久久久爽爽爽麻豆色哟哟 | 精品剧情在线观看| 久久成人羞羞网站| 亚洲欧美久久久| 亚洲国产成人私人影院tom| 国产精品1区2区| 色偷偷88欧美精品久久久| 亚洲欧洲精品天堂一级 | 蜜桃久久精品乱码一区二区| 国产精品美女久久久久久久久久久 | 国产成人综合网| 日本久久电影网| 亚洲一线二线三线视频| 精品不卡一区| 久久精品一区二区三区四区| 国产成人亚洲精品青草天美| 欧美性做爰猛烈叫床潮| 亚洲国产一区二区在线播放| 亚洲二区精品| 国产亚洲欧美在线| 99久久99久久免费精品蜜臀| 欧美一三区三区四区免费在线看| 日韩高清一区在线| 免费一区视频| 亚洲成人综合视频| 香蕉精品999视频一区二区| 亚洲欧美一区二区三区久本道91| 欧美精品三区| 中日韩免费视频中文字幕| 91视频一区二区三区| 久久久久国产一区二区三区四区| 成人一区二区在线观看| 日韩欧美黄色影院| 高清成人在线观看| 欧美xxxx老人做受| 91日韩在线专区| 国产亚洲精品aa| 欧美精品97| 亚洲欧美另类小说| 日韩一区二区久久| 亚洲国产视频a| 91国内精品野花午夜精品| 久久爱另类一区二区小说| 欧美探花视频资源| 国产一区二区三区综合| 日韩午夜在线观看| 91浏览器入口在线观看| 国产精品网曝门| 99在线|亚洲一区二区| 亚洲综合激情网| 久久精彩视频| 国产原创一区二区| 久久久久久久久免费| 欧美精品偷拍| 亚洲福利视频一区| 欧美精品在欧美一区二区少妇| 国产成都精品91一区二区三| 久久婷婷综合激情| 国产色综合网| 精品一区免费av| 精品国产乱子伦一区| 激情综合久久| 日本vs亚洲vs韩国一区三区 | 精品99久久久久久| 亚洲成色精品| 日日嗨av一区二区三区四区| 91精品国产综合久久福利| 99re这里都是精品| 亚洲午夜视频在线观看| 欧美日韩一区二区三区四区| 成人av网站免费| 亚洲综合视频在线| 777xxx欧美| 在线播放精品| 国产一区二区精品久久91| 欧美激情一区二区三区四区| 性久久久久久| 不卡欧美aaaaa| 亚洲精品国产精品乱码不99| 欧美日韩一级视频| 国内精品久久国产| 精品亚洲欧美一区| 日韩伦理免费电影| 91精品国产综合久久久久久久久久| 欧美va亚洲va日韩∨a综合色| 日本亚洲视频在线| 国产视频一区在线观看| 色婷婷一区二区三区四区| 91日韩精品一区| 青青草精品视频| 国产精品国产馆在线真实露脸| 欧美日韩一区国产| 一本色道久久99精品综合| 高潮精品一区videoshd| 亚洲综合一区二区精品导航| 精品国产乱码久久久久久影片| 久久亚洲午夜电影| 国产尤物精品| 成人高清在线视频| 久久精品久久精品| 亚洲精选免费视频| 久久久久高清精品| 欧美久久久久久久久久| 国产精品毛片在线| 国产一区日韩一区| 成人一区二区三区中文字幕| 美女一区二区三区在线观看| 亚洲免费观看高清完整| 久久久久成人黄色影片| 制服丝袜亚洲播放| 91福利视频在线| 亚洲免费中文| 在线日韩av永久免费观看| va亚洲va日韩不卡在线观看| 久久超级碰视频| 午夜精品国产更新| 一区二区三区四区不卡在线| 国产精品免费av| 欧美国产丝袜视频| 精品成人在线观看| 3d成人h动漫网站入口| 欧美视频精品在线观看| 米奇777在线欧美播放| 国产日产高清欧美一区二区三区| 国产精品xnxxcom| 91麻豆精品秘密| av电影一区二区| 成人丝袜视频网| 成人sese在线| av在线一区二区| 成人福利视频网站| 丰满亚洲少妇av| 成人av资源站| 91性感美女视频| 女同性一区二区三区人了人一| 色综合天天综合|