當(dāng)前位置：首頁 > 元宇宙 > AI

百度文小言官宣支持多模型調(diào)度，升級端到端語音大模型、圖片問答能力

來源：責(zé)編：時間：2025-04-02 14:33:18 118觀看

導(dǎo)讀 3 月 31 日消息，今日在新一期百度 AI DAY 上，文小言宣布完成品牌煥新與功能升級。除品牌視覺形象煥新外，文小言聚焦模型開放與功能創(chuàng)新，支持多模型融合調(diào)度，升級全新語音大模型、圖片問答、AI 生圖生視頻等多項能

3 月 31 日消息，今日在新一期百度 AI DAY 上，文小言宣布完成品牌煥新與功能升級。除品牌視覺形象煥新外，文小言聚焦模型開放與功能創(chuàng)新，支持多模型融合調(diào)度，升級全新語音大模型、圖片問答、AI 生圖生視頻等多項能力。

文小言此次升級的核心亮點在于“多模型融合調(diào)度”。通過整合百度自研的文心 X1、文心 4.5 等模型，并接入 DeepSeek-R1、可靈等第三方優(yōu)質(zhì)模型，文小言實現(xiàn)了多模型間的智能協(xié)同。用戶只需選擇“自動模式”，即可一鍵調(diào)用最優(yōu)模型組合，或根據(jù)需求靈活選擇單一模型完成特定任務(wù)，大幅提升響應(yīng)速度與任務(wù)處理能力。

據(jù)了解，此次功能升級，文小言進一步提升了全新語音大模型、圖片問答、AI 生圖生視頻等能力。全新語音大模型支持方言對話、復(fù)雜知識問答及隨時打斷等場景，用戶可進行語音知識問答或趣味角色扮演。

百度語音首席架構(gòu)師賈磊透露，該模型是百度在業(yè)界首個推出、基于全新互相關(guān)注意力 (Cross-Attention) 的端到端語音語言大模型。在語音場景滿足一定交互指標(biāo)下，大模型調(diào)用成本比行業(yè)平均降低 50%-90%，推理響應(yīng)速度極快，將語音交互等待時間壓縮至 1 秒左右，極大提升了交互流暢性。同時，在大模型加持下，實現(xiàn)了流式逐字的 LLM 驅(qū)動的多情感語音合成，情感飽滿、逼真、擬人，交互聽感也得到極大提升。

圖片問答功能讓用戶可以通過拍攝或上傳圖片，以文字或語音提問直接獲取深度解析。例如，拍攝一道數(shù)學(xué)題可實時生成解題思路與視頻解析；上傳多款商品圖可對比參數(shù)、價格，輔助購物決策；拍攝杯子設(shè)計圖后，AI 可自動解析風(fēng)格并生成同款手機殼、支架等周邊產(chǎn)品。

值得一提的是，新增的“圖個冷知識”功能更富趣味性，用戶可預(yù)設(shè)“歷史學(xué)者”“科技達人”等人設(shè)視角，為同一圖片賦予多維解讀。例如，當(dāng)用戶詢問“貓窗探秘，為何貓愛窗邊的科學(xué)真相？"，文小言能從狩獵本能、能量獲取、領(lǐng)地意識等角度給出獨特解讀。

本文鏈接：http://www.rrqrq.com/showinfo-45-11834-0.html百度文小言官宣支持多模型調(diào)度，升級端到端語音大模型、圖片問答能力

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：[email protected]

上一篇：百度端到端語音語言大模型發(fā)布，成本宣稱最高降 90%

下一篇： 5.28 億融資砸向杭州具身智能公司：清華叉院機器人天才坐鎮(zhèn)，被稱為“中國版 Figure”

標(biāo)簽：

熱門焦點

搶先推出“元宇宙”飲料，可口可樂贏麻了

試圖傍上元宇宙的品牌千千萬，但像可口可樂玩得這么花的，屬實不多。01 可口可樂盯上元宇宙1886年，可口可樂誕生于美國喬治亞州亞特蘭大市，至今已擁有136年的悠久歷
冰墩墩還能火多久？

作者：田巧云題圖源自北京2022年冬奧會官方微博如果要問2022年的開年明星是誰，冰墩墩當(dāng)仁不讓。幾乎所有人都被那個抖雪的動作實力圈粉。在社交媒體的助推，以及日
區(qū)塊鏈產(chǎn)業(yè)人才發(fā)展報告

工業(yè)和信息化部作為工業(yè)和信息化行業(yè)主管部門，正在著力推進“兩個強國”建設(shè)，加快推動以區(qū)塊鏈為代表的新興技術(shù)與實體經(jīng)濟深度融合。我國區(qū)塊鏈技術(shù)和應(yīng)用想要
NFT世界的藝術(shù)家名單

我們匯編了以下藝術(shù)家的名單，它包括每個藝術(shù)家的簡短概述。當(dāng)然，這份名單肯定不全面，還有很多很多藝術(shù)家、哲學(xué)家和商業(yè)領(lǐng)袖為世界貢獻了不可估量的價值。而他們
NFT領(lǐng)域，我們是否應(yīng)該遵守版權(quán)法

NFTs中最有爭議的因素之一是你是否真的 "擁有 "你所購買的藝術(shù)品。除此之外，圍繞著NFT行業(yè)內(nèi)的版權(quán)和知識產(chǎn)權(quán)盜竊的問題也同樣重要，因為人們很容易誤解這些事情
元宇宙存在的意義和價值

科技公司目前都在猶豫，看誰能在元宇宙上押下更大的賭注。然而，除了巨額的資金投入，到底要怎樣才能獲勝在很大程度上還沒有得到證實。它是否僅僅是對當(dāng)前數(shù)字景觀
FTX 加密貨幣交易所開始向游戲公司提供加密服務(wù)

據(jù)媒體報道，業(yè)內(nèi)領(lǐng)先的加密貨幣交易所FTX宣布將涉足游戲領(lǐng)域。該公司表示，計劃推出自己的游戲部門作為中介，專注于為傳統(tǒng)游戲公司提供加密相關(guān)服務(wù)。此舉將有助于
知名藝術(shù)家打造去中心化“好萊塢”：一部電影一個DAO

根據(jù)市場追蹤網(wǎng)站 DappRadar 的數(shù)據(jù)，隨著 NFT 的“出圈”與加密貨幣的普及，NFT 市場在 2021 年的銷售額達到約 250 億美元，而 2020 年僅為 9490 萬美元，同比增超 2
初探元宇宙

2021年可以被稱為“元宇宙”元年。繼2021年3月沙盒游戲平臺Roblox將“元宇宙”概念放入招股書中，被稱為“元宇宙”第一股后，F(xiàn)acebook更名為Meta, 引發(fā)全球范圍內(nèi)

国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美日韩国产一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

百度文小言官宣支持多模型調(diào)度，升級端到端語音大模型、圖片問答能力

搶先推出“元宇宙”飲料，可口可樂贏麻了

冰墩墩還能火多久？

區(qū)塊鏈產(chǎn)業(yè)人才發(fā)展報告

NFT世界的藝術(shù)家名單

NFT領(lǐng)域，我們是否應(yīng)該遵守版權(quán)法

元宇宙存在的意義和價值

FTX 加密貨幣交易所開始向游戲公司提供加密服務(wù)

知名藝術(shù)家打造去中心化“好萊塢”：一部電影一個DAO

初探元宇宙

最新推薦

三院士三教授熱聊元宇宙&——AIGC，學(xué)術(shù)界怎么看？

《蜘蛛俠》火了，超級英雄就該這么演

亞馬遜AIGC全家桶來襲，巨頭AI大亂戰(zhàn)都有什么殺手锏

元宇宙“概念股”集體崩塌，背后究竟發(fā)生了什么？

Kitten Coup社區(qū)反轉(zhuǎn)Cool Kittens NFT騙局

韓國建立元宇宙生態(tài)系統(tǒng)，智度股份發(fā)布元宇宙社區(qū)Meta彼岸

猜你喜歡

熱門推薦

相關(guān)資訊