
发布日期:2025-03-31 20:42 点击次数:144
在本日的百度AI DAY嘉会上爱操操网,百度公司震荡发布了其首个基于立异相互关切释力(Cross-Attention)机制的端到端语音说话大模子。这一麻烦性本领不仅在电话语音信答场景中扫尾了超低时延与超低资本,还使得调用资本较行业平均水平显耀数落了50%至90%。
与此同期,百度旗下的文小言品牌也迎来了焕新时刻,起初接入了这一前沿模子。文小言不仅迎来了多模子交融周折、图片问答等功能上的全面升级,更在语聊后果上扫尾了拟真度的飞跃。这次升级后,文小言撑合手重庆、广西、河南、广东、山东等多地特点方言,进一步拓宽了使用场景。
据百度先容,该语音大模子在查考和使用资本上极具上风,推理反馈速率极快,将用户恭候时长从行业常见的3-5秒镌汰至约1秒,极地面擢升了语音交互的畅通性。这一本领麻烦,无疑将为用户带来愈加高效、粗浅的语音交互体验。
更新后的文小言还撑合手“多模子交融周折”功能,整合了百度自研的文心X1、文心4.5等模子,并接入了DeepSeek-R1品级三方优质模子。用户不错凭证需求遴荐“自动边幅”,一键调用最优模子组合,大要遴荐特定模子完成特定任务,从而进一步擢升反馈速率与任务解决智力。
文小言的图片问答功能也得到了显耀加强。用户只需拍摄或上传图片,即可通过笔墨或语音发问,平直赢得深度知道。这一功能不仅适用于数学题意见及时知道,还能匡助用户对比商品参数、价钱,补助购物有盘算。
为了欢欣用户对图片多维解读的需求,文小言还新增了“图个冷学问”功能。用户不错预设“历史学者”、“科技达东说念主”等东说念主设视角,为吞并图片赋予不同维度的解读。举例,当用户商讨“猫为何偏疼窗边”时,文小言能从狩猎本能、能量赢得、领地结实等多个角度给出独到且意旨的解读。
百度语音首席架构师贾磊在活动中流露,这是百度在业界首个推出的基于全新相互关切释力(Cross-Attention)机制的端到端语音说话大模子。他示意:“在欢欣一定交互方针的前提下,该大模子的调用资本远低于行业平均水平爱操操网,推理反馈速率极快,将语音交互恭候时辰压缩至约1秒,极大擢升了交互的畅通性和用户体验。同期,在大模子的加合手下,咱们扫尾了流式逐字的LLM运行的多厚谊语音合成,使得语音交互愈加厚谊足够、传神且拟东说念主化。”
Powered by telegram 偷拍 @2013-2022 RSS地图 HTML地图
Copyright Powered by365建站 © 2013-2024