026-569256939

我们只用绿色的食品原料

体育app零食加工厂,只为您的健康着想

百度舆图语音定制功效启示:百度正在用AI改变一切

本文摘要:文|吴俊宇美国鬼才科普作家詹姆斯·弗拉霍斯用《智能语音时代》这样一个标题形容了如今语音科技对人们的影响。他的副标题很有趣——商业竞争、技术创新与虚拟永生。在他看来,每十年左右,人与技术的互动方式就会有一个基础性的转变。数十亿美元的财富会“恭候”那些界说了新的时代范式的公司,而落伍者将破产倒闭。 语音正在酿成影响现实的通用遥控器,成为险些能控制任何一种技术装置的手段。语音打破了世界上一些最有价值的公司的商业模式,为新的应用缔造了时机。

体育app

文|吴俊宇美国鬼才科普作家詹姆斯·弗拉霍斯用《智能语音时代》这样一个标题形容了如今语音科技对人们的影响。他的副标题很有趣——商业竞争、技术创新与虚拟永生。在他看来,每十年左右,人与技术的互动方式就会有一个基础性的转变。数十亿美元的财富会“恭候”那些界说了新的时代范式的公司,而落伍者将破产倒闭。

语音正在酿成影响现实的通用遥控器,成为险些能控制任何一种技术装置的手段。语音打破了世界上一些最有价值的公司的商业模式,为新的应用缔造了时机。这一次,百度舆图用语音定制功效同时展现了品牌营销和技术积淀的双重能力。

其中的语音技术未来的ToB、ToC领域也都有宽阔的运用空间。一品牌营销的创新已往舆图行业经常找来明星站台,通过明星语音包的方式展开品牌运动。这种计谋简直卓有成效,事实上,不管是汤唯、林志玲语音都很受用户的接待。

可是要知道,明星的粉丝究竟圈层有限,明星语音可能仅仅只能吸引一部门粉丝用户,想要真正扩大圈层,实现营销破圈,可能要接纳一些此外计谋。不外有趣的是,9月19日,百度舆图公布语音定制功效,直接推出了用户定制专属语音包。定制方式很简朴,打开百度舆图App,叫醒“小度小度”后说“录制我的语音”,或点击百度舆图首页的“出行助手”后进入“语音定制”,便可开启语音定制之旅。在平静的情况中,随着百度舆图指引,念出卡通和影视台词等充满趣味性的录制文本,等候约莫20分钟,就能拥有一个自己专属的语音包。

百度舆图事业部总司理李莹最后你就可以用自己的语音包替换掉其他明星语音包,可以在百度舆图的景区智能语音导览、智能语音交互、导航等全部场景使用。让用户使用舆图时听着自己的语音,这或许是一个对所有人来说,都是个饶有趣味的实验,这种实验的有趣之处在于:1、满足新鲜感;明星语音已经是市面上大部门手机舆图的通例操作,由于传导机制的差别,人们听自己声音与自己声音的录音往往差别,这种“奇妙而羞耻”的感受往往比明星语音来得更有趣。2、打破了圈层;明星语音究竟只是一部门粉丝群体会选择使用,可是自己的语音却是所有人都感兴趣的,不花一分钱请明星做代言,不针对少部门粉丝用户群体,直接用技术手段笼罩所有用户群体,这种计谋可谓是四两拨千斤。

可以说,这既是一次营销运动,也是一次技术展示。而且两者有着很好的联合,已经很少有品牌营销能够真正让技术能力获得释放,可是百度舆图这次做到了。它让技术和营销软硬兼备。

二语音技术的跃进这个功效主要应用了百度独创的气势派头迁移技术Meitron模型。所谓气势派头迁移这个观点最早泉源于图像领域的观点,简朴说就是:将一张图片的艺术气势派头应用到另外一张图片上。语音的气势派头迁移其实也被称作是“语音克隆”(voice clone)、“多说话人气势派头迁移”(multi-speaker)、“气势派头迁移”(style transfer)、“语音转换”(voice conversion)。

要知道语音的气势派头迁移很是难题。因为深度网络对于语音处置惩罚难题。一来不如图像和文本事域研究火热,二来语音所具有的信息,难以编码到高维隐空间。

体育app

一段语音时间序列中,混杂着以下方面的信息:说话人特征(如一小我私家的音色,音调等);语言学内容(语音表述的内容);副语言特征(如情感等)。2017年,美国曾有一篇名为《Style Tokens: Unsupervised Style Modeling, Control and Transfer in End-to-End Speech Synthesis》的学术论文讲述气势派头迁移的问题。百度舆图这次接纳的Meitron模型其特点主要体现在发音人音色转换,多情感朗读和韵律气势派头迁移三个方面,从而让个性化语音合成的定制门槛大大降低。要知道,已往明星舆图语音的录制很是贫苦。

体育app

以高德舆图的林志玲语音为例,它的制作分成两块。一块是根据录音稿录制出来的语音内容。

另一块则是高德其时找专人,跟了林志玲几个月,贴身录音,把原始声音文件处置惩罚提取出数字特征。再接纳通用的、很完善波型合成技术,将元音、辅音及音调等采样,通过算法实现文语转换。这是2014年明星语音生成的处置惩罚方案——看完你或许会想,录个音实在太难了。

可是在Meitron模型下情况就纷歧样了,这个模型背后的技术支撑是百度大脑语音技术的赋能。AI的加持让舆图语音包生产实现了从月级别到分钟级此外突破性希望。百度语音首席架构师贾磊该模型是现在行业领先的语音合成技术。

用手机即可完美复刻说话者的音色,气势派头,情绪等。关键是,仅仅只需要20分钟就能全部生成。也就是说,未来不管是什么明星,他们的语音只需要在Meitron模型里跑20分钟,基本就能生成一个完整的导航语音包。

语音合成能力越强,其实也说明未来人机交互、语义明白的可能性越大,机械阅读的能力越强。短短5年时间,AI加持下的语音技术可谓突飞猛进。百度大脑的实力可见一斑。

三未来商业的联合点这次品牌营销其实也是百度语音技术的一次能力展示,它未来在ToB侧、ToC侧都可以有更多联合之处。好比深度神经网络技术,提供高度拟人、流通自然的语音合成服务,让客户的应用、设备开口说话,更具个性。1、教育和阅读类产物:让课程和解说变得重生动通过阅读类APP阅读小说或新闻时,如果使用语音合成技术为用户提供多种发音人的朗读功效,释放双手和双眼,获得更极致的阅读体验。

2、生活和服务类产物:让服务交互效率得以提升语音合成还可应用于打车软件、餐饮叫号、排队软件等场景,通过语音合成举行订。


本文关键词:体育app,百度,舆图,语音,定制,功效,启示,正,在用,改变

本文来源:体育app-www.cdmingxiang.com