查看原文
其他

1024程序员节丨点击接收24K高保真祝福

AIspeech 思必驰 2023-09-02


10.24,一年一度的程序员节到了

点击接收这份祝福


 

哎吆,不错哦~这个音频很真心。

那是自然,24k高保真臻品音色,心意真,音质更真。


近期,思必驰DUI开放平台上线了24K高保真臻品音色,包含三款臻品女音,一款臻品男音,为用户的AI语音产品提供听感更自然的高质量语音。



24K高保真音色

打造臻品语音

在智能语音产品中,清晰、饱满、富有感情色彩的智能语音能为用户带来更好的人机交互体验。


近日,思必驰DUI开放平台上线四款不同音色的24K高保真音色:

臻品女声芊芊:温柔大方,适合有声阅读、智能客服等场景。

臻品女声楚楚:活泼开朗,适合语音导航、智能家居等场景。

臻品女声芳芳:天真可爱,适合智能客服、故事机等场景。

臻品男声小军:成熟稳重,适合语音导航、语音播报等场景。

在人机交互体验中,除了清晰饱满的音质外,语音产品的情绪也至关重要。四款臻品音色还可以搭配中性、抱歉、难过、高兴四种情感音色,让智能语音情感更加丰富,充满活力。



那么,为什么24K高保真音色听起来更加细腻自然呢?这要从与音质的好坏息息相关的采样率说起。

   

采样率,也称为采样速度或者采样频率,就是每秒对声音进行采集的次数,它用赫兹(Hz)来表示。采样率越高,声音的还原度就越真实越自然。


常用采样率:

8KHz——电话所用采样率,对于说话沟通已经足够;

11.025KHz——AM调幅广播所用采样率;

22.05KHz和24KHz-——FM调频广播所用采样率;

44.1KHz ——音频CD、MP3常用采样率。

人对频率的识别范围是20HZ - 20KHZ,如果每秒钟能对声音做20000个采样,回放时就足以满足人耳的需求。所以22.05KHz的采样频率是常用的,44.1KHz已是CD音质,超过48KHz的采样,人耳已几乎分辨不出来。


目前,市场上AI语音产品的主流采样率为8K、16K、24K。其中,24K是目前AI语音产品最好的采样率。


思必驰上线24K臻品音色后,除四款音色、情感可供用户选择外,用户还可以就语速和音量进行调节,定制个性化语音。


通过思必驰DUI开放平台打造出的臻品语音可广泛应用于各类场景中。智能家居场景,可应用于电视、空调、冰箱等产品;出行场景,可应用于语音导航、车载音箱中;消费电子场景,可应用于故事机、智能手表、手机等产品中。



仅需4步

即可体验臻品音色

想要获得这样一段24K高清富含情绪的音质,仅需4步。

第一步:

扫码登录“小驰慧听”小程序;

第二步:

点击栏目【语音合成】;

第三步:

选择【臻品推荐】栏目;

第四步:

输入文本,选择喜欢的音色和情感即可合成臻品音色。


近年,随着深度学习技术的不断发展,越来越多的语音合成系统(特别是云端语音合成系统)已经发展至以深度学习神经网络为主流技术的语音合成系统,语音合成的质量也相较以往有了巨大提升。


思必驰主要采用基于深度神经网络的TTS技术,涉及的业务范围涵盖了大数据语音定制、小数据快速定制、声音克隆、歌声合成、小语种合成、方言合成、情感合成等。已建设的音色库接近200个,音色涵盖多种角色,多种风格,各个年龄层次。部署方式可选公有云、私有云以及离线三种部署方式,可方便用户灵活选择。


未来,思必驰将为用户提供更自然、真实和富有情感的语音合成效果、个性化风格可控的语音合成,助力用户打造多样化的AI语音产品。




—如有合作意向,请发邮件—

marketing@aispeech.com




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存