我们已经进入 21 世纪几十年了,汽车真的开始飞起来了,去太空度假指日可待……然而不知何故,每当被要求将文本转换为 -语音(TTS)。 来吧,开发者,必须有更好的解决方案。
一家名为 WellSaid Labs 的公司相信它拥有一个,并且由于超额认购的 A 系列而得到提振。
“简单明了,WellSaid 是语音内容创作的未来。这就是为什么成千上万的客户喜欢每天使用该产品并采用自下而上的方式使用该产品。马特和迈克尔组建了一支世界一流的团队,我们 能够成为 WellSaid 旅程的一部分,我感到无比激动,”领投该轮融资的 FUSE 普通合伙人 Cameron Borumand 说。
我会开门见山地告诉你,你可以在这里听声音样本。
在将文本转换为语音时使数字化语音听起来像人声的问题看似复杂,这是人工智能领域的重大挑战之一,也是计算机科学、人机界面和机器人等领域大量研究的课题。 2020 年 6 月,根据一份声明,WellSaid Labs 的文本转语音成为第一个在跨多种语音的短音频剪辑上实现人类对等自然度的方法。
WellSaid Labs 首席执行官 Matt Hocking 表示:“我们已将 AI Voice 添加到数以千计的内容创作者及其团队的工具包中。” “我们的 AI 语音可以比实时和按需更新更快地生成。开辟新的和令人兴奋的机会来“添加语音”是前所未有的。AI 语音可以轻松确保每个产品都可以高效地创建和更新 在规模上。”
人类平等里程碑对音频内容的创建方式具有重要意义,这让投资者热衷于加入。 用例包括流媒体服务、广播、程序化广告、数字营销和企业培训内容。 WellSaid Labs 有一个 Voice Avatar 库,可以访问多种阅读风格和音调。 此外,品牌可以创建自己的 AI Voice Avatars,以捕捉讲述其故事所需的声音的相似性、风格和独特性。
“内容创作者或产品体验设计师以前在使用 TTS 工具或人类画外音时面临质量和可扩展性之间的艰难权衡。WellSaid 令人难以置信的声音可通过工作室应用程序或可扩展的 API 访问,无需选择是否想要自然、逼真 Voyager Capital 的 James Newell 说:“语音或无限可扩展且易于编辑的语音内容。WellSaid 提供并交付您的团队想要使用的内容。” “创意团队发现,当他们需要在数小时而不是数周内以一致的声音制作多条高质量内容时,它非常有用。”