所有 SaaS 功能和所有支付网关(Paypal | Stripe | Mollie | Braintree | Paystack | Razorpay | BankTransfer | Coinbase)都可通过常规许可证获得。立即开始您的 SaaS 业务!
描述
Cloud Polly 让您创建自己的业务,允许将任何文本变成逼真的语音,允许您创建各种媒体内容,例如有声读物、播客、语音内容以及会说话的应用程序,并构建全新的语音类别产品。 Cloud Polly 的 Text-to-Speech (TTS) 服务使用领先的云服务提供商(如 Amazon Web Services、Microsoft Azure、Google Cloud Platform 和 IBM Cloud)的先进深度学习技术来合成听起来自然的人类语音,您可以注册任何一个他们或同时与他们一起。拥有超过 135 种语言和方言的超过 838 种不同的逼真声音,您可以构建可在许多不同国家/地区使用的支持语音的应用程序。
除了标准 TTS 语音之外,Cloud Polly 还提供神经文本到语音 (NTTS) 语音,通过新的机器学习方法提供语音质量的高级改进。 Cloud Polly 的大部分神经 TTS 技术还支持取决于云供应商的独特讲话风格,使您可以更好地将演讲者的交付风格与应用程序相匹配:示例:为新闻旁白量身定制的新闻播音员阅读风格 (AWS/Azure)用例,以及非常适合双向通信(如电话应用程序)的会话式说话风格 (AWS/Azure)。
享受方便地使用 SSML 标签来添加各种语音效果,例如调整音高、音量、速度、强调、单词或短语的提示音等等。选择相应的声音后,可以在演示中找到完整列表。
现在您也可以接受比特币付款 |比特币现金 |以太坊 |美元硬币 |莱特币 |狗狗币 | Dai 加密货币通过新的 Coinbase 网关进行预付费计划。
Cloud Polly 的特点
支持超过 135 种以上的语言和方言
支持超过 838 种不同的声音和口音
供电:
亚马逊网络服务
微软天青
谷歌云平台
IBM 云
自然的声音(神经 TTS)
谷歌 WaveNet 语音
标准音色的各种音色效果组合
神经声音的各种声音效果组合
强大的声音工作室
在单个文本合成任务中使用 +840 种声音中的任何一种
在单个文本合成任务中混合多达 20 种声音
在单个文本合成任务中处理多达 60000 个字符
多种音频输出格式:
MP3 (AWS/Azure/GCP/IBM)
OGG (AWS/GCP/IBM/Azure)
WAV (GCP/IBM)
WEBM(天蓝色)
通过社交媒体轻松存储和重新分发语音
近实时文本合成
自定义和控制语音输出
优化您的流媒体音频
调整说话风格(用于神经声音)
调整语速、音调和响度
调整口语重点
正确发音数字/日期/单词/缩写
添加工作/短语替换效果
将文本/句子的任何部分静音/发出哔哔声
将大文本直接合成到您的 Amazon S3 存储桶
将结果存储在:
本地服务器
亚马逊 S3
芥末储藏室
方便地分享合成结果或下载
完整的会员/推荐系统
完全响应的界面
轻松创建每月订阅计划
轻松创建各种预付计划
为预付计划创建优惠券/促销代码
各种包含的支付网关:
Paypal(在线)(订阅/预付)
Stripe(在线)(订阅/预付费)
Razorpay(在线)(订阅/预付费)
Paystack(在线)(订阅/预付)
Mollie(在线)(订阅/预付费)
Braintree(在线)(预付费)
Coinbase(加密货币)(预付)
银行转账(离线)(订阅/预付)
密切监控月收入和年收入
密切监控云 TTS 服务的估计支出
准备就绪的 SaaS 平台
一键自动更新选项
使用 PHP 7.4.x 和 Laravel 8.4.x 开发
详细而全面的文档
笔记
请注意,要使脚本正常运行,您需要拥有有效的 AWS、GCP、Azure、IBM 帐户(您可以使用云提供商的任意组合,但至少需要一个云提供商。只有激活的云提供商的语言和声音将在脚本中提供。要提供对所有 +135 语言和 +840 声音的访问,您需要在所有 4 个云供应商处注册)。