Chat with Wiki - 有没有语音转文字的API或者是应用呢？

Answer

以下是一些语音转文字的 API 或应用：

基于开源大型-v2 Whisper 模型的语音转文本 API，提供转录和翻译两个端点，可用于将音频转录为任何语言或翻译并转录成英语。目前文件上传限制为 25MB，支持的输入文件类型包括 mp3、mp4、mpeg、mpga、m4a、wav 和 webm。
OpenAI 的 wishper：https://huggingface.co/openai/whisper-large-v2 ，还有相关项目：https://huggingface.co/spaces/sanchit-gandhi/whisper-jax ，该项目在 JAX 上运行，后端支持 TPU v4-8，与 A100 GPU 上的 PyTorch 相比，速度快 70 多倍，是目前最快的 Whisper API。
出门问问的语音合成（TTS）API：
- 接口请求域名：https://open.mobvoi.com/api/tts/v1
- 接口请求频率限制：5 次/秒
- 可以将任意文本转化为语音，应用场景广泛，如视频 APP 配音解说、小说 App 有声阅读、移动 App 语音播报新闻、智能设备语音提醒、车载导航语音合成的个性化语音播报等。提供普通话、台湾腔、粤语、四川话、东北话等多种方言，数百个发音人，上千种风格，实时合成支持 SSML，语法详见 SSML 标记语言。请求参数方面，HTTP Method 支持 POST 请求。

Content generated by AI large model, please carefully verify (powered by aily)

References

语音转文本API提供了两个端点，即基于我们最先进的开源大型-v2 Whisper模型的转录和翻译。它们可以用于：将音频转录为任何语言。将音频翻译并转录成英语。目前文件上传限制为25 MB，并支持以下输入文件类型：mp3、mp4、mpeg、mpga、m4a、wav和webm。

语音：语音转文字

语音转文字推荐OpenAI的wishperhttps://huggingface.co/openai/whisper-large-v2语音转文字：一分钟搞定的~ 23分钟的音频https://huggingface.co/spaces/sanchit-gandhi/whisper-jax这个项目在JAX上运行，后端支持TPU v4-8。与A100 GPU上的PyTorch相比，它要快70多倍，是目前最快的Whisper API。

照片数字人工作流及语音合成（TTS）API- 出门问问Mobvoi

1.接口描述接口请求域名：https://open.mobvoi.com/api/tts/v1接口请求频率限制：5次/秒出门问问语音合成技术（TTS）可以将任意文本转化为语音，实现让机器和应用张口说话。出门问问TTS技术可以应用到很多场景，例如，在视频APP中作为配音解说；小说App完成有声阅读，移动App语音播报新闻；智能设备语音提醒；车载导航语音合成的个性化语音播报等。出门问问TTS服务提供了普通话、台湾腔、粤语、四川话、东北话等多种方言，数百个发音人，上千种风格，满足客户在不同场景的选择需求。实时合成支持SSML，语法详见SSML标记语言。1.请求参数HTTP Method:支持POST请求调用参数及说明：