与知识库对话 - AI录音软件

回答

以下是一些 AI 录音相关的软件：

11labs（官网：https://elevenlabs.io/）：英文效果较好，但无法使用语速、情绪调节等控件，只能通过标点符号改变语音效果，生成合适声音有一定难度。
出门问问的魔音工坊：国内软件，可使用情绪调节控件。
Podcastle（https://podcastle.ai/）：录音室级别的录音，AI 驱动的编辑和无缝导出，易于使用且免费。
cleanvoice（https://cleanvoice.ai/）：可移除播客或音频录音中的填充音、口吃和口腔声音。

此外，还有一些与音频相关的工具和应用：

faidr（https://www.faidr.com/）：让您无干扰地收听最喜爱的广播。
fathom（https://hello.fathom.fm/）：播客搜索引擎。
Nomono（https://nomono.co/）：用于实地采访的独立录音设备。
Descript（https://www.descript.com/）：一体化音频和视频编辑，像文档一样简单。
auphonic（https://auphonic.com/）：为播客、广播节目、电影、屏幕录制等提供自动音频后期制作的网络服务。
SimonSays（https://www.simonsaysai.com/）：为团队打造的视频编辑工具，速度提升 5 倍。
Super Hi-Fi（https://www.superhifi.com/）：人工智能驱动的音乐体验。

在听力方面的相关应用有：

Whisper.ai（https://whisper.ai/）：比普通助听器更智能。
Eargo（https://www.eargo.com/）：革命性的新型助听器。
Concha Labs（https://conchalabs.com/）：帮助您更清晰地听见声音。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

前Sora时代我最想做的AI短片——使用Pika、Pixverse、Runway、SVD四大AI视频工具

这次我们尝试使用了一些简短对话的制作。通常在传统影视制作流程里，声音部分的制作会分为现场录音、后期配音、音效音乐制作等多个部分。这里用AI声音来制作对话相当于是后期配音的部分。我们会把中文台词谷歌翻译成英文，但我英语比较拉垮，所以找了非常专业的Azura Ge葛女士进行英文字幕校对与台词润色，形成配音稿。接着使用AI声音软件11labs（官网：https://elevenlabs.io/）进行对白制作，11labs的英文效果比较好，但我们仍然非常头疼地遇到了AI声音没有情绪和情感的问题。跟视频制作类似，需要不断地抽卡（反复生成），因为11labs无法使用语速、情绪调节等控件，我们只能通过标点符号去改变语音效果，比如使用，、……。！等等标点符号，有时会叠加不同标点符号，去试它的语音效果。同一句台词，大家可以听出不同标点和抽不同卡时，声音的情绪都不太一样，所以要在AI声音里调试到合适的声音，抽声音卡的难度其实并不亚于抽视频的难度……我们常常一句台词要生成十几二十段音频，才能找到稍微能听得过去的、自然的声音。国内的可以使用出门问问的魔音工坊。魔音工坊可以使用情绪调节控件，还比较友好，但具体的评测还得等我们有机会做中文短片再试试！第五步，剪辑上篇剪辑没有多说，这次我会多说一些。目前大部分AI短片的创作者用的都是剪映，我也是，因为短片1-3分钟，用剪映其实会比传统剪辑软件更方便一些。但更长的篇幅，比如可能到5-10分钟，或者10分钟以上，要更好的效果的话，还是避免不了可能要用PR/FCP/达芬奇等等传统剪辑软件。

AIGC Weekly #83

GitHub发布了GitHub Models，使开发者能够利用包括Llama 3.1、GPT-4o、Phi 3和Mistral Large 2等在内的顶尖AI模型。这些模型可以在GitHub的交互式模型游乐场中免费测试，开发者可以在那里实验、比较、测试和部署AI应用程序。GitHub Models还提供了无缝的过渡，允许开发者在Codespaces和VS Code中将模型引入到他们的开发环境中。目前需要加入等待列表才能使用。[heading2][Miley AI：移动端AI记录软件](https://apps.apple.com/us/a[content]狈狈新app，又一个语音笔记软件。支持更多的内容分析，会将你录入的内容自动变成todo、习惯打卡、运动记录、记账等。这类应用确实降低了记录成本，原来因为麻烦不愿意记录的，也可以低成本记录内容了。[heading2][Toby：实时视频翻译](https://www.trytoby.com/)[content]Toby是一个创新的桌面应用程序，它能够在视频通话中实时翻译语音，Toby提供的功能包括双向实时翻译、讲义和听写稿以确保信息准确传递，以及个性化的词汇表。[heading2][Friend：AI语音项链](https://www.friend.com/index.html[content]Friend是一款即将推出的交流设备，用户可以通过预订的方式获得。宣传片24小时内获得了1200万的播放。该产品的工作原理包括与设备对话、暂停让设备思考以及阅读设备的回应。Friend设备具有“一直在听”的特性，当通过蓝牙连接时，它会持续倾听并形成自己的思考，但它的回应是自愿的。使用Friend设备需要手机配合，目前仅支持iOS设备，并且需要互联网连接。

人工智能音频初创公司列表

[faidr](https://www.faidr.com/)-让你无干扰地收听最喜爱的广播。[fathom](https://hello.fathom.fm/)-播客搜索引擎。[Nomono](https://nomono.co/)-用于实地采访的独立录音设备。[Descript](https://www.descript.com/)-一体化音频和视频编辑，像文档一样简单。[auphonic](https://auphonic.com/)-为播客、广播节目、电影、屏幕录制等提供自动音频后期制作的网络服务。[SimonSays](https://www.simonsaysai.com/)-为团队打造的视频编辑工具，速度提升5倍。[Podcastle](https://podcastle.ai/)-录音室级别的录音，AI驱动的编辑和无缝导出，易于使用且免费。[cleanvoice](https://cleanvoice.ai/)-移除播客或音频录音中的填充音、口吃和口腔声音。[Super Hi-Fi](https://www.superhifi.com/)-人工智能驱动的音乐体验。[heading1]听力[content][Whisper.ai](https://whisper.ai/)-比普通助听器更智能。[Eargo](https://www.eargo.com/)-革命性的新型助听器。[Concha Labs](https://conchalabs.com/)-帮助你更清晰地听见声音。