Chat with Wiki - 怎么投喂语料库给ai

Answer

以下是关于投喂语料库给 AI 的一些方法和步骤：

在音乐学习方面：

步骤 3：把 Midi 导出到 MP3 虚拟演奏文件。可以直接导总谱，也可以分轨导出（适用于不同乐器组合）。由于制谱软件有很重的 midi 味，有时需要调整乐器音色。320kbit 码率是各大音乐平台的门槛，而向 Suno 导出的是 192k 的，后期如果想输出到 QQ 音乐之类，需要转个码。导出以后就可以喂给 AI 了。修改音色这一步不是必须，也有很多染色的软件可以用，比如用 Neutron4 从 Youtube 上面下载一些自己喜欢的乐器音色（比如雅马哈大钢琴），然后用宿主软件打开插件，导入这段音频，就可以实现渲染。
步骤 4：丢给 AI 做二次创作。比较喜欢丢完整的小节给 AI，这样节奏的识别性更好，当然也可以在中间掐断，AI 的识别能力还是不错的。接下来就是细化去 roll 后面的部分，大家可以自由发挥。

在 OpenAI 方面：如果作为输入的一部分提供，模型可以利用外部信息源。这可以帮助模型生成更明智和最新的响应。例如，如果用户询问有关特定电影的问题，将有关电影的高质量信息（例如演员、导演等）添加到模型的输入中可能会很有用。嵌入可用于实现高效的知识检索，以便在运行时将相关信息动态添加到模型输入中。文本嵌入是一个向量，可以衡量文本字符串之间的相关性。相似或相关的字符串将比不相关的字符串靠得更近。这一事实以及快速向量搜索算法的存在意味着嵌入可用于实现高效的知识检索。特别是，一个文本语料库可以被分割成块，每个块都可以被嵌入和存储。然后，给定的查询可以被嵌入，可以进行向量搜索，以找到与查询最相关的语料库的嵌入文本块（即，在嵌入空间中最接近的）。可以在OpenAI Cookbook中找到示例实现。有关如何使用知识检索来最小化模型编造错误事实的可能性的示例，请参阅策略“指示模型使用检索到的知识来回答查询”。

Content generated by AI large model, please carefully verify (powered by aily)

References

[音乐学习] AI音乐-自定义前奏的一种工作流

可以直接导总谱，也可以分轨导出（适用于不同乐器组合，由于制谱软件有很重的midi味，有时需要调整乐器音色）320kbit码率是各大音乐平台的门槛，而向Suno导出的是192k的，后期如果想输出到QQ音乐之类，需要转个码（虽然单纯转码对音质没有直接提升~）导出以后就可以喂给AI了修改音色这一步不是必须，也有很多染色的软件可以用，比如我现在用的是Neutron4，从Youtube上面下载一些自己喜欢的乐器音色（比如雅马哈大钢琴），然后用宿主软件打开插件，导入这段音频，就可以实现渲染了（刚刚Studio One过期了，这里就先不放图了）[heading1]步骤4：丢给AI做二次创作：[content]我比较喜欢丢完整的小节给AI，这样节奏的识别性更好，当然也可以在中间掐断，AI的识别能力还是不错的：接下来就是细化去roll后面的部分，这个就步细讲了，大家可以自由发挥最后丢个完整版（前奏有点长没剪，AI生成的部分在53秒之后）：输出响度调大了，大家可以把音量降下来点~[Udio完整版.mp3](https://bytedance.feishu.cn/space/api/box/stream/download/all/V3yxbOQtXolGWPxG4Jnc5MWdn9d?allow_redirect=1)

吵爷：AI音乐-自定义前奏的一种工作流

目录：OpenAI 官方指南

如果作为输入的一部分提供，模型可以利用外部信息源。这可以帮助模型生成更明智和最新的响应。例如，如果用户询问有关特定电影的问题，将有关电影的高质量信息（例如演员、导演等）添加到模型的输入中可能会很有用。嵌入可用于实现高效的知识检索，以便在运行时将相关信息动态添加到模型输入中。文本嵌入是一个向量，可以衡量文本字符串之间的相关性。相似或相关的字符串将比不相关的字符串靠得更近。这一事实以及快速向量搜索算法的存在意味着嵌入可用于实现高效的知识检索。特别是，一个文本语料库可以被分割成块，每个块都可以被嵌入和存储。然后，给定的查询可以被嵌入，可以进行向量搜索，以找到与查询最相关的语料库的嵌入文本块（即，在嵌入空间中最接近的）。可以在[OpenAI Cookbook](https://github.com/openai/openai-cookbook/blob/main/examples/vector_databases/Using_vector_databases_for_embeddings_search.ipynb)中找到示例实现。[有关如何使用知识检索来最小化模型编造](https://platform.openai.com/docs/guides/gpt-best-practices/tactic-instruct-the-model-to-use-retrieved-knowledge-to-answer-queries)错误事实的可能性的示例，请参阅策略“指示模型使用检索到的知识来回答查询”。