Chat with Wiki - 想建一个具身智能方面的知识库，有哪些建议

Answer

以下是关于建立具身智能知识库的一些建议：

数据清洗方面：
- 可以尝试手动清洗数据以提高准确性。对于在线知识库，创建飞书在线文档，每个问题和答案以“###”分割，可进行编辑修改和删除，添加 Bot 后在调试区测试效果。
- 对于本地文档，注意合理拆分内容，不能将大量数据一股脑全部放入训练，例如对于章节内容，先放入大章节名称，再按固定方式细化处理，然后选择创建知识库自定义清洗数据。
智能体的相关方面：
- 注重智能体的交互能力，包括大模型本身的交互能力、多 Agent 的灵活性、workflow 的妙用以及上下文说明。
- 考虑智能体的知识体量，利用豆包大模型本身的行业数据和语料库，创建结构化数据的知识库。
- 关注智能体的记忆能力，如变量、数据库和信息记录。
具身智能的具体内容：
- 了解具身智能本体的形态实现思路，如 Mobility 和 Manipulation 的实现方式。
- 明确具身智能的定义，探讨其与大模型要解决问题的差异，以及“人形”的重要性。
- 解决数据来源和构建大脑的问题，包括大模型和多模态的数据泛化、数据采集和量的问题，以及特定任务和场景的处理，还有结构化与非结构化场景的处理等。
- 思考具身智能的落地场景和商业化方向，例如 ToB 或 ToC 的选择。
- 考虑具身智能创业团队的背景组成，如工业机器人、自动驾驶、服务机器人等领域的经验。

Content generated by AI large model, please carefully verify (powered by aily)

References

本次创建知识库使用手动清洗数据，上节课程是自动清洗数据：[【智能体】用Coze在微信里搭建一个机器人，还能挖掘销售线索](https://a1i1hjmvcf0.feishu.cn/docx/JSdDd8ybLo7OHqxmePwcHlbLn3b?from=from_copylink),自动清洗数据会出现目前数据不准的情况，本节视频就尝试使用手动清洗数据，提高数据的准确性。[heading3]3.1在线知识库[content]点击创建知识库，创建一个画小二课程的FAQ知识库知识库的飞书在线文档，其中每个问题和答案以###分割，暂时不要问为什么。选择飞书文档选择自定义的自定义输入###然后他就将飞书的文档内容以###区分开来，这里可以点击编辑修改和删除。点击添加Bot添加好可以在调试区测试效果[heading3]3.2本地文档[content]本地word文件，这里要注意了~~~如何拆分内容，提高训练数据准确度，将海报的内容训练的知识库里面画小二这个课程80节课程，分为了11个章节，那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法，首先将11章的大的章节名称内容放进来，如下图所示。章节内详细内容格式如下如所示，如果你再分节的内容，依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据，这里不再赘述。[heading3]3.3发布应用[content]点击发布确保在Bot商店中能够搜到，如图所示可以搜索到画小二智能小助手，这个很重要，没有通过发布的获取不到API的。

汽车栏目主持人（零壹老师）智能体经验分享

大模型本身的交互能力多Agent的灵活性workflow的妙用——“问”字诀，引导用户输入车辆信息，便于大模型理解和分析上下文说明[heading4]3.2智能体的知识体量[content]豆包大模型本身的行业数据和语料库知识库——结构化数据与非结构化数据创建知识库(结构化数据)[table_3.xlsx](https://bytedance.feishu.cn/space/api/box/stream/download/all/NCOXbqWvYosCEYxkMN6c4lqOnZf?allow_redirect=1)步骤一步骤二步骤三步骤四步骤五处理完成参赛用知识库：大模型RAG检索大模型的选择和参数设定新模型的调用方法https://console.volcengine.com/ark/region:ark+cn-beijing/model?projectName=undefined&vendor=Bytedance&view=LIST_VIEW[heading4]3.3智能体的记忆能力[content]变量数据库信息记录

质朴发言：大模型时代下的具身智能｜Z 沙龙第 5 期

[title]质朴发言：大模型时代下的具身智能｜Z沙龙第5期目录建议结合要点进行针对性阅读。?一、具身智能本体的形态会是怎样的？Mobility和Manipulation如何实现？1、具身智能的实现思路：2、具身智能相比于当前的LLM，是"下一代智能“3、关于如何用多模态模型实现具身智能，理想和现实的差距仍有待学术界弥合4、想要让机器人实现具身智能的目标，应该从三个方面训练机器人5、大模型的到来，为智能机器人的研究带来了实实在在的生产力爆发6、大模型动的机器人研究vs传统控制算法驱动的机器人研究7、对大模型驱动的机器人研究未来展望8、未来4大趋势二、如何定义具身智能？1、具身智能的具体定义是什么？大模型要解决的智能问题与具身智能要解决的核心问题的差异点是什么？2、“人形”对于具身智能重要吗？三、数据从何而来，如何构建具身智能的大脑？1、关于大模型和多模态的数据泛化2、数据采集和数据量问题3、如何解决特定任务/特定场景问题?4、结构化场景与非结构化场景5、目前的VLM还是缸中之脑?6、强化学习的优势及超级仿真器可能四、落地场景可以畅想，但哪种最先商业化？1、ToB or ToC?ToB公司能否无缝转向ToC?五、什么样背景组成的团队堪称具身智能创业的梦之队？工业机器人？自动驾驶？服务机器人？1、机器人创业观察2、硬件选代和软件迭代的区别3、成本和场景价值决定创业终局4、具身智能出海insights