与知识库对话 - 如何创造自己的知识库，并且能完成对给定文本的润色和修改

回答

要创建自己的知识库并完成对给定文本的润色和修改，您可以参考以下内容：

上传方式及操作步骤

Notion

在文本格式页签下，选择 Notion，然后单击下一步。
单击授权。首次导入 Notion 数据和页面时，需要进行授权。
在弹出的页面完成登录，并选择要导入的页面。
选择要导入的数据，然后单击下一步。
选择内容分段方式：
- 自动分段与清洗：系统会对上传的文件数据进行自动分段，并会按照系统默认的预处理规则处理数据。
- 自定义：手动设置分段规则和预处理规则。
  - 分段标识符：选择符合实际所需的标识符。
  - 分段最大长度：设置每个片段内的字符数上限。文本预处理规则：
  - 替换掉连续的空格、换行符和制表符
  - 删除所有 URL 和电子邮箱地址
单击下一步完成内容上传和分片。

本地文档

在文本格式页签下，选择本地文档，然后单击下一步。
将要上传的文档拖拽到上传区，或单击上传区域选择要上传的文档。目前支持上传.txt、.pdf、.docx 格式的文件内容。每个文件不得大于 20M。一次最多可上传 10 个文件。
当上传完成后单击下一步。
选择内容分段方式：
- 自动分段与清洗：系统会对上传的文件数据进行自动分段，并会按照系统默认的预处理规则处理数据。
- 自定义：手动设置分段规则和预处理规则。
  - 分段标识符：选择符合实际所需的标识符。
  - 分段最大长度：设置每个片段内的字符数上限。文本预处理规则：
  - 替换掉连续的空格、换行符和制表符
  - 删除所有 URL 和电子邮箱地址
单击下一步完成内容上传和分片。

在线数据 自动采集方式：该方式适用于内容量大，需要批量快速导入的场景。

在文本格式页签下，选择在线数据，然后单击下一步。
单击自动采集。
单击新增 URL。在弹出的页面完成以下操作：
- 输入要上传的网站地址。
- 选择是否需要定期同步网站内容，如果需要选择内容同步周期。
- 单击确认。
当上传完成后单击下一步。系统会自动根据网站的内容进行内容分片。

手动采集：该方式适用于需要精准采集网页上指定内容的场景

安装扩展程序，详情请参考安装 Coze Scraper。
在文本格式页签下，选择在线数据，然后单击下一步。
点击手动采集，然后在弹出的页面点击权限授予完成授权。
在弹出的页面输入要采集内容的网址，然后单击确认。
在弹出的页面上，点击页面下方文本标注按钮，开始标注要提取的内容，然后单击文本框上方的文本或链接按钮。
单击查看数据查看已采集的内容，确认无误后再点击完成并采集。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

创建并使用知识库

|上传方式|操作步骤||-|-||Notion|1.在文本格式页签下，选择Notion，然后单击下一步。 2.单击授权。 首次导入Notion数据和页面时，需要进行授权。 1.在弹出的页面完成登录，并选择要导入的页面。 2.选择要导入的数据，然后单击下一步。 3.选择内容分段方式： 3.1.自动分段与清洗：系统会对上传的文件数据进行自动分段，并会按照系统默认的预处理规则处理数据。 3.2.自定义：手动设置分段规则和预处理规则。 分段标识符：选择符合实际所需的标识符。 分段最大长度：设置每个片段内的字符数上限。 文本预处理规则： 替换掉连续的空格、换行符和制表符 删除所有URL和电子邮箱地址 1.单击下一步完成内容上传和分片。||自定义|1.在文本格式页签下，选择自定义，然后单击下一步。 2.输入单元名称，然后单击确认。 3.单击创建分段，然后在弹出的页面输入要上传的内容。 每个分段最多可添加2000个字符。 1.单击保存。|

创建并使用知识库

|上传方式|操作步骤||-|-||本地文档|1.在文本格式页签下，选择本地文档，然后单击下一步。 2.将要上传的文档拖拽到上传区，或单击上传区域选择要上传的文档。 目前支持上传.txt,.pdf,.docx格式的文件内容。 每个文件不得大于20M。 一次最多可上传10个文件 1.当上传完成后单击下一步。 2.选择内容分段方式： 2.1.自动分段与清洗：系统会对上传的文件数据进行自动分段，并会按照系统默认的预处理规则处理数据。 2.2.自定义：手动设置分段规则和预处理规则。 分段标识符：选择符合实际所需的标识符。 分段最大长度：设置每个片段内的字符数上限。 文本预处理规则： 替换掉连续的空格、换行符和制表符 删除所有URL和电子邮箱地址 1.单击下一步完成内容上传和分片。|

创建并使用知识库

|上传方式|操作步骤||-|-||在线数据|扣子支持自动抓取指定URL的内容，也支持手动采集指定页面上的内容，上传到数据库。 自动采集方式：该方式适用于内容量大，需要批量快速导入的场景。 1.在文本格式页签下，选择在线数据，然后单击下一步。 2.单击自动采集。 3.单击新增URL。在弹出的页面完成以下操作： 3.1.输入要上传的网站地址。 3.2.选择是否需要定期同步网站内容，如果需要选择内容同步周期。 3.3.单击确认。 4.当上传完成后单击下一步。 系统会自动根据网站的内容进行内容分片。 手动采集：该方式适用于需要精准采集网页上指定内容的场景 1.安装扩展程序，详情请参考[安装Coze Scraper](https://www.coze.cn/docs/guides/scraper)。 2.在文本格式页签下，选择在线数据，然后单击下一步。 3.点击手动采集，然后在弹出的页面点击权限授予完成授权。 4.在弹出的页面输入要采集内容的网址，然后单击确认。 5.在弹出的页面上，点击页面下方文本标注按钮，开始标注要提取的内容，然后单击文本框上方的文本或链接按钮。 6.单击查看数据查看已采集的内容，确认无误后再点击完成并采集。 |