要创建自己的知识库并完成对给定文本的润色和修改,您可以参考以下内容:
上传方式及操作步骤
Notion
本地文档
在线数据 自动采集方式:该方式适用于内容量大,需要批量快速导入的场景。
手动采集:该方式适用于需要精准采集网页上指定内容的场景
|上传方式|操作步骤||-|-||Notion|1.在文本格式页签下,选择Notion,然后单击下一步。<br>2.单击授权。<br>首次导入Notion数据和页面时,需要进行授权。<br>1.在弹出的页面完成登录,并选择要导入的页面。<br>2.选择要导入的数据,然后单击下一步。<br>3.选择内容分段方式:<br>3.1.自动分段与清洗:系统会对上传的文件数据进行自动分段,并会按照系统默认的预处理规则处理数据。<br>3.2.自定义:手动设置分段规则和预处理规则。<br>分段标识符:选择符合实际所需的标识符。<br>分段最大长度:设置每个片段内的字符数上限。<br>文本预处理规则:<br>替换掉连续的空格、换行符和制表符<br>删除所有URL和电子邮箱地址<br>1.单击下一步完成内容上传和分片。||自定义|1.在文本格式页签下,选择自定义,然后单击下一步。<br>2.输入单元名称,然后单击确认。<br>3.单击创建分段,然后在弹出的页面输入要上传的内容。<br>每个分段最多可添加2000个字符。<br>1.单击保存。|
|上传方式|操作步骤||-|-||本地文档|1.在文本格式页签下,选择本地文档,然后单击下一步。<br>2.将要上传的文档拖拽到上传区,或单击上传区域选择要上传的文档。<br>目前支持上传.txt,.pdf,.docx格式的文件内容。<br>每个文件不得大于20M。<br>一次最多可上传10个文件<br>1.当上传完成后单击下一步。<br>2.选择内容分段方式:<br>2.1.自动分段与清洗:系统会对上传的文件数据进行自动分段,并会按照系统默认的预处理规则处理数据。<br>2.2.自定义:手动设置分段规则和预处理规则。<br>分段标识符:选择符合实际所需的标识符。<br>分段最大长度:设置每个片段内的字符数上限。<br>文本预处理规则:<br>替换掉连续的空格、换行符和制表符<br>删除所有URL和电子邮箱地址<br>1.单击下一步完成内容上传和分片。|
|上传方式|操作步骤||-|-||在线数据|扣子支持自动抓取指定URL的内容,也支持手动采集指定页面上的内容,上传到数据库。<br>自动采集方式:该方式适用于内容量大,需要批量快速导入的场景。<br>1.在文本格式页签下,选择在线数据,然后单击下一步。<br>2.单击自动采集。<br>3.单击新增URL。在弹出的页面完成以下操作:<br>3.1.输入要上传的网站地址。<br>3.2.选择是否需要定期同步网站内容,如果需要选择内容同步周期。<br>3.3.单击确认。<br>4.当上传完成后单击下一步。<br>系统会自动根据网站的内容进行内容分片。<br>手动采集:该方式适用于需要精准采集网页上指定内容的场景<br>1.安装扩展程序,详情请参考[安装Coze Scraper](https://www.coze.cn/docs/guides/scraper)。<br>2.在文本格式页签下,选择在线数据,然后单击下一步。<br>3.点击手动采集,然后在弹出的页面点击权限授予完成授权。<br>4.在弹出的页面输入要采集内容的网址,然后单击确认。<br>5.在弹出的页面上,点击页面下方文本标注按钮,开始标注要提取的内容,然后单击文本框上方的文本或链接按钮。<br>6.单击查看数据查看已采集的内容,确认无误后再点击完成并采集。<br>|