以下是一些提取文件内容的工具:
步骤:1.准备文件:确保所有需要处理的文件都是TXT、PDF、Word文档、PPT幻灯片或Excel电子表格格式。2.发送文件:您可以将这些文件的链接或者直接将文件内容发送给Kimi Chat。3.指定任务:告诉Kimi Chat您需要进行的具体操作,比如提取关键信息、总结内容、比较文件差异等。示例:假设您有三个PDF文件,分别包含市场分析、竞争对手研究和用户调研的结果。您可以将这三个文件发送给Kimi Chat,并请求总结每个文件的核心发现,并比较它们之间的关键差异。
让我们通过一个例子来演示如何使用这项服务。首先,可以创建一个抽取器:这段代码是做什么的呢?首先,我们向服务发送了一个名字参数——这是我们所创建的抽取器的一个简单可读名称,并不由LLM使用。同样,描述参数也仅供记录,未在任何处理中使用。服务使用的是schema参数。这是表示我们希望抽取对象结构的JSON模式。我们在此抽取一个包含两个必要属性的个人信息:年龄(一个整数)和姓名(一个字符串)。服务还使用了指令参数。这些指令与模式和文本一同发送至LLM,以提供额外的上下文提示以及指导LLM应如何操作。发送完毕后,我们会收到一个新创建的抽取器ID对应的回应:注册完成后,我们可以用如下方式发起请求:我们传入了一个抽取器的ID ——这是我们在前一步骤中返回的ID。我们还传入了要抽取信息的文本内容。我们指定了整个文件的提取模式mode=entire_document。如果我们要处理的文本很长,可能需要使用不同的处理方式——这就是我们掌控该参数的地方。最后,我们传入了一个空值的文件参数,表明我们此次请求没有使用文件上传功能。我们得到了如下响应:
Coze Scraper是一个用来提取网页上的文本内容,将这些内容上传到知识库的一个工具。你可以通过Chrome浏览器的应用商店进行安装,也可以将该工具下载到本地进行安装。Coze Scraper目前仅支持Chrome浏览器。