直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
有没有 AI bot 做意图识别的资料
以下是关于 AI bot 做意图识别的资料: 尽管意图识别在自然语言处理领域已被广泛讨论,且通过各种小规模模型处理过此任务,但随着大型模型兴起,尤其是用作智能体的 Brain 模块时,它们在意图识别方面承担了主要工作。 意图识别的定义是:当用户输入指令,指令通过感知模块传递到 Brain 模块,Brain 模块需对指令做出反应,本质上是一种分类任务,即识别并区分用户的具体意图。在单一智能体架构或复杂的多智能体系统中,意图识别都至关重要。 通过一些常见的例子,如 Siri、小爱同学及其他手机品牌搭载的智能助手,当向它们发出指令时能做出相应反应,此过程中意图识别起到关键作用。大型模型执行意图识别任务时,主要基于前期通过大量数据训练得到的模型,可能是专门针对意图识别任务训练的大型模型,也可能是通过在特定任务中微调来优化的模型,通过微调能使模型更好地适应特定领域的任务需求。
2024-10-21
用AI解读视频
以下是关于用 AI 解读视频的相关内容: 制作将小说做成视频的流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 现有能力项目应用的思考: MMVid 是一个集成的视频理解系统,能处理和理解长视频内容并进行问答。其应用场景包括快速的视频剪辑、图生视频、快速诊断等。它由 Microsoft Azure AI 开发,结合了 GPT4V 的能力和其他视觉、音频和语音处理工具,能处理和理解长视频和复杂任务。能够自动识别和解释视频中的元素,如人物行为、情感表达、场景变化和对话内容,从而实现对视频故事线的理解。其核心功能是将视频中的多模态信息(如视觉图像、音频信号和语言对话)转录成详细的文本脚本,这样大语言模型就能够理解视频内容。 声音克隆相关: ElevenLabs 推出全自动化的 AI 配音或视频翻译工具,只需上传视频或粘贴视频链接,就能在几十秒到几分钟内将视频翻译成 29 种语言,还能克隆原视频里面的声音来配音。群友瑞華进行了相关测试。另外,豆包的音色模仿效果不错,读大概 20 个字的句子,5 秒就可生成非常像的音色。剪映也出了新的声音克隆功能,卡兹克做了对比,效果不错。
2024-10-21
有什么可以clone网站的AI
目前,能联网检索的 AI 有以下几种: ChatGPT Plus:其用户现在可以开启 web browsing 功能,实现联网。 Perplexity:结合了 ChatGPT 式的问答和普通搜索引擎的功能,允许用户指定希望聊天机器人在制定响应时搜索的源类型。 Bing Copilot:作为一个 AI 助手,旨在简化您的在线查询和浏览活动。 You.com 和 Neeva AI 等搜索引擎:提供了基于人工智能的定制搜索体验,并保持用户数据的私密性。 关于制作网站的 AI 工具,有以下几种: Zyro:网址:https://zyro.com/ 。特点包括使用 AI 生成网站内容,包括文本、图像和布局建议;提供 AI 驱动的品牌和标志生成器,帮助创建独特的品牌形象;包含 SEO 和营销工具,帮助提升网站可见性和流量。 10Web:网址:https://10web.io/ 。特点为基于 AI 的 WordPress 网站构建工具,可以自动生成网站布局和设计;提供一键迁移功能,将现有网站迁移到 10Web 平台;集成的 AI 驱动 SEO 分析和优化工具。 Jimdo Dolphin:网址:https://www.jimdo.com/ 。特点是 Dolphin 是 Jimdo 的 AI 网站构建器,通过询问用户问题来定制网站;提供自动生成的内容和图像,帮助快速启动网站;包含电子商务功能,适合小型企业和在线商店。 Site123:网址:https://www.site123.com/ 。特点是简单易用的 AI 网站构建工具,适合初学者;提供多种设计模板和布局,用户可以快速创建专业网站;包括内置的 SEO 和分析工具,帮助优化网站表现。
2024-10-21
如何使用openai的chatGPT
使用 OpenAI 的 ChatGPT 可以参考以下步骤: 1. 会话补全(Chat completions):ChatGPT 基于 OpenAI 最先进的语言模型 gpt3.5turbo。使用 OpenAI 的 API,您可以用 gpt3.5turbo 构建自己的应用来做多种事情,如起草邮件或其他文字内容、写 Python 代码、回答关于一组文档的问题、创建会话代理、给软件提供自然语言接口、辅导各种学科、语言翻译、假扮成游戏或其他内容的角色。您可以参考。 2. 对于不会代码的情况: 获得 API Key(扣费凭证):以 OpenAI API 为例,您可以在这个页面找到 API Key:https://platform.openai.com/apikeys ,打开后,点击「Create new secret key」即可获取。请注意,通常需要绑定支付方式,才可以获取有效 Key。 获得 API 使用的示例代码:以 OpenAI API 为例,您可以在 Playground 这个页面获取 API 调用的示例代码:https://platform.openai.com/playground 。并且可以将您和 GPT 的对话,转换成代码。注意,这里有两个值可以定义,一个是 SYSTEM:对应 ChatGPT 里的 Instructions,用来定义这个 Bot 的功能/特点;USER:对应 ChatGPT 里,用户发出的信息。这里,可以将 SYSTEM 定义成缩略信息助手,而在 USER 中输入文章内容。运行后,结果可能会令人满意。点击右上方 View Code,获取生成这一内容的示例代码。 顺着之前的对话,让 ChatGPT 帮您继续写代码。
2024-10-21
AI 制作PPT
以下是关于 AI 制作 PPT 的相关内容: 目前市面上大多数 AI 生成 PPT 的思路通常为:AI 生成 PPT 大纲、手动优化大纲、导入工具生成 PPT、优化整体结构。 推荐的市场分析文章:《》 相似问题包括:有没有生成 PPT 的应用推荐,不用翻墙的;免费生成 PPT 的网站有哪些;推荐一款文字生成 ppt 的工具;免费 ai 制作 ppt 软件;推荐 3 款好用的 AI 制作 ppt 工具。 卓 sir 分享的省时又可控的 PPT 制作流程:先让 GPT4 生成 PPT 大纲,然后把大纲导入到 WPS 当中,启用 WPS AI 一键生成 PPT,再让 chatPPT 添加动画,最后手动修改细节。 免费工具推荐:讯飞智文(http://zhiwen.xfyun.cn);付费工具推荐:百度文库。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-21
12种Prompt框架
以下是 12 种 Prompt 框架: 1. Key Result(关键结果):说明想要的具体效果,试验并调整。包括改进输入(从答案不足之处着手改进背景、目标与关键结果)、改进答案(在后续对话中指正 ChatGPT 答案缺点)、重新生成(在 Prompt 不变情况下多次生成结果,优中选优)。 2. Evolve(试验并改进):三种改进方法自由组合。 3. APE 框架:未提供具体说明。 4. COAST 框架:未提供具体说明。 5. CONTEXT(上下文背景):为对话设定舞台。 6. OBJECTIVE(目的):描述目标。 7. ACTION(行动):解释所需的动作。 8. SCENARIO(方案):描述场景。 9. TASK(任务):描述任务。 10. ICIO 框架:相关链接 。 11. CRISPE 框架:相关链接 。 12. BROKE 框架:作者陈财猫,相关链接 。 此外还有: 1. 框架集合:右侧附件做成了海报。 2. Instruction(指令):即希望 AI 执行的具体任务,比如翻译或者写一段文字。 3. Context(背景信息):给 AI 更多背景信息引导模型做出更贴合需求的回复。 4. Input Data(输入数据):告知模型需要处理的数据。 5. Output Indicator(输出引导):告知模型要输出的类型或风格。 6. Capacity and Role(能力和角色):ChatGPT 应扮演的角色。 7. Insight(见解):提供请求的背后见解、背景和上下文。 8. Statement(声明):要求 ChatGPT 做什么。 9. Personality(个性):希望 ChatGPT 以何种风格、个性或方式回应。 10. Experiment(实验):请求 ChatGPT 为您回复多个示例。 其他框架: 1. ACTION(行动):描述想做什么。 2. RESULT(结果):描述所需的结果。 3. EXAMPLE(示例):举一个例子来说明观点。 4. ROSES 框架:未提供具体说明。 5. ROLE(角色):指定 ChatGPT 的角色。 6. OBJECTIVE(目的):陈述目标或目标。 7. SCENARIO(方案):描述情况。 8. EXPECTED SOLUTION(解决方案):定义所需的结果。 9. STEPS(步骤):要求达到解决方案所需的措施。 10. RACE 框架:未提供具体说明。 11. PATFU 泡芙提示词框架:作者口袋君。 12. Problem(问题):清晰地表述需要解决的问题。 13. Aera(领域):问题所在领域以及需要扮演的角色。 14. Task(任务):解决问题需要执行的具体任务。
2024-10-21
剪辑事如何使用ai提高效率
在剪辑工作中,可通过以下方式利用 AI 提高效率: 1. 团队分工: 制片人负责影片的制作管理,包括团队组建、日程安排等。 图像创意人员用 AI 生成富有想象力的角色和场景,并为每个角色赋予人物小传。 视频制作人员将做好的图像素材进行 AI 图生文的工作,擅长运用工具控制以契合剧本。 编剧撰写剧本,包括故事情节、角色串联、人物台词等。 配音和配乐人员利用各种声音类 AI 工具完成相关工作。 剪辑师负责后期剪辑,包括镜头选择、节奏控制和音效配合。 团队成员分工明确,形成高效的 SOP,可快速产出。 2. 工具选择: 剪映具有人性化设计和简单音效库,但无法协同工作和导出工程文件,难以达到更好的商业化效果。 对于复杂和真实的音效制作,可能需要另外的工具。 利用 Adobe Photoshop 网页版的新技术,其 AI 能自动扫描、识别和选择图像中的各种元素,更高效、准确和可控地编辑选定区域。 3. 剪辑流程: 视频粗剪:先确定画面逻辑,声音作为部分参考,快速对片子全貌有整体把握,把素材放上,再看哪些部分需要细节调整和画面替换。 视频定剪:将画面素材调整和替换到满意效果。 音效/音乐:注意版权问题,复杂音效可能需另外制作。 特效:根据需要添加,如为弥补 AI 视频生成吃掉的光影可添加光的效果。 包装(如字幕):字幕最后添加,剪映可智能匹配字幕再修改。
2024-10-21
李继刚大神提出的伪代码prompt 相关文章
李继刚等的 prompt 最佳实践相关内容如下: 方法论: 提出了基于 GPT3 的无代码聊天机器人设计工具 BotDesigner。 创建了 Conversation 视图和 Error Browser 视图。 使用 BotDesigner 观察 10 名非专家提示设计师执行聊天机器人设计任务的行为,以探索他们在提示设计中的直觉方法和困难。 结论: 所有参与者都能进行机会性的提示迭代设计,并能对提示更改进行局部测试。 参与者在生成提示、评估提示有效性和解释提示效果方面的困难主要源自过度概括和人际交往预期。 参与者倾向于从单一数据点过度推广,也倾向于从人类交流的角度过滤他们的提示设计和聊天机器人的响应。 关键信息: 贡献者包括李继刚、Sailor、田彬玏、Kyle?、小七姐等群友。 李继刚的,最近收录不是很及时,可在李继刚的即刻查看更多。 每个角色都有版本迭代,标注版本号,争取更新到最新版本。 李继刚写了上百个这种 Prompt,有具体场景需求可评论留言,作者可帮忙写定制,也可自己用结构化方式写。 使用方法:开一个 new chat,点代码块右上角的复制,发送到 chat 聊天框,里面的描述可按需求修改。 思路来源:云中江树的框架: 方法论总结: 建议用文心一言/讯飞星火等国内大模型试试,有这些 prompt 的加持效果不错。 此外,还有相关的高阶使用方法,如陈财猫的“如何用 GPT 写长篇科幻?用分治法完成复杂任务”(https://waytoagi.feishu.cn/wiki/GY3sw4LQli5k9ckzrDZcRnVmnQf),刘海的“Prompt 纵向研究的最新成果:伪代码提示词”(https://waytoagi.feishu.cn/wiki/MjUDwTbq9iUtBrkskPXcpfOHnPg),陈财猫的“由 GPT 驱动的人生重开模拟器游戏,体验无穷变化的多重人生”(https://waytoagi.feishu.cn/wiki/WyJSwjvN5iZudhkd8iocrSy3njc)
2024-10-21
如何用大模型和数据接口对话
以下是关于如何用大模型和数据接口对话的相关内容: 大模型入门指南 动手实验 由于作者使用的是 macOS 系统,因此采用 GGML 量化后的模型。官方开源出来的模型大都以 Python 为主,效率一般。作者通常会采用社区内的其他实现,比较有名的项目有: ggerganov/llama.cpp:Port of Facebook's LLaMA model in C/C++ ggerganov/whisper.cpp:Port of OpenAI's Whisper model in C/C++ LLama 首先是编译,为了利用 Metal 的 GPU,可以用如下命令编译。之后需要去 Llama27BChatGGML中下载模型,3G 到 7G 不等,读者可以按需尝试。此外,llama.cpp 还提供了 WebUI 供用户使用,首先启动 server,它默认监听 8080 端口,打开浏览器就可以对话。 Whisper 和 llama 类似,采用 make 命令编译,之后去 ggerganov/whisper.cpp下载量化好的模型,然后转换音频即可,目前只接受 wav 格式,可以用 ffmpeg 转化。输出的 srt 文件如下所示: |Size|Parameters|Englishonly model|Multilingual model|Required VRAM|Relative speed| ||||||| |tiny|39 M|tiny.en|tiny|~1 GB|~32x| |base|74 M|base.en|base|~1 GB|~16x| |small|244 M|small.en|small|~2 GB|~6x| |medium|769 M|medium.en|medium|~5 GB|~2x| |large|1550 M|N/A|large|~10 GB|1x| 一般来说,英文的音频 small 模型就足够了,但是如果是中文,最好用最大的模型。 数据库 通过在工作流中添加数据库节点对数据表进行操作。在工作流中可通过 NL2SQL 方式和代码方式进行调用,支持完整读写模式。 参考以下操作,在工作流中添加并配置工作流节点。在工作流中配置数据库节点前,确保已经搭建了一个 Bot,并在这个 Bot 中创建好了数据表。 1. 单击页面顶部的工作流页签,然后单击创建工作流。 2. 输入工作流名称和工作流的使用描述,然后单击确认。工作流名称和描述可以帮助大语言模型理解什么场景下需要调用该工作流。 1. 在基础节点页签下,将数据库节点拖入到工作流配置画布区域。 2. 根据以下信息配置数据库节点。 2.1. 输入:添加 SQL 执行中需要的参数,可以是一个变量,也可以是一个固定值。 2.2. SQL:输入要执行的 SQL 语句,可以直接使用输入参数中的变量。 可单击自动生成使用大模型生成 SQL。在弹出的页面中,选择这个数据库工作流生效的 Bot 和数据表,然后使用自然语言描述要执行的操作,单击自动生成生成 SQL 语句,最后单击使用。 不支持 Select语法。不支持多表 Join 操作。最多返回 100 行数据。 手把手教你本地部署大模型以及搭建个人知识库 通过 Open WebUI 使用大模型 使用 Open WebUI 1. 首先访问如下网址。当打开这个页面的时候,会让你登陆,这个时候随便使用一个邮箱注册一个账号即可。 1. 和本地大模型进行对话。登陆成功之后,如果已经使用过 ChatGPT 等类似的大模型对话网站,对这个页面应该不陌生。Open WebUI 一般有两种使用方式:第一种是聊天对话;第二种是 RAG 能力,也就是可以让模型根据文档内容来回答问题。这种能力就是构建知识库的基础之一。如果要求不高的话,已经搭建了一个本地大模型了,并且通过 Web UI 实现了和大模型进行对话的功能。 相信通过这么一通折腾,就理解了 ChatGPT 的信息流。至于为什么 ChatGPT 的访问速度比我们自己的要快,而且回答效果要好,有两个原因:快是因为 GPT 大模型部署的服务器配置高;好是因为 GPT 大模型的训练参数多,数据更优以及训练算法更好。如果想要更加灵活的掌握知识库,请接着往下看。
2024-10-21
心理咨询师可以用AI干什么
心理咨询师可以利用 AI 做以下事情: 1. 借助市场上已有的 AI 心理咨询产品为工作提供支持和参考,例如: Woebot:基于聊天机器人的心理健康平台,通过对话方式帮助用户探索和处理情绪问题,运用认知行为疗法(CBT)原理引导用户自我反思和情绪管理。 Replika:AI 驱动的个人朋友,通过日常对话提供情感支持和心理健康指导。 Talkspace:在线心理咨询平台,提供与专业咨询师的视频、音频或文本会话服务,同时使用 AI 技术匹配用户与合适的咨询师。 Wysa:AI 心理健康应用,提供情绪管理和心理健康支持,结合了 AI 聊天机器人和人类专家的支持。 Moodfit:心理健康和情绪跟踪应用,使用 AI 算法分析用户情绪模式并提供个性化建议和干预措施。 Youper:结合 AI 和虚拟现实(VR)的心理健康平台,通过沉浸式体验和 AI 辅助对话改善用户情绪和心理健康。 2. 预期会看到更多针对 AI 聊天机器人的专业甚至临床用例,AI 驱动的心理治疗师、营养师、教练和导师将使个人和职业发展更经济便捷,用户只需打开应用程序就能提问或对话。 3. 像 Woebot 和 Wysa 这样的产品已展示出经过临床验证的效果,并获得 FDA 认证,在治疗产后抑郁症、慢性疼痛和焦虑症等病症方面具有疗效。在成年人心理健康状况不佳且治疗师全国性短缺的情况下,聊天机器人可能是处理非急性病例的可行方案。 需要注意的是,虽然 AI 可以提供初步支持和建议,但对于严重的心理健康问题,仍需寻求专业心理咨询师或医生的帮助。此外,AI 心理咨询产品应作为传统心理咨询的补充,而非替代品。在使用这些工具时,应保持谨慎,并确保其使用符合当地法律和伦理标准。
2024-10-21