直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
我应该如何调用你的知识库并用在本地部署的deepseek上呢
要在本地部署的 DeepSeek 上调用知识库,您可以参考以下步骤: 在 Bot 内使用知识库: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 4. 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 5. (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项。配置项包括最大召回数量、最小匹配度和调用方式等。 6. (可选)在预览与调试区域调试 Bot 能力时,扩展运行完毕的内容可以查看知识库命中并召回的分片内容。 在工作流内使用 Knowledge 节点: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在页面顶部进入工作流页面,并打开指定的工作流。 4. 在左侧基础节点列表内,选择添加 Knowledge 节点。 此外,关于 DeepSeek 的提示词相关内容: 效果对比:用 Coze 做了个小测试,大家可以对比看看,参考 。 如何使用: Step1:搜索 www.deepseek.com,点击“开始对话”。 Step2:将装有提示词的代码发给 Deepseek。 Step3:认真阅读开场白之后,正式开始对话。 设计思路: 1. 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 2. 通过提示词文件,让 DeepSeek 实现:同时使用联网功能和深度思考功能。 3. 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 4. 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 5. 用 XML 来进行更为规范的设定,而不是用 Lisp(对您来说有难度)和 Markdown(运行下来似乎不是很稳定)。 DeepSeekR1 提示词系统的核心原理认知包括: AI 特性定位:多模态理解,支持文本/代码/数学公式混合输入;动态上下文,对话式连续记忆(约 4K tokens 上下文窗口);任务适应性,可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别+内容生成双通道理,自动检测 prompt 中的任务类型/输出格式/知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架方面,如果不知道如何表达,还是可以套用框架指令,包括四要素模板和格式控制语法。格式控制语法中,强制结构使用```包裹格式要求,占位符标记用{{}}标注需填充内容,优先级符号>表示关键要求,!表示禁止项。 进阶控制技巧包括思维链引导和知识库调用。思维链引导中的分步标记法为请逐步思考:1.问题分析→2.方案设计→3.风险评估;苏格拉底式追问为在得出最终结论前,请先列举三个可能存在的认知偏差。知识库调用包括领域限定指令和文献引用模式。
2025-02-11
大模型是怎么训练的
大模型的训练过程可以类比为“上学参加工作”: 1. 找学校:训练大模型需要大量的计算,因此 GPU 更合适,只有购买得起大量 GPU 的才有资本训练自己的大模型。 2. 确定教材:大模型需要大量的数据量,几千亿序列(Token)的输入基本是标配。 3. 找老师:即用合适的算法讲述“书本”中的内容,让大模型能够更好理解 Token 之间的关系。 4. 就业指导:学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)。 在 LLM 中,Token 被视为模型处理和生成的文本单位。它们可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token 是原始文本数据与 LLM 可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表。比如:The cat sat on the mat,会被分割成“The”、“cat”、“sat”等的同时,会生成相应的词汇表。 此外,训练大模型的具体操作步骤如下: 1. 创建数据集:进入厚德云模型训练数据集(https://portal.houdeyun.cn/sd/dataset),在数据集一栏中,点击右上角创建数据集,输入数据集名称。zip 文件可以是包含图片+标签 txt,也可以只有图片没有打标文件(之后可以在 c 站使用它的自动打标功能)。也可以一张一张单独上传照片,但建议提前把图片和标签打包成 zip 上传。Zip 文件里图片名称与标签文件应当匹配,例如:图片名"1.png",对应的达标文件就叫"1.txt"。上传 zip 以后等待一段时间,确认创建数据集,返回到上一个页面,等待一段时间后就会上传成功,可以点击详情检查,可以预览到数据集的图片以及对应的标签。 2. Lora 训练:点击 Flux,基础模型会默认是 FLUX 1.0D 版本。选择数据集,点击右侧箭头,会跳出所有上传过的数据集。触发词可有可无,取决于数据集是否有触发词。模型效果预览提示词则随机抽取一个数据集中的标签填入即可。训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。然后就可以等待训练了,会显示预览时间和进度条。训练完成的会显示出每一轮的预览图。鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 从原理层面,用数学来理解 Prompt:传统的机器学习是 p,假设 a 是训练出来的通用模型,这个模型没有经过人工标注,但什么都可以学会。给出的 Prompt 其实就是 x,然后让大模型基于这个 x 知道概率最大的 y,这样就避免了人工标注,但依赖于 x 给入的信息,去更大概率找到合适的 y。比如给一张照片,然后输入这是一个动物,这是什么,大模型根据这个输入,提取照片的特征和提示作为输入,最终返回猫。
2025-02-11
RAG是什么
RAG 是检索增强生成技术(RetrievalAugmented Generation)。关于 RAG 的详细研究和应用,您可以参考以下文献: 1. Alibaba Group Holding Limited. Fiscal year annual report 2023. https://static.alibabagroup.com/reports/fy2023/ar/ebook/en/index.html, 2023. 2. Rongyu Cao, Hongwei Li, Ganbin Zhou, and Ping Luo. Towards document panoptic segmentation with pinpoint accuracy: Method and evaluation. In 16th International Conference on Document Analysis and Recognition, pages 3–18, 2021. 3. https://pdflux.com/. 4. Daisho Microline Holdings Limited. Fiscal year annual report 2022. https://www1.hkexnews.hk/listedco/listconews/sehk/2022/0626/2022062600094.pdf, 2022. 5. Peiyi Wang, Lei Li, Liang Chen, Dawei Zhu, Binghuai Lin, Yunbo Cao, Qi Liu, Tianyu Liu, and Zhifang Sui. Large language models are not fair evaluators, 2023. 6. Tesla Inc. Model 3 owner’s manual. https://manualdirectory.com/manual/2023teslamodel3ownersmanual/, 2023. 7. Flávio Cunha, Fatih Karahan, and Ilton Soares. Returns to skills and the college premium. Journal of Money, Credit and Banking, 43:39–86, 2011. https://scihub.hkvisa.net/https://doi.org/10.1111/j.15384616.2011.00410.x. 8. Tom S. Vogl. Height, skills, and labor market outcomes in mexico. NBER Working Paper Series, 2012. https://www.nber.org/system/files/working_papers/w18318/w18318.pdf.
2025-02-11
海报设计
以下是一些关于海报设计的相关信息: 设计海报的 AI 产品: Canva(可画):https://www.canva.cn/ ,是一个受欢迎的在线设计工具,提供大量模板和设计元素,用户可通过简单拖放操作创建海报,其 AI 功能可协助选择合适颜色搭配和字体样式。 稿定设计:https://www.gaoding.com/ ,稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 VistaCreate:https://create.vista.com/ ,简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面,可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,简化设计流程。 Midjourney 新编辑器在电商的应用: 产品海报设计:将产品图片导入 Midjourney 编辑器,通过简单操作生成不同风格的海报设计。 家具材质变化:在电商家具展示中,利用图像重纹理化模式快速为家具换上各种材质。 艺术字体海报:通过白底字体图,利用图像重纹理化模式变换成各种炫酷的字体海报风格。 1 分钟搞定海报设计的思路:鉴于近期热门的城市建筑风格,比如尝试用老北京糖葫芦做成北京建筑,然后生成海报并挑选喜欢的,确定这种风格后,替换同材质的北京建筑物即可延续风格设计一系列海报,继续复用上一张的关键词生成其他建筑,调整关键词继续生成单个建筑物,再用 PS 稍作处理,替换建筑物,就可得到一系列海报。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-11
使用指南
以下是为您提供的几种使用指南: Midjourney 的使用指南: Midjourney v6 版本提供“风格一致性”功能,用户输入一幅图像,MJ 可根据其风格创作,如素描风、油画风等。参考。 使用指令:垫图链接(可选择)+关键词+“sref”+图片链接+风格化参数+“v 6.0”。指令为:url+关键词+“sref”+url+“sw”+“v 6.0”。“sw”风格化参数用于控制整体风格强度,默认为 100,数值范围为。参考多张图像风格时,url 间使用空格隔开,权重代表不同参考风格的权重。 sref 模仿图片风格,垫图模仿图片结构、元素。 生成 url:准备一张照片和想要的写真风格参考图片。Prompt:垫图 url+Chinese female model,upper body,clothes with collars,bright space natural pose,big earrings,Chinese traditional minimalism,flat illustration,geometric shapes,minimalismniji 6ar 3:4sw 200sref url 。适用模型为 V6 和 Niji V6 。 Discord 的使用指南: 注册和下载:在 Discord 官网(discord.com)注册账号,可使用谷歌、Facebook 等账号直接登录。根据设备(Windows、Mac、Linux、iOS、Android 等)下载并安装应用程序或使用网页版。 创建或加入服务器:可创建新服务器并邀请朋友加入,或通过邀请链接或搜索加入现有公开服务器。每个服务器可创建多个不同频道。 频道介绍:服务器通常包含多种类型频道,如文字频道用于文字聊天,语音频道用于语音通话,私聊频道用于与个人好友私聊。 权限管理:服务器所有者可设置频道权限,如允许/禁止发送图片/文件,设置只读权限等。还能创建不同身份组管理成员权限。 消息和信息交互:在频道中可发送文字、表情包、图片、视频、文件等丰富消息内容,系统支持 Markdown 语法格式化文本,成员间可回复、引用、添加表情等交互。 语音和屏幕共享:进入语音频道可进行语音聊天、视频通话,还可共享屏幕画面。 机器人和扩展:有大量机器人供选择添加,实现娱乐、提示、搜索等功能。还可浏览商店添加扩展定制界面和体验。 移动设备使用:在手机和平板电脑上安装应用,随时随地聊天保持在线互动。 Fooocus 的使用指南: Fooocus 使用的是最新推出的 SDXL 1.0 模型,对 stable diffusion 和 Midjourney 做了结合升级。保留了 SD 的开源属性,可部署到本地免费使用;操作界面吸取了 midjourney 简洁的特点,省去了 WebUI 中复杂的参数调节,让用户专注于提示和图像。只有图像展示窗口、正向提示词和生成按钮 3 项。勾选“Advanced”会弹出高级设置窗口,可调整画面宽高比、风格、图像数量、种子值、反向提示词、模型、lora 权重比值、图像锐利程度等。风格选项整合了 100 多种常见画面风格,涉及写实、胶片、电影质感、动漫、水彩、黏土、3D、等距、像素、霓虹、赛博朋克、波普、纸艺等方面。高级选项用于设置模型、lora、清晰度等。 配置要求:本地部署,需要不低于 8GB 的内存和 4GB 的英伟达显卡。 Fooocus 介绍/安装包下载:https://github.com/lllyasviel/Fooocus (文末领取软件+模型整合包:16G) 使用指南:https://github.com/lllyasviel/Fooocus/discussions/117 大模型(base 和 Refiner)默认放在这里:\\Fooocus_win64_1110\\Fooocus\\models\\checkpoints
2025-02-11
意图识别如何通过提示词实现
通过提示词实现意图识别通常有以下几种方式: 1. 准备特定于任务的数据集,对模型进行 Finetuning,以提升其在特定意图识别任务上的表现。但此过程需要较多训练数据和计算资源。 2. 使用 Prompttuning 方法,通过精心设计的提示词来引导模型识别和响应用户意图。这种方法具有灵活性和快速适应性。 3. 对用户的指令通过提示词进行分类,以识别不同的意图,然后根据识别出的意图执行相应动作,最终输出 JSON 格式的结果。 4. 对用户提问进行分类,如分为导航类、信息查询类、交易类、本地信息类等,匹配更准的信息源和更好的回复提示词。例如搜索“笔记本电脑”,提取出“shopping”意图,挂载相关电商平台信息源进行更小范围搜索,并加载匹配的提示词模板控制大模型回答内容。 5. 利用大模型提供的 Function Calling 能力进行意图识别。 但目前主流的实现方案,不管是成熟的大模型还是微调的小模型,准确度都不够高。
2025-02-11
系统学习ai
以下是关于系统学习 AI 的建议: 对于中学生: 1. 从编程语言入手:可以选择 Python、JavaScript 等编程语言,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习筑牢根基。 2. 尝试使用 AI 工具和平台:体验如 ChatGPT、Midjourney 等生成工具,探索面向中学生的教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识:了解 AI 的基本概念、发展历程,掌握主要技术如机器学习、深度学习等,学习其在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目:参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试运用 AI 技术解决实际问题,锻炼动手能力。 5. 关注 AI 发展的前沿动态:关注权威媒体和学者,思考 AI 技术对未来社会的影响,培养思考和判断能力。 对于一般学习者: 1. 系统性学习:避免碎片化输入,通过系统地看书、听课来打好基础,了解 AI 的底层原理和发展历程。 2. 加入相关社区:如“通往 AGI 之路”开源知识库,参考新手指引和学习路径课程,避免弯路,直接获取有用信息。 此外,鉴于人工智能依赖的神经网络基础,专家 AI 可能通过元学习更快地获取知识,并可能成为下一代专家(人类或 AI)的教师。
2025-02-11
如何使用suno.ai?
以下是关于如何使用 suno.ai 的详细步骤: 1. 简介:Suno AI 是一款革命性的 AI 驱动歌曲生成器,能根据简单提示创造完整音乐作品。 2. 账号要求:需要拥有 Discord、谷歌或微软中的至少一个账号,并确保网络环境稳定。 3. 订阅信息: 免费用户:每天 50 积分,每首歌消耗 5 积分,每天可创作 10 首歌曲,每次点击生成两首歌曲。 Pro 用户:每月 2500 点数(约 500 首歌),按月每月 10 美元,按年每月 8 美元,每年 96 美元。 Premier 用户:每月 10000 点数(约 2000 首歌),按月每月 30 美元,按年每月 24 美元,每年 288 美元。 4. 点击 Create: 有默认模式和个性化模式两种。 默认模式:关闭个性化,可描述歌曲、开关乐器、选择模型 v3。 个性化模式:开启个性化定制,填写歌词、曲风、标题等。 5. 生成歌词:可以使用大模型如 Kimi、GPT、文心一言等来生成。 6. 开始生成:填写好所需内容后点击 Create,等待 2 3 分钟即可。 7. 新功能“Suno Scenes”: 可通过照片或视频生成独特音乐,用户可直接拍摄或上传内容来创建音乐场景。 注意事项:目前只有 iOS 客户端,系统版本需升级到 17.0+,下载需使用美国 ID 并在美国 IP 环境下体验。 8. 基础操作: 注册官方地址加入 discord。 在消息栏输入/chirp,按下 Enter,将出现弹出窗口。 输入歌曲风格及歌词到对应框中,或在 Chirp 提供的 ChatGPT 框中输入关键词让 AI 帮你生成。 点击提交。 Chirp 操作:Chirp v1 更新了类型描述窗口。提交完成后,等待 2 3 分钟,即可生成两个示例音频,目前 Chirp 最多可生成 40 秒的音频。生成的两个示例音频,若喜欢第一个,就点击⏩Continue 1,Chirp 会弹出 Continue 窗口,可继续填入想要的歌曲风格和歌词,点击提交,Chirp 会根据提示生成新的两个示例音频。若不满意,可点击?,Chirp 会弹出窗口提供修改,点击提交即可生成新的两个示例音频。当延续生成足够多音频,想要将它们连接起来生成一个完整音频,可以点击最后想要的音频所对应的❤️,Chirp 会自动剪接之前所选音频并生成完整音频,此过程不消耗次数。延续音频流程:/Chirp 输入→⏩Continue→⏩Continue→❤️
2025-02-11
我想找款Ai变口播软件
以下为您推荐几款 AI 变口播软件及相关功能: 1. TecCreative: 数字人口播配音:输入口播文案,选择期望生成的数字人形象及目标语言,即可生成数字人口播视频。操作指引为输入口播文案——选择目标语言——选择数字人角色——选择输出类型——点击开始生成。 图片换脸:上传原始图片和换脸图片,即可一键实现素材换脸。操作指引为上传原始图片——上传换脸图片——点击开始生成。图片大小上限 5M,支持 JPG、PNG 格式。 视频换脸:自动识别视频中的人脸,并将其替换为选择的脸部。操作指引为上传原始视频——上传换脸图片——点击生成。 音频合成数字人:上传音频文件,即可基于音频合成对应的数字人视频。操作指引为上传音频文件——选择数字人角色——选择输出类型——点击开始生成。音频文件支持 MP3 和 WAV 格式,文件大小上限 5M。 AI 配音:多语种(包含菲律宾语、印地语、马来语等小语种)智能配音,同时支持区分男声和女声。操作指引为输入需配音文案——选择音色——点击立即生成。输入的配音文案需和选择音色语种保持一致。 AI 字幕:智能识别视频语言并生成对应字幕。操作指引为点击上传视频——开始生成——字幕解析完成——下载 SRT 字幕。支持 MP4 文件类型,大小上限为 50M。 2. XiaoHu.AI: 无需真人模特,上传产品图片,数字人即可手持产品进行口播展示。支持语音和口型同步,动作、姿势定制,提供 1000+多国家数字人模特,覆盖全球 28+种语言,快速生成产品宣传视频。测试视频效果已接近成熟,嘴型部分仍需微调。在线体验: 希望以上信息对您有所帮助。
2025-02-11
Azure AI认证
以下是为您整理的关于 AI 认证的相关信息: 亚马逊 AI 从业者认证:在线学习获取国际认证,现报名享 5 折优惠。通过后可获得报名费奖学金,限量 50 人。 了解&报名: 免费课程: 阿里云大模型 ACA 认证:系统体验的改进优化永远没有终点,您可以考虑学习并通过该认证,其配套的免费课程能帮助您进一步了解大模型的能力和应用场景,以及如何优化通过大模型的应用效果。
2025-02-11