直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
可自定义知识库的智能体
以下是关于可自定义知识库的智能体的相关信息: 在线知识库: 点击创建知识库,创建一个画小二课程的 FAQ 知识库。 知识库的飞书在线文档中,每个问题和答案以分割。 选择飞书文档,选择自定义的自定义,输入。 可对内容进行编辑修改和删除,点击添加 Bot 后可在调试区测试效果。 本地文档: 对于本地 word 文件,注意不能将训练数据一股脑全部放进去训练。 正确的方法是首先将大的章节名称内容放进来,章节内详细内容按照固定方式进行人工标注和处理,然后选择创建知识库自定义清洗数据。 外置知识: 外置知识由外部数据库提供,能够动态更新和调整。 涉及多种数据存储和组织方式,包括向量数据库、关系型数据库以及知识图谱。 向量数据库优化了向量检索操作,常用于处理和索引非结构化数据,如图像和文本。 关系型数据库通过表格形式存储结构化数据,支持复杂的查询,适用于事务性数据存储。 知识图谱以图的形式组织数据,强调实体之间的关系,适合于复杂的语义分析和知识推理。 在实际应用中,外置知识的集成和管理常常采用 RAG 架构,它是一种结合了检索和生成的模型,通过检索外部知识源来增强模型的生成能力。
2024-08-30
学习率正常区间
学习率是神经网络训练过程中的关键超参数,用于控制模型权重更新的幅度。 正常区间方面: 对于一般情况,建议在 0.000006 到 0.00000175 之间选择。 学习率过高(如 1e4 即 0.0001)会出现过拟合,导致图片和素材太相似;学习率过低(如 1e5 即 0.00001)会出现不拟合,图片和素材没关系。 学习率的影响: 学习率越大,权重更新幅度越大,训练速度越快,越容易过拟合,可能更不稳定,在局部最优解附近震荡,无法收敛。 学习率越小,权重更新幅度越小,训练速度越慢,越容易找到最优解,相对更稳定,有可能陷入局部最优解爬不出坑。 学习率的调节基本不会影响显存的使用。 在 LORA 模型训练中: unet_lr 基本跟 lr 数值一样即可。 text_encoder_lr 需要通过实践具体情况来测试更改。 lr_scheduler 提供了多种可选的调度策略,基本只用“constant_with_warmup”。 lr_warmup_steps 一般不动。 lr_restart_cycles 一般不动。 学习率可以类比为学习一门技能的速度,速度过快可能会错过细节或理解不深刻,速度过慢可能会浪费时间或失去耐性,因此其大小需要根据具体情况进行调整,以获得最佳学习效果。
2024-08-30
AI学习率
学习率是指 AI 学习图片或进行训练时的效率。以下是关于学习率的一些重要特点和相关内容: 学习率过高会导致过拟合,即生成的图片与素材过于相似;学习率过低会出现不拟合,图片和素材没有关系。 学习率指的是一次迭代(即输入一个样本对它学习,并用此次学习的经验调整神经网络)的步长。这个值越大,表明一次学习对模型的影响越大。为了让学习循序渐进,学习率不应该太高,需要 AI 在训练中反复总结经验,最终累积为完整的学习成果。合理的学习率会让学习过程收敛,使 Loss 达到足够低。学习率太低,容易出现局部最优解;学习率太高,容易使得模型不收敛,找不到解。 如果想追求品质最好的模型效果,可以参考青龙圣者提出的黄金学习率计算方法。详情可看: 。安装方法:在训练脚本根目录鼠标右键点击 Git bash here 在指令窗口输入 pip install tensorboard 安装依赖。使用方法:首先开始跑第一次训练,跑不跑完都可以,然后找到 LoraTrain\\lorascripts\\logs 路径内找到最新时间戳的文件夹名称,在这个文件夹内鼠标右键再次唤出 Git bash here 指令窗口输入。 1e4 是一种程序里的数学表达,实际上就是 1 除以 10 的 4 次方,即:1e4 = 1/10000 = 0.0001 ;1e5 = 1/100000 = 0.00001 。
2024-08-30
推荐几款翻译软件,并把文字转为音频的工具
以下为您推荐几款翻译软件和文字转音频的工具: 翻译软件: 1. DeepL(网站): 点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件): 安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML / TXT 文件」、「翻译本地字幕文件」 。 3. calibre(电子书管理应用): 下载并安装 calibre,并安装翻译插件「Ebook Translator」 。 4. 谷歌翻译(网页): 使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页): 点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、PDF、Word、Excel、PPT、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 8. 浏览器自带的翻译功能:如果一些 PDF 太大,翻译工具不支持,除了将 PDF 压缩或者切分外,还可以转成 HTML 格式,然后使用浏览器自带的网页翻译功能。 文字转音频工具: 1. Eleven Labs:https://elevenlabs.io/ ElevenLabs Prime Voice AI 是一款功能强大且多功能的 AI 语音软件,使创作者和出版商能够生成逼真、高品质的音频。人工智能模型能够高保真地呈现人类语调和语调变化,并能够根据上下文调整表达方式。 2. Speechify:https://speechify.com/ Speechify 是一款人工智能驱动的文本转语音工具,使用户能够将文本转换为音频文件。它可作为 Chrome 扩展、Mac 应用程序、iOS 和 Android 应用程序使用,可用于收听网页、文档、PDF 和有声读物。 3. Azure AI Speech Studio:https://speech.microsoft.com/portal Microsoft Azure Speech Studio 是一套服务,它赋予应用程序能力,让它们能够“听懂、理解并与客户进行对话”。 视频自动字幕工具: 1. Reccloud:这是一个免费的在线 AI 字幕生成工具,可以直接上传视频进行精准识别,并且可以对识别的字幕进行翻译,自动生成双语字幕。它声称已经处理了 1.2 亿+视频,识别准确率接近 100%。 2. 绘影字幕:这是一个一站式专业视频自动字幕编辑器,提供简单、准确、快速的字幕制作和翻译服务。它支持 95 种语言,并且有 98%的超高准确率。此外,用户还可以自定义视频字幕样式,包括字体、颜色、大小、位置等。 3. Arctime:这是一款可以对视频语音自动识别并转换为字幕的工具,甚至支持自动打轴。它支持 Windows 和 Linux 等主流平台,并且支持 SRT 和 ASS 等字幕功能。 4. 网易见外:这是一个国内知名的语音平台,支持视频智能字幕功能,转换的正确率比较高,并且支持音频转写功能。 以上工具各有特点,您可以根据自己的需求选择最适合您的工具。
2024-08-30
模型微调
模型微调包括以下方面: 使用微调模型:当作业成功时,fine_tuned_model 字段将填充模型名称,完成后可能需几分钟准备好处理请求,若超时可能仍在加载中,可几分钟后重试。可通过将模型名称作为 model 完成请求的参数传递来开始发出请求,如 OpenAI 命令行界面、cURL、Python、Node.js 等方式。同时,可继续使用如 temperature、frequency_penalty、presence_penalty 等所有其他完成参数对微调模型进行请求。 Step4: 加载微调模型:基于 LoRA 微调的模型参数见基于 Llama2 的中文微调模型,LoRA 参数需要和基础模型参数结合使用。通过加载预训练模型参数和微调模型参数,示例代码中,base_model_name_or_path 为预训练模型参数保存路径,finetune_model_path 为微调模型参数保存路径。 创建微调模型:假设已准备好训练数据。使用 OpenAI CLI 开始微调工作,需明确从哪里 BASE_MODEL 开始的基本模型的名称(ada、babbage、curie 或 davinci),可使用后缀参数自定义微调模型的名称。运行命令会进行上传文件、创建微调作业、流式传输事件直到作业完成等操作。每个微调工作都从默认为 curie 的基本模型开始,模型选择会影响性能和成本,包括 ada、babbage、curie 或 davinci 等。开始微调作业后,可能需几分钟或几小时完成,工作可能排队,若事件流中断可恢复。此外,还可列出现有作业、检索作业状态或取消作业。
2024-08-30
我如何快速ai入门?
以下是一些帮助您快速 AI 入门的方法: 对于不会代码的您,可以参考“写给不会代码的你:20 分钟上手 Python + AI”。在深入学习 AI 时,很多朋友会因需要编程而感到困难,各类教程默认会打命令行也增加了入门难度。这份入门指南旨在让您更快掌握 Python 和 AI 的相互调用,在接下来的 20 分钟内,循序渐进完成以下任务: 1. 完成一个简单程序。 2. 完成一个爬虫应用,抓取公众号文章。 3. 完成一个 AI 应用,为公众号文章生成概述。 如果您熟悉 JavaScript,可参考“适用于 JavaScript 的 AI 堆栈入门”。文中提到由于新的软件基础设施技术变化迅速,好的文档通常落后于代码,且缺乏好的快速入门框架。为此创建了一个简单的“入门人工智能”模板(https://github.com/a16zinfra/aigettingstarted),供想要尝试核心技术但不想过多考虑授权、托管和工具选择等辅助问题的人使用。
2024-08-30
国内大模型厂商对比
以下是国内大模型厂商的相关情况: 8 月正式上线的国内大模型: 北京的五家企业机构: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com/ 上海的三家企业机构: 商汤(日日新大模型):https://www.sensetime.com/ MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 聊天状态下能生成 Markdown 格式的:智谱清言、商量 Sensechat。 目前不能进行自然语言交流的:昇思(可以对文本进行是否由 AI 生成的检测,类似论文查重,准确度不错)。 受限制使用的:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值)。 特色功能:昇思——生图,MiniMax——语音合成。 中文大模型基准测评 2023 年度报告中的情况: 从大厂和创业公司的平均成绩来看,大厂与创业公司差值约 6.33 分,较 11 月份差距在增大,说明大厂在大模型竞争中长期资源投入方面有一定优势。 过去八个月国内模型在 SuperCLUE 基准上的前三名: 12 月:文心一言 4.0 11 月:文心一言 4.0 10 月:BlueLM 9 月:SenseChat3.0 通过 SuperCLUE 测评结果发现,国内大模型的第一梯队有了更多新的模型加入。头部模型如文心一言 4.0、通义千问 2.0 引领国内大模型的研发进度,部分高质量大模型紧追不舍,分别在闭源应用和开源生态中形成自己独特的优势。 从国内 TOP19 大模型的数量来看,创业公司和大厂的占比几乎持平。
2024-08-30
媒体大模型
以下是关于媒体大模型的相关信息: 可图大模型:由快手可图团队开发的基于潜在扩散的大规模文本到图像生成模型,名为 Kolors。它在数十亿图文对下进行训练,在视觉质量、复杂语义理解、文字生成(中英文字符)等方面具有优势,支持中英双语,在中文特色内容理解方面更具竞争力。更多实验结果和细节可查看技术报告:https://github.com/KwaiKolors/Kolors/blob/master/imgs/Kolors_paper.pdf 。 开发:AI 应用大模型商业化落地现状与思考 大模型的背景和趋势:重点放在大模型当前的应用能力上,随着大模型技术的成熟和规模增大,为 AI Agent 提供强大能力,有望构建具备自主思考、决策和执行能力的智能体,广泛应用于多个行业和领域。 大模型的道德观念:大型语言模型本身不具有真正的道德观念或意识,是通过大量数据训练来模拟语言统计规律的。但可以被设计用来识别和生成包含道德观念内容的文本。道德观念通常与人类的价值观、文化、情感和意识相关,目前的 AI 技术不具备。开发者和研究人员在设计和训练模型时,会尽量使其输出符合社会道德和伦理标准,避免生成有害、不准确或有偏见的内容。确保大型语言模型输出符合道德和伦理标准的方法包括:(未给出具体方法)
2024-08-30
智谱跟其他厂商的差异和优势是什么
智谱与其他厂商的差异和优势主要体现在以下几个方面: 1. 模型研发:一年间推出了 4 代 GLM,一直是国内能力最好的模型之一。22 年就和清华一起自研了 GLM130B。 2. 技术来源:由清华大学计算机系技术成果转化而来,背后有清华大学研发团队的科研成果支持。 3. 产品设计:以 ChatGPT 为对标,努力打造类似的用户体验。 4. 智能体应用:是国内首批开放智能体应用的 AI 公司之一,在智能体开发和模型优化方面积累了丰富经验和技术。 5. 性能表现:在逻辑推理和处理复杂提示词方面表现出明显优势,在处理需要深度思考和分析的任务时表现出色。 6. 产品体系:合作研发了双语千亿级超大规模预训练模型 GLM130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎。基于此模型打造了 ChatGLM,还推出了认知大模型平台 Bigmodel.ai,包括 CodeGeeX 和 CogView 等产品,提供智能 API 服务。
2024-08-30
如何让AI写出更有网感的标题
要让 AI 写出更有网感的标题,可以参考以下方法: 1. 利用 Claude 3 Opus :Claude 写的标题更有网感,建议在 Claude 中使用相关提示词。您可以开通一个 Claude 3 Opus 账号,某宝一个月 168 元,能节省很多时间。 2. 学会编写提示词 :这是搭建人和 AI 之间“沟通桥梁”的关键。要用 AI 能理解的语言,清晰说明需求、任务内容和步骤,比如写标题可用 ChatGPT ,写文章可用 Claude 。 3. 提供清晰且具指导性的提示词 :一个好的提示词能帮助 AI 更准确理解需求并生成符合预期的内容。若想进一步提升质量,可提供更详细、具创意的提示词,设定文章的语气、风格和重点等,例如“请根据我们收集的关于 OpenAI 回应马斯克言论的资讯,创作一篇既深入又易于理解的科技资讯文章。文章应该有一个吸引人的标题,开头部分要概述事件的背景和重要性,主体部分详细分析 OpenAI 的回应内容及其可能产生的影响,结尾处提出一些引人深思的问题或观点。”但最终产出的内容可能需要进行微调以符合预期和公众号风格。
2024-08-30