直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
如何调优大模型
以下是关于调优大模型的一些方法: 1. 更换大模型:比如从 ChatGLM26B 替换成 baichuan213b,针对特定场景,后者性能可能提升一倍左右。 2. 更换 embedding 模型:将 embedding 模型从 LangChain Chatchat 默认的 m3ebase 替换为 bgelargezh,后者可能更优。 3. 测试不同 Top k 的值:比较 Top 5、Top 10、Top 15 的结果,发现 Top 10 时效果最优。 4. 对文档名称进行处理:人工对文件重命名,上传相同文件构建知识库,同时在构建时勾选【开启中文标题加强】选项。重命名文件对结果提升不明显,但勾选该选项后,回答的无关信息减少,效果有所提升。 5. Prompt 阶段:需要一定的 prompt 工程,选择最合适的 prompt 模板。根据相关论文,把 query 放到头部和尾部,同时把相似度大的文档放到 context 的两端,能提升回答效果。 6. LLM 生成答案:大模型本身的性能是最大影响因素。选择大模型时要在成本和收益间找最佳平衡点,有条件还可对模型进行微调以更匹配自身场景。
2024-12-12
怎么用ai生成ppt
以下是使用 AI 生成 PPT 的几种方法: 1. 卓 sir 的方法: 先让 GPT4 生成 PPT 大纲,然后把大纲导入到 WPS 当中,启用 WPS AI 一键生成 PPT。 为让 PPT 更具灵动性和观感,可让 chatPPT 添加一些动画,最后手动修改细节,如字体、事实性错误等。 生成大纲环节可能较耗时,需明确主题,如结合具体电商网站研究 5 种不同电商模式。 2. 熊猫 Jay 的 Process ON 方法: 网址:https://www.processon.com/ 输入大纲和要点的方式: 导入大纲和要点: 手动复制,相对耗时。 导入方式:复制最终大纲内容到本地 txt 文件,改后缀为.md,用 Xmind 软件导入 md 文件,再在 Process ON 导入 Xmind 文件。 输入主题自动生成大纲和要求:新增思维导图,输入主题点击 AI 帮我创作。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版再点击下载。若使用可某宝买一天会员。 3. 熊猫 Jay 的闪击方法: 网址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite 选择模版,输入大纲和要点,由于闪击的语法和准备的大纲内容可能有偏差,可参考官方使用指南:https://zhuanlan.zhihu.com/p/607583650 ,将大纲转换成适配闪击的语法。 点击文本转 PPT 并在提示框中确定得到转换后的 PPT,可在线编辑,但导出有一些限制,PPT 需要会员才能导出。
2024-12-12
AI中医
以下是关于 AI 中医的相关信息: 该项目将 AI 与中医相结合,具体方式包括使用摄像头观察患者口腔和舌苔,用指尖传感器抓取脉搏数据。 依据数百本中医教材和一千多种常见病的临床数据,以及三百多个三甲医院中医的药方数据进行 AI 训练。 AI 开出的方子与三甲医院中医基本一致,目前应用在辅助看诊领域,能够提高诊疗效率。 创始人的愿景是在未来实现 24 小时独立问诊开药。 此外,还有一个关于 AI 产品经理的招聘信息,职责包括负责基于通用人工智能技术(AGI)的智慧医疗诊断产品的规划、研发、发布上市的全过程管理等;任职要求包括本科及以上学历,相关专业优先考虑,具备一定年限的产品管理经验等。
2024-12-12
中文播客生成
以下是关于中文播客生成的相关信息: NotebookLM 中文版平替:输入 url,生成中文播客,可一键发布小宇宙,开源地址为 https://github.com/lihuithe/podlmpublic 。 NotebookLlama:Meta 的播客生成教程,使用 Llama 模型从 PDF 中提取文本生成干净的.txt 文件,转化文本为播客转录创造富有创意的内容,对转录进行戏剧化处理提高互动性和吸引力,最终将文本转换为播客音频,支持多种 TTS 模型。详细介绍:https://xiaohu.ai/p/15036 ,GitHub:https://github.com/metallama/llamarecipes/tree/main/recipes/quickstart/NotebookLlama 。 此外,播客一词于 2004 年提出,由“iPod”“broadcast”两个词合并而成,多数围绕音乐、电台。AI 播客降低了播客的制作门槛,增加了内容的多样性,但也可能造成劣币驱逐良币和信息茧房效应加剧。综合来看,播客和短视频都属于泛娱乐类,区别在于注意力和知识密度体系。
2024-12-12
人工智能
以下是关于人工智能的全面介绍: AGI 的 5 个等级: 1. 聊天机器人:具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者:具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体:不仅具备推理能力,还能执行全自动化业务,但目前许多产品执行任务后仍需人类参与。 4. 创新者:能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可加速科学研究和新药发现。 5. 组织:最高级别,能够自动执行组织的全部业务流程,包括规划、执行、反馈、迭代、资源分配和管理等。 人工智能简介和历史: 人工智能是研究如何使计算机表现出智能行为的科学。最初由查尔斯·巴贝奇发明计算机,现代计算机仍遵循相同的受控计算理念。但对于像根据照片判断人的年龄这类无法明确编程的任务,正是人工智能感兴趣的,因为我们无法明确大脑完成此类任务的具体步骤,所以无法编写明确程序让计算机完成。 人工智能的应用场景: 1. 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 2. 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 3. 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 4. 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 5. 交通运输:(未具体说明)
2024-12-12
想要自学AI课程
以下是为您提供的自学 AI 课程的相关建议: 1. 课程内容: 预习周课程:包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 基础操作课:涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等内容。 ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 2. 免费课程机会: 如果想要免费获得这门课程,可以来参与 video battle,这是唯一一个获胜者就可以拥有课程的机会。每期的 video battle 的评委野菩萨老师都非常严格,需要寓意深度审美并存。 冠军奖励:4980 课程一份 亚军奖励:3980 课程一份 季军奖励:1980 课程一份 入围奖励:598 野神殿门票一张 3. 新手学习 AI 的步骤: 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 开始 AI 学习之旅:在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如 Coursera、edX、Udacity)上的课程,您可以按照自己的节奏学习,并有机会获得证书。 选择感兴趣的模块深入学习:AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。建议您一定要掌握提示词的技巧,它上手容易且很有用。 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 体验 AI 产品:与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 4. 使用 AI 来做事: 更令人兴奋的是,使用人工智能来帮助教育的可能性,包括帮助我们学习。可以要求人工智能解释概念并获得非常好的结果。但因为人工智能可能会产生幻觉,所以明智的做法是(小心!)根据其他来源仔细检查任何关键数据。这里有相关提示。
2024-12-12
ai 进行重新填词并进行翻唱
AI 语音合成中的关键技术包括深度伪造技术。深度伪造技术是一种利用 AI 程序和深度学习算法实现音视频模拟和伪造的技术。投入深度学习的内容库越大,合成的视音频真实性越高,甚至能达到以假乱真的程度。 在 AI 翻唱方面,粉丝们通常会通过 Stems 音轨分离工具将人声与原始歌曲分离,接着使用人声转换模型将人声转换成另一位明星的风格,最后将新的人声轨道与原始作品重新拼接在一起。DiffSVC 是一种特别流行的用于此目的的语音传输模型。
2024-12-12
查看图像是否由ai生成
以下是关于如何判断一张图片是否由 AI 生成的相关内容: 1. 通过画面风格、物品 bug 等细节进行辨别。但需注意,AI 在不断修正作图 bug,相关方法可能随时失效。 2. 整体看光影,细节看结构。通过累积对 AIGC 画作分析的量,人们会在脑中自发形成一个“判断模型”,但往往是“知其然,而不知其所以然”。 3. 从本质上分析,人类绘画创作是线性发展的过程,通常先学习线稿表达、再理解色彩搭配、随后加入光影表现等,初级画手笔触生硬但完整。而 AI 是以积累数据、扩散噪声、再降噪收束的路径来生图,不是线性创作过程,常导致同一张图中呈现出不同绘画级别的细节。 4. 曾在小红书、B站 等自媒体平台上以真迹混同 AI 仿品的形式让大家判别,发现大家对判断哪幅图是 AI 搞的有近乎直觉的感受,但进一步询问如何看出时,多半难以迅速回答出一套章程。
2024-12-12
能够通过 给出 伴奏 和 歌词 生成音频文件
Suno 和 Udio 都推出了上传音频文件生成音乐的功能,很多行业大号借此做了各种无厘头编曲,短期能带来很多流量。此功能对于 AI 音乐的作用在于精确的控制力,有了前置旋律,可以精确控制每首歌的速度(Tempo),无需再背绕口的速度词,能精确控制想要的 BPM;旋律(Melody)方面,可自己制作简单旋律让 AI 补全并贯穿整首歌,实现旋律与速度的一谱变速,节省大量 Roll 旋律的时间;配器(Instrumentation)能按自己想法选择乐器,减少提示词里乐器不灵光的情况,还能选择特殊音色;合成(synthesizer)方面,当有两支 BPM 相同、调性相同的音乐时,可尝试更多拆分组合和好玩的效果。 上传音频节省了点数消耗,每月的点数可用于:用提示词多 Roll 一些和流派、心情、场景相关的曲子,减少限制让 AI 音乐发挥更多创造力,把好旋律存起来作为制作素材;用于 roll 更多细节调整,如让某段曲子升调提升作品品质。 UDIO 制作音乐时,除了更改每个部分的提示,还能指定单独的自定义歌词。构建 1.5 分钟长的独立歌曲的最简单工作流程为:使用常规创建模式生成中间(主要)部分,这是曲目的“核心”;为刚创建的部分输入扩展模式,在扩展放置区域中选择添加介绍选项并单击扩展,生成的两部分轨道长 1 分钟;进入 1 分钟曲目的扩展模式,选择“添加尾奏”并单击“扩展”,即可创作有正确开头和结尾的音乐。
2024-12-12
不会写代码可以制作一款工具软件吗
不会写代码也有可能制作一款工具软件。以下是一些途径和案例: 1. 利用提示词工程和精巧的代码设计:有研究表明,仅使用提示词工程和一些设计,能让语言模型(LLM)获得稳定的工具调用能力,适合没有代码基础的人员复现和修改。 2. 借助低代码平台:例如 Coze 这样的平台,降低了技术门槛,提供了相当的可定制性,写很少的代码就能快速实现想法并制作出产品。 3. 使用专门的工具:如 bolt.new,它能在浏览器中为用户自动写代码、自动运行并自动部署,用户只需撰写简单提示,无需安装额外软件。但需注意,该工具处于 alpha 测试阶段,可能存在问题,且目前对仓库规模有一定限制。
2024-12-12