直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
提示词一定要统一吗
提示词不一定要统一。在一些情况下,使用统一的提示词可能有其优势,例如能更清晰地表达意图、增强可读性、便于扩展和维护等。但在实际应用中,是否采用统一的提示词取决于具体的需求和使用场景。 对于结构化提示词,其具有层级清晰、结构可扩展性强、格式和语义一致性好等优点,其思维链通常包括角色、角色简介、角色技能、角色要遵守的规则、工作流程、初始化准备等环节。但要注意,结构化框架的核心在于清晰、简明、有效、统一,不应为了结构化而结构化。如果不需要增设新的模块,就不必强行加入。 在写提示词时,一般要根据自己想画的内容来写。多个提示词之间使用英文半角符号可将权重降低至原先的 90.91%,可将权重减少为原先的 25%。
2024-10-10
如何从小白开始学习AI
对于小白学习 AI,以下是一些建议: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),可根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。 在知识库有很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-10-10
语音模型
以下为您介绍一些语音模型: 1. 阿里云最新开源模型——FunAudioLLM: 可以实现语音翻译、情感语音聊天、交互式播客、有声读物叙述等应用。 核心是两个创新模型:用于高精度多语言语音识别、情感识别和音频事件检测的 SenseVoice ;以及用于多语言、音色和情感控制的自然语音生成的 CosyVoice。 FunAudioLLM 主页:https://funaudiollm.github.io/ CosyVoice 开源地址:https://github.com/FunAudioLLM/CosyVoice SenseVoice 开源地址:https://github.com/FunAudioLLM/SenseVoice 2. 智谱·AI 开源模型列表: Chat 模型: |模型|介绍|上下文 token 数|代码链接|模型权重下载链接| |||||| |ChatGLM6Bint4|ChatGLM6B 的 Int4 版本。最低只需 6GB 显存即可部署,最低只需 7GB 显存即可启动微调(|魔搭社区|始智社区|启智社区| |ChatGLM6Bint8|ChatGLM6B 的 Int8 版本|2K|||魔搭社区|始智社区|启智社区| |AgentLM7B|1. 提出了一种 AgentTuning 的方法;2. 开源了包含 1866 个高质量交互、6 个多样化的真实场景任务的 Agent 数据集 AgentInstruct;3. 基于上述方法和数据集,利用 Llama2 微调了具备超强 Agent 能力的 AgentLM7B、AgentLM13B、AgentLM70B。|4K|| |AgentLM13B||4K||| |AgentLM70B||8K||| 3. OpenAI 春季发布会:GPT4o: 在 GPT4o 之前,使用语音模式与 ChatGPT 交谈,平均延迟为 2.8 秒(GPT3.5)和 5.4 秒(GPT4)。语音模式由三个独立模型组成的管道:一个简单的模型将音频转录为文本,GPT3.5 或 GPT4 接收文本并输出文本,第三个简单模型将该文本转换回音频。这个过程意味着智能的主要来源 GPT4 会丢失大量信息——它无法直接观察音调、多个扬声器或背景噪音,也无法输出笑声、歌声或表达情感。 借助 GPT4o,在文本、视觉和音频上端到端地训练了一个新模型,这意味着所有输入和输出都由同一个神经网络处理。因为 GPT4o 是第一个结合了所有这些模式的模型,所以仍只是在探索该模型可以做什么及其局限性的表面。
2024-10-10
扩散模型
在 AI 图像生成中,“diffusion”(扩散)通常指的是一类生成模型,称为扩散模型(Diffusion Models)。 扩散模型的工作原理如下: 1. 正向扩散过程:向图像逐渐添加高斯噪声,直到图像完全无法识别,这个过程可以被形式化为顺序扩散马尔可夫链。 2. 潜空间表示:将图像压缩到低维的潜在空间(Latent Space)中,以减少计算量和提高生成速度。 3. 学习逆向过程:训练一个神经网络来预测每一步中噪声的分布,并逐步去除噪声,从而恢复出清晰的图像。 4. 文本到图像的生成:结合文本编码器和图像解码器,根据文本描述生成相应的图像。 扩散模型的关键优势在于其生成高质量图像的能力,以及相比其他生成模型(如 GANs)在计算效率和稳定性上的优势。Stable Diffusion 等模型就是基于扩散模型的文本到图像生成工具,能够根据文本提示生成逼真的图像。 扩散模型的逆向过程,即从噪声中恢复图像的过程,可以类比为雕刻,AI 逐步去除不必要的部分,最终得到清晰的图像。这个过程可以逐步进行,也可以一次性完成,取决于模型的具体实现和采样算法。 从 2015 年被引入图像生成领域,直到近几年才真正受到关注。2020 年开始,关于扩散模型的研究领域兴起,支撑着许多最先进的图像生成系统。 无条件扩散模型可以从特定的图像(如人脸)中训练,并学习生成新的图像实例。还能用于图像超分辨率,增强低质量图像。 扩散模型还可以从文本提示生成图像,或者用于图像到图像的转换,以及图像编辑,比如添加或删除某些内容。 基本思想是通过迭代的正向扩散过程系统地并逐渐破坏数据分布中的结构,具体是向图像添加噪声,然后学习一个反向扩散过程,以恢复数据结构。目标是让模型学会去噪,以去除添加的噪音,从而能够从纯噪声图像开始合成新的图像。 Sora 是一个扩散模型,给定输入的噪声块(以及像文本提示这样的条件信息),它被训练来预测原始的“干净”分块。Sora 是一个扩散 Transformers 变换器,在包括语言建模、计算机视觉和图像生成在内的多个领域展示了显著的扩展性。在视频生成中,随着训练计算增加,固定种子和输入的视频样本质量显著提高。
2024-10-10
如何系统学习AI
以下是关于系统学习 AI 的建议: 对于中学生: 1. 从编程语言入手学习:可以选择 Python、JavaScript 等编程语言,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习筑牢根基。 2. 尝试使用 AI 工具和平台:体验如 ChatGPT、Midjourney 等生成工具,探索面向中学生的教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识:了解 AI 的基本概念、发展历程、主要技术(如机器学习、深度学习等),学习其在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目:参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试用 AI 技术解决生活中的实际问题,锻炼动手能力。 5. 关注 AI 发展的前沿动态:关注权威媒体和学者,思考 AI 技术对未来社会的影响,培养思考和判断能力。 对于新手: 1. 了解 AI 基本概念:阅读「」部分,熟悉术语和基础概念,了解其主要分支及相互联系,浏览入门文章。 2. 开始 AI 学习之旅:在「」中找到为初学者设计的课程,推荐李宏毅老师的课程,通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习并争取获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,可根据兴趣选择特定模块(如图像、音乐、视频等)深入学习,掌握提示词技巧。 4. 实践和尝试:实践是巩固知识的关键,尝试使用各种产品创作作品,在知识库分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式,获取实际应用体验,激发对 AI 潜力的认识。
2024-10-10
扩写prompt
以下是关于扩写 prompt 的相关内容: 小七姐在其免费知识星球专门研究提示词,最近常被询问如何让大模型生成的内容更多更丰富。这个问题可拆解为几种不同诉求,如扩写(俗称水文),即基于给定内容进行“注水”式扩充;编写,基于给定内容框架生成详细内文;改写,基于给定完整内容以另一种方式写作。这三种写法都有相应方法论,要明确保留与增加的内容及规则,避免啰嗦。在单次对话中,大模型生成内容常受限,可采用分治法分段输出再拼合。此外,还探索了丰富单个窗口生成内容的方法,包括用详细度设定 Prompt、用英文生成再翻译为中文、直接用扩写 Prompt、用代码分析器检查字数加扩写 Prompt 以及情绪勒索。 写 prompt 是关键步骤,决定 AI 模型如何理解和生成文本。好的 prompt 能助模型更好理解任务要求并生成符合预期的文本。编写 prompt 建议有:明确任务,清晰定义如写故事时的背景、角色和情节;提供上下文,任务需特定背景知识时要在 prompt 中提供;使用清晰语言,避免模糊歧义词汇;给出具体要求,如格式或风格;使用示例辅助模型理解;保持简洁,避免过多信息致模型困惑;使用关键词和标签;测试和调整,根据生成结果多次迭代直至满意。 夙愿提到使用 GPT 模仿创作内容的万能思路中,要把方法论和示例写到 prompt 中,最快方法是改写大佬写好的 prompt,如模仿 JK 老师改写。把拆解的方法论和示例写到 Skills 部分可运用 COT 技巧。若之前未写过结构化 prompt,推荐学习云中江树老师的 LangGPT 项目。
2024-10-10
如何学习提示词
学习提示词可以通过以下步骤和方法: 1. 基本概念: 了解 Stable Diffusion 的工作原理和模型架构。 理解提示词如何影响生成结果。 掌握提示词的组成部分,如主题词、修饰词、反面词等。 2. 研究官方文档和教程: 通读 Stable Diffusion 官方文档,了解提示词相关指南。 研究来自开发团队和专家的教程和技巧分享。 3. 学习常见术语和范例: 熟悉 UI、艺术、摄影等相关领域的专业术语和概念。 研究优秀的图像标题和描述,作为提示词范例。 4. 掌握关键技巧: 学习如何组合多个词条来精确描述想要的效果。 掌握使用“()”、“”等符号来控制生成权重的技巧。 了解如何处理抽象概念、情感等无形事物的描述。 5. 实践和反馈: 使用不同的提示词尝试生成各种风格和主题的图像。 对比提示词和实际结果,分析原因,总结经验教训。 在社区内分享结果,请教高手,获取反馈和建议。 6. 创建提示词库: 根据主题、风格等维度,建立自己的高质量提示词库。 将成功案例和总结记录在案,方便后续参考和复用。 7. 持续跟进前沿: 关注 Stable Diffusion 的最新更新和社区分享。 及时掌握提示词的新技术、新范式、新趋势。 此外,还需注意以下提示词运用的要点: 1. 理解提示词的作用:提示词向模型提供上下文和指示,其质量直接影响模型输出质量。 2. 学习提示词的构建技巧:明确任务目标,用简洁准确的语言描述;给予足够背景信息和示例,帮助模型理解语境;使用清晰指令,如“解释”“总结”“创作”等;对特殊要求应给予明确指示,如输出格式、字数限制等。 3. 参考优秀案例:研究和学习已有的优秀提示词案例,了解行之有效的模式和技巧。 4. 实践、迭代、优化:多与语言模型互动,根据输出提高提示词质量。尝试各种变体,比较分析输出差异,持续优化提示词构建。 5. 活用提示工程工具:目前已有一些提示工程工具可供使用。 6. 跟上前沿研究:提示工程是当前前沿研究领域之一,持续关注最新研究成果和方法论。 小七姐将提示词学习分为五个维度,舒适的学习顺序是: 1. 场景:直接切入提示词的场景去学,比如在什么场景下,可以如何使用提示词,用特定提示词以及不用它们的效果对比。 2. 工具:使用一些现成的、方便的提示词工具,包括一些 Meta Prompt、一些 AI 角色定制等,也包括别人写好的成型的提示词,作为工具来体验和尝试。 3. 有效语句:学习大量的经典论文中明确提出的提示词语句。 4. 方法论:把有效语句及其背后的原理整合成比较稳定可控的一整套方法,可以自动编写一些稳定的提示词。 5. 思维框架:这是最高的维度,将前面的内容整合在一个框架中。
2024-10-10
ai生成类产品的深度学习路径
以下是关于 AI 生成类产品的深度学习路径: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 通过与这些 AI 产品的对话,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,您还可以通过以下课程深入学习: 谷歌生成式 AI 课程:此学习路径将引导您完成有关生成式 AI 产品和技术的精选内容集合,从大型语言模型的基础知识,到如何在 Google Cloud 上创建和部署生成式 AI 解决方案。链接:https://www.cloudskillsboost.google/journeys/118 。 【AI 学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐): 视频一主要回答了什么是 AI 大模型,原理是什么。 概念:生成式 AI 生成的内容,叫做 AIGC 。 概念与关系:相关技术名词: AI——人工智能 。 机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习 。 监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归 。 无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组 。 强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗 。 深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习 。 生成式 AI——可以生成文本、图片、音频、视频等内容形式 。 LLM——大语言模型。对于生成式 AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的 BERT 模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类 。 技术里程碑——2017 年 6 月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了 Transformer 模型,它完全基于自注意力机制(SelfAttention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。GPT 含义:Transformer 是关键。Transformer 比 RNN 更适合处理文本的长距离依赖性。
2024-10-10
法律行业搜索案例的免费ai哪个好用
在法律行业,进行案例搜索时最好使用法律行业垂类的 AI 产品,通用型 AI 可能存在查不出来、数据不全或生成内容不满足需求的情况。以下是一些案例检索的 Prompt 指令词示例及相关场景: 场景一:案例检索 Prompt 指令词:请搜索近五年内关于商标侵权案件中“混淆可能性”标准的具体判例,并提供相似度最高的三个案例的关键要点摘要。 预计效果:AI 系统将检索相关数据库,找出符合要求的判例,并提炼出这些案例中有关“混淆可能性”标准的关键判决理由和结果,形成摘要报告。 其他例子: Prompt 指令词:检索近三年内所有涉及软件算法专利侵权的案例,分析法院判决中关于技术特征对比和侵权判定的标准,为即将面临的专利侵权案件提供参考。 Prompt 指令词:比对不同地区法院在处理劳动争议案件时对加班费计算标准的差异判决,总结对雇主有利的判决趋势,为客户提供合规操作指导。 Prompt 指令词:研究环境法相关案例,特别是涉及工业废弃物处理的法律责任,为客户提供合规处理建议,以降低潜在的法律风险。 Prompt 结构提示:【案例领域或类型+明确需要查找的重点内容+查找案例的目的+其他希望 AI 做的事情】 场景二:类案检索 Prompt 指令词:(与场景一类似) 预计效果:(与场景一类似) 其他例子:(与场景一类似) Prompt 结构提示:(与场景一类似) 场景四:法规研究与解读 Prompt 指令词:根据最新修订的《数据安全法》,解析企业在处理个人信息时应遵循的主要原则,并给出具体操作建议。 预计效果:AI 助手将依据《数据安全法》的最新条款,解析企业处理个人信息所必须遵循的原则,并结合实践情况提出详细的操作指南或合规建议。 其他例子: Prompt 指令词:分析新出台的《网络安全法》对电子商务平台的具体影响,特别是数据保护和用户隐私方面的规定,为客户提供合规操作指南。 Prompt 指令词:【输入一段具体法律规定如:国际贸易规定】,以上是国际贸易法规的最新变化,为客户提供跨境交易的合规指南,特别是关税和进出口限制方面的内容。 Prompt 指令词:解读新修订的税法对中小企业的影响,提供税务规划和避税策略的建议,确保客户在合法范围内优化税务负担。 Prompt 结构提示:【需求 or 目的+根据具体法条或者根据某部法律+具体需要研究或则具体的研究细节内容】 场景五:法律意见书撰写或非诉交易文件材料 Prompt 指令词:针对我方当事人涉及的版权纠纷案,输入【已有的证据材料】+【相关法律条文】,撰写一份初步法律意见书,论证我方主张的合理性和胜诉的可能性。 预计效果:AI 将基于商标法的相关条款和案例法,提供关于商标侵权案件的诉讼策略。这将包括对原告商标权利的详细分析、被告侵权行为的法律评估、关键证据的搜集建议、可能的法律抗辩点以及在适当情况下和解或调解的策略。AI 的目标是帮助律师构建一个全面的诉讼计划,以提高胜诉几率并为客户争取最大利益。 其他例子: Prompt 指令词:为一起涉及专利侵权的案件制定诉讼策略,分析专利的有效性、被告的侵权行为以及可能的抗辩理由,提出如何证明侵权和计算损害赔偿的建议。 Prompt 指令词:针对一起劳动合同纠纷案件,分析员工的权益和雇主的责任,提出诉讼策略,包括主张的权益、证据收集的重点以及如何证明雇主的违约行为。 Prompt 指令词:在一场涉及知识产权许可的诉讼中,分析许可协议的条款和双方的权利义务,提出诉讼策略,包括如何证明许可协议的违反、计算损失赔偿以及可能的合同解除条件。 其他可以尝试的场景:模拟法庭 Prompt 指令词:模拟一场涉及商业合同违约的法庭审理,分析原告主张的违约责任和被告提出的免责抗辩,预测法庭可能的判决,并提出如何优化法庭陈述和证据呈现的建议。 预计效果:AI 将根据商业合同法的相关规定和案例法,模拟法庭审理过程。AI 将提供对原告和被告双方可能的论点、证据和法律依据的分析,预测法庭可能的判决结果,并给出如何更有效地在法庭上进行陈述、展示证据和进行交叉审问的建议。这将帮助律师准备更有说服力的法庭策略,以期达到最佳的诉讼结果。 其他例子:(与上述类似)
2024-10-10
普通人怎麼獲取ChatGPT
普通人获取 ChatGPT 可以通过以下方式: 1. ChatGPT 可以作为 API 进行访问。 2. 对于身处海外或拥有稳定国际网络连接的用户,ChatGPT 是一个不错的选择。但需要注意的是,对于国内用户,可能会因网络连接问题遇到连接不稳定、响应延迟等情况,影响使用体验。 ChatGPT 具有以下特点和优势: 1. 开创性:作为首批向公众开放的大规模商用 AI 对话系统之一,在全球范围内掀起了 AI 革命,改变了人们对 AI 的认知,为未来技术发展指明了方向。 2. 用户体验:界面简洁直观,交互流畅自然,新手也能轻松上手,降低了普通人接触和使用 AI 的门槛。 3. 技术实力:背后的 GPT 系列模型在性能和能力上处于行业领先地位,在语言理解深度和生成内容质量方面表现出色,能应对各种复杂任务和挑战。 同时也要认识到 ChatGPT 的局限性: 1. 随着 AI 技术发展,它已不再是市场上唯一的顶级选择,其他公司和研究机构推出的新模型和产品在特定领域可能超越它。 2. 国内用户使用可能存在网络连接等技术障碍。
2024-10-10