直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
提示词工程教程
以下是关于提示词工程的教程: 1. 提示词工程师:为帮助大型语言模型更好地理解提示词工程任务,提供了在线教程。任务可分解为两步,第一步模型检查当前提示词和样本,第二步编写改进的提示词。 2. 基础提示词:通过简单提示词可获得结果,其质量与提供信息的数量和完善度有关。提示词包含指令、问题、上下文、输入或示例等元素。使用 OpenAI 聊天模型时,有 system、user 和 assistant 三种角色,本指南示例通常仅使用 user 消息作为 prompt。提示工程探讨如何设计最佳提示词以高效完成任务。 3. 无需微调,仅用提示词工程让 LLM 获得 tool calling 功能:主要由提示词注入和工具结果回传两部分代码组成。提示词注入将工具信息及使用提示添加到系统提示中,包含 TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT 三部分。工具结果回传通过正则表达式抓取输出参数,将工具返回结果回传给 LLM。对于不接受特定角色的 LLM 接口,可改为回传给 user 角色。
2024-12-07
如何从0开始学AI
以下是从 0 开始学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-12-07
想学AI编程,要怎么逐步进行
如果您想学习 AI 编程,可以按照以下步骤逐步进行: 1. Python 基础: 基本语法:了解 Python 的基本语法规则,如变量命名、缩进等。 数据类型:熟悉字符串(String)、整数(Integer)、浮点数(Float)、列表(List)、元组(Tuple)、字典(Dictionary)等基本数据类型。 控制流:学习使用条件语句(if)、循环语句(for 和 while)控制程序执行流程。 函数:掌握定义和调用函数,理解参数和返回值,以及作用域和命名空间中局部变量和全局变量的概念和工作方式。 2. 模块和包: 导入模块:学会导入 Python 标准库中的模块或第三方库。 使用包:理解如何安装和使用 Python 包来扩展程序功能。 3. 面向对象编程(OOP): 类和对象:了解类的定义和实例化等基本概念。 属性和方法:学习为类定义属性和方法,并通过对象调用它们。 继承和多态:了解类之间的继承关系及如何实现多态。 4. 异常处理: 理解异常:明白什么是异常以及在 Python 中的工作原理。 异常处理:学会使用 try 和 except 语句处理程序中可能出现的错误。 5. 文件操作: 文件读写:学习打开文件、读取文件内容和写入文件。 文件与路径操作:理解如何用 Python 处理文件路径,以及列举目录下的文件。 在深入学习过程中,您可以通过完成一些任务来巩固所学,比如完成一个简单程序、一个爬虫应用来抓取公众号文章,或者完成一个 AI 应用为公众号文章生成概述。
2024-12-07
AI在3D制图方面有什么突破吗
AI 在 3D 制图方面有以下突破: Stability AI 与 Tripo AI 合作发布了 TripoSR,能够将单图在半秒内变为 3D。 生成式 AI 可以为游戏创建 2D 艺术、纹理、3D 模型,并协助关卡设计。在营销中,有望取代库存艺术、产品摄影和插图,且已在网页设计、室内设计和景观设计中有所应用。 Diffusion Model 像极具耐心的艺术家,通过逐步去噪实现高质量的图像生成和重构。 NeRF 像空间中的建筑师,能把一系列二维图像转化成逼真的三维场景,3DGS 作为三维形状生成领域的重要技术,专注于物体的结构和几何特征,能理解和重构三维物体的形状。在虚拟现实、游戏开发等领域,二者的结合能生成逼真的三维场景和高度定制的三维对象。 您可以通过以下链接获取更多详细信息:
2024-12-07
AI在机械制图方面有什么进展吗
AI 在机械制图方面的进展相对有限。然而,在艺术创作领域,特别是 AI 绘画方面有显著的发展。从早期的机械臂机器人到当前的大语言模型,技术的进步使得 AI 绘画在创作质量和速度上取得了新的突破。 AI 绘画不仅改变了艺术作品的创作方式,还对艺术的审美观念和市场需求产生了影响。但同时也引发了一系列讨论和争议。一方面,人们对于由 AI 驱动的机器人创作的艺术品和人类创作的艺术品的接受程度大致相同,但不太愿意将机器人视为艺术家,因为 AI 在表达情感和创造性意图方面存在局限性。另一方面,艺术家对 AI 生成艺术的态度复杂,既有对创新潜力的期待,也有对版权、原创性和伦理问题的担忧。 此外,AI 绘画技术的发展带来了对文化创意领域从业者职业安全的焦虑,以及对其“侵权”嫌疑的反对之声。不过,AI 绘画也为艺术创作提供了新的可能性,能帮助艺术家探索新的创意表达方式,提高制作效率,降低制作成本,促进艺术与观众之间的互动,提供更加个性化和互动的艺术体验。 总的来说,AI 绘画对艺术界的影响是复杂且双面的,既提供了新的创作工具和可能性,也引发了关于艺术本质、创造性、版权和伦理的重要讨论。但目前在机械制图领域,相关进展尚不明显。
2024-12-07
哪些ai工具在法律上面比较精通
以下是一些在法律方面表现出色的 AI 工具及相关情况: AI 大模型擅长的方面: 1. 信息检索与整理:能迅速从大量数据中检索相关信息,如法律法规和案例的检索,提取和整理案件相关资料。 2. 模式识别与预测:通过导入历史数据和参考信息,设定指令,可以预测案件的可能结果,如判决趋势、赔偿金额,辅助制定诉讼策略。 3. 自动化文档处理:能够自动生成和修改标准化文本与合同,减少律师在文档起草和修订上的工作量。 4. 多任务处理能力:可以同时处理多个任务,不受时间和体力的限制,对于同时处理基础任务能够极大提高效率。 AI 大模型不擅长的方面: 1. 法律解释与推理:可以根据历史信息和数据给出一些预测和判断,但仍然难以像专业的法律人一样,推演复杂的法律解释和论证。特别是在涉及交叉多个法律领域或需要深入社会背景解读法条时,AI 的能力非常有限。 2. 理解道德和情感:难以理解案件中涉及的复杂情感和动机,如离婚案件中的夫妻之间可能出现的多重关系。 3. 创新或个性化的服务:难以提供客户的综合性需求来提供个性化的法律服务,因为大模型是基于预设的数据和规则,不能及时采集到客户所有的即时信息,很难超出语料的内容生成创新且专业的答案,因此很难针对性地为客户提供专业服务,哪怕是基于同样的事由或案件。 律师擅长的方面: 1. 法律专业知识:具备深厚的法律知识,能够提供专业的法律分析和建议,如在证券欺诈案件中的专业分析。 2. 沟通与谈判:在沟通和谈判中能够与客户方、相对方、其他机构建立信任、表达观点、促成交易等。 3. 创造性解决问题:能够针对新兴行业或监管空白提出合规建议,如为新技术制定合法性指导。 4. 危机应对:作为专业人士,恰恰需要具备能够在紧急情况下能做出专业判断,提供及时的法律建议和解决方案。 律师不擅长的方面: 1. 处理大量信息和数据:在需要处理大量文本和数据的情况下,律师人工的效率非常有限,如大量文件调查中的数据提取和整理。 2. 处理细节:可能难以记住各类案件中的所有事实和细节,如:时间,人物,金额,关系,尤其是在复杂案件中。 3. 精力与情绪:在处理复杂案件时,律师可能会面临情绪、精力、时间等带来的压力,从而影响专业判断。 在法规研究与解读方面,法规检索最好是使用法律行业垂类的 AI 产品,通用型 AI 可能存在查不出来、数据不全或生成式内容不能满足需求的情况。例如: 1. Prompt 指令词:根据最新修订的《数据安全法》,解析企业在处理个人信息时应遵循的主要原则,并给出具体操作建议。 2. 预计效果:AI 助手将依据《数据安全法》的最新条款,解析企业处理个人信息所必须遵循的原则,并结合实践情况提出详细的操作指南或合规建议。 在法律意见书撰写或非诉交易文件材料方面: 1. Prompt 指令词:针对我方当事人涉及的版权纠纷案,输入【已有的证据材料】+【相关法律条文】,撰写一份初步法律意见书,论证我方主张的合理性和胜诉的可能性。 2. 预计效果:AI 将根据提供的案件背景、证据材料以及适用的法律法规,自动撰写一份初步的法律意见书,其中包含对案件事实的梳理、法律分析和结论部分。 总之,律师和 AI 的协同并非简单相加,而是一种借助互相优势、相互加持的关系。律师在运用大模型这一强大工具时,最关键的任务是:如何根据不同的法律业务场景,精准地提出问题、指令(Prompt),以引导 AI 发挥其最大的效用。
2024-12-07
为什么不愿意用AI
以下是一些关于人们不愿意使用 AI 的原因: 从“他山之石|如何防止 AI 取代人类思考一切?”的原文中可知,手绘图有助于建立将信息从短期记忆转移到长期记忆所需的突触连接,不使用 AI 做笔记能让人成为更好的概念思考者。研究表明,学生手写笔记比打字能保留更多信息,在科学中手绘所见能让学生成为更好的观察者。在学习新技能时,应先依靠人类自身元素,不应一开始就使用 AI。 另外,有人认为如果一开始就将 AI 作为默认方式,可能会逐渐失去自己的声音,因为享受通过自己写作来梳理思路。
2024-12-07
2024年最权威的人工智能行业报告
以下是 2024 年人工智能行业报告的相关内容: 在 2024 年,国内外 AI 企业的竞争达到白热化阶段。 国外方面: Google DeepMind 和 OpenAI 展示了强大的文本到视频扩散模型预览,但访问受限且技术细节披露不多。 Meta 更进一步,将音频加入其中,Movie Gen 核心包含 30 亿视频生成和 13 亿音频生成模型,能分别以每秒 16 帧的速度生成 16 秒的视频和每秒 45 秒的速度生成音频片段。 Llama 3.1 是迄今为止最大版本,在推理、数学、多语言和长上下文任务中能与 GPT4 相抗衡,标志着开放模型缩小与专有前沿的差距。 OpenAI 草莓落地,加倍扩大推理计算规模,通过将计算从预训练和后训练转移到推理,以链式思维方式逐步处理复杂提示,采用强化学习优化,在需要大量推理的基准测试中取得显著改进,但成本较高。 Meta 推出 Llama 3 家族,包括 3.1 和 3.2 版本,使用大量令牌训练,在规模上不断突破。 国内方面: 国内涌现出类似可灵、即梦、智谱清影等一系列 AI 生成视频工具,生成结果甚至远超国外。 由 DeepSeek、零一万物、知谱 AI 和阿里巴巴开发的模型在 LMSYS 排行榜上取得优异成绩,尤其在数学和编程方面表现出色。中国模型各有优势,如 DeepSeek 在推理过程中通过多头隐式注意力减少内存需求并改进 MoE 架构,零一万物更加关注数据集的建设。中国模型更能优先考虑计算效率,以弥补 GPU 访问的限制,并学会更有效地利用资源。 需要注意的是,报告中对中国的 AI 生成图、生成视频的工具未展开详细说明,但这并不代表中国有关该功能的 AI 工具落后于国外。
2024-12-07
AGI是什么
AGI 即通用人工智能(Artificial General Intelligence),是指能够像人类一样思考、学习和执行多种任务的人工智能系统。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 在 AI 的分类中,AGI 与 ANI(弱人工智能)相对,ANI 只可做一件事,如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等,而 AGI 能做任何人类可以做的事。
2024-12-07
提示词
提示词相关知识如下: 1. 什么是提示词: 用于描绘您想生成的画面。 输入语言方面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),支持中英文输入。 启用提示词优化后,能帮您扩展提示词,更生动地描述画面内容。 2. 如何写好提示词: 小白用户可以点击提示词上方官方预设词组进行生图。 提示词内容要准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词,点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可以帮助 AI 理解我们不想生成的内容,比如:不好的质量、低像素、模糊、水印。 利用“加权重”功能,让 AI 明白重点内容,可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先,也可对已有的提示词权重进行编辑。 辅助功能包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 3. 提示词要素: 提示词可以包含指令(想要模型执行的特定任务或指令)、上下文(包含外部信息或额外的上下文信息,引导语言模型更好地响应)、输入数据(用户输入的内容或问题)、输出指示(指定输出的类型或格式)。 4. 提示工程与提示词的区别: 提示工程是人工智能领域中,特别是在自然语言处理和大型语言模型的上下文中一个相对较新的概念,涉及设计和优化输入提示,以引导 AI 模型生成特定类型的输出或执行特定的任务。其关键点包括精确性、创造性、迭代、上下文理解。 提示词通常指直接输入到 AI 模型中的问题、请求或指示,是提示工程的一部分。提示工程不仅包括创建提示词,还涉及理解模型的行为、优化提示以获得更好的性能、以及创造性地探索模型的潜在应用。提示工程的目标是最大化 AI 模型的效用和性能,提示词是实现这一目标的手段之一。在实际应用中,提示工程可能包括对 AI 模型的深入分析、用户研究、以及对特定任务的定制化提示设计。
2024-12-07