直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
学习ai的名词
以下是关于 AI 相关名词的解释: AGI:通用人工智能,指具备与人类同等智能水平和能力的人工智能。 AIGC:利用人工智能技术生成的内容。 Agent:智能体,能够自主感知、决策和行动的实体。 Prompt:提示词,用于引导 AI 生成特定的输出。 此外,还有以下相关名词和概念: 人工智能(AI):使计算机模拟人类智能的技术。 机器学习:电脑通过找规律进行学习,包括监督学习、无监督学习、强化学习。 监督学习:使用有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归。 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务包括聚类。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训小狗。 深度学习:一种参照人脑的方法,具有神经网络和神经元,因层数多被称为深度。神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI:能够生成文本、图片、音频、视频等内容形式。 LLM:大语言模型。对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类。 建议您通过与 AI 对话或李继刚老师的课程来深入理解这些名词。
2024-12-09
如何构建自己业务系统的AI Agent
构建自己业务系统的 AI Agent 可以参考以下内容: AI Agent 简介:AI Agent 也称为 AI 智能体,是拥有各项能力来帮助我们做特定事情的“打工人”。它包含自己的知识库、工作流,还能调用外部工具,并结合大模型的自然语言理解能力完成复杂工作。其出现是为了解决如胡编乱造、时效性、无法满足个性化需求等问题,以结合业务场景和需求解决自身问题。 扣子 Coze:字节跳动旗下的新一代一站式 AI Bot 开发平台,无论是否具备编程基础,都能在该平台上迅速构建基于 AI 模型的各类问答 Bot,开发完成后还可发布到各种社交平台和通讯软件上。 构建步骤:通过简单 3 步创建智能体,首先起一个智能体的名称,然后写一段智能体的简单介绍,最后使用 AI 创建一个头像。 工作流相关:构建稳定可用的 AI Agent 是不断调试和迭代的过程。通常从当前性能最强的 LLM 着手,先用单条 Prompt 或 Prompt Chain 测试任务执行质量和稳定性,再根据实际情况和最终使用的 LLM 逐步拆解子任务。一般对于场景多样、结构复杂、对输出格式要求严格的内容,基本可预见到需要拆解为工作流。此外,若涉及生成多媒体内容或从网络自主获取额外信息等能力,必然需要通过工作流调用相应插件。 关于只用一段 Prompt 的 Agent:也算 AI Agent,详见
2024-12-09
AI Agent 落地业务应用
以下是关于 AI Agent 落地业务应用的相关内容: 影刀 RPA + AI Power 功能亮点:大模型存在限制,AI Power 集成丰富组件拓展能力边界,打造 AI Agent,如搜索引擎组件获取实时信息,RPA 组件实现自动化操作。 无缝多样的使用方式:提供网页分享、对话助理、API 集成等嵌入方式,方便企业在不同业务场景灵活选择接入方式,实现内部员工、外部客户与 AI 便捷交互。 贴身的企业级服务支持:提供教学培训、技术答疑、场景共创等贴身服务,帮助企业把产品用起来,把 AI 落地下去。 智谱 AutoGLM 深度体验:经过深度测试,展现出落地希望。解决了 API 对接难等问题,借助 RPA 思路实现跨应用控制。场景理解能力出色,能准确选择应用场景,但存在语音识别偏差等问题。 产品思路:选择高频场景深耕细作,证明产品价值,未来发展空间大,可能改变与手机交互方式。 学习路径 结合“一人公司”愿景,需要大量智能体,未来的 AI 数字员工以大语言模型为大脑串联工具。 Agent 工程(基础版):如同传统软件工程学,有迭代范式,包括梳理流程、任务工具化、建立规划、迭代优化,造就能应对实际场景的 Agent。 数字员工“进化论”:需要在固化流程和让 AI 自主思考之间作出妥协和平衡。
2024-12-09
LLM 和 AI Agent的区别
LLM(大型语言模型)和 AI Agent(人工智能智能体)存在以下区别: LLM 主要侧重于语言的理解和生成,具有强大的语言处理能力。它们在大规模语料库上进行预训练,能够通过少量样本展现出泛化能力。然而,其缺点是计算资源消耗大,可能存在偏见和误解。 AI Agent 则为人工智能应用程序提供了全新的功能,包括解决复杂问题、对外界采取行动以及在部署后从经验中学习。它们通过高级推理/规划、工具使用、记忆/递归/自我反思的组合来实现这些功能。AI Agent 能够进行令人难以置信的演示,但目前大多数框架仍处于概念验证阶段,还不能可靠、可重现地完成任务。 基于 LLM 的 AI Agent 以 LLM 置于“大脑”或“控制器”的核心位置,赋予强大的语言理解和生成能力。为扩展感知和行动范围,采用多模态感知技术和工具利用策略,能理解和响应多种类型输入,并与环境有效互动。通过思维链和问题分解技术展现出推理和规划能力,还能从反馈中学习并执行新行动,表现出类似反应式 Agent 的特性。其已在软件开发、科学研究等现实场景中应用,能利用自然语言理解和生成能力与其他 Agent 交流协作。特点是基于大规模神经网络,特别是 Transformer 架构,技术上有 Llama、GPT 等预训练大型语言模型,优点是强大的语言理解、生成和对话能力,缺点是计算资源消耗大,可能存在偏见和误解。
2024-12-09
将活动主题拆解为大量结构化提示词,用于文生视频
以下是将活动主题拆解为大量结构化提示词用于文生视频的相关内容: 技巧 1:提示词的结构 当提示词有清晰的结构时,提示效果最有效。可使用简单公式:。 例如:无结构提示词“小男孩喝咖啡”,有结构的提示词“摄影机平移(镜头移动),一个小男孩坐在公园的长椅上(主体描述),手里拿着一杯热气腾腾的咖啡(主体动作)。他穿着一件蓝色的衬衫,看起来很愉快(主体细节描述),背景是绿树成荫的公园,阳光透过树叶洒在男孩身上(所处环境描述)”。 技巧 2:提示词的优化 有三个原则: 1. 强调关键信息:在提示的不同部分重复或强化关键词有助于提高输出的一致性。 2. 聚焦出现内容:尽量让提示集中在场景中应该出现的内容上。 3. 规避负面效果:在提示词中写明不需要的效果。 写提示词时,首先要明确场景中的人物和冲突,其次是对场景进行详细描述,包括地点、人物形象、任务动作等细节,使用生动的动词营造动态和戏剧化氛围,第三要加强镜头语言,如推、拉、摇、移、升、降等,每种镜头运动都有其特定作用和效果。 PixelDance V1.4 提示词指南 图生视频的基础提示词结构为:主体+运动。当主体有突出特征时可加上,需基于输入图片内容写,明确写出主体及想做的动作或运镜,提示词不要与图片内容/基础参数存在事实矛盾。
2024-12-09
AI写小说
以下是关于 AI 写小说的相关内容: 1. Stuart 分享的用 coze 写起点爆款小说《夜无疆》的工作流: 工作流效果:虽未达到起点小说家水平,但至少达到高中生中写得不错的水平,从通常的 AI 写作水平到这个级别是质的飞跃,其中思路值得学习。 工作流步骤: 用 bing 搜索标题相关内容。 用程序将搜索结果结构化(不熟悉程序可忽略或复制文中代码)。 用大模型草拟大纲,包括标题、主旨、世界观、主要角色、小说背景、情节概要。 再用大模型写文章。 输出文章内容。 2. AI 与即兴戏剧工作坊结合的形式: 现场用肢体语言摆出姿势,用 AI 绘画画出,最后表演出一个即兴剧。 使用工具:写短篇小说可用 midreal.ai 以“即兴喜剧”开头,AI 绘画可用 GPT4、悠船、midjourney,Canva 做电影格式模板用于编辑。 3. 南瓜博士在人机协作小说创作中的体验: 尝试过多种方法,包括写 agent flow 框架让 AI 自动写作和评判,但因无法认同 AI 审美而放弃。 选择在 GPT 页面上对话,先让 AI 生成大量创意,自己进行判断挑选,写作过程中自己掌舵,最后给出改进意见让 AI 遵循修改,认为在小说创作中人有人的用处。
2024-12-09
怎么最大限度使用chatgpt
以下是关于如何最大限度使用 ChatGPT 的一些方法和建议: 1. 产品经理使用方法: 需求及现状问题输入:在完成原 SQL 输入后,将真实的业务需求场景及现存问题输入给 ChatGPT,通过多轮输入输出的讨论,强化其对真实需求的认知。 根据优化结果不断调试:输入旧代码、需求和问题后,根据 ChatGPT 给出的新代码不断调试和优化,直至生成满足需求的新代码。例如,按照原 SQL 思路更新数据时存在资源浪费,通过与 ChatGPT 沟通得到优化建议,包括每次更新 1 天数据、创建中间结果表存储非二次计算数据、利用 CASE WHEN 合并查询约束条件基本相同的指标等。 2. 学习相关技巧: Prompt 有效并非因其理解想法:ChatGPT 只是预测下一个 Token,目前主要专注于文本输出,尚未具备与外部系统直接交互的能力,应用范围存在限制。 让效果更好的方法:使用搜索引擎时,通过精确描述问题可获得更高质量答案。激活更多神经元能增加获得高质量答案的可能性。 3. 写好提示词的技巧: 放开思路,激发更多想法。 采用 PUA 方式,如在回答后换话术继续引导,可适当鼓励但也要提出更高要求。考验创造力,未来想象很重要。
2024-12-09
大模型学习路径
以下是大模型的学习路径: 1. 大模型入门: 通俗来讲,大模型输入大量语料,让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。 可以用“上学参加工作”来类比大模型的训练和使用过程: 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练。 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。 找老师:用合适算法让大模型更好理解 Token 之间的关系。 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称为推导(infer)。 Token 是原始文本数据与大模型可使用的数字表示之间的桥梁,输入分词时会数字化形成词汇表。 2. 系统学习 LLM 开发: 掌握深度学习和自然语言处理基础:包括机器学习、深度学习、神经网络等基础理论,以及自然语言处理基础,如词向量、序列模型、注意力机制等。相关课程有吴恩达的深度学习课程、斯坦福 cs224n 等。 理解 Transformer 和 BERT 等模型原理:包括 Transformer 模型架构及自注意力机制原理,BERT 的预训练和微调方法。掌握相关论文,如 Attention is All You Need、BERT 论文等。 学习 LLM 模型训练和微调:包括大规模文本语料预处理,LLM 预训练框架,如 PyTorch、TensorFlow 等,微调 LLM 模型进行特定任务迁移。相关资源有 HuggingFace 课程、论文及开源仓库等。 LLM 模型优化和部署:包括模型压缩、蒸馏、并行等优化技术,模型评估和可解释性,模型服务化、在线推理、多语言支持等。相关资源有 ONNX、TVM、BentoML 等开源工具。 LLM 工程实践和案例学习:结合行业场景进行个性化的 LLM 训练,分析和优化具体 LLM 工程案例,研究 LLM 新模型、新方法的最新进展。 持续跟踪前沿发展动态:关注顶会最新论文、技术博客等资源。
2024-12-09
cloude 怎么用
Claude 的使用方法如下: 要求 Claude 进行重写:在使用 Claude 表格时,您可以构建您的表格,使每一行包含一组不同的指令,以替换{{INSTRUCTIONS}}占位符,这样可以同时生成多种类型的重写。 体验 Claude 电脑操控功能(以 Windows 系统为例): 一共需要三步: 安装 Python 环境: 点击电脑“系统”,直接输入“cmd”,点击回车,打开命令窗口。 在命令窗口中,粘贴入以下代码,确认是否有 python。 粘贴入以下代码,确认是否有 pip。 两步命令输入完,核对一下。如果有的话,会如上图一样,分别显示出版本号。那么可以跳过“安装环境这一步,直接到“二、部署项目”。如果没有的话,需要安装,可去 python 官网下载,或者公众号回复“Python”获取安装包。 安装 Docker Desktop: 复制链接去下载,根据您的系统进行选择。我是 Windows 系统。https://docs.docker.com/desktop/install/windowsinstall/ 下载后,双击下载项目,出现下图,点击 ok,开始加载文件。 点击“close and restart”重启电脑。 重启后,点击:“Accept”。 选择第二个即可,点击"Finish"。 然后会进入 Docker Desktop。此处完成。 最后体验时需要使用 Claude API,如果没有 API 的小伙伴,可以在公众号文末留言,抽三个小伙伴把我充值的 API 送给大家体验使用,里边一共 20 刀额度。用完即止。 22 日晚,Claude 3.5 迎来了重大的更新,其中最重磅的当属“Computer Use”操控电脑的能力,官方发布了几个演示视频,令人十分震撼,各大媒体争相报道。然而此功能只针对开发者在 API 中开放使用。
2024-12-09
大纲生成
利用 AI 生成课题大纲的步骤和建议如下: 1. 确定课题主题:明确研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具搜集相关研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的大纲。 5. 撰写文献综述:借助 AI 工具确保内容准确完整。 6. 构建方法论:根据研究需求,采用 AI 建议的方法和技术设计研究方法。 7. 数据分析:若课题涉及数据,使用 AI 数据分析工具处理和解释。 8. 撰写和编辑:利用 AI 写作工具撰写各部分,并检查语法和风格。 9. 生成参考文献:使用 AI 文献管理工具生成正确格式。 10. 审阅和修改:借助 AI 审阅工具检查逻辑性和一致性,并根据反馈修改。 11. 提交前的检查:使用 AI 抄袭检测工具确保原创性,进行最后的格式调整。 需要注意的是,AI 工具只是辅助,不能完全替代研究者的专业判断和创造性思维,应保持批判性思维,确保研究质量和学术诚信。 在文章写作中,大纲编写是关键步骤,尤其是对于中长篇文章创作者。这个过程需要多次迭代和深思熟虑,将想法、创意和思路进行系统整理,是反复推敲和不断优化的过程。 采用多 Agent 模式较为合适,不同 Agent 可扮演不同角色,如负责资料搜集、创意构思、逻辑梳理等,协作带来更丰富视角和更深入思考。 大纲写作的流程规划:从捕捉初步想法(背景增强阶段,收集整合主题相关信息知识),到大纲生成(将背景信息转化为大纲草案,包括识别主要论点、安排结构、确定关键内容),生成后进行整合输出,若需修订则继续循环迭代,直至满意。
2024-12-09