直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
AI产品经理教程
以下是为您提供的 AI 产品经理教程: 一、AI 市场与 AI 产品经理分析 个人对 AI 产品经理做了以下划分,仅供娱乐和参考: 1. 入门级 能通过 WaytoAGI 等开源网站或一些课程了解 AI 的概念,使用 AI 产品并尝试动手实践应用搭建。对应的画像可能是喜欢听小宇宙 APP 的播客或浏览 AI 相关的文章。 以前互联网刚兴起的时候,部分用谷歌的人会比用百度的有优越感,现在可能用 AI 搜索的更有优越感。 2. 研究级 有两个路径,一个是技术研究路径,一个是商业化研究路径;对应传统互联网偏功能实现的产品经理和偏商业运营的产品经理,当然最好是同一个人,产品运营不分家。 这个阶段对应的画像可能是对某一领域有认知,可以根据需求场景选择解决方案,或利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用 这一阶段的画像就是有一些成功落地应用的案例,如产生商业化价值。 对应传统互联网 PM 也有三个层级: 负责功能模块与执行细节。 负责整体系统与产品架构。 熟悉行业竞争格局与商业运营策略。 总结来说,对 AI 产品经理要求懂得技术框架,不一定要了解技术细节,而是对技术边界有认知,最好能知道一些优化手段和新技术的发展。AI 是工具和手段,产品经理要关注的还是场景、痛点、价值。 二、超越贪吃蛇——技术纯小白如何用 AI 开发真正的应用 1. 基础小任务 推荐从一个最最基础的小任务开始,让 AI 先帮您按照 best practice 写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑。这样,您可以通过最基础的绝对不会出错的小任务,来学会必备的调试技能。 您可以这样要求 AI:“我在学习写 chrome 插件。请选择最适合小白上手的技术栈,按照 best practice 为我生成一个简单的示范项目,但要包含尽可能全面的典型文件和功能。请为我讲解每个文件的作用和程序运行的逻辑。” 此处要求 AI 按照 best practice 来写非常重要:文件一开始就有良好的组织,后续功能复杂了才不会乱套。 还有一个偷懒小妙招:如果您用的是 o1mini,您可以在 prompt 最后添加这句:“请生成 create.sh 脚本,运行脚本就能直接创建插件所需要的所有文件。请教我如何运行脚本。”(如果 windows 机器则是 create.cmd)足够勤勉的 o1mini 会为您生成一段超级长的代码,并给出提示,您只需要复制粘贴并执行,一次性生成十多个目录和文件,超方便。 2. 明确项目需求 您可以通过和 AI 的对话,来逐步明确项目需求。(如果您是训练有素的产品经理,可以忽略这一步) 您可以这样要求 AI:“我想要开发一个 XXX。你能否像一个高级别的还懂技术的产品经理指导初级产品经理那样,向我提问,帮我梳理清产品功能,尤其要注意可能会涉及到技术方案选择的关键点。请一问一答,帮我由全局到细节逐步梳理。不要一口气问我太多问题。” 来来回回的对话后,您可以让 AI 帮助您梳理出产品需求文档。这样的文档会包含影响技术方案选择的细节,比直接给 AI 一段口头的需求描述要准确得多。在后续开发的时候每次新起一个聊天就把文档发给 AI 并告知您现在在做第几点功能,会非常方便。 三、2024 年历史更新(归档) 1. 2024 年 7 月 22 日 《》今日是二十四节气的大暑,SD 的教程奉上。 《》Agent 共学活动新一期“谁是人类”全新开启!本次活动获得了阿里云☁️百炼和通义千问大模型的大力支持,为大家准备了丰厚的比赛奖品,不过切记:“奖品不是目的,目的是共同学习,享受学习过程带来的成长。”本次活动是一个基于通义千问模型的 Bot 拟人化竞赛,通过多轮问答和投票,旨在识别最模仿人类交流最像人类的 Bot。 《》,作者 ElliotBai,本文探讨了 AI Agent 产品经理在工具(Tools)方面的经验。尽管大模型不断进化,接口依然是基础。通过 AI 模型,可以将非结构化数据转化为结构化信息,实现自动化。引入 Function Calling 和 Tools 后,开发流程变得更高效、维护成本降低。推荐放弃不稳定的 JSON 模式,减少系统提示依赖,增强 API 响应提示,以及提供选项而非填空,以提升 Agent 的可控性和准确性。
2025-02-24
AI产品经理
以下是为您整合的关于 AI 产品经理的相关信息: 北京分队中有 Kelton 是一位 AI 产品经理,深耕 NLP 方向 2 年,作为 Owner 从 0 1 打造过两款 AIGC 产品,也完成过 LLM 评测体系的从零搭建,技术出身,还曾在云计算、元宇宙领域工作 2 年,坐标海淀(北四环)。 银海是一位 AI 产品经理,是通往 AGI 之路社区共建者,5 + 大模型厂商资深讲师,全网粉丝量 3W + ,在 AI Agent、多模态大模型、企业级 AI 应用等多领域具备丰富实战经验。 特看科技正在招聘 AI 产品经理,岗位要求:负责 AI 视频工具方向产品工作,对生成式 AI 产品有一定研究,熟悉 Transformer 和 Diffusion 模型的优先;英文好,有海外产品经验优先,有内容工具或 SaaS 产品经验优先;2 年以上产品岗位经验,职级根据经验能力制定,对标阿里 P6 P8 区间。该公司专注于 AI 视频和直播应用,在国内和海外市场服务众多头部品牌。能提供确定性的商业化应用场景、初创公司充沛的早期期权池、强大的工程师团队等。有电子商务、企业服务、人工智能、海外产品等行业经验为加分项。欢迎推荐或自荐简历至 qingshen@tabcut.com,或飞书与清慎联系。
2025-02-24
古诗词AI
以下是关于古诗词 AI 的相关内容: 在即梦 AI 视频生成中,对于古诗词的输入,应避免直接使用,而将其转化为更具体、详细的描述,例如“举头望明月”可编写为“一位中国古代的男人抬头看着天空中的月亮”/“An ancient Chinese man is raising his head towards the moon”。同时要注意避免输入超长脚本、抽象描述等。 在游戏《逆水寒》中,有 AI 作宋词的设定,在游戏中超过 40 个热门景点设置了 AI 作词打卡点。但文字生成在游戏中的作用更多是丰富体验,对情节发展影响不大。 关于让 Claude 帮做“古诗词卡片”,整个流程较为简单,输入 Prompt 后,用户再输入主题、风格,AI 就会输出结果。提示词已开源,获取方式多样。
2025-02-24
有没有一个人工智能工具,可以针对某个网站的更新内容进行分析
以下是为您找到的一些可能针对网站更新内容进行分析的人工智能工具: 1. NotebookLM:可以综合不同材料生成笔记,但存在交互设计不够清晰的问题。 2. Excel 中的 Copilot:能帮助写复杂公式、创建可视化图表及书写 Python 代码完成复杂任务。 3. Loop:可以生成对应内容的表格和其他 Office 软件链接。 4. Stream 中的 Copilot:能够帮助理解视频内容,询问并跳转到对应时间点。 5. Bard:推出了英语版 Bard Extensions,可从 Google 工具中查找并显示相关信息,还能使用“Google it”按钮核实答案,分享聊天时可继续对话并询问。 6. PaLM 2 模型:根据用户反馈应用强化学习技术训练,更加直观和富有想象力。 7. Youtube 的 AI 工具:包括 Dream Screen 可添加背景、YouTube Create 编辑手机视频、AI Insights 获取创意和大纲建议、Aloud 自动配音、创作者音乐中的辅助搜索找到配乐。 8. Dzine:更新了 Insert Character 能力,可快速替换画面角色。 9. 谷歌 IOS 中 Google Lens:在手机 Chrome 浏览器中可更快视觉搜索,还将 AI Overviews 广泛集成到搜索结果中。
2025-02-24
AI编程大模型排行榜
以下是一些关于 AI 编程大模型的相关信息: 1. ShowMeAI 周刊 No.13 中提到的相关内容: Learn About:继 NotebookLM 之后又一个 AI Native 产品,谷歌真正的 AI Native Education 尝试。 ima.copilot V.S. 秘塔 V.S. 天工:国区 Perplexity 青出于蓝而胜于蓝,秘塔一骑绝尘。 Markdown:技术圈(最)常用的文本编辑语言,一种「四通八达」的中转格式,并附上好用的转换工具。 把 17 岁高中生涂津豪的 Thinking Claude 提示词,设置在 Cursor 里。 两篇优秀的 AI 编程教程:跟着资深工程师&全栈开发者,挖掘 LLM 编程能力的极限。 恭喜阶跃星辰!step2 在 LiveBench 榜单杀进前 5,斩获国产大模型第 1 名,并顺带聊聊榜单和测评的「内幕」。 举个栗子:当把大模型「开源」用「做饭吃饭」来解释,一起都豁然开朗起来,甚至还玩起了谐音梗。 很有共鸣:为什么大部分人用不起来 AI?可能还没体验到效率飞升的 Aha Moment。 集体讨论:大家都是怎么快速处理长视频、长音频、长文本材料的?都有哪些工作流和工具的配合应用? 2. Trae:字节开发的一款和 AI 深度集成的 AI 编程工具,可让用户限时免费无限量使用地球上最强大的编程大模型 Claude Sonnet,全自动化进行 AI 编程。包含完整的 IDE 功能,如代码编写、项目管理、插件管理、源代码管理等,提供智能问答、实时代码建议、代码片段生成、从 0 到 1 开发项目。 3. 8 月正式上线的国内大模型: 北京的五家企业机构:百度(文心一言)https://wenxin.baidu.com ;抖音(云雀大模型)https://www.doubao.com ;智谱 AI(GLM 大模型)https://chatglm.cn ;中科院(紫东太初大模型)https://xihe.mindspore.cn ;百川智能(百川大模型)https://www.baichuanai.com/ 。 上海的三家企业机构:商汤(日日新大模型)https://www.sensetime.com/ ;MiniMax(ABAB 大模型)https://api.minimax.chat ;上海人工智能实验室(书生通用大模型)https://internai.org.cn 。 能生成 Markdown 格式的:智谱清言、商量 Sensechat、MiniMax 。 目前不能进行自然语言交流的:昇思(可以对文本进行是否由 AI 生成的检测,类似论文查重,准确度不错)、书生 。 受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值) 。 特色功能:昇思——生图,MiniMax——语音合成 。 阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。
2025-02-24
增强检索生成
RAG(RetrievalAugmented Generation,检索增强生成)是一种结合检索和生成能力的自然语言处理架构,旨在为大语言模型(LLM)提供额外的、来自外部知识源的信息。 通用语言模型通过微调可完成常见任务,而对于更复杂和知识密集型任务,基于语言模型构建访问外部知识源的系统能使结果更符合事实、更可靠,缓解“幻觉”问题。Meta AI 的研究人员引入了 RAG 方法来完成这类任务,它把信息检索组件和文本生成模型结合在一起,可微调且内部知识修改高效,无需重新训练整个模型。 RAG 工作流程如下: 1. 检索:利用用户查询从外部知识源获取相关信息,将查询转化为向量与向量数据库比对,找到最匹配的前 k 个数据作为补充背景信息。 2. 数据库索引:包括离线获取数据、清理提取原始数据、转换文件格式、分块、嵌入和创建索引等步骤。 3. 增强:将用户查询和检索到的额外信息嵌入预设提示模板。 4. 生成:将问题与相关文档合并为新提示信息,由大语言模型回答问题,可选择依赖知识库或仅基于给定信息,也可融入历史对话信息支持多轮对话。 LLM 需要 RAG 的原因在于 LLM 存在一些缺点: 1. 无法记住所有知识,尤其是长尾知识,接受能力不高。 2. 知识容易过时且不好更新,微调效果不佳且有丢失原有知识的风险。 3. 输出难以解释和验证,易受幻觉等问题干扰。 4. 容易泄露隐私训练数据。 5. 规模大,训练和运行成本高。 RAG 具有以下优点: 1. 数据库对数据的存储和更新稳定,无学习风险。 2. 数据库数据更新敏捷,可解释且不影响原有知识。 3. 数据库内容明确结构化,降低大模型输出出错可能。 4. 便于管控用户隐私数据,可控、稳定、准确。 5. 降低大模型训练成本,新知识存储在数据库无需频繁更新模型。
2025-02-24
claude使用手册
以下是关于 Claude 使用手册的相关内容: Anthropic 公司在 AI 领域表现出色,其最新最强的 Claude 3.5sonnet 的内置提示词公开在用户手册中,还会在 X 上主动通知有新内容可学。Claude 用户手册包含整整 10 个章节的“提示工程”指南,堪称赛博菩萨。它不仅单独维护了提示库,归纳了商业、个人任务场景中的高可用提示词,还从提示工程的 CoT 方法论,到提示库,再到直接做了个提示生成器,手把手接引、度化全球提示词爱好者。甚至作为一家不向大陆提供服务的公司,Anthropic 还准备了用户手册的汉化版本。 为方便您学习,以下是相关直达链接: Claude 用户手册 提示工程指南:https://docs.anthropic.com/en/docs/buildwithclaude/promptengineering/overview Claude 提示库:https://docs.anthropic.com/en/promptlibrary/library Claude 官方提示词生成器:https://console.anthropic.com/dashboard 此外,在使用 Claude 表格时,您可以构建表格,使每一行包含不同指令以替换{{INSTRUCTIONS}}占位符,从而同时生成多种类型的重写。 如果觉得不错,不妨随手点个赞、在看、转发三连,这将对作者有很大帮助。谢谢阅读!
2025-02-24
RAG
RAG(RetrievalAugmented Generation,检索增强生成)是一种结合检索和生成能力的自然语言处理架构。 通用语言模型通过微调可完成常见任务,而更复杂和知识密集型任务可基于语言模型构建系统,访问外部知识源来实现。Meta AI 研究人员引入 RAG 来完成这类任务,它将信息检索组件和文本生成模型结合,可微调且内部知识修改高效,无需重新训练整个模型。 RAG 接受输入后会检索相关支撑文档并给出来源,与原始提示词组合后送给文本生成器得到最终输出,能适应事实随时间变化的情况,让语言模型获取最新信息并生成可靠输出。 LLM 存在一些缺点,如无法记住所有知识尤其是长尾知识、知识容易过时且不好更新、输出难以解释和验证、容易泄露隐私训练数据、规模大导致训练和运行成本高。而 RAG 具有数据库存储和更新稳定、数据更新敏捷且可解释、降低大模型输出出错可能、便于管控用户隐私数据、降低大模型训练成本等优点。 在 RAG 系统开发中存在 12 大痛点及相应的解决方案。
2025-02-24
deepseek提示词
以下是关于 deepseek 提示词的相关内容: 1. 生成小红书爆款单词视频: 开始时输入单词主题、图片风格、单词数量。 选择 deepseekr1 模型生成单词数组,以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。 提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且以特定数组形式呈现。 2. Deepseek 时代提示词的关键诉求: 观察发现完整的提示词可能不如片段有效,甚至可能干扰模型思考流程,过长提示会带来 Token 浪费和上下文污染。 在 deepseek 时代,用户只需在关键点进行引导,让模型自主发挥,“关键诉求直通车”模式是新一代 LLM 的正确打开方式。 新旧提示法对比:传统方法像唠叨家长,费力不讨好,新型技巧像对聪明助理打暗号,精准狙击。 3. 让 DeepSeek 生成相机运动轨迹的提示词: 以往的提示词是场景、构图、尺寸、位置、形态、半身全身、环境的组合。 现在把这些提示词喂给 DeepSeek,要求以“相机运动轨迹”的方式描写,可得到新提示词,如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”。 对空间理解和对语义的遵循能让有光影变化的泳池自然生成,海螺 AI 甚至能给主角穿上与场景匹配的拖鞋。
2025-02-24
提示词如何设计
提示词的设计需要遵循以下要点和准则: 明确描述想要的内容:模型能完成多种任务,所以要清晰展示需求,而非简单告知。 遵循三个基本准则: 展示和告知:通过说明、示例或两者结合表明需求。如让模型排序或分类,要展示示例。 提供高质量数据:构建分类器或遵循某种模式时,确保有足够且正确的示例。 检查设置:温度和 top_p 控制模型生成响应的确定性,根据需求设置合适的值。 故障排除:若 API 未达预期,检查是否清楚预期结果、提供足够示例、示例有无错误、是否正确使用温度和 top_p。 让代理明确任务以提高表现:采用合理结构并清晰指令,如为不同代理设置不同指令结构,包括角色预设、回复要求、提供示例和所需掌握的知识等。 通用流程: 数据准备:收集高质量案例数据。 模型选择:根据创作目的选合适模型。 提示词设计:结合数据设计初版,注意角色、背景、目标、约束等要点。 测试与迭代:输入提示词测试,与模型交流获取优化建议,修正提示词,重复测试、交流、修正过程,直至满意。 总结提炼:归纳优化经验,形成最佳实践。 应用拓展:将方法论用于其他创意内容设计。 使用他人写好的 prompt 时,要深入揣摩背后思路,理解编写方式的原因和逻辑,关键在于养成充分利用模型、不断迭代、深度交流和思考的习惯。
2025-02-24