Navigate to WaytoAGI Wiki →
Home/All Questions
如何学习AI
以下是新手学习 AI 的方法和建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-26
如果我想让一个agent的回复的观点更鲜明,而非对一连串的侧面做分析,然后给出分散的建议, 如何做到?
要让一个智能体(agent)的回复观点更鲜明,而非分散地分析侧面和给出建议,您可以考虑以下几个方法: 1. 明确任务设定:在与智能体交互之前,清晰准确地定义任务目标和期望的回复形式,强调需要鲜明的观点表达。 2. 优化训练数据:确保用于训练智能体的数据集包含观点鲜明的示例,让智能体学习到这种表达模式。 3. 调整提示词:精心设计提示词,明确要求智能体给出直接、明确且鲜明的观点,避免模糊或宽泛的指令。 4. 引入奖励机制:在训练过程中,对观点鲜明的回复给予更高的奖励,激励智能体朝着这个方向优化。 5. 后处理和筛选:对智能体的初步回复进行后处理,筛选出观点鲜明的部分,或者对不够鲜明的部分进行修改和优化。
2025-01-26
通义AI有哪些产品
通义 AI 的产品包括: 1. 基于通义千问开发的“航天小飞侠”AI 助理模型,可以解答关于航空航天的问题。 2. 通义万相:阿里云旗下产品,上半年有多个现象级案例,9 月刚开放视频生成产品的预约。 网页版访问:https://tongyi.aliyun.com/ 移动端下载:通义 APP 此外,在一些活动中还展示了通义 AI 相关的创新应用,如 AI 调酒等。
2025-01-26
到底有多强大
以下是关于不同 AI 相关内容强大之处的介绍: Sora:当不复制旧的,而是把新的、不可能的想法变成现实时,Sora 最为强大。它能帮助创意人员将想法变为现实,不仅擅长创造看起来真实的东西,创造完全超现实的东西的能力也令人兴奋。 LORA:在画风、人物、物品、动作姿态的固定方面表现强大,其文件承载的信息量远大于 Embedding,在还原真人物品时细节精度更高。使用时需注意搭配相应大模型和特定触发词。 Hypernetworks:主要针对画风训练,可像 LORA 一样加载使用。 Google 的 Gemini:是 Google DeepMind 团队开发的多模态模型,支持多种提示类型,能理解和处理几乎任何输入,结合不同类型信息并生成几乎任何输出,被称为 Google 迄今为止最强大、最全面的模型,是原生多模态大模型,从设计之初就支持多模态,能处理多种形式的数据。
2025-01-26
文字转视频软件
以下是一些文字转视频的软件和相关信息: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 另外,更多的文生视频的网站可以查看: 通过 ChatGPT 生成文案,将这些文案复制到支持 AI 文字转视频的工具内,可实现短视频的自动生成。市面上一些手机剪辑软件也支持文字转视频,如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类工具区别于专业剪辑软件复杂的操作页面,让普罗大众生产视频更轻松上手。 Morphstudio 相关: MorphVideoBot 的 Text to Video 命令:/video MorphBot 的 Image to Video 命令:/animate 参数说明: ar(MorphVideoBot 专用):设置视频的宽高比,如 16:9、4:3、1:1、3:4、9:16 等。 motion:调整视频中运动的强度,值越低运动越轻微,值越高运动越夸张。 camera:控制相机运动,如 Zoom(缩放)、Pan(平移)、Rotate(旋转)、Static(静止)。 fps:设置视频的帧率,默认是每秒 24 帧。 s(MorphVideoBot 专用):设置视频的时长(秒)。 提示:更详细和描述性的提示可能会在生成的视频中产生更好的结果。可以自由尝试不同的设置以达到期望的效果。
2025-01-26
我在写小说,怎么让AI在写作时能很好地根据整体故事情节和上下文进行故事的展开和描写
以下是一些让 AI 在写作小说时能很好地根据整体故事情节和上下文进行故事展开和描写的方法: 1. 创作穿越故事的 Prompt 时,明确以下内容: 标题:“generate:小说的标题” 设置:“generate:小说的情景设置细节,包括时间段、地点和所有相关背景信息” 主角:“generate:小说主角的名字、年龄、职业,以及他们的性格和动机、简要的描述” 反派角色:“generate:小说反派角色的名字、年龄、职业,以及他们的性格和动机、简要的描述” 冲突:“generate:小说故事的主要冲突,包括主角面临的问题和涉及的利害关系” 对话:“generate:以对话的形式描述情节,揭示人物,以此提供一些提示给读者” 主题:“generate:小说中心主题,并说明如何在整个情节、角色和背景中展开” 基调:“generate:整体故事的基调,以及保持背景和人物的一致性和适当性的说明” 节奏:“generate:调节故事节奏以建立和释放紧张气氛,推进情节,创造戏剧效果的说明” 其它:“generate:任何额外的细节或对故事的要求,如特定的字数或题材限制” 根据上面的模板生成为特定题材小说填充内容,并分章节,生成小说的目录。 2. 接下来,让 AI 一段一段进行细节描写。为确保文章前后一致,先让 AI 帮助写故事概要和角色背景介绍,并在其基础上按自己的审美略做修改。 3. 可以让 AI 以表格的形式输出细节描述。这样做有三个好处: 打破 AI 原本的叙事习惯,避免陈词滥调。 按编号做局部调整很容易,指哪改哪,别的内容都能够稳定保持不变。 确保内容都是具体的细节,避免整段输出时缩减导致丢光细节只有笼统介绍。 4. 把生成的表格依次复制粘贴,让 AI 照着写文章,偶尔根据需要给 AI 提供建议。 5. 注意小说大赛的要求,如最后的作品必须是 AI 直接吐出来的,不能有任何改动,不能超过规定字数等。如果需要修改,可能会遇到像 GPT4 记性不好或 Claude 改掉关键情节等问题。
2025-01-26
COZE 是基于什么框架
Coze 基于以下框架构成: 1. 提示词:使用了结构化提示词的框架,通过提示要求大模型根据不同的行为调用不同的工作流。 2. 数据库:能够记录不同用户历史记账记录,工作流里会用到。 3. 工作流:增加记账调用 add_accounting_record 工作流;查询账户余额调用 query_accounting_balance 工作流;删除所有记账记录调用 init_accounting_records 。 此外,还有关于 Coze 的其他信息: Coze 是由字节跳动推出的 AI 聊天机器人和应用程序编辑开发平台,专为开发下一代 AI 聊天机器人而设计。 具有多语言模型支持、插件系统、知识库功能、数据库和记忆能力、工作流设计、多代理模式等特点。 目前对用户完全免费,且易于发布和分享。
2025-01-26
如何搭建一个知识库自动检索的功能
搭建知识库自动检索功能主要包括以下步骤: 1. 文本预处理:去除无关字符、标准化文本(如转换为小写)、分词等,以清洁和准备文本数据。 2. 嵌入表示:将预处理后的文本(词或短语)转换为向量,通常通过使用预训练的嵌入模型如 Word2Vec、GloVe、BERT 等完成。 3. 特征提取:对于整个问题句子,应用进一步的特征提取技术,如句子级别的嵌入,或使用深度学习模型(如 BERT)直接提取整个句子的表示,以捕捉句子的上下文信息。 4. 向量优化:在某些情况下,问题的向量表示可能会根据具体任务进行优化,例如通过调整模型参数来更好地与检索系统的其他部分协同工作。 在知识库检索阶段: 1. 文档向量化:将知识库转化为一个巨大的向量库。在大模型的检索中,依靠问题在空间中的向量位置,去寻找距离这个向量最近的其他词句,然后完成检索。 2. 配置知识库: 上传文件:在百炼控制台的中的非结构化数据页签中点击导入数据,根据引导上传相关文档。 建立索引:进入,根据引导创建新的知识库,并选择上传的文件,其他参数保持默认。选择向量存储类型时,如果希望集中存储、灵活管理多个应用的向量数据,可选择 ADBPG。 引用知识:完成知识库的创建后,返回进入到创建的应用设置界面,打开知识检索增强开关、选择目标知识库,测试验证符合预期后点击发布。Prompt 中会被自动添加一段信息,以便大模型在后续回答时参考检索出来的信息。 此外,因为利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用。在进行本地知识库的搭建实操之前,需要先对 RAG 有大概的了解。RAG 应用可抽象为 5 个过程:文档加载(从多种不同来源加载文档)、文本分割(把 Documents 切分为指定大小的块)、存储(将切分好的文档块进行嵌入转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库)、检索(通过某种检索算法找到与输入问题相似的嵌入片)、Output(把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案)。文本加载器则是将用户提供的文本加载到内存中,便于进行后续的处理。
2025-01-26
imagine prompt
以下是关于图像提示、排列提示和探索提示的相关内容: 图像提示: 将图像添加到提示中,按“/imagine”照常输入,出现提示框后可拖入图片文件或粘贴图片 URL。使用 Midjourney Bot 在私信中上传图像可保护隐私,除非用户有隐身模式,否则图像提示在中途网站上可见。 举例:如阿波罗雕像、复古花图、恩斯特·海克尔的水母等,还包括中途模型版本 4 和 5 的相关示例。同时,将图像裁剪为与最终图像相同的宽高比可获得最佳效果。 排列提示: 排列提示允许您使用单个命令快速生成提示的变体。不同订阅者可创建的作业数量不同,基本订阅者最多 4 个,标准订阅者最多 10 个,Pro 和 Mega 订阅者最多 40 个。 您可以使用排列提示创建涉及中途提示任何部分的组合和排列,包括文本、图像提示、参数或提示权重。排列提示仅在使用快速模式时可用。将选项列表放在大括号{}内以快速创建和处理多个提示变体,例如“/imagine prompt a{red,green,yellow}bird”会创建并处理三个作业。排列提示将在开始处理之前显示确认消息。 探索提示: 时间旅行:不同的时代有不同的视觉风格,如“/imagine prompt<decade>cat illustration 1700 年代1700s”等。 表情:使用情感词语赋予人物个性,如“/imagine prompt<emotion>cat 决定Determined”等。 变得多彩:全方位的可能性,如“/imagine prompt<color word>colored cat 千禧粉红Millennial Pink”等。 环境探索:不同的环境可以设定独特的情绪,如“/imagine prompt<location>cat 苔原Tundra”等。
2025-01-26
设计卡通头像
以下是使用 Midjourney 设计卡通头像的方法: 1. 简单提示词: 在聊天窗口输入/imainge 找到/imagine prompt,然后把刚才的链接放进去,然后空格。 加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数。 设置参数: iw 1.5 是设置参考图片的权重,数值越高与参考的图片越接近,默认是 0.5,最大是 2,可选择中间的某个值并调整。 s 500 设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为 0 1000 间任意整数。 v 5 是指用 Midjourney 的第 5 代版本,这一代的最真实,目前 v5 需要订阅付费,不想付费可以使用v 4。 no glasses 是指不戴眼镜,如果你不喜欢戴眼镜的图片,可以加上这个设置,让它不戴眼镜。 完整的提示词如下simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5。如果对生成的结果不满意,可以调整s 和iw 的值进行多次尝试。 2. 复杂提示词: 如果觉得简单提示词不够好,可以选择更复杂的提示词,比如:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5。 效果展示:不同照片生成,如果对照片风格不满意,可以换一张新的照片使用上面的提示词重新生成。 其他调整:如果觉得 Disney 风格的头像太过卡通,可以把提示词里面的 Disney 都换成 Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的 boy 换成 girl。 每次会生成 4 张图片,如果对某一张图片满意,点击下方的 U1 U4 生成大图,如果对风格满意但是需要调整,点击下方的 V1 V4 进行修改。 此外,做卡通头像的教程不少,科技小飞哥这一篇写得通俗易懂,手把手教会怎么做。原文链接:https://leftpocket.cn/post/ai/cartoon/ 。之前制作了一篇视频,教大家怎么从零开始使用 Midjourney 并通过简单的提示词来生成图片。今天教点高级的知识,利用 Midjourney 的以图绘图功能来生成属于您的迪斯尼卡通风格的头像。要生成一张 Disney 风格的头像,先选一张比较满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击+,然后点击上传文件,选取图片,然后在聊天框发送(记得这里一定要点击回车或发送按钮)。然后图片会上传到服务器并生成一张唯一的链接,点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,这个链接就是这张图片的链接,复制下来。可以使用这个链接加 prompt 提示词来发送给 Midjourney,Midjourney 会根据需求来生成特定的图片,这就是 Midjourney 的以图绘图。如果还没有 Midjourney 账号,或者还不懂基础操作,可以看之前的教程:
2025-01-26