直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
AI 图像识别的发展历程
AI 图像识别的发展历程如下: 早期处理印刷体图片的方法是将图片变成黑白、调整为固定尺寸,与数据库对比得出结论,但这种方法存在多种字体、拍摄角度等例外情况,且本质上是通过不断添加规则来解决问题,不可行。 神经网络专门处理未知规则的情况,如手写体识别。其发展得益于生物学研究的支持,并在数学上提供了方向。 CNN(卷积神经网络)的结构基于大脑中两类细胞的级联模型,在计算上更高效、快速,在自然语言处理和图像识别等应用中表现出色。 ImageNet 数据集变得越来越有名,为年度 DL 竞赛提供了基准,在短短七年内使获胜算法对图像中物体分类的准确率从 72%提高到 98%,超过人类平均能力,引领了 DL 革命,并开创了新数据集的先例。 2012 年以来,在 Deep Learning 理论和数据集的支持下,深度神经网络算法大爆发,如卷积神经网络(CNN)、递归神经网络(RNN)和长短期记忆网络(LSTM)等,每种都有不同特性。例如,递归神经网络是较高层神经元直接连接到较低层神经元;福岛邦彦创建的人工神经网络模型基于人脑中视觉的运作方式,架构基于初级视觉皮层中的简单细胞和复杂细胞,简单细胞检测局部特征,复杂细胞汇总信息。
2024-11-14
我现在是一个AI小白,我想学习AI相关知识,我要怎么进阶学习?
对于 AI 小白的进阶学习,您可以参考以下步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能、机器学习、深度学习等主要分支及其之间的联系。 浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅: 在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并争取获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,根据自身兴趣选择特定模块深入学习。 掌握提示词的技巧,因其上手容易且实用。 4. 实践和尝试: 理论学习后,通过实践巩固知识,尝试使用各种产品创作自己的作品。 分享实践后的经验和成果。 5. 体验 AI 产品: 与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式,获取实际应用中的体验,激发对 AI 潜力的认识。 同时,您还需要掌握以下基础知识: AI 背景知识: 基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等线性代数基本概念。 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:简介强化学习的基本概念。 评估和调优: 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习如何使用网格搜索等技术优化模型参数。 神经网络基础: 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。
2024-11-14
哪里可以学习AI
以下是为您提供的新手学习 AI 的建议: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,您可以按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 持续学习和跟进: AI 是一个快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。 考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-11-14
让AI帮我操作电脑
目前在让 AI 操作电脑方面,有以下相关信息: 去年夏天在处理自动备份配置脚本的任务中,尽管对运维领域不熟悉且编写 Shell 脚本遇到困难,但 AI 可以作为很好的教练,通过请教如“请告诉我 rclone 命令的用法”“Shell 里面的循环怎么写”等具体问题,AI 能提供解决方案,甚至写出带详细中文注释的代码。 4 月动态中有一些相关的 AI 新产品,如 AutoGPT GUI 开放了 waitlist,MULTI·ON plugin 能在笔记本电脑上自动执行许多任务,BabyBeeAGI 有更强的任务管理等能力,MiniAGI 基于 GPT3.5Turbo/4 能执行多种任务。 生成式 AI Studio 中,可定义场景让 AI 响应特定查询,如设定名字和身份后对 help desk 查询做出特定回应。还提到 Google 提供了 API 和 SDK 帮助构建应用程序,以及调整语言模型以提高响应质量,提示的设计会影响模型结果,但制作提示可能存在一定难度。
2024-11-13
给出指令,让AI帮我执行的网页,app,大模型,小程序
以下为一些可以给出指令让 AI 帮您执行的网页、app、大模型和小程序: 1. Midjourney:在生成 UI 界面方面表现出色。如果想指定生成某个页面(如首页、登录页等),只需添加页面指令描述,例如“landing page”(社交平台登录页)、“Profile Page”(人力资源类产品的个人资料页)。其产出的设计图视觉效果不错,适合在 APP 设计的初始阶段提供灵感和创意,但目前直接用于落地开发仍有距离。 2. 很多 AI 网站可以创建“智能体”,例如您可以为其配置提示词、知识库、能力配置等,让其为您工作,如出试题、找资料、画插图、专业翻译等。 3. 在使用生成式人工智能时,要把大模型当作大学生而非专家,“实习生”只能执行任务,需要您指明方向、拆解任务、教其一步步操作,像导演一样编排具体流程、检查结果、修改流程并反复迭代。提示语的核心是逻辑,要将复杂任务拆分成科学合理的步骤,且确保每个步骤的结果能为后续步骤提供基础。同时,即使在 Prompt 里指明了步骤,如果没有打印出来,也无法达到理想效果。
2024-11-13
AI可以解决可控性核聚变吗
AI 可以在一定程度上协助解决可控性核聚变问题。 从全人类能源供给的角度来看,可控核聚变是唯一有希望大幅提升全人类能源供给数量级的技术。目前,在可控核聚变技术的研究中,AI 已经发挥了作用。例如,普林斯顿大学等离子体物理实验室通过 AI 成功在离子体撕裂前 300ms 进行了预测,这是可控核聚变进展的一小步。 同时,由于 AI 发展对能源的强大需求,科技公司纷纷投资致力于核聚变技术商业化的公司,如 Sam Altman 投资了 Helion Energy,谷歌投资了 TAE Technologies,OpenAI 投资了 Commonwealth Fusion Systems。这很有可能加速攻克可控核聚变技术的难题。 此外,AI 已经在工业中对诸如控制核聚变过程等大规模安全关键实践带来了变革。
2024-11-13
AI可以运用于炒股领域吗
AI 可以运用于炒股领域。 目前,AI 在炒股领域的应用仍处于不断探索和发展的阶段。例如,博主林亦 LYi 的《AI 炒股?我开了一家员工全是 AI 的公司,自动帮我炒股》就在某种程度上实现了多 Agent 协作的能力。 人工智能和机器学习在金融服务行业的应用已有十多年历史,大型语言模型通过生成式人工智能代表着重大飞跃,可能为金融服务市场带来数十年来最大的变革。但需要注意的是,AI 在炒股领域的应用还存在一些挑战和需要完善的地方。一方面,高度智能化的能力需要进一步打磨,概念落地还有较长距离;另一方面,AI 与金融服务的结合还需要不断探索和优化。
2024-11-13
提示词学习
以下是关于提示词学习的相关内容: 提示词的知识体系: 可分为五个维度,从高到低依次是思维框架、方法论、语句、工具和场景。但对于初学者,舒适的学习顺序应是反过来的。 学习 Stable Diffusion 提示词的步骤: 1. 学习基本概念:了解其工作原理、模型架构,理解提示词如何影响生成结果,掌握提示词的组成部分。 2. 研究官方文档和教程:通读官方文档,研究开发团队和专家的教程与技巧分享。 3. 学习常见术语和范例:熟悉相关领域术语和概念,研究优秀的图像标题和描述作为范例。 4. 掌握关键技巧:学会组合词条精确描述效果,掌握控制生成权重的符号技巧,处理抽象概念等无形事物的描述。 5. 实践和反馈:尝试生成不同风格和主题的图像,对比结果并总结经验,在社区分享请教获取反馈。 6. 创建提示词库:按主题、风格等维度建立,记录成功案例方便复用。 7. 持续跟进前沿:关注最新更新和社区分享,掌握新技术、新范式、新趋势。 学习提示词运用的建议: 1. 理解提示词的作用:向模型提供上下文和指示,影响模型输出质量。 2. 学习构建技巧:明确任务目标,用简洁准确语言描述,提供背景信息和示例,使用清晰指令,明确特殊要求。 3. 参考优秀案例:在领域社区、Github 等资源中研究学习。 4. 实践、迭代、优化:与语言模型互动,根据输出提高提示词质量,尝试变体并分析差异。 5. 活用提示工程工具:如 Anthropic 的 Constitutional AI 等。 6. 跟上前沿研究:持续关注最新研究成果和方法论。
2024-11-13
我现在正在使用mid journey生成图片,做漫画,我想知道怎么样写提示词,才能更好的让mid journey生成我需要的图片
以下是关于在 Midjourney 中写提示词以生成所需图片的一些指导: 1. 常规操作: 登录 Discord 网站,打开 MJ 服务器出图。 通过 /imagine 命令,在对话框输入“/imagine”激活指令,然后把提示词粘贴到“prompt”后面,点击发送即可。 想要多少张图片,就要输入多少次提示词,且输入下一次提示词之前,要等待上一张图片生成完毕。 2. 使用插件提效: Autojourney 是电脑浏览器的一个插件,可在浏览器拓展程序中下载安装。 它功能强大,支持批量发送提示词、自动下载图片、自动放大图片、生成提示词等功能,能够提高使用 Midjourney 的效率。 点击浏览器右上角的插件,选择 Autojourney 插件将其激活,将提示词复制到插件中点击发送,提示词会排队进入 MJ 发送程序,自动批量出图。 Autojourney 插件支持一次输入 10 组提示词。 3. Midjourney V6 更新风格参考命令 2.0“sref”: 将“sref”和 URL添加到提示的末尾,以参考风格参考图像的视觉风格创建新图像。 新提示本身没有美学内容,有助于“sref”的执行。 4. Midjourney 最新编辑器更新: 常见问题:提出极其不合适的请求或要求修改非常小的区域,可能无法得到预期结果;在场景中放很小的头部并要求外绘,生成的身体可能会太大。 重纹理化:是一种通过使用另一张图像来引导图像结构或构图的方法,从构图引导图像开始,然后使用提示词和参数添加所需细节。 右侧显示的缩略图:显示器右侧的缩略图显示最近几次编辑会话的记录,左边稍大的缩略图是上传或链接的母图像,其他四张是子图像,展示根据提示生成的不同表达方式。 “View All /查看全部”按钮:每次在不改变选择区域的情况下对母图像进行编辑时,会生成新的缩略图行,更改提示词,新提示词对应的图像会显示在子图像中。
2024-11-13
能做高等数学的AI
以下是为您整理的关于能做高等数学的 AI 的相关信息: Pi 对于高等数学的表现不稳定,有时不回答,有时能回答但可能答错,状态飘忽不定。比如在做七八道高等数学入门水平的题时,存在这样的情况。 沃尔夫勒姆认为,人工智能在“流体动力学风格”的数学水平上可能提供代码帮助,但对于真正新的、不涉及太多“样板文件”的内容,帮助有限。数学家在做数学时似乎在更高水平上对“微观元数学”进行了“粗粒度”处理。
2024-11-13