直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
如何开始学习AI
学习人工智能(AI)对于新手来说是一段充满挑战但也充满机遇的旅程。以下是为您提供的学习路径指南: 首先,要了解 AI 基本概念。建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支如机器学习、深度学习、自然语言处理等以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 接着,开始您的 AI 学习之旅。在「」中,您能找到为初学者设计的一系列课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并争取获得证书。 然后,选择感兴趣的模块深入学习。AI 领域广泛,涵盖图像、音乐、视频等方面,您可以根据自身兴趣选择特定模块进行深入探索。 对于中学生而言,学习 AI 可以从以下几个方面入手: 1. 从编程语言入手学习,例如 Python、JavaScript 等,掌握编程语法、数据结构、算法等基础知识。 2. 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等体验应用场景,也可以探索面向中学生的百度“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识,包括基本概念、发展历程、主要技术如机器学习、深度学习等,以及其在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目,参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态,关注权威媒体和学者,了解最新进展,思考其对未来社会的影响,培养思考和判断能力。 总之,新手学习 AI 可以参考「通往 AGI 之路」的布鲁姆分类法,设计适合自己的学习路径。
2024-09-05
AI视觉算法
以下是关于 AI 视觉算法的相关内容: GPT4 Vision GPT4 Vision 是 OpenAI 高级模型 GPT4 的创新功能,于 2023 年 9 月推出,能够解释视觉内容和文本,为用户提供更丰富、更直观的交互体验。 GPT4V 模型使用带有预训练组件的视觉编码器进行视觉感知,将编码的视觉特征与语言模型对齐。它建立在复杂的深度学习算法之上,能有效处理复杂的视觉数据。 GPT4V 允许用户上传图像作为输入并询问有关图像的问题,这种任务类型称为视觉问答(VQA)。 GPT4V 的工作原理: 利用先进的机器学习技术解释和分析视觉和文本信息。 对庞大数据集进行训练,包括文本和各种视觉元素。 训练过程结合强化学习,采用两阶段训练方法,先掌握视觉语言知识,再对更小、更高质量的数据集进行微调,以提高生成的可靠性和可用性。 计算机视觉 图像分类和物体识别:将图片作为输入,输出图像的内容分类,应用于面部识别。 物体识别:不仅分类或识别物体,还检测物体是否出现在图像中。 图像分割算法:识别物体位置,并标记不同物体对应的像素点,如用于识别 X 光照射图片。 视觉追踪:检测视频中的奔跑者,并追踪其轨迹和运动方向。 自然语言处理 文本分类:识别邮箱或文本中的内容并归类,可用于情绪识别。 信息检索:输入关键字,找出相关文档。 名称实体识别:找出句子中的名称,自动提取电话、姓名、国籍等。 机械翻译:进行语言翻译。 解析与语音部分标注技术:标注句子词性,让 AI 系统找出需留意的词语。 解析器:将单词组合成短语和句子,也是一种分类标签。 语音识别:将麦克风记录的空气高速压力变化数据转化为文本。 触发词检测:识别触发词。 语音 ID 识别:通过倾听说话来识别身份。
2024-09-05
AI提效工具浏览器插件推荐
以下为您推荐一些 AI 提效工具的浏览器插件: 结合 GPT4V 和 TTS API,创建辅助解释网页内容的工具,功能多样,包括解释表格和学习视觉科目。链接: bardeen.ai:让 AI 帮您构建自动化,曾排名 Product Hunt 月度榜榜首。链接:
2024-09-05
大模型的原理
大模型的原理如下: 1. 大模型是通过输入大量语料,让计算机获得类似人类的“思考”能力,从而能够理解自然语言,并进行文本生成、推理问答、对话、文档摘要等工作。其训练和使用过程可以类比为上学参加工作: 找学校:训练大模型需要大量计算,GPU 更合适,只有有资本购买大量 GPU 的才有能力训练。 确定教材:大模型需要大量的数据量,几千亿序列(Token)的输入是基本标配。 找老师:采用合适的算法讲述数据内容,让大模型更好理解 Token 之间的关系。 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称之为推导(infer)。 2. 大模型的本质是一个基于语言的概率模型,它返回其认为概率最大的内容。如果直接问大模型而不提供 Prompt,相当于大模型随机给出答案。有了 Prompt,相当于给了一个模板,包括对模型的要求、输入和输出的限制,大模型在这个限制下得到概率最大的答案。 3. 大模型与当下智能语音技能的 NLU 存在本质差别。语音技能 NLU 是通过一系列规则、分词策略等训练而成,其运作逻辑规律可观测,具有 ifelse 式的逻辑性。而大模型凭借海量数据在向量空间中学习知识的关联性形成,其运作逻辑难以观测,脱离了 ifelse 的层面。
2024-09-05
使用AI进行海报制作
使用 AI 进行海报制作的流程如下: 1. 主题与文案:确定海报主题后,可借助 ChatGPT 等文本类 AI 工具协助完成文案。 2. 风格与布局:选择想要完成的风格意向,背景不一定是空白的,可根据文案和风格灵活调整画面布局。 3. 生成与筛选:使用无界 AI 等工具,输入关键词,生成并挑选一张满意的海报底图。其他可生成海报底图的工具还有: Canva(可画):https://www.canva.cn/ ,是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可帮助选择合适的颜色搭配和字体样式。 稿定设计:https://www.gaoding.com/ ,稿定智能设计工具采用先进的人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 VistaCreate:https://create.vista.com/ ,是一个简单易用的设计平台,提供大量设计模板和元素,用户可以使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适的设计元素。 Microsoft Designer:https://designer.microsoft.com/ ,通过简单的拖放界面,用户可以快速创建演示文稿、社交媒体帖子和其他视觉内容,还集成了丰富的模板库和自动图像编辑功能,如智能布局和文字优化,大大简化了设计流程。 4. 配文与排版:将上述素材进行合理排版,得到成品。排版同样可以参考 AIGC 海报成果。 需要注意的是,所用软件为无界 AI,其余可进行 AIGC 绘图的软件,在操作步骤上不完全相同,但思路一致。
2024-09-05
最大似然函数
最大似然估计是估计分布的一种直接方法。先假设分布的形式,如假设 x 来自多元高斯分布,其中高斯分布的维度和图片的像素个数一致,待定参数如 。此时似然估计函数为 ,通过梯度下降或公式推导求解出最佳参数,从而求得分布。但这种方法有明显弊端,一是形式未知,需要丰富的领域知识才能确定分布形式,对于复杂问题只有上帝才知道分布的参数化表达式;二是参数量的空间太大,像 ImageNet 这种情况,是 150528 元高斯分布,需要海量数据才能估计准确。
2024-09-05
prompt的撰写语法
以下是关于 prompt 撰写语法的相关内容: 一、什么是 Prompt Prompt 指的是给人工智能(AI)系统提供的信息或者问题,用来引导 AI 产生特定的回答或者执行特定的任务。它就像您在聊天时提出的问题,是启动对话或者引导对话方向的起点。对于 AI 来说,一个好的 Prompt 可以帮助它更准确地理解您的需求,并给出更相关、更有用的回答。简言之,Prompt 就像是您对 AI 说的一句话,告诉它您想要它做什么。 二、Prompt 的建议框架及格式 第一种:CRISPE 1. Capacity and Role(能力与角色):您希望它的角色和能力,比如您是一名专注于民商事法律领域的律师,擅长案例研究、法律条文检索以及案件策略分析。通过赋予 AI 这样的角色,能够更有效地利用它的数据处理和模式识别能力,从而提升工作效率。 2. Insight(洞察):提供背景信息和上下文,比如处理一起复杂的合同纠纷案件,向 AI 提供案件的关键事实、相关法律以及案件涉及的背景。这样,AI 在输出答案的时候,能提前理解案件的来龙去脉,为您提供更精准的辅助。 3. Statement(陈述):您希望 AI 做什么。 三、Prompting 注意项 1. Midjourney Bot 无法像人类一样理解语法、句子结构或词语。多数情况下,词语的选择非常重要。更具体的同义词在许多情况下表现更佳。例如,可以用 gigantic、enormous 或 immense 替换 big。尽可能减少用词量。用词越少,每个单词的影响力就越强。使用逗号、方括号和连字符来帮助组织您的想法,注意,Midjourney Bot 无法可靠地解释这些符号。Midjourney Bot 不考虑大小写。Midjourney 4 稍微比其他模型更擅长解释传统的句子结构。 2. Prompt 技巧: 语气:指定所需语气(如正式、随意、信息性、说服性)。例如:请用正式语气编写一篇关于气候变化的文章。 格式:定义格式或结构(如论文、要点、大纲、对话)。例如:请为我提供一个关于健康饮食的要点清单。 限制:指定约束条件,如字数或字符数限制。例如:请提供一个关于太阳能的 100 字简介。 引用:要求包含引用或来源以支持信息。例如:请在关于全球变暖的文章中引用权威研究。 语言:如果与提示不同,请指明回应的语言。例如:请用法语回答关于巴黎旅游景点的问题。 反驳:要求解决潜在的反驳论点。例如:针对抵制疫苗接种的观点提出反驳。 术语:指定要使用或避免的行业特定或技术术语。例如:请用通俗易懂的语言解释区块链技术。 类比:要求 AI 用类比或示例阐明概念。例如:请用一个类比解释黑洞的概念。
2024-09-04
我想学习如何写promt
以下是关于如何写 prompt 的一些指导: 写 prompt 是决定 AI 模型理解和生成文本的关键步骤。一个好的 prompt 能帮助模型更好地理解任务要求并生成符合预期的文本。 编写 prompt 的建议: 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,在 prompt 中提供足够信息。 3. 使用清晰语言:尽量用简单、清晰的语言描述,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,在 prompt 中明确指出。 5. 使用示例:若有特定期望结果,在 prompt 中提供示例。 6. 保持简洁:避免过多信息,以免模型困惑。 7. 使用关键词和标签:帮助模型理解任务主题和类型。 此外,使用 GPT 模仿创作内容时,写出好的 prompt 卡点在于用方法论教 GPT 创作,即“know how”。比如让 GPT 创作视频标题时,不能简单写“帮我写爆款视频的标题”,而要提供创作标题的方法论和技巧,如修辞手法、写作人称、语言风格、内容结构等。可以通过找对标账号的标题拆解、模仿来获取这些方法论和技巧。 如果之前没写过结构化的 prompt,推荐打开云中江树老师的 LangGPT 项目学习:https://github.com/yzfly/LangGPT/blob/main/README_zh.md 。最快的方法是改写大佬写好的 prompt,例如 JK 老师的欢乐多朋友圈段子生产 V0.3 。
2024-09-04
AI能够取代人类的什么工作场景,请简单举个实际的例子
AI 能够在一些工作场景中取代人类,例如: 在一些重复性高、规律性强的工作中,如数据录入、文件整理等,AI 可以更高效地完成任务。 某些简单的客服工作,AI 能够根据预设的回答模式处理常见问题。 不过,AI 无法完全取代需要人际交往、团队领导和复杂决策制定的角色。像云架构师、网络架构师和企业架构师等职位,不仅需要技术知识,更需要与人沟通、管理利益相关者和领导团队的能力。此外,企业领导者在利用 AI 提高工作效率的同时,仍需将更多精力投入到创新和战略规划上。 同时,知名投资机构 Nfx 在他们最新的《The AI Workforce is Here:The Rise of a New Labor Market》中提到,Sam Altman 经常提到 AGI 到来的定义之一就是 AI 能替代百分之七十的人类工作。现在 AI 正在强制逆转 SaaS 这个缩写的含义,从“软件即服务”转变为“服务即软件”,软件既能组织任务,也能执行任务,无需雇佣额外劳动力,传统的劳动力市场最终将和软件融合成为一个新市场。
2024-09-04
有什么AI可以实现科研论文转变为报告PPT
以下是一些可以帮助您将科研论文转变为报告 PPT 的 AI 工具: 1. Scite.ai:这是一个为研究人员、学者和行业专业人员打造的创新平台,旨在增强他们对科学文献的洞察。它提供了一系列工具,如引用声明搜索、自定义仪表板和参考检查,这些都能简化您的学术工作。网址: 2. Scholarcy:这是一款科研神器,主要为做科研、学术、写论文的人准备。它可以从文档中提取结构化数据,并通过知识归纳引擎生成文章概要,精炼地呈现文章的总结信息,分析中包含关键概念、摘要、学术亮点、学术总结、比较分析、局限等板块的内容。网址: 3. ChatGPT:这是一个强大的自然语言处理模型,可以提供有关医学课题的修改意见。您可以向它提供您的文章,并提出您的问题和需求,它将尽力为您提供帮助。网址:
2024-09-04