直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
作业帮搜题算ai嘛
作业帮属于作业助手类的应用,在一些关于 AI 应用的榜单中有所提及。但仅从所提供的数据,难以直接判断作业帮搜题是否完全属于 AI 应用。一般来说,作业帮的搜题功能可能运用了一定的人工智能技术来实现题目搜索和答案匹配,但具体的程度和方式还需要进一步了解其技术架构和实现原理。
2025-02-09
开发一款AI产品怎么入手
开发一款 AI 产品可以从以下几个方面入手: 1. 明确技术方案,封装 API 调用提示词: 在成功验证纯提示词方案后,进入产品化开发阶段。 借助 Cursor、Windsurf 等 AI 编程工具,实现插件效果。 产品化开发需考虑稳定获取网页内容、选择适合的 AI 大模型 API 服务、构建生产级提示词等问题。 稳定获取网页内容可通过用户浏览器以插件形式本地提取,例如让 AI 设计获取相关元素的 js 代码。 2. 对 AI 产品经理的要求: 入门级:能通过开源网站或课程了解 AI 概念,使用并实践应用搭建。 研究级:包括技术研究和商业化研究路径,能根据需求场景选择解决方案,或利用工具手搓出 AI 应用验证想法。 落地应用级:有成功落地应用案例并产生商业化价值。 总结来说,AI 产品经理要懂得技术框架,关注场景、痛点、价值。 3. 创新产品和服务: 探索基于 AI 的新产品或服务:调查分析市场需求,鼓励创新思维,开发原型并测试。 利用 AI 技术提升现有产品的智能化程度:识别可优化部分,改善用户界面和交互体验,基于反馈不断迭代更新。 通过以上策略,有助于开发出具有创新性和竞争力的 AI 产品。
2025-02-09
比较火的AI产品
以下是一些比较火的 AI 产品: 在获取高质量 Prompt 方面: GPTs 通过对话引导获取用户信息。 Jasper 拆解场景流程,按步骤收集信息。 Leonardo 用画布、实时反馈加速 Prompt 提升。 Novel 用交互式、渐进式续写。 c.ai 卷生态卷模型。 筑梦岛探索更多场景的对话玩法。 FlowGPT 以 Prompt 的分享为核心。 小悟空数据驱动优化 Prompt。 同时发现一些现象,如 GUI、LUI 的结合会极大提高产品体验;随着模型能力提升,实时反馈越发重要;模型能力在现阶段依旧是核心竞争力;互联网产品的很多思维和方法论出现在大量 AI 产品上;产品形式和模型能力还很接近,产品还在技术应用阶段。 制作 PPT 的 AI 产品: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。https://gamma.app/ 美图 AI PPT:由美图秀秀团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等。https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。https://zhiwen.xfyun.cn/ 近期热门融资的 AI 产品:Genspark、Rockset、ButterfliesAI、MeetRecord 等。这些产品展示了技术的先进性,为各行业提供高效、智能的信息处理和决策支持工具。
2025-02-09
如何尽可能多的了解AI的信息
以下是尽可能多了解 AI 信息的一些方法: 1. 万能公式法:问 AI“一个(xxx 职业)需要具备哪些知识?”,AI 会给出知识框架,然后针对每一个小点继续询问,能帮助您深度思考。 2. 优质信息源:像没有技术背景的普通人,可以在「即刻」App 的“”等免费圈子获取前沿信息线索,很多 Twitter 上的开发者大牛也会在这里分享,必要时可去 Twitter 和相关官网溯源。 3. 信息爆炸做减法的小 tips: 只掌握最好的产品,少关注新产品测评(除非远超 ChatGPT)。 只解决具体问题,不做泛泛了解。从问题中来,到问题中去。 只关注核心能力,不关注花式玩法,用 AI 扬其长避其短。 只关注理清需求和逻辑,不死记硬背提示词。 先关注提升认知/洞察,然后再谈技巧。 4. 持续学习和跟进:AI 发展迅速,新成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 5. 一位投资人的信息源: 简报:TLDR AI。 播客:No Priors podcast hosted by Sarah Guo 和 Elad Gil、Robot Brains Podcast hosted by Pieter Abbeel、Lex Fridman Podcast hosted by Lex Fridman、The Gradient podcast hosted by Daniel Bashir、Generally Intelligent hosted by Kanjun Qiu、Last Week in AI 。 会议:World AI Cannes Festival 。
2025-02-09
如何尽可能多的了解AI
以下是尽可能多了解 AI 的方法: 1. 认识 AI :对于没有理工科背景的人,可以将 AI 当成一个黑箱,只需知道它是能理解和输出自然语言的东西,其生态位是似人而非人的存在。从人类文明传说和古老哲人的智慧中寻找与 AI 相处的原则,比如在让其实现愿望时,要通过清晰的语言文字压缩其自由度,明确告知任务、边界、目标、实现路径和所需知识。 2. 了解基本概念 : 阅读「」部分,熟悉术语和基础概念,了解人工智能及其主要分支(如机器学习、深度学习、自然语言处理等)的联系。 浏览入门文章,了解其历史、应用和发展趋势。 3. 开始学习之旅 : 在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习,有机会获得证书。 4. 选择感兴趣模块深入学习 :AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习,掌握提示词技巧。 5. 实践和尝试 :理论学习后,通过实践巩固知识,使用各种产品创作作品,在知识库分享实践成果。 6. 体验 AI 产品 :与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解工作原理和交互方式,获得实际应用体验。 7. 持续学习和跟进 :AI 发展迅速,关注新闻、博客、论坛和社交媒体,加入相关社群和组织,参加研讨会、工作坊和会议,与他人交流。
2025-02-09
学习ai的系统课程
以下是为您推荐的学习 AI 的系统课程: 1. 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习,AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。同时,一定要掌握提示词的技巧,它上手容易且很有用。 4. 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品,与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 【野菩萨】课程: 预习周课程:包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 基础操作课:涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等内容。 ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 免费课程机会:如果想要免费获得这门课程,可以来参与 video battle,这是唯一一个获胜者就可以拥有课程的机会。每期的 video battle 的评委野菩萨老师都非常严格,需要寓意深度审美并存。冠军奖励:4980 课程一份;亚军奖励:3980 课程一份;季军奖励:1980 课程一份;入围奖励:598 野神殿门票一张。扫码添加菩萨老师助理,了解更多课程信息。 7. 微软 AI 初学者入门课程: 人工智能的商业应用案例:可以学习《》(和欧洲工商管理学院 INSEAD 共同开发)。 经典机器学习:可参考《》。 使用 Azure 认知服务(Azure Cognitive Services)来创建实用的人工智能应用:建议从《》等课程开始学习。
2025-02-09
学习智能体
智能体(Agent)是指具有一定自主性和智能行为的实体。它可以根据其复杂性和功能分为以下几种类型: 1. 简单反应型智能体(Reactive Agents):根据当前的感知输入直接采取行动,不维护内部状态,也不考虑历史信息。例如温控器,它根据温度传感器的输入直接打开或关闭加热器。 2. 基于模型的智能体(Modelbased Agents):维护内部状态,对当前和历史感知输入进行建模,能够推理未来的状态变化,并根据推理结果采取行动。比如自动驾驶汽车,它不仅感知当前环境,还维护和更新周围环境的模型。 3. 目标导向型智能体(Goalbased Agents):除了感知和行动外,还具有明确的目标,能够根据目标评估不同的行动方案,并选择最优的行动。例如机器人导航系统,它有明确的目的地,并计划路线以避免障碍。 4. 效用型智能体(Utilitybased Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动的优劣,权衡利弊。比如金融交易智能体,根据不同市场条件选择最优的交易策略。 5. 学习型智能体(Learning Agents):能够通过与环境的交互不断改进其性能,学习模型、行为策略以及目标函数。例如强化学习智能体,通过与环境互动不断学习最优策略。 虽然互联网上关于智能体的介绍已经相当丰富,但能够系统性地讲解智能体,并让读者在一系列文章中全面掌握智能体的知识,这种情况实属罕见。为此,开设了相关系列文章,旨在帮助大家系统性地了解智能体,并从中学习跨学科、跨领域的人工智能知识。 现在接触到的智能体大多是建立在大模型之上的,其发展历程是从基于符号推理的专家系统逐步演进而来。基于大模型的智能体具有强大的学习能力、灵活性和泛化能力。智能体的核心在于如何有效地控制和利用这些大型模型,以达到设定的目标,这通常涉及到精确的提示词设计。 在介绍了智能体的基本概念之后,可以基于一些公开的大模型应用产品(如 Chat GLM、Chat GPT、Kimi 等),尝试开发属于自己的智能体。具体步骤为: 1. 点击“浏览 GPTs”按钮。 2. 点击“Create”按钮创建自己的智能体。 3. 使用自然语言对话进行具体设置。 4. 使用手工设置。 5. 开始调试智能体并发布。
2025-02-09
长文本理解能里较强的AI
以下是一些长文本理解能力较强的 AI 模型: 1. 智谱·AI 的 ChatGLM26B32k:这是第二代 ChatGLM 长上下文对话模型,在 ChatGLM26B 的基础上进一步强化了对于长文本的理解能力,能够更好地处理最多 32K 长度的上下文。在实际使用中,如果上下文长度基本在 8K 以内,推荐使用 ChatGLM26B;如果需要处理超过 8K 的上下文长度,推荐使用 ChatGLM26B32K。此外,还有 ChatGLM26B32kint4 版本,它是 ChatGLM26B32K 的 int4 版本。 2. 通义千问的 Qwen2.51M:推出 7B、14B 两个尺寸,在处理长文本任务中稳定超越 GPT4omini,同时开源推理框架,在处理百万级别长文本输入时可实现近 7 倍的提速。首次将开源 Qwen 模型的上下文扩展到 1M 长度。在上下文长度为 100 万 Tokens 的大海捞针任务中,Qwen2.51M 能够准确地从 1M 长度的文档中检索出隐藏信息。其开源平台包括 Huggingface(https://huggingface.co/spaces/Qwen/Qwen2.51MDemo)和 Modelscope(https://www.modelscope.cn/studios/Qwen/Qwen2.51MDemo)。
2025-02-09
多模态大模型
Google 的多模态大模型叫 Gemini。Gemini 是由 Google DeepMind 团队开发的,不仅支持文本、图片等提示,还支持视频、音频和代码提示。它能够理解和处理几乎任何输入,结合不同类型的信息,并生成几乎任何输出,被称为 Google 迄今为止最强大、最全面的模型,从设计之初就支持多模态,能够处理语言、视觉、听觉等不同形式的数据。 多模态大模型(MLLM)是一种在统一的框架下,集成了多种不同类型数据处理能力的深度学习模型,这些数据可以包括文本、图像、音频和视频等。通过整合这些多样化的数据,MLLM 能够更全面地理解和解释现实世界中的复杂信息,在面对复杂任务时表现出更高的准确性和鲁棒性。其典型架构包括一个编码器、一个连接器和一个 LLM,还可选择性地在 LLM 上附加一个生成器,以生成除文本之外的更多模态。连接器大致可分为基于投影的、基于查询的和基于融合的三类。 有基于多模态大模型给现实世界加一本说明书的应用,例如将手机置于车载摄像机位置,能够实时分析当前地区今年新春的最新流行趋势。该应用后端采用 llama.cpp 挂载 LLaVA 模型,为应用提供推理服务,同时部署了一个 Flask 应用用于数据前处理和后处理,提供 Stream 流服务,前端页面采用 HTML5 用于采集画面和用户输入。下载模型 ggml_llavav1.513b,BakLLaVA 推理速度更快,但对中文支持较差,7b 的模型在语义理解方面存在不足,特别是在需要规范数据格式进行交互的场合,对于 function call 和 action 操作极度依赖模型的 AGI 能力。
2025-02-09
大模型 Agent
AI Agent 是从年前到现在比较火的概念,被认为是大模型未来的主要发展方向。 从原理上看,中间的“智能体”就是 LLM 或大模型,为其增加的四个能力分别是工具、记忆、行动、规划。目前行业里主要用到的是 langchain 框架,它把 LLM 和 LLM 之间以及 LLM 和工具之间通过代码或 prompt 的形式进行串接。比如给大模型增加长期记忆,就是提供一个数据库工具让其记录重要信息;规划和行动则是在大模型的 prompt 层做逻辑处理,将目标拆解并输出不同的固定格式 action 指令给工具。 大模型利用“网页搜索”工具的典型例子如 Kimi Chat,会在互联网上检索相关内容并总结分析给出结论。Agent 可以自行规划任务执行的工作流路径,面向简单或线性流程运行。吴恩达通过开源项目 ChatDev 举例,一个大语言模型可以扮演不同角色相互协作开发应用或复杂程序。 OpenAI 的研究主管 Lilian Weng 提出“Agent = LLM + 规划 + 记忆 + 工具使用”的基础架构,其中规划包括子目标分解、反思与改进,记忆用于存储信息。 结合“一人公司”的愿景,未来的 AI 数字员工会以大语言模型为大脑串联所有工具,创造者的学习方向是用大模型和 Agent 模式把工具串起来,关注创造能落地的 agent 应用。Agent 工程如同传统软件工程学,有迭代的范式,包括梳理流程、任务工具化、建立规划、迭代优化。在从 copilot 到 Agent 的发展中,需要在对 AI 能力基础上对固化流程和让 AI 自主思考作出妥协和平衡。
2025-02-09