Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

人工智能分类

Answer

人工智能主要分为以下几类:

  1. 按照智能程度划分:
    • ANI(Artificial Narrow Intelligence,弱人工智能):只能完成特定的一项任务,例如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等。
    • AGI(Artificial General Intelligence,通用人工智能):能够完成任何人类可以做的事情,但目前还未取得巨大进展。
  2. 在 Generative AI 的开发工具和基础设施方面:
    • Orchestration(编排):涉及如 DUST、FIAVIE、LangChain 等公司,提供帮助开发人员管理和协调各部分及任务的工具,确保系统流畅运行。
    • Deployment, Scalability, & Pre-Training(部署、可扩展性和预训练):包括 UWA mosaicm、NMAREL、anyscale 等公司,提供部署模型、保证可扩展性及预训练的工具。
    • Context & Embeddings(上下文和嵌入):有 TRUDO、Llamalndex、BerriAI 等公司,提供处理和理解语言上下文及词语和句子转化为计算机可理解形式的工具。
    • QA & Observability(质量保证和可观察性):例如 Pinecone、drant、Vald 等公司,提供确保模型表现和监控模型性能及状态的工具。
  3. 关键词接龙中的分类:
    • 主体描述:Monkey, k-pop monkey, thinker, Millennials, k-pop girl, Buddha
    • 环境与构图:cliff, Temple, post apocalyptic
    • 背景:zen art, Art deco, vaporwave, pink moon, International version of the film effect, steampunk
    • 光线:ethereal pink, pink moon
    • 视角:Twist fantasy, Double Exposure
    • 构图:levitating, jouy print
    • 风格:Hiroshi Sugimoto, Edward Hopper, V for Vendetta, Vaporwave, Celadon green
    • 艺术家:Hiroshi Sugimoto, Edward Hopper
Content generated by AI large model, please carefully verify (powered by aily)

References

学习笔记:AI for everyone吴恩达

AI分为ANI和AGI,ANI得到巨大发展但是AGI还没有取得巨大进展。ANI,artificial narrow intelligence弱人工智能。这种人工智能只可做一件事,如智能音箱,网站搜索,自动驾驶,工厂与农场的应用等。AGI,artificial general intelligence,做任何人类可以做的事

Generative AI的开发工具和基础设施的趋势

这张图描绘了Generative AI的开发工具和基础设施的趋势。它代表了在AI开发领域中,为满足不同需求,工具和基础设施正在逐渐模块化和专业化的趋势。图中的公司被分组到以下四个主要类别:1.Orchestration(编排):涉及到的公司(如DUST、FIAVIE、LangChain等)提供的工具帮助开发人员管理和协调各个部分和任务,以确保系统的流畅运行。2.Deployment,Scalability,& Pre-Training(部署,可扩展性和预训练):这个类别的公司(如UWA mosaicm、NMAREL、anyscale等)提供工具,帮助开发人员部署模型,保证模型的可扩展性,以及在模型使用前进行预训练。3.Context & Embeddings(上下文和嵌入):这个类别的公司(如TRUDO,Llamalndex,BerriAI等)提供工具,帮助模型处理和理解语言上下文,以及将词语和句子转化为计算机可以理解的形式。4.QA & Observability(质量保证和可观察性):这个类别的公司(如Pinecone,drant,Vald等)提供工具,以确保模型的表现,并能够监控模型的性能和状态。这些类别和公司的出现代表了人工智能技术的复杂化和专业化。随着技术的发展,更多专门针对不同AI开发阶段的工具和服务正在被开发和使用,这有助于提高开发效率和模型质量。

关键词接龙

首先,我们将关键词分为几个主要类别,以便于管理和应用。主体描述:Monkey,k-pop monkey,thinker,Millennials,k-pop girl,Buddha环境与构图:cliff,Temple,post apocalyptic背景:zen art,Art deco,vaporwave,pink moon,International version of the film effect,steampunk光线:ethereal pink,pink moon视角:Twist fantasy,Double Exposure构图:levitating,jouy print风格:Hiroshi Sugimoto,Edward Hopper,V for Vendetta,Vaporwave,Celadon green艺术家:Hiroshi Sugimoto,Edward Hopper

Others are asking
你是福州市政府工作人员,中国移动拟邀请福州市委书记参加中国移动人工智能生态大会并致辞,该大会是第八届数字峰会的组成部分,需要撰写市委书记的致辞稿,需要中国移动准备哪些素材,请告诉我提示词
以下是为您整理的相关内容: 《促进创新的人工智能监管方法》:包含了关于通用人工智能价值链、相关案例研究以及对人工智能监管框架的探讨等内容。 陶力文律师关于律师写好提示词用好 AI 的方法:包括初始化的欢迎语、遵循的规则、获取案例洞察报告和目标群体、输出纲要和写作方案、根据用户反馈调整等流程。 开幕式主持稿:涉及基地代表发言的时间、主题、物料配合和人员配合等信息。 但这些素材似乎与为中国移动准备市委书记致辞稿所需的素材关联不大。一般来说,为撰写市委书记在中国移动人工智能生态大会上的致辞稿,中国移动可能需要准备以下素材: 1. 本次大会的详细介绍,包括主题、目标、议程安排等。 2. 中国移动在人工智能领域的发展成果、战略规划和未来愿景。 3. 中国移动人工智能生态的构建情况,如合作伙伴、合作项目等。 4. 本次大会在第八届数字峰会中的地位和作用。 5. 相关行业的人工智能发展现状和趋势。 6. 福州市在人工智能领域的发展情况和与中国移动合作的展望。
2025-04-18
人工智能软件现在有哪些
以下是一些常见的人工智能软件: 1. 在自然语言处理和神经科学应用方面,大型语言模型取得了进展,拥有更先进的工具用于解码大脑状态和分析复杂脑部活动。 2. 在艺术创作领域,有涉及知识产权保护的相关软件,如软件工程师在设计时应确保生成内容合法合规、注重用户知识产权保护等。创作者使用此类软件时,应了解自身权利并做好保护。 3. 在线 TTS 工具方面,如 Eleven Labs(https://elevenlabs.io/)、Speechify(https://speechify.com/)、Azure AI Speech Studio(https://speech.microsoft.com/portal)、Voicemaker(https://voicemaker.in/)等。这些工具可将文本转换为语音,具有不同的特点和适用场景。但请注意,相关内容由 AI 大模型生成,请仔细甄别。
2025-04-15
什么是通用人工智能
通用人工智能(AGI)是指具有人类水平的智能和理解能力的 AI 系统。它有能力完成任何人类可以完成的智力任务,适用于不同的领域,同时拥有某种形式的意识或自我意识。 目前 AGI 还只是一个理论概念,没有任何 AI 系统能达到这种通用智能水平。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力的 AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平的 AI,能够解决复杂问题,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务的 AI。目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明的 AI,如谷歌 DeepMind 的 AlphaFold 模型,可以预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 常见名词解释: AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing),就是说人话。 LLM:大型语言模型(Large Language Model),数据规模很大,没钱搞不出来,大烧钱模型。
2025-04-15
2025年人工智能大模型的技术提升有哪些,是参数?推理能力?还是语料
2025 年人工智能大模型的技术提升可能体现在以下几个方面: 1. 视频生成能力:如 2024 年推出的多个先进的 AI 模型能够从文本输入生成高质量视频,相比 2023 年有显著进步。 2. 模型规模与性能:更小的模型能驱动更强的性能,如 2022 年最小能在 MMLU 上得分高于 60%的模型是具有 5400 亿参数的 PaLM,到 2024 年,参数仅 38 亿的微软 Phi3mini 也能达到相同阈值。 3. 推理能力:尽管加入了如思维链推理等机制显著提升了大语言模型的性能,但在一些需要逻辑推理的问题上,如算术和规划,尤其在超出训练范围的实例上,这些系统仍存在问题。 4. AI 代理:在短时间预算设置下,顶级 AI 系统得分高于人类专家,但随着时间预算增加,人类表现会超过 AI。 5. 算法变革:如 DeepSeek 的出现标志着算力效率拐点显现,其通过优化算法架构显著提升了算力利用效率,同时 2025 年发布的大模型呈现低参数量特征,为本地化部署到 AI 终端运行提供了可能,其训练过程聚焦于强化学习,提升了模型的推理能力。
2025-04-14
用通俗易懂的动画描述人工智能工作原理
人工智能的工作原理可以通过以下动画来描述: 在一个动画场景中,首先有一个传统工作流的部分,就像精心搭建的积木城堡,每一块积木的位置和形状都被精确设计和控制,这代表着传统工作流的可控性和高成本、慢速度。 然后是 AI 工作流的部分。想象一下,有一团混乱的色彩在飞舞,这团色彩代表着随机和不可控。但在这混乱中,有一种力量在尝试引导和塑造,就像在狂风中努力抓住风筝线一样,这就是在随机性中寻找可控性。 比如在一个生成音频与视频同步的例子中,动画展示了一个系统。首先,系统将视频输入编码成压缩的表示形式,就像把一大包东西压缩成一个小包裹。然后,扩散模型从随机噪声中不断改进音频,就像在混沌中逐渐塑造出清晰的声音。这个过程受到视觉输入和自然语言提示的引导,最终生成与提示紧密配合的同步逼真音频。最后,音频输出被解码,变成音频波形,并与视频数据完美结合。 总的来说,传统工作流在可控中寻找创新的随机,而 AI 工作流更多是在随机中寻找可控,两者各有优劣,结合起来能创造出更出色的成果。
2025-04-14
人工智能简史
人工智能作为一个领域始于二十世纪中叶。最初,符号推理流行,带来了如专家系统等重要进展,但因方法无法大规模拓展应用场景,且从专家提取知识并以计算机可读形式表现及保持知识库准确的任务复杂、成本高,导致 20 世纪 70 年代出现“人工智能寒冬”。 随着时间推移,计算资源变便宜,数据增多,神经网络方法在计算机视觉、语音理解等领域展现出卓越性能。过去十年中,“人工智能”常被视为“神经网络”的同义词,因多数成功案例基于神经网络方法。 以下是人工智能发展历程中的一些重要节点: 1969 年:经历低潮。Marvin Minsky 和 Seymour Papert 阐述因硬件限制,几层的神经网络仅能执行基本计算,AI 领域迎来第一次泡沫破灭。 1960 1970 年代:早期专家系统。此时期 AI 研究集中在符号主义,以逻辑推理为中心,主要是基于规则的系统,如早期专家系统。 1980 年代:神经网络。基于规则的系统弊端显现,人工智能研究关注机器学习,神经网络根据人脑结构和操作创建和建模。 1997 年:深蓝赢得国际象棋比赛。IBM 深蓝战胜国际象棋冠军卡斯帕罗夫,新的基于概率推论思路广泛应用于 AI 领域。 1990 2000 年代:机器学习。AI 研究在机器人技术、计算机视觉和自然语言处理等领域取得显著进展,21 世纪初深度学习出现使语音识别、图像识别和自然语言处理进步成为可能。 2012 年:深度学习兴起。Geoffrey Hinton 开创相关领域,发表开创性论文引入反向传播概念,突破感知器局限。 2012 年:AlexNet 赢得 ImageNet 挑战赛。引发深度学习热潮。 2016 年:AlphaGo 战胜围棋世界冠军。DeepMind 的 AlphaGo 战胜李世石,标志着人工智能在围棋领域超越人类,对人类理解产生深远影响。
2025-04-10
目前模型之间是如何分类的
目前模型的分类方式多种多样,以下为您介绍几种常见的分类角度: 1. 从来源角度:根据模型的出处,可分为来自行业(如 Google、Meta、OpenAI 等公司)、学术界(如清华大学、麻省理工学院、牛津大学等)、政府(如英国的艾伦·图灵研究所、阿布扎比的技术创新研究所等)以及研究团体(如艾伦研究所、弗劳恩霍夫研究所等非营利性 AI 研究组织)。在 2014 年之前,学术界在发布机器学习模型方面领先,此后行业占据主导。 2. 从整体架构角度: 基础层:为大模型提供硬件支撑和数据支持,例如 A100、数据服务器等。 数据层:包括企业根据自身特性维护的静态知识库和动态的三方数据集,而非用于基层模型训练的数据基集。 模型层:分为 LLm(如 GPT 等大语言模型,一般使用 transformer 算法实现)和多模态模型(如文生图、图生图等模型,训练数据为图文或声音等多模态数据集)。 平台层:如大模型的评测体系或 langchain 平台等,是模型与应用之间的组成部分。 表现层:即应用层,是用户实际看到的部分。 此外,像 OpenAI o3mini 模型,在 OpenAI 的准备框架中被分类为中等风险,并采取了相应的保障和安全缓解措施。
2025-04-13
基于技术类别的不同,将现在的AI产品进行分类
目前,AI 产品基于技术类别可以进行如下分类: 1. 从生成方式分类: 文生视频、图生视频:如 Runway、Pika labs、SD+Deforum、SD+Infinite zoom、SD+AnimateDiff、Warpfusion、Stability Animation 等。 视频生视频: 逐帧生成:如 SD+Mov2Mov。 关键帧+补帧:如 SD+Ebsynth、Rerender A Video。 动态捕捉:如 Deep motion、Move AI、Wonder Dynamics。 视频修复:如 Topaz Video AI。 AI Avatar+语音生成:如 Synthesia、HeyGen AI、DID。 长视频生短视频:如 Opus Clip。 脚本生成+视频匹配:如 Invideo AI。 剧情生成:如 Showrunner AI。 2. 从产品阶段和可用维度分类: 以 AI 为底层设计逻辑的 AI 原生类产品。 在原有互联网产品上深度嵌入 AI 功能的 AI+X 产品,目前整体数据表现显著优于 AI 原生类产品,在办公软件和内容平台重点布局。办公软件方面,如百度文库和 WPS AI 等在续写、改写、命题写作等不同程度的 AI 写作功能,以及针对论文、小说等不同题材的 AI 总结功能上表现突出。内容平台方面,AIGC 大多从基于平台内容的 AI 搜索、用于带动 UGC 的 AI 生成功能及模板、降低门槛的内容创作工具三个方向发力。 基于外接 API 微创新的套壳类产品。 将多个产品/模型 API 集中拼凑的集合站类产品。 此外,从 AI 产品经理的角度,个人划分仅供娱乐和参考: 1. 入门级:能通过 WaytoAGI 等开源网站或一些课程了解 AI 概念,使用 AI 产品并尝试动手实践应用搭建。 2. 研究级:有技术研究和商业化研究两个路径,能根据需求场景选择解决方案,或利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用级:有成功落地应用的案例,产生商业化价值。对应传统互联网 PM 也有三个层级: 负责功能模块与执行细节。 负责整体系统与产品架构。 熟悉行业竞争格局与商业运营策略。
2025-04-01
请基于应用场景,对AI模型进行分类
以下是对 AI 模型基于应用场景的分类: 1. 文本生成和内容创作:包括撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手:提供客户服务、日常任务提醒和信息咨询等服务。 3. 编程和代码辅助:如代码自动补全、bug 修复和代码解释。 4. 翻译和跨语言通信:促进不同语言背景的用户之间的沟通和信息共享。 5. 情感分析和意见挖掘:为市场研究和产品改进提供数据支持。 6. 教育和学习辅助:创建个性化的学习材料、自动回答学生问题和提供语言学习支持。 7. 图像和视频生成:如根据文本描述生成相应的图像,甚至未来可能扩展到视频内容的生成。 8. 游戏开发和互动体验:创建游戏中的角色对话、故事情节生成和增强玩家的沉浸式体验。 9. 医疗和健康咨询:理解和回答医疗相关的问题,提供初步的健康建议和医疗信息查询服务。 10. 法律和合规咨询:帮助解读法律文件,提供合规建议。 此外,在开源模型方面,如 Civitai、海艺 AI、liblib 等为主流创作社区,提供了让用户利用 AI 技术进行图像创作和分享的平台。AI 视频方面,其应用场景广泛,涵盖内容创建、社交媒体营销、讲故事与动画制作、个性化内容、视频摘要、电子学习和培训、新闻媒体、电子游戏开发、虚拟助理和聊天机器人、归档与文档保存以及提高内容的可访问性等多个领域。从使用场景来看,分为改善大模型产品的使用体验、助力用户工作流、细分场景独立实用工具、AI 社区、Chatbot 五个方向;从产品形态上来看,分为插件、辅助现有产品能力、深度结合 LLM 能力的独立网站&应用、AI 社区四种。目前产品大多分布在 PC 端。
2025-04-01
基于深度学习的商代食器分类研究 明确详细的研究意义
基于深度学习的商代食器分类研究具有多方面的重要意义。首先,它有助于深入了解商代的饮食文化和社会生活。通过对食器的准确分类,可以揭示当时人们的饮食习惯、烹饪方式以及社交礼仪等方面的信息。 其次,为考古学研究提供新的方法和视角。利用深度学习技术能够更高效、更准确地处理和分析大量的商代食器数据,突破传统研究方法的局限。 再者,有助于文物保护和管理。精确的分类有助于制定更有针对性的保护策略,确保这些珍贵的文化遗产得到妥善保存。 最后,促进跨学科研究的发展。将深度学习与考古学相结合,能够吸引更多不同领域的学者参与,推动相关研究的创新和进步。
2025-03-27
AI分类
AI 主要有以下分类: 1. 生成式 AI: 生产力方面:包括文档、PPT、会议、脑爆、数据处理、搜索、浏览、email、文件等。 社交方面:包括真实和虚拟社交。 教育方面:涵盖早教、语言学习、公司教育、父母教育、学生工具、学校工具等。 创意内容方面:包含视频、音乐、声音、个人图像、图像等。 2. 以生成方式划分: 音视频生成类: 视频生成:当前视频生成可分为文生视频、图生视频与视频生视频。主流生成模型为扩散模型,可用于娱乐、体育分析和自动驾驶等领域,经常与语音生成一起使用。 语音生成:用于文本到语音的转换、虚拟助手和语音克隆等,模型可由 Transformers 提供。 音频生成:用于生成音乐、语音或其他声音,常用技术包括循环神经网络、长短时记忆网络、WaveNet 等。 一些具有代表性的海外项目: Sora(OpenAI):以扩散 Transformer 模型为核心,能生成长达一分钟的高保真视频,支持多种生成方式,在文本理解方面表现出色。 Genie(Google):采用 STtransformer 架构,包括潜在动作模型、视频分词器与动力学模型,拥有 110 亿参数。 WaveNet(DeepMind):一种生成模型,可以生成非常逼真的人类语音。 MuseNet(OpenAI):一种生成音乐的 AI 模型,可以在多种风格和乐器之间进行组合。 Multilingual v2(ElevenLabs):一种语音生成模型,支持 28 种语言的语音合成服务。 3. 在 AI 创客松中,参与同学的分类: 秦超:AI 2C 项目负责人,擅长产品落地服务,具有产品、技术架构和项目管理经验。 kaikai:技术实践者,擅长多 Agent 处理任务流,具备技术实践和团队合作能力。 Cici?:AI 算法开发,想法是宠物与 AI 结合,具有 AI 产品研发和创业经验。 BIN 陈裕彬:CTO,方向是 AI 绘画精灵、AI 推文小说视频生成器,是爆款 AI 小程序作者。 11 鸭鸭呀:产品经理,专注智能写作产品,擅长 Prompt 撰写和 AI 应用。 zz:AI 产品经理,方向是效率工具和游戏,具有大厂经验。 天天向上:AIGC 爱好者,方向是 AI 配音应用,是配音演员,有 AI 预告片制作经验。 烦烦烦??:产品经理,方向是企业服务 AI 应用,具备 PRD 输出和前端开发能力。 周文斌:产品业务负责人,方向是 AI 创业,具有产品规划和研发经验。 Wilson·W:咨询顾问/服务设计师,方向是 AI 组团协作场景,是 GPT4.0 用户,有咨询行业经验。 王蒙:程序员,从事 AI 相关开发,具有后端开发经验。 Nero:产品体验设计师,方向是 AI 绘画、AI 视频,研究 AIGC 方向。
2025-03-26
我是一个没有技术背景且对AI感兴趣的互联网产品经理,目标是希望理解AI的实现原理并且能够跟开发算法工程师沟通交流,请给我举出AI模型或者机器学习的分类吧。
以下是 AI 模型和机器学习的分类: 1. AI(人工智能):是一个广泛的概念,旨在使计算机系统能够模拟人类智能。 2. 机器学习:是人工智能的一个子领域,让计算机通过数据学习来提高性能。包括以下几种类型: 监督学习:使用有标签的训练数据,算法学习输入和输出之间的映射关系,包括分类和回归任务。 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务如聚类。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训练小狗。 3. 深度学习:是机器学习的一个子领域,模拟人脑创建人工神经网络处理数据,包含多个处理层,在图像识别、语音识别和自然语言处理等任务中表现出色。 4. 大语言模型:是深度学习在自然语言处理领域的应用,目标是理解和生成人类语言,如 ChatGPT、文心一言等。同时具有生成式 AI 的特点,能够生成文本、图像、音频和视频等内容。 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖循环神经网络或卷积神经网络。生成式 AI 生成的内容称为 AIGC。
2025-03-26