直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
哪里可以学习最新AI
以下是一些学习最新 AI 的途径和建议: 1. 持续学习和跟进:AI 是快速发展的领域,新成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。 2. 加入相关社群和组织:参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。例如“通往 AGI 之路”这样的中文知识库和社区平台,它汇集了上千个人工智能网站和工具,提供最新的 AI 工具、应用、智能体和行业资讯,还有丰富的学习资源、实践活动,并倡导开放共享的知识体系。 3. 参考学习日记:如《雪梅 May 的 AI 学习日记》,其中提到适合纯 AI 小白的学习模式,即输入→模仿→自发创造。但需注意学习内容可能因 AI 发展而变化,可在相关社区发现自己感兴趣的领域,学习最新内容。 4. 利用免费开源资源:很多学习资源是免费开源的,充分利用这些资源进行学习。
2025-02-18
AI术语
以下是一些常见的 AI 术语: Forward Prediction:前向预测 Forward Reaction Prediction:前向反应预测 Fuzzy Logic:模糊逻辑 Fuzzy Neural Networks:模糊神经网络 GaBased Approaches:基于遗传算法的方法 Garbage In, Garbage Out:无用数据入、无用数据出 GasPhase Networks:气相网络 Gaussian Kernels:高斯核 GaussianType Structure Descriptors:高斯型结构描述符 General Intelligence:通用智能 Generalized Gradient Approximation:广义梯度近似 DataDriven Spectral Analysis:数据驱动的光谱分析 DataMining:数据挖掘 Database:数据库 DE Algorithm:差分进化算法 Deeplift:DeepLift 模型 Dendrogram:树状图 Density Functional Theory:密度泛函理论 DensityBased Spatial Clustering Of Applications With Noise:DBSCAN 密度聚类 Descriptor:描述符 DFT Calculations:DFT 计算 Dice Similarity:戴斯相似度 Differential Evolution:差分进化 Parametric Case:有参情况 Parametric Density Estimation:参数密度估计 Parametric Model:参数化模型 Parametric ReLU:参数化修正线性单元/参数化整流线性单元 Parse Tree:解析树 PartOfSpeech Tagging:词性标注 Partial Derivative:偏导数 Partially Observable Markov Decision Processes:部分可观测马尔可夫决策过程 Particle Swarm Optimization:粒子群优化算法 Partition:划分 Partition Function:配分函数
2025-02-18
零基础学习ai先学习哪一步
对于零基础学习 AI,您可以按照以下步骤进行: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念。了解人工智能是什么,其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 可以参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 总之,无论是零基础还是中学生,都可以从编程基础、工具体验、知识学习、实践项目等多个方面入手,全面系统地学习 AI 知识和技能。
2025-02-18
数字人项目
以下是关于数字人项目的相关信息: 构建高质量的 AI 数字人: 建好的数字人模型可以使用 web 前端页面(如 Live2D 提供的 web 端 SDK)或者 Native 的可执行程序进行部署,最终以 GUI 的形式呈现给用户。 开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择 live2d 作为数字人躯壳,原因是其驱动方式相比 AI 生成式更可控和自然,相比虚幻引擎更轻量和简单。卡通二次元形象的接受度更高,超写实风格在目前技术下易出现一致性问题和恐怖谷效应。Live2d 的 SDK 驱动方式可参考官方示例:https://github.com/Live2D 。 MimicMotion 项目: 腾讯发布的 MimicMotion 项目效果显著优于阿里,支持面部特征和唇形同步,不仅用于跳舞视频,也可应用于数字人。 相较阿里的方案,MimicMotion 的优化包括:基于置信度的姿态引导机制,确保生成视频更加连贯流畅;基于姿态置信度的区域损失放大技术,显著减少图像扭曲和变形;创新的渐进式融合策略,在可接受的计算资源消耗下,实现任意长度视频生成。项目地址:https://github.com/tencent/MimicMotion ,节点地址:https://github.com/AIFSH/ComfyUIMimicMotion 。 爱的传承·数字母亲: 内容负责人:朱睿电子酒 统筹负责人:张小琳电子酒 摄影:万阳 剪辑:萧川布丁子健 数字人:大萌子 使用工具:剪辑:剪映、imovie、美图秀秀;数字人:heygen 为完成数字人的拍摄,朱妈妈吃了 4 片吗啡。2 月 4 号制作完数字人,2 月 5 号拍摄,布丁川川子健凌晨开始剪辑,协调补拍追加了很多镜头,朱哥也熬了几个通宵来丰满素材。虽然最后呈现的效果不完美,但相信这部片子具有一定的社会价值。
2025-02-18
大模型产品对比
以下是对一些大模型产品的对比介绍: 智谱清言:由智谱 AI 和清华大学推出,基础模型为 ChatGLM 大模型。2023 年 10 月 27 日,智谱 AI 于 2023 中国计算机大会(CNCC)上推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。 模型特点:在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三。更擅长专业能力,但代码能力有优化空间,知识百科稍显不足,是很有竞争力的大模型。 适合应用:场景广泛,可优先推进在 AI 智能体方面相关的应用,包括任务规划、工具使用及长文本记忆相关场景,在较复杂推理应用上效果不错,也适用于广告文案、文学写作。 其他大模型产品: OpenAI 发布 GPT4 科大讯飞发布星火 1.0 及升级至星火 3.0 百度发布文心一言 1.0 及升级至 V3.5 清华开源 ChatGLM 360 发布 360 智脑 1.0 及升级至智脑 4.0 复旦开源 MOSS 元语开源 ChatYuan 阿里云发布通义千问 1.0 及开源 Qwen7B 商汤科技发布商量 1.0 及升级至商量 2.0、商量 3.0 昆仑万维发布天工 1.0 出门问问发布序列猴子 华为发布盘古 3.0 西湖心辰发布西湖大模型 云从科技发布从容大模型 理想汽车发布 MindGPT OPPO 发布 AndesGPT vivo 发布 BlueLM 小米发布大模型 MiLM 元象科技开源 XVERSE13B Google 发布多模态大模型 Gemini 上海人工智能实验室开源 InternLM20B 百川智能发布 Baichuan2—Turbo 关于大模型在营销方面的应用: 大模型在实体类产品的营销标语生成上表现较好,虚拟类产品相对欠佳。可能是因为大模型训练数据中实体类语料多,更能调用已有知识加工,而虚拟类产品非标准品,大模型认识不足。 情绪价值在营销领域有很多用武之地,除快消商品外,很多产品的营销需要反复沟通,虚拟产品对感性成交依赖更大,大模型在这方面仍有很大发展空间。
2025-02-18
我想创业,花多少钱,能够搭建一个视频领域的AI模型
在视频领域搭建 AI 模型的成本因多种因素而异。对于创业者或小公司来说,这个领域存在一定的挑战。 腾讯的混元 AI 视频模型目前只支持文生视频,且已开源免费。 在模型供应商方面,不同供应商的特点和成本有所不同: 智谱 GLM4V 是通用视觉类大模型,为拍立得最早使用的模型,接口响应速度快,指令灵活性差一些,调用成本为 0.05 元/千 tokens。 阿里云百炼 qwenvlplus 也是通用视觉类大模型,是拍立得目前使用的模型,指令灵活性比较丰富,接口调用入门流程长一些,密钥安全性更高,调用成本为 0.008 元/千 tokens,训练成本为 0.03 元/千 tokens。 阶跃星辰是通用视觉类大模型,响应速度快,支持视频理解,输入成本为 0.005 0.015 元/千 tokens,输出成本为 0.02 0.07 元/千 tokens。 百度 PaddlePaddle 是 OCR 垂直小模型,文本识别能力补齐增强,私有化部署有服务费,API 调用在 0.05 0.1 元/次。 此外,获取高质量数据的难度较高,大厂在该领域的护城河深厚。大公司在争取大模型 API 客户方面更具优势,且开源大模型的发展可能会影响创业公司的业务。去年为大客户定制一个大模型的最高订单额可达 1000 万元,而今年则快速降到了百万元级别乃至更低。
2025-02-18
way to agi社群
WaytoAGI(通往 AGI 之路)是一个由一群热爱 AI 的专家和爱好者共同建设的开源知识库和社区平台。它于 2023 年 4 月 26 日诞生,社群的 Slogan 是让更多的人因 AI 而强大,有很多学社和共学共建的活动。在没有任何推广的情况下,一年时间已有超过 70 万(也有提到超过 100 万)用户和超千万次的访问量,是很多 AI 爱好者知识的源头。 WaytoAGI 是一个致力于人工智能学习的中文知识库和社区平台,为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。它具有以下特点: 1. 知识库与社区平台:汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。 2. 学习资源:提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 3. 实践活动:定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 4. 开放共享:引领并推广开放共享的知识体系,倡导共学共创等形式,孵化了 AI 春晚、离谱村等大型共创项目。 目前合作过的公司/产品包括阿里云、通义千问、淘宝、智谱、支付宝、豆包、火山引擎、marscode、coze、堆友、即梦、可灵、MiniMax 海螺 AI、阶跃星辰、百度、Kimi、吐司、liblib、华硕、美团、美的、360、伊利、魔搭、央视频、Civitai、Openart、Tripo3D、青椒云等。您可以打开“waytoagi.com”找到社群。
2025-02-18
线稿转3d
以下是关于线稿转 3D 的相关内容: 1. 教程:线稿上色 Midjourney + Stable Diffusion 3、sd 上色 正关键词:添加增加照片质感常用的 + mj 生成线稿的关键词调整(去掉 mj 里线稿的关键词,一开始嘴巴效果不好,添加了张开嘴巴等关键词,颜色都是可以单独调整控制)+ 风格参数 负关键词:看自己的效果添加。添加一切您不想要的东西,前面调用了词嵌入(bad_prompt_version2neg, badhandv4, easynegative)需要去 c 站下载,这些主要是为了控制人手部错误的,在最后一步放大的时候,却起到了反作用,强行给小猫咪小动物 5 个手指(建议不加,或者建议生成的时候加,放大的时候去掉) 正关键词:, CG, unity, official art, amazing, finely detail, an extremely delicate and beautiful, extremely detailed, 3d, rendering, c4d, blender, octane render 负关键词:back and white, green, blue, purple 真实系大模型:revAnimated v1.2.2 版本 尺寸:最好和您的草稿图保持一致,如果尺寸太大爆显存可以保持和草图一样的比例缩小尺寸 最重要的 ControlNet 设置:上传自己的草图到 ControlNet,点击启用。记得点?的图标让预处理器生效 2. 手把手教你用 AI 做 3d 新年表情包:ai 小鹿给您拜年啦! 直播回放 第一步:从设计稿到 3d 效果图 在平面设计稿——转 3d 这两个节点您可以直接用 AI(MJ 或国产 AI 如即梦等)生成角色,这里为了保持角色高一致性他们用 lllustrator 制作的平面稿转 3d 效果 在即梦图片生成界面中导入参考图参考选项为参考轮廓边缘生图模型选择 图片 2.0 输入提示词,生成图片。这里生成了十次左右然后选择高清放大。 提示词:角色 + 细节描述 + 场景 + 风格材质等,例如:可爱的拟人小鹿角色,米白色鹿角,戴着时尚耳机,穿着红色唐装,衣服中国圆环纹理,喜气洋洋,充满春节过年的氛围。迪士尼皮克斯工作室风格的肖像摄影,色调柔和,模型展示有精细的光泽,白色干净背景,3D 渲染,柔焦 C4D 渲染风格,Blender,知识产权风格,最佳画质,8K,超级详细,简洁,可爱 3. 摊位信息 摊位列表 AI 3D 打印纹身印章 通过 AI 将图片转绘成简约线条插画风格,然后现场 3D 打印出来,最终交付定制化的纹身印章产品。 具体流程: 适用 comfyui 工作流生成 + 输出线稿素材 将线稿生成模型文件 输入 3D 打印机,输出定制图案模型(预计打印时间 3 5 分钟) 印章图案为软性材料 印章颜料为可水洗安全材料,可另选半永久植物染料 摊位区域:E 摊位编号:69 摊位类型:3D 印章
2025-02-18
线稿上色
以下是关于线稿上色(Midjourney + Stable Diffusion)的详细步骤: 1. 线稿产出:使用 Midjourney 生成线稿,关键词如“Black and white line drawing illustration of a cute cat cartoon IP character, black line sketch, wearing a fortune hat, wearing a collar around the neck, Carrying a huge bag containing scrolls and ingots, matching rope and straps at his wrists, Chinese element style, popular toys, blind box toys, Disney style, white background niji 5 style expressive”。 2. PS 手动重绘错误的地方:对于生成的线稿,在 PS 中手动修正一些错误,比如添加阴影等。 3. SD 上色: 关键词:正关键词包括增加照片质感常用的、mj 生成线稿的关键词调整(去掉 mj 里线稿的关键词,针对效果不好的部分添加特定关键词,如嘴巴效果不好添加张开嘴巴等,颜色可单独调整控制)、风格参数,如“, CG, unity, official art, amazing, finely detail, an extremely delicate and beautiful, extremely detailed, 3d, rendering, c4d, blender, octane render, Chinese festive color scheme, open mouth, 1 tooth, The cat has a pair of white gloves, a cute cat cartoon IP character, black line sketch, wearing a hat, wearing a collar around the neck, carrying a huge red bag, matching rope and straps at his wrists, Chinese element style, poular toys, blind box toys, Disney style”;负关键词根据效果添加,如“back and white, green, blue, purple”。 模型选择:真实系大模型选择 revAnimated v1.2.2 版本。 尺寸设置:尺寸最好和草稿图保持一致,如果尺寸太大爆显存可以保持和草图一样的比例缩小尺寸。 ControlNet 设置:上传自己的草图到 ControlNet,点击启用,记得点击?的图标让预处理器生效。 ControlNet 的预处理器有 37 种,可分类理解为线条约束类、canny 边缘检测、scribble 涂鸦、softedge 软边缘检测、lineart 线稿提取等。其中 lineart 线稿提取可能是目前最强的线稿上色功能。例如,从花瓣上找一张线稿图,先通过 invert 预处理将白底黑线处理成黑底白线,然后拖到左边重新载入,切换到 lineart 预处理器和模型进行生成,文生图关键词填写如“, solo, Blue hair, white clothes, white background”。
2025-02-18