直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
主流大厂目前的agi 进展
目前主流大厂在 AGI 方面的进展情况如下: 2023 年之前,国内 AI 行业自认为与美国差距不大,但 ChatGPT 和 GPT4 的出现打破了这种认知,OpenAI 直接拉开了 2 年的技术差距。 2023 年上半年,国内大厂纷纷囤卡招人,研究类 GPT 架构,或成立创业公司,试图创造国产 AGI。但下半年发现不容易后,纷纷转向“垂直应用”“商业化”,不再提 AGI。 国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距。 百度和阿里在大厂中比较高调,百度的“文心 4.0”是当前国内能力较好的模型之一,即将发布的阿里的“通义千问”也备受关注。 大厂们在人才、GPU、数据和资金储备方面具备冲击 AGI 的条件,但实际效果尚无明确亮点,且受内部短期考核压力影响,多数力量用于卷新产品和向上汇报工作,同时还背负其他业务和政治考量。
2024-11-12
文生图
以下是关于文生图的相关知识: 简明操作流程: 定主题:明确生成图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora 以控制图片效果和质量。 ControlNet:可控制图片中特定图像,如人物姿态、特定文字等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:可无脑选择 840000。 Prompt 提示词:用英文写需求,单词和短语组合,用英文半角逗号隔开。 负向提示词 Negative Prompt:用英文写避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:一般选 DPM++ 2M Karras,也可参考模型作者推荐的采样器。 采样次数:选 DPM++ 2M Karras 时,一般在 30 40 次。 尺寸:根据需求和喜好选择,注意尺寸并非越大越好。 提示词写作: 分为内容型提示词和标准化提示词,内容型提示词用于描述想要的画面。 例如选择 anythingV5 模型,输入“1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面”等描述,并翻译成英文。 采样迭代步数通常控制在 20 40 之间。 常用采样方法有 Euler a、DPM++2S a Karras、DPM++2M Karras、DPM++ SDE Karras、DDIM 等,有的模型有指定算法,搭配使用效果更好。 比例设置为 800:400,高宽比尽量接近 512x512,太大的数值可能导致奇怪构图,如需高清图可使用高清修复放大图像倍率。 常见工具: DALL·E:OpenAI 推出,可根据文本描述生成逼真图片。 StableDiffusion:开源,能生成高质量图片,支持多种模型和算法。 MidJourney:图像生成效果好,界面用户友好,在创意设计人群中流行。 更多工具可在 WaytoAGI 网站(https://www.waytoagi.com/category/104 )查看。
2024-11-12
为什么AI那么厉害
AI 之所以厉害,原因主要包括以下几点: 1. 具有非凡的潜力,能够在众多领域得到应用,如改善社会和经济,其影响力可与电力和互联网相媲美,能推动增长并创造就业机会。 2. 可支持人们完成现有工作,提高劳动力效率和工作场所安全性。 3. 是人类研究世界的有力工具,能帮助解决基础科学面临的瓶颈,例如在生物领域能快速计算蛋白质的折叠结构。 4. 不断发展和创新,如 GPT4 的升级,能为用户提供更多帮助。但同时也存在耗能等问题。
2024-11-12
国内有哪些AI出海产品
国内的 AI 出海产品有 ThinkAny、GenSpark、Devv 等。 在图像类 AI 产品方面,国内有可灵和通义万相。可灵由快手团队开发,用于生成高质量的图像和视频,图像质量高,但价格相对较高;通义万相是阿里旗下的工具,在中文理解和处理方面表现出色,用户可选择多种艺术和图像风格,操作界面简洁直观,且目前免费,但在某些方面存在局限性。 在 PPT 类 AI 产品方面,国内推荐爱设计 PPT,其背后有强大的团队,能敏锐把握市场机遇,已确立市场领先地位,能提高制作效率并保证高质量输出。
2024-11-12
0基础怎么快速学会做AI
对于 0 基础学习 AI,您可以参考以下步骤: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,您还可以参考以下具体的学习活动: 1. 参加“AI 编程共学”活动,例如: 10 月 28 日 20:00 开始的“0 基础做小游戏分享:通往 AGI 之路增量小游戏、转生之我是野菩萨”,回放链接:。 10 月 29 日 20:00 开始的“0 编程基础入门 Cursor 极简使用指南”,回放链接:。 10 月 30 日 20:00 开始的“0 基础学做 AI 拍立得:Coze 工作流实现手把手教学、AI 拍立得开源代码开箱即用”,回放链接:。 10 月 31 日 20:00 开始的“0 基础做小游戏分享:猪猪?撞南墙”,回放链接:。 2. 对于技术纯小白,您可以: 从一个最最基础的小任务开始,让 AI 先帮您按照 best practice 写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,学会必备的调试技能。 通过和 AI 的对话,逐步明确项目需求,让 AI 帮助您梳理出产品需求文档。
2024-11-12
AI如何在平面设计工作流中提高效率,具体的步骤有哪些
以下是 AI 在平面设计工作流中提高效率的具体步骤和相关信息: 1. 工具选择 主要工具:Midjourney 和 Stabel Diffusion。 辅助工具:RUNWAY 和 PS beta 等。 2. 工作流效果 创意多样:设计解决方案更为多样和创新,项目中不同创意概念的提出数量增加了 150%。 执行加速:AI 生成的设计灵感和概念显著缩短了创意阶段所需时间,设计师在创意生成阶段的时间缩短了平均 60%。 整体提效:在整体项目的设计时间减少了 18%。 3. 提升能力的方法 建立针对性的 AI 工作流:使用 lora 模型训练的方式,生成特定的形象及 KV 风格,建立包含品牌形象、风格视觉 DNA 的模型,并根据实用场景进行分类。 实用的模型训练:在营销活动期间,根据市场环境和消费者偏好的变化迅速调整 lora 模型。 AI 设计资产储备:建立和管理 AI 设计资产,沉淀相关知识、技能、工具,促进团队内部的知识积累和提升。 此外,对于建筑设计师审核规划平面图,以下是一些可用的 AI 工具: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster。 Maket.ai:面向住宅行业,在户型和室内软装设计方面有探索,能根据输入需求自动生成户型图。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期可引入标准和规范约束设计结果。 Fast AI 人工智能审图平台:形成全自动智能审图流程,实现数据的汇总与管理。 但每个工具都有其特定应用场景和功能,建议根据具体需求选择合适的工具。
2024-11-12
从0到1学习大模型知识
以下是从 0 到 1 学习大模型知识的相关内容: 什么是大模型: 通俗来讲,大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练和使用过程: 1. 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练自己的大模型。 2. 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。 3. 找老师:用合适算法让大模型更好理解 Token 之间的关系。 4. 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,正式干活,比如进行翻译、问答等,在大模型里称之为推导(infer)。在 LLM 中,Token 被视为模型处理和生成的文本单位,会对输入进行数字化形成词汇表。 大模型如何运作: 打个比方,“我今天吃了狮子头和蔬菜”这句话,在 transformer 中,会由 attention 层对其加入更多信息补充,如“狮子头是一道菜”“今天是星期六”等,这些补充信息会作为输入给到下一个 attention 层,最终哪些信息补充、保留、传递由模型自主学习。层与层之间就像人阅读文章时的连贯性注意力过程,大模型以词向量和 transformer 模型学习海量知识,把知识作为向量空间中的关系网存储,接受输入时通过向量空间中的匹配进行输出。这个过程像人脑阅读学习,记忆的不是逐字逐句,而是按相关性、重要程度结合历史经验,比如看到红色会觉得代表温暖、强烈。 大模型的整体架构: 从整体分层角度,大模型架构可分为以下几层: 1. 基础层:为大模型提供硬件支撑、数据支持,如 A100、数据服务器等。 2. 数据层:分为静态的知识库和动态的三方数据集,不是用于基层模型训练的数据基集,而是企业根据自身特性维护的垂域数据。 3. 模型层:包括 LLm(largelanguagemodel,如 GPT,一般使用 transformer 算法实现)或多模态模型(如文生图、图生图等,训练数据与 llm 不同,用图文或声音等多模态数据集)。 4. 平台层:如大模型的评测体系或 langchain 平台等,提供模型与应用间的组成部分。 5. 表现层:即应用层,是用户实际看到的地方。
2024-11-12
数字人软件
以下是一些制作数字人的工具: 1. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,只需上传人像照片和输入要说的内容,平台的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化。使用时请遵守相关条款和政策,并注意版权和伦理责任。 此外,关于数字人的一些实战操作: 剪映数字人“个性化”:可用 AI 换脸软件完成,如: 1. 第一步打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费。点击红框对应的 URL 打开操作界面。 2. 第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 3. 第三步:等待专属数字人视频出炉。 用剪映制作数字人视频: 1. 在剪映右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”添加到视频中,软件会生成对应音视频并添加到轨道中,左下角提示渲染完成,可点击预览查看效果。 2. 增加背景图片:删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”按钮选择本地图片上传,将图片添加到视频轨道,可通过拖拽轨道右侧竖线使其与视频对齐,选中轨道可调整图片大小和数字人位置。
2024-11-12
学习AICG的步骤
学习 AICG(AI 与计算机图形学)通常可以遵循以下步骤: 1. 基础知识储备:了解计算机图形学的基本概念,如几何建模、渲染、动画等,同时掌握一定的数学基础,包括线性代数、微积分等。 2. 学习编程语言:例如 Python,它在 AICG 领域应用广泛。 3. 熟悉相关框架和库:如 TensorFlow、PyTorch 等深度学习框架,以及 OpenCV 等计算机视觉库。 4. 掌握机器学习和深度学习知识:包括神经网络、监督学习、无监督学习等。 5. 研究 AICG 应用案例:通过实际案例了解 AICG 在图像生成、风格迁移、虚拟角色创建等方面的应用。 6. 实践项目:自己动手实现一些 AICG 项目,加深对知识的理解和应用能力。 7. 持续学习和跟进最新技术:关注领域内的最新研究成果和技术发展趋势。
2024-11-12
我想请教一些问题 1:目前有哪些AI教育类产品 2:目前有哪些AI辅助学习类产品 3:有哪些AI辅助学习的好用的方法
以下是关于您所提出问题的回答: 目前的 AI 教育类产品和 AI 辅助学习类产品有: 语言学习方面:Speak、Quazel、Lingostar 等是由 AI 驱动的语言老师,能够实时交流并给予发音或措辞反馈;Grammarly 可进行英语写作和语法纠错。 数学学习方面:Photomath、Mathly 可指导学生解决数学问题;Khan Academy 有自适应学习系统。 综合学习方面:Duolingo 是自适应学习平台,能为用户提供个性化学习内容和练习。 AI 辅助学习的好用方法包括: 英语学习:利用智能辅助工具如 Grammarly 改进写作和语法;通过语音识别应用如 Call Annie 练习口语和纠正发音;使用自适应学习平台如 Duolingo 获得个性化学习计划;借助智能对话机器人如 ChatGPT 进行会话练习。 数学学习:运用自适应学习系统如 Khan Academy 获取精准推荐;使用智能题库和作业辅助工具如 Photomath 获得问题解答和解题步骤;借助虚拟教学助手如 Socratic 解答问题、观看教学视频和获得答疑服务;参与交互式学习平台如 Wolfram Alpha 进行数学建模和问题求解。
2024-11-12