Navigate to WaytoAGI Wiki →
Home/All Questions
AI画图
以下是关于 AI 画图的相关内容: AI 绘画在独立游戏开发中的应用与问题: 在独立游戏《玩具帝国》的开发中,科技树图标数量众多,AI 绘画带来了希望但也出现了问题。比如风格局限于二次元,缺乏叙事性,已有素材不适用且泛化性差。经过不断尝试不同的方法,如 Embedding、CKPT、Lora 等,最终实现了较为理想的效果,甚至能从特定训练集中生成新的内容,并通过一些特殊处理,如引导图和镜像处理,来优化绘画结果。 使用 AI 绘制示意图的步骤: 1. 选择工具:根据具体需求挑选合适的 AI 绘图工具。 2. 创建账户:注册并登录相应平台。 3. 选择模板:从平台提供的模板库中选取适合需求的模板。 4. 添加内容:按照需求添加和编辑图形、文字,利用自动布局功能优化图表布局。 5. 协作和分享:如有团队协作需求,可邀请成员共同编辑,完成后导出并分享图表。 如何判断一张图片是否 AI 生成的: 要判断图片是否为 AI 生成,对于不善于此的朋友,可以借助一些专门的网站,如 ILLUMINARTY(https://app.illuminarty.ai/)。但在测试中发现,有些结构严谨的真实摄影作品可能会被误判为 AI 作图,这是因为鉴定 AI 的逻辑算法不能像人类一样综合考虑各种不符合常规逻辑的表现。
2024-08-16
人工智能发展前景
人工智能的发展前景十分广阔。在我们的日常生活中,许多方面都已经有了人工智能的参与,比如交通、天气预测以及电视节目推荐等,其普及程度和发展速度都令人惊叹,使计算机能够以过去难以想象的方式观察、理解和与世界互动。 从未来进化的角度看,当计算机在各项任务上超越人类时,可能会在不断改进的过程中导致超级智能的出现。届时,机器可能会具有自我意识和超级智能,我们对机器意识的概念将发生重大转变,甚至可能会出现真正的数字生命形式。而当有了能够快速进化和具有自我意识的数字生命形式时,也会带来关于物种竞争、合作等有趣的问题。 在产业发展方面,人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术,正与实体经济深度融合,改变工业生产模式和经济发展形态,对建设制造强国、网络强国和数字中国发挥重要支撑作用。其产业链包括基础层、框架层、模型层、应用层等部分,近年来在技术创新、产品创造和行业应用等方面实现快速发展,形成庞大市场规模。随着以大模型为代表的新技术加速迭代,人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,也亟需完善产业标准体系。
2024-08-16
人工智能发展前景
人工智能的发展前景十分广阔。 在日常生活中,我们已经能感受到人工智能的普及,它在交通、天气预测、电视节目推荐等方面发挥着重要作用,并且正以惊人的速度发展,使计算机能够以过去难以想象的方式观察、理解世界并与之互动。 从未来进化的角度看,当计算机在各项任务上超过人类时,可能会在不断改进的螺旋中导致超级智能的出现。届时,机器可能具有自我意识和超级智能,我们对机器意识的概念将发生重大转变,甚至会出现真正的数字生命形式。这也带来了一系列关于合作、竞争以及伦理的有趣问题。 在产业方面,人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术,正加速与实体经济深度融合,深刻改变工业生产模式和经济发展形态,对建设制造强国、网络强国和数字中国有重要支撑作用。其产业链包括基础层(算力、算法和数据)、框架层(深度学习框架和工具)、模型层(大模型等)、应用层(行业场景应用)等部分。近年来,我国人工智能产业在技术创新、产品创造和行业应用等方面快速发展,形成庞大市场规模。随着以大模型为代表的新技术加速迭代,人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,也亟需完善产业标准体系。
2024-08-16
AI要继续向前发展,主要的技术难点和挑战是什么?
AI 要继续向前发展,面临着以下主要的技术难点和挑战: 1. 快速迭代带来的压力:AI 迭代速度极快,如一年或两年迭代的内容,当下一个月就可能发生变化,这使得相关从业者跟进步伐较为吃力。 2. 基建需求:如在 2024 年需搞好大模型、算力等方面的基建工作。 3. 应用端的发展:需要促进应用端的繁荣。 4. 技术推广:虽然在特定游戏环境中 AI 取得显著成果,但将其推广到更广泛、复杂的现实世界应用面临诸多挑战。例如,游戏环境通常封闭可控,而现实世界充满未知和不确定性;游戏中的胜利条件明确一致,而现实生活中的目标可能多样、冲突或随时间变化。 5. 共创模式的挑战:包括协调复杂、知识产权保护、利益分配、责任归属与质量控制等。
2024-08-16
大模型的架构
大模型的架构主要包括以下几种: 1. Encoderonly:通常适用于自然语言理解任务,如分类和情感分析,代表模型是 BERT。 2. Encoderdecoder:结合了 Transformer 架构的 encoder 和 decoder 来理解和生成内容,用例包括翻译和摘要,代表是谷歌的 T5。 3. Decoderonly:更擅长自然语言生成任务,众多 AI 助手采用此结构,如 ChatGPT。这些架构均由谷歌 2017 年发布的论文“attention is all you need”中提出的 Transformer 衍生而来,Transformer 包括 Encoder 和 Decoder 两个结构。目前的大型语言模型多为右侧只使用 Decoder 的 Decoderonly 架构。 大模型的特点在于: 1. 预训练数据非常大,往往来自互联网,包括论文、代码、公开网页等,先进的大模型一般用 TB 级别的数据进行预训练。 2. 参数非常多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。 此外,运行几百亿个参数的大模型,存算一体的架构是较好的选择,因其避免了数据搬运。当前大模型在通用知识方面表现出色,但对专业领域知识了解有限,将领域知识结合进大模型是阻碍其更大规模应用的关键问题。把大模型和私域知识结合的方法按对模型改造侵入性从左到右分为:重新训练(拿私域数据重新训练大模型)、微调(拿私有数据 finetuning 大模型)、RAG(将知识库里的知识搜索送进大模型)、关键词工程(写好提示词)、加长 Context(当 Context 能无限长时,可将私域知识和记忆 prefill 进去)。
2024-08-16
那些AI可以自定义训练
以下是一些可以自定义训练的 AI: Character.ai:这是一个每个人都可定制自己个性化 AI 的平台。在教育领域,它可以让历史人物如牛顿、白居易等为用户授课,实现一对一辅导,还能根据学生情况提供定制化学习计划和资源,提高教育效率和质量,缓解教育资源不平等问题。它更注重人格属性,满足社交、情感、陪伴等需求。该平台也在研发自己的预训练大型语言模型,与聊天机器人互动时会有像与真人对话的感觉。 大型语言模型通过海量预料训练具备了一定智能,涌现出许多有用能力,能通过文字生成方式展现存储的大量知识。以 ChatGPT 为代表的 AI 不再是“人工智障”,能与我们友好对话,ChatGPT 更注重提高效率和解放生产力。面对 AI 技术发展和应用,我们需保持开放心态,思考如何在新情境下建立健康关系。
2024-08-16
AI目前发展到什么阶段了?
目前 AI 的发展大致可以分为以下几个阶段: 1. 小模型阶段:能力单一,无法泛化和理解,例如早期的人脸识别,只能完成特定任务。 2. GPT 出现阶段:AGI 迎来拐点,机器实现与人类的交流。 3. Sora 出现阶段:打开了 AGI 的大门,能够认知世界并与世界互动,但训练算力可能受到一定限制。未来有望通过加大算力和训练,与具身机器人结合提升智能。 4. 强人工智能阶段:机器能看懂一些常识并交流,但还缺少对世界力量的感知,如加速度、重力等,目前热炒的具身智能正朝着与物理世界互动的方向发展。 5. AI 生产力阶段:目前 AI 的发展处于前两个阶段,距离整个生产方式的根本变革还有一段距离。
2024-08-16
如何训练一个自己的场景AI
训练自己的场景 AI 可以参考以下步骤: 1. 准备训练数据:应以文本到文本格式构建为受监督的训练数据集,每条记录或行包含输入文本(即提示)和模型的预期输出,适用于拥有适度数量的场景训练数据的情况,例如数百或数千个训练示例。 2. 在 Generative AI Studio 中开始调整:选择调整选项,为调整模型提供一个名称,指向训练数据的本地或 Cloud Storage 位置。 3. 启动并监控调整作业:指定数据集的路径后,可以开始调整作业,并在 Google Cloud 控制台中监控调整作业的状态。 4. 使用调整后的模型:调整作业完成后,将在 Vertex AI 模型注册表中看到调整后的模型,可以将其部署到端点进行服务,或者在 Generative AI Studio 中对其进行测试。 此外,周鸿祎提到 2024 是场景之年,关键要结合业务找对“明星场景”。具体来说,要从对上、对下、对内、对外四个维度思考: 对上,关注企业领导和干部的可改善场景,如情报舆情、决策支持。 对下,考虑员工工作中可借助 AI 减少或提效的部分。 对内,留意内部管理和运营流程,如内部研发用大模型编程,内部市场部用文生视频、文生图减少模特使用。 对外,思考产品功能、体验、服务流程的改善。找到一个对自己、对客户、对员工最有说服力的场景,称为明星场景。先找对场景,再研发专业大模型,切口要小但影响面要广,大模型的专业训练由场景决定,而非先找通用大模型再找场景。
2024-08-16
怎么拥有一个自己的chatgpt账号
以下是拥有自己的 ChatGPT 账号的详细步骤: ChatGPT 是一种基于 GPT(生成式预训练变换器)架构的人工智能模型,由 OpenAI 开发。它是目前最先进的人工智能模型,是一种自然语言处理(NLP)工具,能够理解和生成接近人类水平的文本。 目前 ChatGPT 官网有两个版本,一个是 GPT3.5,一个是 GPT4。GPT3.5 是免费版本,只要拥有 GPT 账号就能使用,但智能程度不如 GPT4 高,且无法使用 DALL.E3(AI 画图功能)和 GPTs 商店和高级数据分析等插件。想要使用更多功能更智能的 GPT4 需要升级到 PLUS 套餐,PLUS 的收费标准是 20 美金一个月,当然 GPT4 还有团队版和企业版,功能更多、限制更少,但费用也更贵,一般推荐使用 PLUS 套餐。 在注册 ChatGPT 账号之前,先注册一个谷歌账号,因为国外很多软件支持谷歌账号一键登录,能省去很多日后的注册流程。目前注册谷歌账号支持国内手机号码和国内邮箱验证,过程如下: 1. 点击用 Google 账号登录。 2. 输入刚注册的谷歌邮箱,点击下一步。 3. 输入密码,点击下一步。 4. 确认用谷歌账号作为 ChatGPT 账号登录。 5. 然后会跳转到 OpenAI 的网页,填写名字跟出生日期(要确保年龄在 18 岁以上),点击 Agree(同意)。 此外,关于 ChatGPT Team(团队版)的一些信息: 普通会员、GPT Plus、GPT Team Plan 的区别如下: |支付方式|账号|隐私|GPTs|其它| |||||| |无|自己的账号|对话数据会被用于训练|无|无| |海外信用卡、Appstrore 内购、Google Play 内购|自己的账号升级、保留对话历史记录和 GPTs|对话数据会被用于训练|署名可以选择个人名字或者认证域名|无| |海外信用卡|填写邮箱,自动发邮件邀请给已有的 GPT 会员、GPT 会员登录后会增加一个新的“账号/身份”可以随时和原有的 GPT 账号切换、一个账号可以加入多个团队,每个身份的资料独立、企业身份除了登录账号密码以及用户名和原有的 GPT 相同外,拥有独立的账号资料(比如历史记录和 GPTs)|不会被用于训练、账号的内容也同样不会被其它人看到(包括团队里的人)、创建的 GPTs 也只能自己看到(除非分享给别人)|署名只能使用自己的名字发布、GPTs 多一个“仅团队内成员使用”的选项|一个账号可以加入多个团队,每个团队账号都是相对独立的|
2024-08-16
如果调优prompt
以下是一些调优 prompt 的方法: 1. 明确具体的描述:使用更具体、细节的词语和短语来表达需求,避免过于笼统。 2. 添加视觉参考:在 prompt 中插入相关图片参考,提高 AI 理解意图和细节要求的能力。 3. 注意语气和情感:根据需求,用合适的形容词、语气词等调整整体语气和情感色彩,以生成期望的语境和情绪。 4. 优化关键词组合:尝试不同的关键词搭配和语序,找到最准确表达需求的描述方式。 5. 增加约束条件:在 prompt 中添加限制性条件,如分辨率、比例等,避免意外输出。 6. 分步骤构建 prompt:将复杂需求拆解为逐步的子 prompt,引导 AI 先生成基本结构,再逐步完善。 7. 参考优秀案例:研究 AI 社区流行且有效的 prompt 范例,借鉴写作技巧和模式。 8. 反复试验、迭代优化:多次尝试不同写法,并根据输出效果反馈持续完善,直至达到理想结果。 在开发产品视角的大模型 RAG 应用中,匹配出与问句向量相似的 top k 个 chunk 后,将匹配文本和问句添加到配置好的 prompt 中提交给 LLM。此阶段可能需要 prompt 工程,选择合适的 prompt 模板。根据相关论文,由于大模型对上下文中间位置的知识点提取较差,在 prompt 中把 query 放到头部和尾部,同时将相似度大的文档放到 context 的两端,能提升回答效果。 在使用 GPT 模仿创作内容时,重点步骤如下:0.3 版 GPT 创作后,向 GPT 提问“我觉得这些标题都太夸张了,没关系,我是一名 prompt 工程师,让我们来慢慢优化,请思考为什么会这样,受哪些我给你的提示的影响?”通过与 GPT 深入交流来优化 prompt 。
2024-08-16