直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
2024年AI视频、图像领域市场情况
2024 年在 AI 视频、图像领域,市场呈现出以下情况: 国内方面: 中国开源项目在全球受到关注,成为积极开源贡献者。 DeepSeek 在编码任务中表现出色,推出的 deepseekcoderv2 受到欢迎。 阿里巴巴发布的 Qwen2 系列在视觉能力方面给社区留下深刻印象。 清华大学的自然语言处理实验室资助的 OpenBMB 项目催生了 MiniCPM 项目。 国外方面: Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,且在定制化方面有显著进步,还推出了 Stable Video 3D。 OpenAI 的 Sora 能够生成长达一分钟的视频,并保持三维一致性、物体持久性和高分辨率。 Google DeepMind 的 Veo 能将文本和可选图像提示与嘈杂压缩视频输入相结合,创建独特的压缩视频表示。 从市场数据来看,2024 全年全球 AI 移动应用内付费收入预计为 30 亿美元,其中图像和视频类 AI 应用占据主导地位,收入占比高达 53%。从地区分布来看,北美和欧洲贡献了三分之二的市场份额。 在行业格局方面,云厂商成为 AI 供应链的“链主”,掌握着庞大的商业生态和技术资源。头部阵营基本稳定,大型云厂商在产业链中的地位无可撼动。
2024-12-15
怎样学习和了解ai
以下是新手学习和了解 AI 的方法: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习,同时掌握提示词的技巧。 4. 实践和尝试: 理论学习后,通过实践巩固知识,尝试使用各种产品做出作品。 知识库中有很多实践后的作品、文章分享。 5. 体验 AI 产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式。 6. 持续学习和跟进: 关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。 考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他爱好者和专业人士交流。 此外,对于没有技术背景的普通人,学习或了解 AI 最好的信息源在「即刻」App 的“”等免费圈子里。如果担心信息洪流太大,学不过来,可以尝试以下 5 个技巧: 1. 只掌握最好的产品,少关注新产品测评(除非远超 ChatGPT)。 2. 只解决具体问题,不做泛泛了解。从问题中来,到问题中去。 3. 只关注核心能力,不关注花式玩法,用 AI 扬其长避其短。 4. 只关注理清需求和逻辑,不死记硬背提示词。 5. 先关注提升认知/洞察,然后再谈技巧。
2024-12-15
普通小白如何学习AI人工智能
普通小白学习 AI 人工智能可以参考以下步骤: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,还有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 知识库中有很多大家实践后的作品、文章分享,欢迎实践后分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,以下是一些关于 AI 技术原理的通俗易懂的内容: 1. 概念:生成式 AI 生成的内容叫做 AIGC。 2. 概念与关系: AI 即人工智能。 机器学习是电脑找规律学习,包括监督学习、无监督学习、强化学习。 监督学习是基于有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归。 无监督学习是基于无标签数据,算法自主发现规律,经典任务如聚类。 强化学习是从反馈里学习,最大化奖励或最小化损失,类似训小狗。 深度学习是一种参照人脑的方法,有神经网络和神经元,因层数多称为深度,神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 是大语言模型,对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类。 3. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出 Transformer 模型,它完全基于自注意力机制处理序列数据,不需要依赖循环神经网络或卷积神经网络,Transformer 比 RNN 更适合处理文本的长距离依赖性。
2024-12-14
提示词反推
以下是关于提示词反推的相关信息: 根据图片反推提示词,可以设置替换词。目前使用 Google Gemini API 作为后端服务,需确保网络环境能正常使用 Gemini。在申请 API key,并将其填到插件根目录下的 api_key.ini 文件(默认名字是 api_key.ini.example,初次使用需将文件后缀改为.ini,用文本编辑软件打开,在 google_api_key=后面填入 API key 并保存)。节点选项包括:api(目前只有"geminiprovision"一个选项)、token_limit(生成提示词的最大 token 限制)、exclude_word(需要排除的关键词)、replace_with_word(替换 exclude_word 的关键词)。 在 ComfyUI 里使用 MiniCPM 做图片提示词反推与文本提示词生成,可以和 flux 模型配合生成图片。建议使用量化版本的模型(int4 结尾)以节省显存。安装方法为:进入 ComfyUI 自定义节点目录,克隆相关仓库,重启 ComfyUI。模型可从网盘下载后放入 ComfyUI 的 models 文件夹下 MiniCPM 文件夹中,没有就新建一个。 对于【SD】文生图的提示词,例如:英文为:,(toomany finger 。
2024-12-14
AI在电商领域的应用场景
AI 在电商领域有以下应用场景: 1. 产品推荐:通过分析客户数据,为每个客户推荐可能感兴趣的产品。 2. 搜索和个性化:改善搜索结果,为客户提供个性化的购物体验。 3. 动态定价:根据市场需求动态调整产品价格。 4. 聊天机器人:提供服务,回答客户问题并解决他们的问题。 在生成式 AI 方面,电子商务已成为富有成效的垂直行业之一。相关工具可帮助品牌创建引人注目的产品照片,如将连衣裙的静态照片变成女人穿着裙子在花园行走的形象,预期未来用途将极度个性化,如展示沙发在用户公寓中的照片。品牌还能通过 AI 创作多种内容类型,如用于电子邮件或社交媒体的营销材料、SEO 优化的产品描述等。未来,用户有望仅通过描述期望的审美并点击按钮,创建完整的电商商店及市场营销材料。 此外,还有以下案例场景: 1. 品牌:提升品牌价值,涉及品牌洋葱图思维模型、产品信息、人群等 19 个关键词库。 2. 品牌:分析品牌舆论传播,涵盖舆论传播、数据分析、主题等 25 个关键词库。 3. 推广:制定上市推广方案,包含品牌、产品信息、新品等 28 个关键词库。
2024-12-14
表格处理AI
以下是关于 Excel 的 AI 工具和利用 AI 写小说的相关内容: 关于 Excel 的 AI 工具: 目前有几种不同的工具和插件可以增强 Excel 的数据处理和分析能力: 1. Excel Labs:这是一个 Excel 插件,新增了基于 OpenAI 技术的生成式 AI 功能,可在 Excel 中直接利用 AI 进行数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的 AI 工具,整合了多种办公软件,用户通过聊天形式告知需求,Copilot 自动完成任务,包括 Excel 中的数据分析和格式创建等。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户可通过自然语言交互式地进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,除公式生成外,还能根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 这些工具通过 AI 技术提升了 Excel 的数据处理能力,未来可能会有更多 AI 功能被集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。 利用 AI 写小说: 南瓜博士平生第一次写小说获奖,是在 AI 的帮助下完成的。首先让 AI 写故事概要和角色背景介绍,并在此基础上按自己的审美略做修改。为了让细节描写更出色,采用了让 AI 以表格形式输出细节描述的技巧,这样有三个好处:一是打破 AI 原本的叙事习惯,避免陈词滥调;二是按编号做局部调整容易,指哪改哪,其他内容能稳定不变;三是确保内容都是具体细节,避免整段输出时缩减导致丢光细节只剩笼统介绍。之后把生成的表格依次复制粘贴,AI 就能照着写文章,偶尔需要作者帮忙给点建议。但在修改过程中遇到了问题,小说字数超过要求,让 GPT4 做修改时它很快暴露出记性不好的缺点,求助 Claude 时它把关键情节改没了。
2024-12-14
bot是什么
Bot 即“机器人”,在不同的场景中有不同的具体含义和作用。 在 Coze 平台上,Bot 是自动化的程序,可以执行特定的任务,比如自动回复用户的消息。 例如“爸妈防骗助手”这一 Bot,主要通过对用户发送的内容的真假进行鉴别,包括问题(文本)、链接(网页)、图片内容,然后给出相关鉴别结果和分析,支持热情回复和冷淡回复,可以帮助年轻人和父母更好地沟通。 在“沉浸式单机剧本杀 Bot”中,不仅充当剧本杀的主持人,还会在关键时刻引导玩家,并通过发放道具推动情节发展,让玩家无需依赖多人成局,就能享受沉浸式的游戏体验。其由多个 agent 共同协作完成,包括主持人 Agent、条件判断 Agent 等。
2024-12-14
秘塔是ai吗
秘塔是 AI 。秘塔科技开发了秘塔 AI 搜索,它提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能,旨在提升用户的搜索效率和体验。在一些关于 AI 时代搜索的介绍中,也将秘塔 AI 搜索作为示例,指出其没有广告,能直达结果。同时在相关的比较和讨论中,也有涉及到秘塔。
2024-12-14
怎么用你制作PPT?
以下是使用 AI 制作 PPT 的几种方法: 1. 传统流程: 确定主题。 拟定大纲目录。 补充内容。 美化页面。 2. 借助 ChatGPT 结合其他工具: 确定主题,如针对小白如何快速入门 Python 的 PPT。 让 ChatGPT 用 Markdown 语法展示内容。 借用 MindShow 工具将 Markdown 内容转换为精美的 PPT。 3. 利用 GPT4 和 WPS AI: 让 GPT4 生成 PPT 大纲。 将大纲导入到 WPS 当中,启用 WPS AI 一键生成 PPT。 手动修改细节,如字体、事实性错误等。 4. 结合 Claude 和 Gamma.app: 使用 Claude 快速寻找符合条件的论文、提取精炼论文中某部分信息,并找到适合的 PPT 制作工具及学习使用方法。 针对具体需求向 Claude 提问,如搜索权威期刊、筛选论文、获取论文摘要等,并利用获取的信息制作 PPT。
2024-12-14
换脸AI有免费的吗
以下是一些关于免费换脸 AI 的信息: 有方法可以在大约 10 分钟左右制作 AI 换脸、AI 数字人视频。制作数字人视频免费,数字人换脸约 0.8 元。 Swapface 有免费额度,可通过邀请好友、点评软件获取积分。它支持图片换脸、视频换脸、直播实时换脸,需要下载电脑客户端使用,没有在线版。网址:https://swapface.org//home 。 开源、免费的换脸解决方案 facefusion ,开源地址:https://github.com/facefusion/facefusion 。但该软件需要 python 环境,以及要安装视频解码器等多个依赖的软件,本地安装需要一定编程知识。且本地计算机若无 GPU 或 GPU 显存较小,执行速度会非常缓慢。云服务解决方案如利用阿里云的 PAI 和 AutoDL 则需要产生一定费用。
2024-12-14