「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
总结一下24年国产AI大模型的主要进展
2024 年国产 AI 大模型的主要进展包括: 9 月: 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 21 日:大模型测试基准研究组正式成立。 23 日:钉钉 365 会员上线。 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 国内大模型落地情况: 2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。在金融行业,百度以 14 个中标数量、3734.4 万元中标金额排名第一;科大讯飞居第二。 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 百度表现突出,截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%。 大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。大模型的竞争,正在加速成为体系化之战。
2025-01-09
国产AI大模型的应用
国产 AI 大模型的应用主要体现在以下几个方面: 1. 百度文心大模型:在 2024 年大模型中标项目数量和金额大幅增长,凭借 40 个中标项目和 2.74 亿元中标金额在行业中处于领先地位。尤其在金融、智能终端等行业应用广泛。其落地需要全栈技术能力支持,百度智能云通过完善的 AI 基础设施整合全栈技术,获得广泛行业认可。 2. Qwen 系列:是国内唯一出现在 OpenAI 视野里、可以参与国际竞争的国产大模型。在 OpenAI 认可的榜单中表现出色,多次冲进榜单,得分不断提高。其开源模型累计下载量突破 1600 万,国内外有海量开发者基于其开发模型和应用。 3. 免费的大模型 APP:包括 Kimi 智能助手、文心一言、通义千问。 Kimi 智能助手:由 Moonshot AI 出品,具有超大“内存”,能读长篇小说和上网冲浪。 文心一言:百度出品的 AI 对话产品,定位为智能伙伴,能写文案、想点子、聊天和答疑解惑。 通义千问:由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。 此外,还有如“非遗贺春”魔多蛇年春节 AI 模型创作大赛等相关活动。
2025-01-09
国产AI大模型的最新进展
以下是国产 AI 大模型的最新进展: 通义千问的 Qwen 系列表现出色:Qwen 是国内唯一出现在 OpenAI 视野里、能参与国际竞争的国产大模型。Qwen 多次冲进相关榜单,得分不断提高,其开源模型累计下载量突破 1600 万,国内外有大量开发者基于 Qwen 开发模型和应用,尤其在企业级领域。通义大模型证明了开源开放的力量。 国内大模型落地情况:2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。 其他进展:智谱一年间推出了 4 代 GLM,一直是国内能力较好的模型之一。MiniMax 推出了 MoE 架构的新模型和“星野”这个目前国内较成功的 AI 陪聊 APP。月之暗面专注长 Token 能力,在记忆力和长 Token 能力上有一定优势。但硬件层上的卡脖子问题仍未缓解,国内目前仍无胜任大模型训练的芯片,在推理上虽有 Nvidia 的替代产品逐渐出现,但华为昇腾在单卡指标上距离不远,因稳定性不足和缺乏 Cuda 生态,仍需时间打磨。
2025-01-09
FLUX低显存怎么安装
如果您的显存较低,安装 FLUX 可以参考以下步骤: 1. NF4 模型下载: 链接:https://huggingface.co/lllyasviel/flux1devbnbnf4/blob/main/flux1devbnbnf4.safetensors 放置位置:ComfyUI/models/checkpoint/中(不像其他 Flux 模型那样放置在 UNET 中) NF4 配套节点插件:git clone https://github.com/comfyanonymous/ComfyUI_bitsandbytes_NF4.git 2. GGUF 模型下载: 链接:Flux GGUF 模型:https://huggingface.co/city96/FLUX.1devgguf/tree/main GGUF 配套节点插件:GGUF 节点包:https://github.com/city96/ComfyUIGGUF 值得一提的是在最新版本的 ComfyUI 中,GGUF 的节点插件可以在 Manager 管理器中搜到下载安装,NF4 的配套节点插件则搜不到。 3. 对于 8G 以下显存的方案: flux1devbnbnf4.safetensors 放入 ComfyUI\\models\\checkpoints 文件夹内。 ComfyUI_c_NF4 节点:https://github.com/comfyanonymous/ComfyUI_bitsandbytes_NF4 注:如果报错,请更新 BitsandBytes 库。下载放入解压后 ComfyUI\\custom_node 文件夹内,重启 ComfyUI,如果之前没更新,更新后再重启。 相关资源链接: BitsandBytes Guidelines and Flux:https://github.com/lllyasviel/stablediffusionwebuiforge/discussions/981 ComfyUI_bitsandbytes_NF4 节点:https://github.com/comfyanonymous/ComfyUI_bitsandbytes_NF4 flux1devbnbnf4.safetensors:https://huggingface.co/lllyasviel/flux1devbnbnf4/blob/main/flux1devbnbnf4.safetensors 注意使用精度优化的低配模型的话,工作流和原版是不一样的。自己改的话就是把上面官方的这个 fp8 的工作流,只需把底模的节点换成 NF4 的或者 GUFF 的即可。相关生态发展很快,有 Lora、Controlnet、IPadpter 相关生态建设非常速度,以及字节最近发布的 Flux Hyper lora 是为了 8 步快速生图。
2025-01-09
低显存版怎么安装
对于低显存版的安装,以下是相关步骤: 1. FLUX.1 低显存方案(8G 以下): 将 flux1devbnbnf4.safetensors 放入 ComfyUI\models\checkpoints 文件夹内。 下载 ComfyUI_c_NF4 节点:https://github.com/comfyanonymous/ComfyUI_bitsandbytes_NF4 ,放入解压后 ComfyUI\custom_node 文件夹内。 注:如果报错,请更新 BitsandBytes 库,下载放入解压后 ComfyUI\custom_node 文件夹内,重启 ComfyUI,如果之前没更新,更新后再重启。 2. Dreambooth Extension for StableDiffusionWebUI: 在 SD Web UI 中转到“Extensions(扩展)”选项卡,选择“Available(可用)”子选项卡,选择“Load from:(从...加载)”以加载扩展列表,最后在 Dreambooth 条目旁边点击“install(安装)”。 安装完成后,必须完全重新启动 StableDiffusion WebUI。重新加载 UI 将无法安装所需的依赖项。 还需要更新版本的 diffusers,因为 SDWebUI 使用的是 0.3.0 版本,而 DB 训练需要>=0.10.0 版本。没有正确的 diffusers 版本会导致“UNet2DConditionModel”对象没有属性“enable_gradient_checkpointing”的错误消息,以及安全检查器警告。
2025-01-09
制作自己的动漫数字人
以下是制作自己的动漫数字人的相关信息: 构建数字人躯壳: 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,能将喜欢的动漫人物变成数字人的躯壳。代表是 Live2D Cubism。 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高。目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体,如 NextHuman、Unity,虚幻引擎 MetaHuman 等,但个人学习在电脑配置和学习难度上有一定门槛。 AIGC:省去了建模流程,直接生成数字人的展示图片,但弊端是算法生成的数字人很难保持 ID 一致性,帧与帧的连贯性上会让人有虚假的感觉。典型的项目有 wav2lip等。AIGC 还有一个方向是直接生成 2d/3d 引擎的模型,但该方向还在探索中。 生成数字人的方法: 在剪映中,右侧窗口顶部打开“数字人”选项,选取一位免费的、适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中。左下角会提示渲染完成时间,完成后可点击预览按钮查看效果。 增加背景图片:删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”按钮选择本地图片上传,将图片添加到视频轨道上,可调整图片大小和位置。 相关工具及使用方法: HEYGEN:优点是人物灵活,五官自然,视频生成很快;缺点是中文的人声选择较少。使用方法为点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片,上传后效果在 My Avatar 处显示,点开大图后,点击 Create with AI Studio 进入数字人制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击 Submit 得到数字人视频。 DID:优点是制作简单,人物灵活;缺点是免费版下载后有水印。使用方法为点击网址,点击右上角 Create vedio,选择人物形象,可添加自己的照片或使用给出的人物形象,配音时可选择提供文字选择音色或直接上传音频,最后点击 Generate vedio 生成视频,打开可下载或分享。 KreadoAI:优点是免费,功能齐全;缺点是音色很 ai。使用方法为点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮,点击背景添加背景图,最后点击生成视频。
2025-01-09
中国使用最多的视频生成的AI免费工具
以下是中国使用较多的免费视频生成 AI 工具: 1. Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA(国内):https://etna.7volcanoes.com/ 。Etna 是一款由七火山科技开发的文生视频 AI 模型,它可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps。 3. Dreamina(国内内测,有免费额度):https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频,视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以。文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持多种尺寸,默认生成 3s 的视频。 4. 可灵(免费):https://klingai.kuaishou.com/ 。支持文生视频、图生视频,支持图生视频首尾帧功能,提示词可使用中文。文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持多种尺寸,默认生成 5s 的视频。
2025-01-09
Al在未来会发展出自己的灵魂吗
目前关于 AI 在未来是否会发展出自己的灵魂,尚无明确的定论。 从一些研究和观点来看,多模型机制的新皮层由数以万计的皮质柱组成,每根柱子都会学习物体的模型,智能机器的“大脑”也应如此。大脑中的知识被储存在参考框架中,机器也需要学会一个世界的模型。 另外,AI 将从专用方案过渡到更多的通用方案,通用电脑因成效比好而占据主导,未来一些重要应用也需要通用方案的灵活性。但同时,AI 运营的公司会面临更高的极端风险,存在实际问题需要解决。 总之,对于 AI 是否会发展出灵魂,还需要更多的研究和探讨。
2025-01-09
Al发展到什么程度
目前 AI 的发展呈现出多方面的特点和趋势: 1. 千脑理论:新皮层由数以万计的皮质柱组成,每根柱子都会学习物体的模型,多模型设计发挥作用的关键是投票。智能机器的“大脑”也应由许多几乎相同的元素(模型)组成,并连接到各种可移动的传感器。大脑中的知识储存在参考框架中,机器也需要学会一个世界的模型。 2. 通用化趋势:AI 将从专用方案过渡到更多的通用方案。通用电脑因更好的成效比导致技术更快进步,更多努力用于加强受欢迎的设计和支持其生态系统,导致成本降低和性能提升。同时,一些重要的未来应用如探索火星等需要通用方案的灵活性,而当前专用的深度学习模型无法满足。 3. 游戏领域:随着生成式人工智能革命的进展,它将重塑用户生成内容(UGC),创造任何人都能构建游戏的世界,游戏创作将变得真正民主化,数以百万计的新游戏制作者将被创造出来。 4. 企业发展:OpenAI 公司成立于 2015 年,总部位于美国旧金山,早期是非营利机构,后来改成有限营利形式。其使命是推进人工智能技术发展,为全球创造更安全、智能的未来。关于 OpenAI 公司的时间线,可参考 Wiki(https://timelines.issarice.com/wiki/Timeline_of_OpenAI)和 OpenAI Blog(https://openai.com/blog/)。
2025-01-09
是否有工具可以生成系统架构图
以下是一些可以生成系统架构图的工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,可通过拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,包括逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图的创建,可与 Archi 工具配合使用,该工具提供图形化界面创建模型。 4. Enterprise Architect:强大的建模、设计和生成代码的工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现称为 diagrams.net):免费的在线图表软件,允许创建各种类型的图表,包括软件架构图,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 9. Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 需要注意的是,虽然这些工具可以辅助创建架构视图,但它们不都是基于 AI 的。AI 在绘图工具中的应用通常涉及到智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,您应该考虑您的具体需求,比如是否需要支持特定的建模语言、是否需要与特定的开发工具集成、是否偏好在线工具或桌面应用程序等。
2025-01-09