Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

sd最新的模式是什么

Answer

Stable Diffusion(SD)最新的模式包括:

  1. 隐藏在光里的秘密,AI造字光与影的艺术中,将 lightingBasedPicture 模型的终止时机由 0.6 提高到 0.7 能使文字更好识别,但再提高字会显得太突兀,需把握平衡。
  2. Stability AI 正式发布了期待已久的 SDXL 1.0。SDXL 1.0 由两个模型组成,第二个模型能生成更鲜艳、更准确的颜色,且比前身具有更好的对比度、光照和阴影。SDXL 1.0 是所有开放获取图像模型中参数数量最多的模型之一,拥有 3.5B 参数基础模型和 6.6B 参数模型集成管道。

如果您想要最新的 controlnet 模型,可以添加公众号【白马与少年】,回复【SD】获取。

Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】隐藏在光里的秘密,AI造字光与影的艺术~

所以我锁定随机种子之后,将lightingBasedPicture模型的终止时机由0.6提高到了0.7,这样文字就比较好识别的,当然再提高的话呢,字又会显得太突兀,我们要把握好一个平衡。好了,光影字体就讲到这里。如果想要最新的controlnet模型的话,可以添加我的公众号【白马与少年】,回复【SD】即可。-END-白马与少年Stable Diffusion、Blender等学习心得分享139篇原创内容(持续更新中)公众号微信扫一扫关注该公众号

AIGC 周刊 by 歸藏

|标题|概要|图片|链接|日期||-|-|-|-|-||2023年8月第一周|Stability AI正式发布了我们期待已久的SDXL 1.0。下面是模型的介绍、使用方式和相关的资源链接:<br>SDXL的特点:<br>SDXL有两个模型组成第二个模型可以生成更鲜艳、更准确的颜色,并且比其前身具有更好的对比<br>度、光照和阴影。<br>SDXL 1.0是所有开放获取图像模型中参数数量最多的模型之一,拥有3.5B参数基础模型和6.6B参数模型集成管道。||[AIGC Weekly#32](https://waytoagi.feishu.cn/wiki/XQllwGObJiEn4Hki16FcWSp5n0b)|2023/08/01||2023年7月第四周|上周三Meta正式发布了和开源了Llama 2大语言模型,估计接下来的两个月开源语言模型和国产的一些模型都回迎来性能上的飞跃。<br>模型规模方面Llama2有三个大小的版本分别是7B 13B和70B,Llama 2的训练数据比Llama 1多40%,上下文长度是Llama 1的两倍。预训练的Token为2万亿,上下文长度为4096。||[AIGC Weekly#31](https://waytoagi.feishu.cn/wiki/Bv5sw3cyHiLotoksuwVcYp0hn8d)|2023/07/24||2023年7月第三周|上周Anthropic发布了他们最新的模型Claude 2,Claude2相较于之前的版本有了非常大的提升,同时你现在可以在他们的官网上跟Claude 2对话了(免费)。<br>他们开放了一个官方的聊天机器人程序,你现在可以访问[https://claude.ai](https://claude.ai/)||[AIGC Weekly#30](https://waytoagi.feishu.cn/wiki/IUghwBUdyiiwF7kzYhZc5SX7nah)|2023/07/18|

AIGC常见名词解释(字典篇)

AIGC:AI generated content,又称为生成式AI,意为人工智能生成内容。例如AI文本续写,文字转图像的AI图、AI主持人等,都属于AIGC的应用。类似的名词缩写还有UGC(普通用户生产),PGC(专业用户生产)等。能进行AIGC的产品项目也很多,能进行AIGC的媒介也很多包括且不限于语言文字类:OpenAI的GPT,Google的Bard,百度的文心一言,还有一种国内大佬下场要做的的LLM都是语言类的。语音声音类:Google的WaveNet,微软的Deep Nerual Network,百度的DeepSpeech等,还有合成AI孙燕姿大火的开源模型Sovits。图片美术类:早期有GEN等图片识别/生成技术,去年大热的扩散模型又带火了我们比较熟悉的、生成质量无敌的Midjourney,先驱者谷歌的Disco Diffusion,一直在排队测试的OpenAI的Dalle·2,以及stability ai和runaway共同推出的Stable Diffusion...[heading1]SD是什么?[content]SD是Stable Diffusion的简称。是它是由初创公司StabilityAI、CompVis与Runway合作开发,2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像。Stable Diffusion是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model;LDM)。SD的代码模型权重已公开发布,可以在大多数配备有适度GPU的电脑硬件上运行。当前版本为2.1稳定版(2022.12.7)。源代码库:github.com/Stability-AI/stablediffusion我们可以通过一系列的工具搭建准备,使用SD进行想要的图片aigc(心想事成的魔法施与)。

Others are asking
sd教程
以下是关于 SD 的一些教程: 用 SD 做二维码: 好看的二维码欣赏:第一个就是 qrbtf。 最近新出了融合二维码教程。 方法原文地址:https://stablediffusionart.com/qrcode/ 相关帖子展示了使用 Stable Diffusion 创建的艺术二维码,是使用定制训练的 ControlNet 模型生成的,人们也想出了在无自定义模型情况下制作 QR 码的方法。 用 SD 做中文文字(持续更新中): 制作思路: 将中文字做成白底黑字,存成图片样式。 使用文生图的方式,使用大模型真实系,作者用的 realisticVisionV20_v20.safetensorsControlNet 预设置。 输入关键词,如奶油的英文单词,Cream+Cake(加强质感),反关键词:Easynegative(负能量),反复刷机,得到满意的效果即可。 同理可输出 C4D 模型,可自由贴图材质效果,3d,blender,oc rendering。 如果希望有景深效果,也可以打开 depth(增加阴影和质感)。 打开高清修复,分辨率联系 1024 以上,步数:2960。 参考视频教程:【“牛逼”的教程来了!一次学会 AI 二维码+艺术字+光影光效+创意 Logo 生成,绝对是 B 站最详细的 Stable Diffusion 特效设计流程教学!AI 绘画进阶应用哔哩哔哩】https://b23.tv/c33gTIQ SD 的各种实践教程: 线稿上色 Midjourney+Stable Diffusion:https://waytoagi.feishu.cn/wiki/AsbYwmfS6ikhr3kNsCocdPMEnUd 猫咪狗狗 lora:https://waytoagi.feishu.cn/wiki/JiQewVbOHi7tzakS23ecprxsnfg 字体设计机甲战士:https://waytoagi.feishu.cn/wiki/GUQ3w52elisr9ukIgkBc42UmnWd 做盲盒平面变 3D:https://waytoagi.feishu.cn/wiki/SCK8wV4PTiHQVKkvGRUcx0fcnTe MJ 出图 SD 放大:https://waytoagi.feishu.cn/wiki/E88nwOtk9ilRQskg3Qlc6ZHpnTf 七夕字体和图:https://waytoagi.feishu.cn/wiki/BjQ1wLRv0ivCLtk136VchSCqnpU 可爱毛粘字体:https://waytoagi.feishu.cn/wiki/NjhbwF1cTiQ5Xjkd3tNc1OWynZd
2025-04-08
绘画工具sd怎么使用?
以下是关于绘画工具 SD 的使用方法: 1. 生成超大图像: 若想用 SD 绘制超高分辨率图片(如 10000x768 的清明上河图),直接调分辨率不可行,会爆显存,正常尺寸设置最高到 2048。 先在 PS 中设置所需大尺寸画布,保存为 jpg 图片。 将图片放入 ControlNet 中,点击右下角箭头,将图片尺寸信息发送到生成设置。 填入正反向提示词,启用 Tiled Diffusion 插件,其中方案选择 Mixture of Diffusers,可防止接缝产生。 2. 提示词标签选择: 按顺序选择标签词,如女孩、白头发、蓝眼睛等。 选择画质和视角,如最好的质量、杰作、从人物角度往下看等。 选择艺术风格,如皮克斯动画、轮廓光。 填写负面提示词,点击选框结尾的“负面”。 模型选择“revAnimated”,调整尺寸后点击生图。 3. 真人转二次元及图生图: 使用【X/Y/Z plot】脚本做参数对比,设置 X 轴为提示词相关性(取值范围 130,每次增加 5),Y 轴为重绘幅度(取值范围 01,每次增加 0.2)。 提示词相关性在 6—11 中间为最佳,重绘幅度大小可控制生成图与原图相似度。 可使用绘图功能增加或修改元素,如增加红色眼镜、去掉衣服图案、更换头部或修改帽子部分等。
2025-04-01
comfyui 与 SD 功能上有啥区别
ComfyUI 与 SD 在功能上主要有以下区别: 1. 工作原理:ComfyUI 更接近 SD 的底层工作原理。 2. 自动化工作流:ComfyUI 具有更出色的自动化工作流,能够消灭重复性工作。 3. 后端工具:ComfyUI 作为强大的可视化后端工具,可实现 SD 之外的功能,如调用 API 等。 4. 定制开发:可根据定制需求开发节点或模块。 5. 应用场景:例如在抠图素材方面,ComfyUI 能根据需求自动生成定制的抠图素材。 6. 与其他软件的结合:如与 Blender 整合,从工作流程上天然适配。 7. 工作流搭建:ComfyUI 以连线方式搭建工作流,可通过改变节点实现不同功能,具有更高的自由和拓展性,能根据自身需求搭建和改造工作流。
2025-03-28
我是一名电商设计师,现在想学习SD AI绘图,有一点基础,但学习课程资源有限,请你帮我制定一份详细的学习计划,并提供一些学习资源。
以下是为您制定的学习 SD AI 绘图的详细计划及相关学习资源: 学习计划: 1. 首先,深入学习 Stable Diffusion 的核心基础原理,包括模型工作流程、核心基础原理、训练全过程以及其他主流生成式模型介绍。 2. 接着,掌握 Stable Diffusion 的核心网络结构,如 SD 模型整体架构、VAE 模型、UNet 模型、CLIP Text Encoder 模型等。 3. 学习从 0 到 1 搭建使用 Stable Diffusion 模型进行 AI 绘画的不同方式,如使用 ComfyUI、SD.Next、Stable Diffusion WebUI、diffusers 搭建推理流程,并查看生成示例。 4. 了解 Stable Diffusion 的经典应用场景,如文本生成图像、图片生成图片、图像 inpainting、使用 controlnet 辅助生成图片、超分辨率重建等。 5. 最后,尝试从 0 到 1 上手使用 Stable Diffusion 训练自己的 AI 绘画模型,包括配置训练环境与训练文件,以及基于 Stable Diffusion 训练 LoRA 模型。 学习资源: 1. 教程:深入浅出完整解析 Stable Diffusion(SD)核心基础知识 知乎。 目录涵盖了 Stable Diffusion 系列的各个方面,包括核心基础知识、网络结构解析、搭建推理流程、应用场景和模型训练等。 2. SD 模型权重百度云网盘: 关注 Rocky 的公众号 WeThinkIn,后台回复:SD 模型,即可获得资源链接,包含多种模型权重。 3. SD 保姆级训练资源百度云网盘: 关注 Rocky 的公众号 WeThinkIn,后台回复:SDTrain,即可获得资源链接,包含数据处理、模型微调训练以及基于 SD 的 LoRA 模型训练代码全套资源。 4. Stable Diffusion 中 VAE,UNet 和 CLIP 三大模型的可视化网络结构图下载: 关注 Rocky 的公众号 WeThinkIn,后台回复:SD 网络结构,即可获得网络结构图资源链接。
2025-03-28
SD如何部署
SD 的部署方式如下: 1. 本地部署(Win 系统): 系统要求:Win10 或 Win11。 查看配置: 查看电脑系统:在桌面上找到“我的电脑”,鼠标右键点击,点击“属性”,查看 Windows 规格。 查看电脑配置:需要满足 3 个要求(推荐),电脑运行内存 8GB 以上,是英伟达(NVIDA)的显卡,显卡内存 4GB 以上。打开任务管理器(同时按下 ctrl+shift+esc),可查看电脑运行内存,8GB 运行内存可以勉强运行 SD,推荐 16GB 以上运行内存;查看电脑显卡内存(显存),4GB 显存可运行 SD,推荐 8GB 以上显存。 配置达标跳转至对应安装教程页:。 一键式安装: 电脑配置能支持 SD 运行的朋友们,可使用 B 站秋叶分享的整合包。 具体安装方法: 打开链接 https://pan.baidu.com/s/1hY8CKbYRAj9RrFGmswdNiA?pwd=caru ,下载《1.整合包安装》,存放到电脑本地。 打开保存到电脑里的文件夹。 打开文件夹《1.秋叶整合包主包》,鼠标右击文件,点击“解压文件”。 选择解压到 D 盘或者 E 盘,小心 C 盘被占满,点击确定。 解压完成后,来到第二个文件夹,双击里面的文件,点击安装。 打开刚刚解压保存的 SD 的根目录,找到启动器,鼠标右击启动器,点击“发送到”,桌面快捷方式。 双击启动器,等待更新,接着点击左边第二个“高级选项”,在显存优化里,根据自己电脑的显存选择(就是上面查看的专用 GPU 内存),自己电脑是多少就选多少。 回到第一个一键启动,点击右下角的一键启动。出现代码页面不用管,等一下就行了,SD 的主界面会自动在网页上弹出来。如果出现报错,可以回到最开始的界面,在左边点击“疑难解答”,再点击右边的“开始扫描”,最后点击“修复”按钮。 2. 云端部署: 部署流程: 安装和配置基础环境:浏览器上按照腾讯云>控制台>云服务器的路径找到你刚才购买的实例,点击启动,就会新开一个远程访问的窗口,输入你购买时设置的密码,进入,这样你就有了一个远程的 Windows 系统环境,接下来安装显卡驱动、配置环境变量即可。 安装显卡驱动:用内置的 IE(也可下载 Chrome),打开英伟达的网站,找到驱动下载,选择购买机器时选定的显卡型号、Windows 版本号,下载对应的驱动,然后安装上。 配置环境变量:驱动安全完成后,开始配置环境变量。首先先找到你安装后驱动所在的目录,如果没有特殊设定的话,一般是在「C:\\Program Files\\NCIDIA Corporation」这里,复制这个路径,找到环境变量配置入口(控制面板>系统和安全>系统),选择「高级系统设置」,弹窗设置环境变量,找到「系统变量」里的 Path 环境变量,点击「编辑...」,然后「新建」,帮刚才复制的 nvidia 驱动安装地址粘贴进去,保存即可。 备选:SD 好难,先试试简单的无界 AI:
2025-03-25
sd 换脸
以下是关于 SD 换脸插件 Roop 的详细步骤: 1. 勾选包含 Python 和 C++包等相关项目,更改安装位置后点击右下角安装。安装时间较长,需耐心等待。 2. 安装好后,打开 SD 文件目录下的相关文件夹,在地址栏输入“cmd”并回车,在打开的 dos 界面粘贴“python m pip install insightface==0.7.3 user”代码,自动安装 insightface。若此阶段出错,建议下载最新的秋叶 4.2 整合包(6 月 23 号更新),在云盘后台回复【SD】可下载。 3. 安装完成后,重新打开启动器,后台会继续下载一些模型,全程要保证科学上网。 4. 选用真实系模型“realisticVisionV20”,关键词描述相关内容生成照片。 5. 启用 ROOP 插件,选择要替换的人物照片,面部修复选择“GFPGAN”,根据需求设置右边的参数数值和放大算法,点击生成。 6. 若生成的人脸像素偏低、模糊,可将图发送到“图生图”,开较小的重绘幅度,然后使用 controlnet 中的 tile 模型进行重绘。 此插件主要适用于真实人脸替换,对二次元人物作用不大。在使用时要谨慎,切勿触犯法律。若想要此插件,可添加公众号【白马与少年】,回复【SD】即可。推荐使用最新的秋叶整合包,出错概率最小,且科学上网很重要。
2025-03-19
最新的AI排行榜
以下是最新的 AI 排行榜相关信息: 3 月 9 日榜单: 文生图:Ideogram 2a(官方评价这是 Ideogram 迄今为止最快、最实惠的文生图模型) 文生视频:SkyReels、海螺01director、Pixverse4.0 图生视频:SkyReels、Pixverse4.0、Adobe Firefly 测评涵盖了 Midjourney,Flux,即梦,Recraft,ideogram,SD3.5,Sora,可灵,通义,即梦,海螺,pixverse,pika,vidu,luma 等 50+国内外热门模型,还有 Veo 2.0 等最新模型上线。本周最出乎意料的是最新上的模型 SkyReels,在文生视频和图生视频榜单都排名靠前。 生成式 AI 季度数据报告 2024 月 1 3 月: 赛道方面:天花板潜力为数亿美金;对标公司有 Xmind 等;总体趋势平稳增长,15.93%;月平均增速 34 万 PV/月;原生产品占比中等。 竞争方面:Top1 占比 32%;Top3 占比 82%;马太效应弱;网络效应中;大厂是否入局是,但大厂占比较低;技术门槛中。 23 年 12 月至 24 年 3 月月访问量排行榜及变化情况: 非大厂的 Top1 公司及产品:Whimsical Al,估值融资 3000 万$(2021),最新月 PV 为 237 万。2023 年 4 月,月访问量 382 万,Whimsical AI、gitmind AI 分别位列第一、第二的位置,月访问量合计占比 84%。2024 年 3 月,月访问量 812 万,Whimsical AI 整年看处于增长态势,仍位列第一,月访问量达到 237 万;ProcessOn 凭借其原有客户积累,月访问量快速增长,位列第二名,占比 25%。 记忆辅助榜单中,2023 年 4 月,月访问量为 83 万,Rewind AI 以 43 万的访问量位居第一,占赛道月总访问量的 52%。Personal.ai 和 Heyday 分别以 25 万和 8 万的访问量位列二、三,分别占赛道月总访问量的 30%和 10%。2024 年 3 月,月访问量增长至 245 万,rabbit inc.以 128 万的访问量跃居第一,占赛道月总访问量的 52%。Humane 和 Rewind AI 分别以 46 万和 22 万的访问量位列二、三,分别占赛道月总访问量的 19%和 9%。 相关网址: https://www.xiaohongshu.com/user/profile/65890e73000000003d035101?xsec_token=AB67OV1KW_ANCcrYRU_oRTJKJ9xLtexbMgyoJq68rxQA%3D&xsec_source=pc_search aiwatch.ai
2025-04-15
有哪些最新的ai技术可用在课堂教学上
以下是一些可应用在课堂教学上的最新 AI 技术: 1. 智慧技术助理:为教师提供辅助,帮助教师在课前、课中、课后呈现新的教学样态,驱动学生高效和差异化学习。 2. 生成式人工智能:可用于为教师减负,例如辅助设计教学内容、生成提示词等。 3. 个性化学习支持:通过 AI 技术实现对学生的个性化学习支持,如智能评估学生的学习情况,为每个学生提供定制化的学习方案。 4. 教育过程和结果的结构化表征:利用 AI 进行分析,帮助教师更好地了解学生的学习过程和结果。 5. 多维度数据采集与评价:AI 可以整合行为、情感、认知等多维度数据,为学生绘制发展全景图,实现更全面的教育评价。 需要注意的是,AI 在教育中是“助手”而非“替代”,教师应充分利用这些成熟的技术促进教育变革。
2025-04-13
ai在教学中的最新应用
以下是 AI 在教学中的一些最新应用: 1. MIT 为孩子开设免费的 AI 课程,涵盖了 AI 在跨学科领域的应用,如 AI 与气候、AI 与大学录取、AI 对美国大选的影响等。孩子们需要思考如何用气候数据写好故事、预测气候变换走向,从数据分析角度了解大学录取中的相关问题,以及识别 AI 深度伪造的新媒体材料等。 2. 张翼然提出用 AI 为教师减负,为有初步 AI 使用经验、渴望了解最新技术进展并交流的老师提供了相关技巧和分享。例如,在智慧技术助理加持下探索教学新样态,分享全球 AI 技术在教育界的新发展和应用案例。 3. 从 AI 助教到智慧学伴的应用探索中,提出调整教学理念,将 AI 作为教学辅助工具和合作伙伴。学习利用 AI 工具的优势应用于教学,如自动生成练习、个性化反馈等,同时确认输出质量。根据 AI 能力设计开放性作业,调整考核方式,继续发挥教师在提供情感支持、培养团队合作等方面的优势。
2025-04-11
最新的生命科学有关的 AI动向
以下是生命科学领域有关 AI 的最新动向: 在医疗健康生物制药方面,AI 技术极大地加速了研究,在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。例如,AI 提前三年诊断胰腺癌;两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因;AI 帮助抗衰老,筛查出高效的药物候选物;利用 AI 寻找阿尔兹海默症的治疗方法;通过神经网络分析患者体液中的生物标志物,早期诊断帕金森。 Nature Methods 主题特刊聚焦于 AI 在生物学中的应用,探讨了计算生物学多领域,强调高精度蛋白质结构预测成就,提及了 AI 在蛋白质组学数据分析中的应用、机器学习可解释性挑战,以及科研人员对 AI 工具培训的需求,同时探讨了 AI 与生物医学数据结合的新时代。 Flagship Pioneering 创始人 Noubar Afeyan 提出 AI for Science 的下一步是 MultiAgent,旨在实现类似自动驾驶的科研自动化,推动生命科学领域的革命性进展。
2025-04-10
请问有什么AI最新在零售行业的应用,最好有趣,实用有建设性
以下是 AI 在零售行业的一些有趣、实用且有建设性的最新应用: 1. 舆情、投诉、突发事件监测及分析:通过 AI 技术实时监测和分析消费者的反馈和市场动态,帮助企业及时做出应对策略。 2. 品牌营销内容撰写及投放:利用 AI 生成吸引人的营销文案,并精准投放到目标受众。 3. 自动化库存管理:基于历史销售数据和其他相关因素,预测未来的库存需求,优化库存配置,降低成本。 4. 自动生成或完成 SKU 类别选择、数量和价格分配:提高商品管理的效率和准确性。 5. 客户购物趋势分析及洞察:深入了解消费者的购物偏好和趋势,为企业的产品开发和营销策略提供依据。 此外,在医疗药品零售领域,AI 也有广泛的应用: 1. 药品推荐系统:根据用户购买记录和症状描述等数据,推荐合适的非处方药品和保健品,提高销售转化率。 2. 药品库存管理:分析历史销售数据、天气、疫情等因素,预测药品需求量,优化库存策略。 3. 药品识别与查询:借助计算机视觉技术,用户通过手机拍摄药品图像即可获取相关信息。 4. 客户服务智能助手:基于自然语言处理技术,回答顾客关于购药、用药、保健等常见问题。 5. 药店运营分析:分析销售、顾客流量、库存等大数据,发现潜在问题和优化空间。 6. 药品质量监控:利用机器视觉、图像识别等技术检测药品的包装、标签、颜色等是否合格。 7. 药品防伪追溯:利用区块链等技术实现全流程的药品溯源,保障药品供应链的安全和可信度。 总之,AI 技术在零售行业的应用能够提升购物体验、优化运营管理、降低成本,并为企业创造更多的价值。
2025-04-10
我想了解最新的ai的即时信息(最新资讯与ai工具)
以下是为您提供的最新 AI 即时信息和工具: 4 月 1 日 AI 资讯: 【AI 模型及应用】 OpenAI:将会开源一个推理模型,ChatGPT 即将推出推理强度控制选项,Gpt4o 生图能力面向免费用户。 Gemini 2.5 Pro:免费使用,任何人都可以使用 Canvas 进行编码和创作。 【AI 视频】 Higgsfield:发布 50 多个电影级摄影机动作预设,提升动态镜头表现力。 luma:为 Ray 2 引入摄像机运动概念,可基于预设镜头并组合编辑。 Remakes:支持基于用户上传图像直接编辑,并融合 Remade 视频特效,简化创意流程。 Meta:宣布推出 MoCha 系统,实现电影级说话角色合成效果。 【AI 3D】 HSMR:推出从单张图像重建人体 3D 骨骼和网格模型的系统。 krea:引入 AI 3D 生成能力,扩展其创意工具的功能范围。 PGC:推出基于物理的单一姿势高斯布料模拟技术,提升数字服装的真实感。 【AI 音频】 MiniMax Audio:发布全新 Speech02 语音模型,提升语音合成质量。 3 月 19 日 AI 资讯: 【AI 模型】 英伟达:发布全球首个开源人形机器人基础模型 Isaac GR00T N1 及相关 GTC 信息。 谷歌 Gemini:放出了两个功能 Canvas 和 Audio Overview。 【AI 视频】 STAbility AI:发布 Stable Virtual Camera,2D 图像转化 3D 视频。 Domo AI:推出“图片说话”功能,带口型匹配。 【AI 3D】 Roblox:推出 AI 3D 技术 Cube 3D。 Claude MCP Unity 版本推出。 【AI 音乐】 AI 音乐工具 Udio:推出 v1.5 Allegro。 LVAS Agent:基于多智能体协作的长视频音频合成。 获取 AI 资讯的渠道: 公众号:超时空视角、AI 替代人类。 小红书/抖音:EverAI。 B 站:Ever AI 酱(这里会有教程及 AI 工具界面操作)。 关于“通往 AGI 之路”知识库和社区平台: WaytoAGI(通往 AGI 之路)是一个致力于人工智能(AI)学习的中文知识库和社区平台。为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。 汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。 提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 社区定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 引领并推广开放共享的知识体系,倡导共学共创等形式,孵化了 AI 春晚、离谱村等大型共创项目。 在没有任何推广的情况下,WaytoAGI 一年时间已有超过 100 万用户和超千万次的访问量。 目前合作过的公司/产品包括阿里云,通义千问,淘宝,智谱,支付宝,豆包,火山引擎,marscode,coze,堆友,即梦,可灵,MiniMax 海螺 AI,阶跃星辰,百度,Kimi,吐司,liblib,华硕,美团,美的,360,伊利,魔搭,央视频,Civitai,Openart,Tripo3D,青椒云等。
2025-04-10
,AI agent 发展趋势,技术状态,商业模式
以下是关于 AI Agent 的发展趋势、技术状态和商业模式的相关信息: 发展趋势: 2024 年内,办公场景“AI 助手”开始有良好使用体验,实时生成的内容开始在社交媒体内容、广告中出现。 2025 2027 年,接近 AGI 的技术出现,人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 技术状态: 目标实现基于 ReAct、SFT、RAG、强化学习等实现自主规划能力的 AI Agent,构建具备认知、决策智能的 Agent 智能体框架。 专注文本/多模态大模型、AI Agent 技术创新与应用。 商业模式: 依据不同类型销售市场的特点,结合一站式 AI 搭建平台将销售部署的产品化和模版化,让企业更容易落地和应用 AI 能力。 销售智能体 Blurr.AI 占位交易环节,解决 2B 销售获客的痛点,且具有向前后端环节延展的势能。
2025-04-13
生成超过15000字的人工智能技术在智能化零售行业中的应用与商业模式创新论文,学科方向是计算机科学与技术专业
很抱歉,目前无法直接为您生成超过 15000 字的论文。但我可以为您提供一个论文大纲,以帮助您组织思路和开展研究: 标题:人工智能技术在智能化零售行业中的应用与商业模式创新 摘要:简述人工智能技术在智能化零售中的重要性、应用现状、创新商业模式以及研究的主要结论。 一、引言 (一)研究背景:介绍智能化零售行业的发展趋势和人工智能技术的兴起。 (二)研究目的与意义:阐述研究人工智能技术在该领域应用和商业模式创新的目的,以及对行业发展的重要意义。 (三)研究方法与结构:说明采用的研究方法,如文献综述、案例分析等,并概述论文的结构安排。 二、人工智能技术概述 (一)人工智能技术的定义与分类:解释人工智能的概念,分类如机器学习、深度学习、自然语言处理等。 (二)关键技术原理:详细介绍相关技术的原理,如机器学习中的监督学习、无监督学习等。 (三)技术发展历程与现状:回顾人工智能技术的发展历程,分析当前的技术水平和应用情况。 三、智能化零售行业概述 (一)智能化零售的概念与特点:定义智能化零售,阐述其特点如个性化服务、精准营销等。 (二)行业发展现状与趋势:分析智能化零售行业的现状,包括市场规模、竞争格局等,预测未来的发展趋势。 (三)面临的挑战与机遇:探讨行业发展中面临的问题,以及人工智能技术带来的机遇。 四、人工智能技术在智能化零售中的应用 (一)客户画像与精准营销:如何利用人工智能技术分析客户数据,实现精准营销。 (二)库存管理与供应链优化:通过人工智能算法优化库存水平和供应链流程。 (三)智能推荐与个性化服务:介绍基于人工智能的推荐系统,为客户提供个性化的购物体验。 (四)无人零售与智能支付:探讨无人零售店的技术实现和智能支付方式的应用。 (五)店铺布局与商品陈列优化:利用人工智能进行数据分析,优化店铺布局和商品陈列。 五、人工智能技术驱动的商业模式创新 (一)新的零售模式:如线上线下融合的智能零售模式。 (二)数据驱动的商业决策:依靠人工智能分析数据,制定更科学的商业决策。 (三)合作与共享经济模式:探讨与技术供应商、其他企业的合作模式,以及共享数据和资源的可能性。 (四)增值服务与收费模式创新:基于人工智能技术提供的新服务,创新收费模式。 六、案例分析 (一)选取成功应用人工智能技术的智能化零售企业案例。 (二)详细介绍其应用场景、商业模式创新和取得的成效。 (三)总结经验教训,为其他企业提供借鉴。 七、影响与挑战 (一)对消费者行为和市场竞争的影响:分析人工智能技术如何改变消费者购物行为和市场竞争格局。 (二)技术与数据安全问题:探讨人工智能应用中的技术漏洞和数据泄露风险。 (三)法律法规与伦理道德问题:研究相关法律法规的缺失,以及可能引发的伦理道德问题。 八、结论与展望 (一)研究成果总结:概括人工智能技术在智能化零售中的应用和商业模式创新的主要发现。 (二)未来研究方向与建议:提出进一步研究的方向和对企业、政府的建议。 希望以上大纲对您有所帮助,祝您顺利完成论文!
2025-04-07
AI对商业模式的变革影响
AI 对商业模式的变革影响主要体现在以下几个方面: 1. 生物技术与 AI 的融合:生物技术的工业化带来新规模和新应用,AI 在其中发挥变革性作用,但在某些完全依赖摩尔定律的领域,其对商业模式的贡献可能被过分炒作。 2. 从通用能力到专业化细分:早期通用型 AI 产品难以满足多样化需求,如今越来越多的 AI 产品专注于特定领域,如图像生成、视频制作、音频处理等,不断提升核心能力,提供更精准和高质量的服务。 3. 商业模式的探索与创新:包括 ToB 市场的深耕,如针对内容创作者的 ReadPo;新型广告模式,如天宫搜索的“宝典彩页”等,从单纯的技术展示向解决用户痛点和创造商业价值转变。 4. “AI 原生”模式:基于 AI 的能力再造商业模式,而非套用现有流程。 5. To AI 的商业模式:如模型市场、合成数据、模型工程平台、模型安全等可能更确定。
2025-04-01
吴恩达总结了四种AI Agent的设计模式: 1.反思模式(Reflection): 2.工具使用模式: 3.规划模式: 4.多智能体协作模式:
吴恩达总结了以下四种 AI Agent 的设计模式: 1. 反思模式(Reflection):让 Agent 审视和修正自己生成的输出。例如,在编写代码时,可让大模型检查代码的准确性和结构规范性,并不断优化。 2. 工具使用模式(Tool Use):通过使用外部工具和资源,如 LLM 生成代码、调用 API 等进行实际操作。 3. 规划模式(Planning):让 Agent 分解复杂任务并按计划执行。 4. 多智能体协作模式(Multiagent Collaboration):多个 Agent 扮演不同角色合作完成任务。 如果您想更深入了解这些设计模式,可以参考以下文章:https://waytoagi.feishu.cn/wiki/SPNqwJkmQiyVfGkS8zocMSZcnYd
2025-03-19
AI应用赛道中top应用介绍,实现的功能和应用场景,产品Launch时间:AIGC功能 Launch时间、当前月活用户数、营收利润、一年成本投入、市场占有率、目前融资金额及估值、创始团队介绍、公司员工规模、所属国家、用户来源、用户来自于哪些国家、用户profile、转化率、ROI等等, 盈利模式,优劣势与未来发展趋势。
以下是关于 AI 应用赛道的相关介绍: 应用场景:涵盖医疗、制造业、金融风控、消费端个性化服务、办公、农业、能源优化、娱乐等领域。 关键技术: 1. 包括大语言模型作为中枢神经系统,记忆模块实现长期和短期记忆,以及规划能力中的目标设定、任务拆解、生成策略、执行与反馈、资源管理和多智能体协同。 2. 强化学习用于环境感知和决策调整,多模态融合涉及多种数据类型,低成本训练是考虑成本的重要因素。 智能体特征:包括自主性、交互性和适应性,如通过自我对弈和博弈不断进化,在金融风控领域利用大量数据提升准确率。 AI 技术路线:从有语言能力的 AI 到有推理能力,再到能使用工具、发明创新以及形成组织,共五级。 智能体框架类型:分为任务驱动型、多智能体协作、强化学习型、具身智能体、应用型智能体,每种类型都有代表性框架。 智能体与大模型的关系:大模型是中枢和基石,智能体是行动引擎,两者协同演进,智能体产生的数据可反哺大模型。 未来趋势:智能体可能在中小企业中更具效益,人机协作中人类成为监督角色,但存在算力成本、伦理风险、技术瓶颈等挑战。 B 端变现与创业方向: 1. B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。 2. 自媒体创业:视频号等平台尚有蓝海空间,需具备内容创新和差异化,内容成本低且更新迭代快。 3. 游戏创业:个人或团队可做轻量化游戏,结合 AI 技术,满足放松和社交需求,专注垂类赛道,避免与大厂竞争。 4. 影视创业:25 年将是拐点,更多内容会采用 AI 技术,如哪吒 2 因前期规划未用 AI 技术。 5. 广告营销创业:重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: 1. 创业难点:创业对创业者综合能力要求极高,找到志同道合且能力互补的战友是创业前期最难的事。 2. AI 虚拟人发展:从早期以首位为核心的宅文化虚拟偶像,到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人,其发展历程不断演进。 3. 虚拟人产业链:包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。 4. 未来创业机遇:AI 虚拟人是未来 310 年 Web 3.0 的风口,提前布局未来有潜力的赛道,准备好迎接机遇。 相关案例和产品信息: 1. 10 月 26 日,AI 翻译和口型匹配技术在视频制作中的应用逐渐流行,公司如 Captions、HeyGen 和 Verbalate 通过 AI 生成字幕、配音和口型匹配等功能,帮助用户轻松实现视频翻译本地化。 2. 10 月 25 日,Perplexity 最新估值约为 5 亿美元,较 3 月宣布的 1.5 亿美元估值上涨 300%以上,当前的付费用户数量达到了 1.5 万人,截止本月,Perplexity 的 ARR 达到 300 万美元,最新估值约为 ARR 的 150 倍。 3. 《100 个有意思的 AI 应用》由国盛证券出品,分为基于 LLM 自然语言能力的对话、写作、阅读、分析等应用;多模态技术持续发展,图像、视频、音频、3D 等 AIGC 应用;企业级应用等。
2025-03-14
trae ai编程客户端的buide模式“客户端异常,请稍后再试”
Trae 的 Builder 模式相关信息如下: Trae 提供了两种模式,其中 Builder 模式可以帮助从 0 开发一个完整的项目,对代码文件的任何更改都会自动保存。 使用 Builder 模式的步骤: 在电脑上新建一个文件夹,文件夹名字可自定义,如“helloworld”。 使用 Trae 打开这个文件夹,在弹出的弹层里选中新建的文件夹。 点击右上角的“Builder”按钮切换到 Builder 模式。 在 Builder 模式下的使用案例,如生成一个贪吃蛇游戏:打开 Builder 模式,直接输入“使用 web 技术栈生成一个贪吃蛇游戏”,排队完成后,Trae 开始思考和代码编写过程,期间需要手动接入进行文件审查,在提示中点击“全部接受”。代码生成完成之后,Trae 自动运行命令启动页面,点击运行,在 Webview 中即可看到实现的游戏效果。 如果您在使用 Trae 的 Builder 模式时出现“客户端异常,请稍后再试”的提示,建议您稍后再尝试操作,或者检查网络连接等是否正常。
2025-03-10