Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

flux最新信息

Answer

以下是关于 Flux 的最新信息:

周边生态发展

  • 上周发布后,因其优秀的图片质量,尽管训练成本高昂,但发展态势迅速改变,开源社区活跃。
  • 其偏向真实的美学调教风格使生成的发布会写实图片在推上热度爆发,快速出圈。
  • Runway 将 AI 生成的照片变成视频,让更多人了解图像和视频模型的发展进度。
  • Xlabs 已发布基于 FLUX 的 Controlnet 模型和 Lora 模型的训练脚本:https://github.com/XLabs-AI/x-flux 。
  • Xlabs 还发布了 FLUX 的 Canny Controlnet 模型,Instant ID 作者的新组织 InstantX 训练的一个 Canny 模型也可尝试:https://huggingface.co/InstantX/FLUX.1-dev-Controlnet-Canny-alpha 。
  • Xlabs 发布了多个 Lora,包括 mjv6_lora、动漫 Lora、写实 Lora、迪士尼 Lora、风景_lora、艺术 Lora,下载地址:https://huggingface.co/XLabs-Al/flux-RealismLora 。

作为 AI 会议助手

  • 官网:https://getflux.io/ 。
  • 旨在让会议更加智能高效,帮助用户摆脱重复性任务,集中注意力在有意义的对话上。
  • 核心特性包括转录会议内容、根据上下文提供操作建议、与 HubSpot、Jira 和 Notion 等热门应用程序无缝集成。
  • 使用场景包括简化会议、提高生产力、有效协作。
  • 定价计划有面向个人用户的免费版。
  • 提供客户支持和用户社区。

优势、局限与注意事项

  • 优势:不仅是转录工具,还提供定制化会议摘要和类似 ChatGPT 的问答功能,与 Slack 和 Notion 等应用程序集成。
  • 局限:目前未提及。
  • 注意事项:承诺保护会议隐私和数据安全,符合 GDPR 要求。

Flux 能够准确捕捉会议记录并轻松回顾过去讨论,为用户提供精确的转录和精炼的摘要,支持 Google Meet、Zoom、Teams 和 Discord 等主流会议应用程序,用户还可创建模板适用于不同类型和受众的会议摘要。

Content generated by AI large model, please carefully verify (powered by aily)

References

AIGC Weekly #84

链接:https://x.com/javilop/status/1821814987737735344前段时间由于SD3的问题,开源的图片生态发展一度停滞,值得关注的新项目和模型几乎没有。FLUX上周发布后这个态势被快速改变了,由于其优秀的图片质量,高昂的训练成本并没有阻止开源社区。而且由于在其偏向真实的美学调教风格,也使生成的发布会写实图片在推上的热度爆发使得FLUX模型快速出圈。再加上Runway把那张AI生成的照片变成视频让更多人对现在图像和视频模型的发展进度有了更多的了解。目前Xlabs已经发布了基于FLUX的Controlnet模型和Lora模型的训练脚本。https://github.com/XLabs-AI/x-flux他们还顺便发布了一个FLUX的Canny Controlnet模型,另外这里还有Instant ID作者的新组织InstantX训练的一个Canny模型也可以试试。https://huggingface.co/InstantX/FLUX.1-dev-Controlnet-Canny-alphaXlabs也跟Lora训练脚本一起发布了他们的多个Lora,其中这个火遍推特的图片就是用那个写实Lora做的。https://huggingface.co/XLabs-AI/flux-RealismLora具体的Lora包括mjv6_lora、动漫Lora、写实Lora、迪士尼Lora、风景_lora、艺术Lora。Xlabs Lora下载:https://huggingface.co/XLabs-Al/flux-RealismLora

效率工具篇-5000+个AI 项目详解

官网(https://getflux.io/)Flux是一个AI会议助手,旨在让会议更加智能高效。它可以帮助用户摆脱重复性的任务,将注意力集中在有意义的对话上。Flux提供了以下核心特性:转录:Flux可以将会议内容转录下来,捕捉所有重要的细节。上下文动作:根据对话的上下文,Flux提供相关的操作建议。无缝集成:Flux可以与HubSpot、Jira和Notion等热门应用程序无缝集成,实现工作流的顺畅进行。使用场景:-简化会议:通过自动化重复性任务,让您专注于讨论。-提高生产力:利用Flux的建议来草拟邮件、规划项目等,提高效率。-有效协作:通过一键执行操作,与团队成员进行有效的协作。Flux通过处理重复性任务并提供有价值的建议,革新了会议体验,让用户能够进行更加专注和高效的讨论。定价计划(美元):-免费版:面向个人用户,提供基本功能。用户支持与社区:Flux提供客户支持,并且有用户社区,用户可以从中获取帮助和互动。

效率工具篇-5000+个AI 项目详解

优势、局限与注意事项:-优势:Flux不仅仅是一个转录工具,还提供了定制化的会议摘要和类似ChatGPT的问答功能。此外,Flux还与Slack和Notion等喜爱的应用程序集成。-局限:目前没有提及任何产品的局限性。-注意事项:保护会议隐私和数据安全是Flux的承诺,它符合GDPR的要求。总结:Flux是一个能够准确捕捉会议记录并轻松回顾过去讨论的产品。它为用户提供了精确的转录和精炼的摘要,确保不会遗漏任何细节。用户还可以与Flux AI进行对话,向其询问有关过去会议的问题,甚至撰写跟进邮件等。Flux支持Google Meet、Zoom、Teams和Discord等主流会议应用程序。无论是早上的例会还是晚上的跨时区会议,Flux都能为用户进行精确回顾。用户还可以在Flux中创建模板,适用于不同类型和受众的会议摘要,从2句话的CEO记录到详细的项目经理更新。Flux旨在为忙碌的团队提供帮助,轻松跟踪团队正在进行的工作,并将会议摘要直接发送到Notion。

Others are asking
开源flux模型如何快速使用
以下是关于开源 Flux 模型快速使用的方法: 1. 模型的下载: 如果因为环境问题,可以在网盘中下载。 siglipso400mpatch14384(视觉模型):siglip 由 Google 开发的视觉特征提取模型,负责理解和编码图像内容。工作流程包括接收输入图像、分析图像的视觉内容并将这些视觉信息编码成一组特征向量。打开 ComfyUI\models\clip,在地址栏输入 CMD 回车,打开命令行,输入下面的命令拉取模型(也可以在网盘里下载)。 image_adapter.pt(适配器):连接视觉模型和语言模型,优化数据转换。工作流程包括接收来自视觉模型的特征向量、转换和调整这些特征,使其适合语言模型处理。通过 https://huggingface.co/spaces/fancyfeast/joycaptionprealpha/tree/main/wpkklhc6 下载,放到 models 的 Joy_caption 文件夹里,如果该文件夹不存在,就新建一个。 MetaLlama3.18Bbnb4bit(语言模型):大型语言模型,负责生成文本描述。工作流程包括接收经过适配器处理的特征、基于这些特征生成相应的文本描述、应用语言知识来确保描述的连贯性和准确性。打开 ComfyUI\models\LLM,地址栏输入 CMD 回车,在命令行里面输入下面命令。 2. 下载地址: ae.safetensors 和 flux1dev.safetensors 下载地址:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。 准备了夸克和百度的网盘链接,方便部分同学下载: flux 相关模型(体积较大)的夸克网盘链接:https://pan.quark.cn/s/b5e01255608b 。 flux 相关模型(体积较大)的百度网盘链接:https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码:ub9h 。 如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,速度会快很多,下载地址:https://huggingface.co/Kijai/fluxfp8/tree/main 。 3. 工作流下载: 最后我们再下载 dev 的工作流: 。或者下面官方原版的图片链接,图片导入 comfyUI 就是工作流:https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png 。我们打开 ComfyUI,把工作流或图片拖拽到 ComfyUI 里。
2025-04-08
我现在是学了一段时间的comfyui+flux,接下来准备学Python开发comfyui节点、对接模型,这样学下去方向有没有问题呢
您学习 ComfyUI 和 Flux 一段时间后准备学习 Python 开发 ComfyUI 节点并对接模型,这个方向是可行的。以下是一些相关的知识和要点供您参考: 工作流方面: 工作流节点可直接拖动单个节点到任意位置,也可按住 Control 键并用鼠标左键滑框选中多个节点,再按 Shift 键一起拖动。 选中节点后右键新建组,可修改组名、颜色等,组被覆盖时可直接拖动组。 选中节点后右键选择对齐方式,如顶部对齐、左边对齐等。 第三方节点的安装方式包括在 customer NODE manager 中安装、在 GitHub 上复制链接安装、通过终端输入指令安装、在秋叶启动器的版本管理中安装。 可通过 group by Parser 节点控制组,也可通过按住节点按 control b 跳过或按 control m 终止执行。 模型方面: 噪声强度由种子调节,种子固定噪声分布方式,噪声与 CLIP 无关,增大噪声设置值会增强模型对图片重绘的程度。 模型版本的提示词差异:1.5 以 tag 为主,XL 论文称以自然语言为主,但实际使用中因模型微调情况可能仍需用 tag。 Flux 模型有时生成黑图,可能有修复方案,需自行查询。图像生成结果为空,可能是 VAE 编码器与大模型未连接,调整连接后问题解决。 安装方面: 自动打标 joy_caption 副本的节点安装地址为 D:\\ComfyUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes。 安装步骤包括:(Comfyui evn python.exe)python m pip install rrequirements.txt 或点击 install_req.bat,注意 transformers 版本不能太低。 下载模型或者运行 ComfyUI 自动下载模型到合适文件夹,如从 https://huggingface.co/unsloth/MetaLlama3.18Bbnb4bit 下载并放到 Models/LLM/MetaLlama3.18Bbnb4bit 文件夹内。 新版的 PuLID 解决了模型污染的问题,使用新版的节点需要禁用或者删除之前的 PuLID 节点,不然可能会有冲突问题。模型放在 ComfyUI\\models\\pulid 文件夹里面,注意用新版的。 如果使用 PuLID,还需要安装 EVA CLIP 等模型。
2025-03-21
flux lora训练
以下是关于 Flux 的 Lora 模型训练的详细步骤: 模型准备: 1. 下载所需模型,包括 t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。 注意:不使用时存放位置随意,只要知晓路径即可。训练时建议使用 flux1dev.safetensors 版本的模型和 t5xxl_fp16.safetensors 版本的编码器。 下载脚本: 1. 网盘链接: 夸克网盘链接:https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接:https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码:pfsq 安装虚拟环境: 1. 下载完脚本并解压。 2. 在文件中找到 installcnqinglong.ps1 文件,右键选择“使用 PowerShell 运行”。 3. 新手在此点击“Y”,然后等待 1 2 小时的下载过程,完成后提示是否下载 hunyuan 模型,选择 n 不用下载。 数据集准备: 1. 进入厚德云 模型训练 数据集:https://portal.houdeyun.cn/sd/dataset 2. 创建数据集: 在数据集一栏中,点击右上角创建数据集。 输入数据集名称。 可以上传包含图片 + 标签 txt 的 zip 文件,也可以上传只有图片的文件(之后可在 c 站使用自动打标功能),或者一张一张单独上传照片。 Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。 上传 zip 以后等待一段时间,确认创建数据集,返回到上一个页面,等待一段时间后上传成功,可点击详情检查,预览数据集的图片以及对应的标签。 Lora 训练: 1. 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 2. 选择数据集,点击右侧箭头,选择上传过的数据集。 3. 触发词可有可无,取决于数据集是否有触发词。 4. 模型效果预览提示词则随机抽取一个数据集中的标签填入。 5. 训练参数可调节重复次数与训练轮数,厚德云会自动计算训练步数。若不知如何设置,可默认 20 重复次数和 10 轮训练轮数。 6. 按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。 7. 等待训练,会显示预览时间和进度条。训练完成会显示每一轮的预览图。 8. 鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 数据集存放位置:.Flux_train_20.4\\train\\qinglong\\train 运行训练:约 1 2 小时即可训练完成。 验证和 lora 跑图:有 ComfyUI 基础的话,直接在原版工作流的模型后面,多加一个 LoraloaderModelOnly 的节点就可以,自行选择 Lora 和调节参数。
2025-03-15
flux ae.sft放在哪个文件夹
在 ComfyUI 中,flux ae.sft 应放在 ComfyUI/models/vae/ 文件夹下。 Flux 模型在 ComfyUI 中的使用,需要将相关模型放在对应的目录下。具体来说,t5xxl_fp16.safetensors 放在 ComfyUI/models/clip/ 目录下,clip_l.safetensors 放在 ComfyUI/models/clip/ 目录下,ae.safetensors 放在 ComfyUI/models/vae/ 目录下,flux1dev.safetensors 放在 ComfyUI/models/unet/ 目录下。flux1dev.safetensors 是底模,ae.safetensors 是 VAE,clip_l.safetensors 和 t5xxl_fp16.safetensors 是关于文字语言编码。
2025-03-07
ERROR: Could not detect model type of: D:\AIruanjian\AIRUANJIAN\ComfyUI-aki(1)\ComfyUI-aki-v1.6\ComfyUI\models\checkpoints\flux1-dev-fp8.safetensors
很抱歉,根据您提供的错误信息“ERROR: Could not detect model type of: D:\AIruanjian\AIRUANJIAN\ComfyUIaki\ComfyUIakiv1.6\ComfyUI\models\checkpoints\flux1devfp8.safetensors”,暂时无法明确具体的问题原因。可能是模型文件格式不被识别,或者文件路径存在错误等。建议您检查文件的完整性和正确性,确保其符合相关软件的要求。
2025-03-07
midjourney_whisper_flux_lora_v01
以下是关于您提到的“midjourney_whisper_flux_lora_v01”的相关信息: 1. XLabsAI 发布了 6 个不同的 Lora,包括 Midjourney 风格、写实风格、动漫风格、迪斯尼风格、风景风格等,并提供了相应示例。 2. 文生图模型排序(从高到低):Imagen 3 真实感满分,指令遵从强;Recraft 真实感强,风格泛化很好,指令遵从较好(会受风格影响);Midjourney 风格化强,艺术感在线,但会失真,指令遵从较差;快手可图 影视场景能用,风格化较差;Flux.1.1 真实感强,需要搭配 Lora 使用;文生图大模型 V2.1L(美感版) 影视感强,但会有点油腻,细节不够,容易糊脸;Luma 影视感强,但风格单一,糊;美图奇想 5.0 AI 油腻感重;腾讯混元 AI 油腻感重,影视感弱,空间结构不准;SD 3.5 Large 崩。 3. 指定 AI 生图里的文字,有 9 种解决方案,其中 2 种快过时了。包括 Midjourney(v6 版本开始支持文字效果,主要支持英文,中文支持有限)、Ideogram(以图片嵌入文字能力闻名,2.0 模型能力得到进一步加强,支持复杂文本和多种艺术风格,文字与图像能够自然融合,支持英文,中文提示词可自动翻译为英文)、Recraft(V3 开始支持文本渲染能力,是目前唯一能在图像中生成长文本的模型,支持精确的文本位置控制,支持图像编辑功能,支持矢量图生成,支持英文,中文渲染能力较弱)、Flux(FLUX.1 是一款高质量的开源图像生成模型,支持复杂指令,支持文本渲染,支持图像编辑,生成图像的质量很高,主要支持英文)。
2025-03-07
最新的AI排行榜
以下是最新的 AI 排行榜相关信息: 3 月 9 日榜单: 文生图:Ideogram 2a(官方评价这是 Ideogram 迄今为止最快、最实惠的文生图模型) 文生视频:SkyReels、海螺01director、Pixverse4.0 图生视频:SkyReels、Pixverse4.0、Adobe Firefly 测评涵盖了 Midjourney,Flux,即梦,Recraft,ideogram,SD3.5,Sora,可灵,通义,即梦,海螺,pixverse,pika,vidu,luma 等 50+国内外热门模型,还有 Veo 2.0 等最新模型上线。本周最出乎意料的是最新上的模型 SkyReels,在文生视频和图生视频榜单都排名靠前。 生成式 AI 季度数据报告 2024 月 1 3 月: 赛道方面:天花板潜力为数亿美金;对标公司有 Xmind 等;总体趋势平稳增长,15.93%;月平均增速 34 万 PV/月;原生产品占比中等。 竞争方面:Top1 占比 32%;Top3 占比 82%;马太效应弱;网络效应中;大厂是否入局是,但大厂占比较低;技术门槛中。 23 年 12 月至 24 年 3 月月访问量排行榜及变化情况: 非大厂的 Top1 公司及产品:Whimsical Al,估值融资 3000 万$(2021),最新月 PV 为 237 万。2023 年 4 月,月访问量 382 万,Whimsical AI、gitmind AI 分别位列第一、第二的位置,月访问量合计占比 84%。2024 年 3 月,月访问量 812 万,Whimsical AI 整年看处于增长态势,仍位列第一,月访问量达到 237 万;ProcessOn 凭借其原有客户积累,月访问量快速增长,位列第二名,占比 25%。 记忆辅助榜单中,2023 年 4 月,月访问量为 83 万,Rewind AI 以 43 万的访问量位居第一,占赛道月总访问量的 52%。Personal.ai 和 Heyday 分别以 25 万和 8 万的访问量位列二、三,分别占赛道月总访问量的 30%和 10%。2024 年 3 月,月访问量增长至 245 万,rabbit inc.以 128 万的访问量跃居第一,占赛道月总访问量的 52%。Humane 和 Rewind AI 分别以 46 万和 22 万的访问量位列二、三,分别占赛道月总访问量的 19%和 9%。 相关网址: https://www.xiaohongshu.com/user/profile/65890e73000000003d035101?xsec_token=AB67OV1KW_ANCcrYRU_oRTJKJ9xLtexbMgyoJq68rxQA%3D&xsec_source=pc_search aiwatch.ai
2025-04-15
有哪些最新的ai技术可用在课堂教学上
以下是一些可应用在课堂教学上的最新 AI 技术: 1. 智慧技术助理:为教师提供辅助,帮助教师在课前、课中、课后呈现新的教学样态,驱动学生高效和差异化学习。 2. 生成式人工智能:可用于为教师减负,例如辅助设计教学内容、生成提示词等。 3. 个性化学习支持:通过 AI 技术实现对学生的个性化学习支持,如智能评估学生的学习情况,为每个学生提供定制化的学习方案。 4. 教育过程和结果的结构化表征:利用 AI 进行分析,帮助教师更好地了解学生的学习过程和结果。 5. 多维度数据采集与评价:AI 可以整合行为、情感、认知等多维度数据,为学生绘制发展全景图,实现更全面的教育评价。 需要注意的是,AI 在教育中是“助手”而非“替代”,教师应充分利用这些成熟的技术促进教育变革。
2025-04-13
ai在教学中的最新应用
以下是 AI 在教学中的一些最新应用: 1. MIT 为孩子开设免费的 AI 课程,涵盖了 AI 在跨学科领域的应用,如 AI 与气候、AI 与大学录取、AI 对美国大选的影响等。孩子们需要思考如何用气候数据写好故事、预测气候变换走向,从数据分析角度了解大学录取中的相关问题,以及识别 AI 深度伪造的新媒体材料等。 2. 张翼然提出用 AI 为教师减负,为有初步 AI 使用经验、渴望了解最新技术进展并交流的老师提供了相关技巧和分享。例如,在智慧技术助理加持下探索教学新样态,分享全球 AI 技术在教育界的新发展和应用案例。 3. 从 AI 助教到智慧学伴的应用探索中,提出调整教学理念,将 AI 作为教学辅助工具和合作伙伴。学习利用 AI 工具的优势应用于教学,如自动生成练习、个性化反馈等,同时确认输出质量。根据 AI 能力设计开放性作业,调整考核方式,继续发挥教师在提供情感支持、培养团队合作等方面的优势。
2025-04-11
最新的生命科学有关的 AI动向
以下是生命科学领域有关 AI 的最新动向: 在医疗健康生物制药方面,AI 技术极大地加速了研究,在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。例如,AI 提前三年诊断胰腺癌;两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因;AI 帮助抗衰老,筛查出高效的药物候选物;利用 AI 寻找阿尔兹海默症的治疗方法;通过神经网络分析患者体液中的生物标志物,早期诊断帕金森。 Nature Methods 主题特刊聚焦于 AI 在生物学中的应用,探讨了计算生物学多领域,强调高精度蛋白质结构预测成就,提及了 AI 在蛋白质组学数据分析中的应用、机器学习可解释性挑战,以及科研人员对 AI 工具培训的需求,同时探讨了 AI 与生物医学数据结合的新时代。 Flagship Pioneering 创始人 Noubar Afeyan 提出 AI for Science 的下一步是 MultiAgent,旨在实现类似自动驾驶的科研自动化,推动生命科学领域的革命性进展。
2025-04-10
请问有什么AI最新在零售行业的应用,最好有趣,实用有建设性
以下是 AI 在零售行业的一些有趣、实用且有建设性的最新应用: 1. 舆情、投诉、突发事件监测及分析:通过 AI 技术实时监测和分析消费者的反馈和市场动态,帮助企业及时做出应对策略。 2. 品牌营销内容撰写及投放:利用 AI 生成吸引人的营销文案,并精准投放到目标受众。 3. 自动化库存管理:基于历史销售数据和其他相关因素,预测未来的库存需求,优化库存配置,降低成本。 4. 自动生成或完成 SKU 类别选择、数量和价格分配:提高商品管理的效率和准确性。 5. 客户购物趋势分析及洞察:深入了解消费者的购物偏好和趋势,为企业的产品开发和营销策略提供依据。 此外,在医疗药品零售领域,AI 也有广泛的应用: 1. 药品推荐系统:根据用户购买记录和症状描述等数据,推荐合适的非处方药品和保健品,提高销售转化率。 2. 药品库存管理:分析历史销售数据、天气、疫情等因素,预测药品需求量,优化库存策略。 3. 药品识别与查询:借助计算机视觉技术,用户通过手机拍摄药品图像即可获取相关信息。 4. 客户服务智能助手:基于自然语言处理技术,回答顾客关于购药、用药、保健等常见问题。 5. 药店运营分析:分析销售、顾客流量、库存等大数据,发现潜在问题和优化空间。 6. 药品质量监控:利用机器视觉、图像识别等技术检测药品的包装、标签、颜色等是否合格。 7. 药品防伪追溯:利用区块链等技术实现全流程的药品溯源,保障药品供应链的安全和可信度。 总之,AI 技术在零售行业的应用能够提升购物体验、优化运营管理、降低成本,并为企业创造更多的价值。
2025-04-10
我想了解最新的ai的即时信息(最新资讯与ai工具)
以下是为您提供的最新 AI 即时信息和工具: 4 月 1 日 AI 资讯: 【AI 模型及应用】 OpenAI:将会开源一个推理模型,ChatGPT 即将推出推理强度控制选项,Gpt4o 生图能力面向免费用户。 Gemini 2.5 Pro:免费使用,任何人都可以使用 Canvas 进行编码和创作。 【AI 视频】 Higgsfield:发布 50 多个电影级摄影机动作预设,提升动态镜头表现力。 luma:为 Ray 2 引入摄像机运动概念,可基于预设镜头并组合编辑。 Remakes:支持基于用户上传图像直接编辑,并融合 Remade 视频特效,简化创意流程。 Meta:宣布推出 MoCha 系统,实现电影级说话角色合成效果。 【AI 3D】 HSMR:推出从单张图像重建人体 3D 骨骼和网格模型的系统。 krea:引入 AI 3D 生成能力,扩展其创意工具的功能范围。 PGC:推出基于物理的单一姿势高斯布料模拟技术,提升数字服装的真实感。 【AI 音频】 MiniMax Audio:发布全新 Speech02 语音模型,提升语音合成质量。 3 月 19 日 AI 资讯: 【AI 模型】 英伟达:发布全球首个开源人形机器人基础模型 Isaac GR00T N1 及相关 GTC 信息。 谷歌 Gemini:放出了两个功能 Canvas 和 Audio Overview。 【AI 视频】 STAbility AI:发布 Stable Virtual Camera,2D 图像转化 3D 视频。 Domo AI:推出“图片说话”功能,带口型匹配。 【AI 3D】 Roblox:推出 AI 3D 技术 Cube 3D。 Claude MCP Unity 版本推出。 【AI 音乐】 AI 音乐工具 Udio:推出 v1.5 Allegro。 LVAS Agent:基于多智能体协作的长视频音频合成。 获取 AI 资讯的渠道: 公众号:超时空视角、AI 替代人类。 小红书/抖音:EverAI。 B 站:Ever AI 酱(这里会有教程及 AI 工具界面操作)。 关于“通往 AGI 之路”知识库和社区平台: WaytoAGI(通往 AGI 之路)是一个致力于人工智能(AI)学习的中文知识库和社区平台。为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。 汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。 提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 社区定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 引领并推广开放共享的知识体系,倡导共学共创等形式,孵化了 AI 春晚、离谱村等大型共创项目。 在没有任何推广的情况下,WaytoAGI 一年时间已有超过 100 万用户和超千万次的访问量。 目前合作过的公司/产品包括阿里云,通义千问,淘宝,智谱,支付宝,豆包,火山引擎,marscode,coze,堆友,即梦,可灵,MiniMax 海螺 AI,阶跃星辰,百度,Kimi,吐司,liblib,华硕,美团,美的,360,伊利,魔搭,央视频,Civitai,Openart,Tripo3D,青椒云等。
2025-04-10
如果面试AI产品经理岗位,我的简历应该如何介绍对应的AI项目?目前我在做的是一个AI深度解读的功能,用户通过报告页面进行深度解读,进入后触发AI与用户的沟通,根据沟通信息,将用户的一些情况写在病历信息中,最终发给医生
以下是为您提供的一些参考,帮助您在面试 AI 产品经理岗位时介绍对应的 AI 项目: 在您所做的 AI 深度解读功能项目中,可以从以下几个方面进行介绍: 项目背景:阐述开展该项目的原因和目标,例如为了提升医疗服务的效率和准确性,满足用户对深度医疗解读的需求等。 项目职责:详细说明您在项目中的具体职责,如需求分析、产品规划、与开发团队协作、与用户沟通获取反馈等。 技术实现:描述项目中所运用的关键技术,如触发 AI 与用户沟通的机制、如何将用户信息写入病历等。 用户体验优化:提及为提升用户体验所采取的措施,比如优化报告页面的设计、提高 AI 沟通的自然度和准确性等。 成果与效益:展示项目取得的成果,如提高了医生的诊断效率、提升了用户满意度等。 此外,您还可以参考以下其他相关人员的项目经验: 秦超作为 AI 2C 项目负责人,在产品落地服务方面具有丰富的经验,包括产品、技术架构以及项目管理等。 Cici?在 AI 算法开发领域,将宠物与 AI 结合,具备 AI 产品研发和创业经验。 11 鸭鸭呀作为产品经理,在智能写作产品方面有 Prompt 撰写和 AI 应用的经验。 枫 share 作为产品经理,熟悉 ChatGPT,写过 prompt,使用过多种 AI 创作工具,并正在寻找 AI 方向的产品岗位。 行远作为产品经理,熟悉 prompt,部署过多种绘图项目,使用过多款 AI 创作工具,期待学习和实战案例应用。 希望以上内容对您有所帮助,祝您面试成功!
2025-04-01
扣子设置了微信客服机器人,如何实现机器人按时自动向微信群发布图片或文档等信息。
要实现微信客服机器人按时自动向微信群发布图片或文档等信息,您可以按照以下步骤进行操作: 前提条件: 1. 已开通了。 2. 已搭建了 Bot。 步骤一:获取微信客服配置信息 1. 登录平台。 2. 单击企业信息,然后复制企业 ID。 3. 单击开发配置,然后再单击开始使用。 4. 单击随机获取按钮分别生成并保存 Token 和 EncodingAESKey。复制 Token 和 EncodingAESKey 后,先不要关闭该页面。 步骤二:在扣子中配置微信客服信息 1. 在 Bots 页面,选择需要发布的 Bot。 2. 在 Bot 编排页面,单击发布。 3. 找到微信客服渠道,然后单击配置。 4. 输入步骤一中复制的企业 ID,然后单击下一步。 5. 输入步骤一中复制的 Token 和 EncodingAESKey,然后单击下一步。 6. 复制 webhook 地址。复制 webhook 地址后,先不要关闭该配置窗口。 步骤三:配置回调地址 1. 回到步骤一中的开始企业接入页面,输入上一步中复制的 webhook 地址。单击完成。确保粘贴回调地址时没有引入空格,空格会导致校验失败。 2. 在开发配置页面,复制 secret。 3. 单击客服账号,复制账号。 步骤四:发布 Bot 1. 回到扣子平台的微信客服渠道配置页面,输入复制的 secret 和客服名称。 2. 单击保存。 3. 在发布记录中输入发布信息,然后勾选微信客服渠道,再单击发布。 4. 发布完成后,单击立即对话登录微信客服,体验 Bot 效果。 常见问题: 1. 收不到机器人回复消息怎么办? 可尝试通过以下方法解决: 查看微信客服的启用状态:登录,在应用管理页面,点击微信客服。确保没有启用微信客服功能。如果已经开启了微信客服功能,需要关闭。关闭后,该应用在工作台入口将被隐藏,员工不可使用。请谨慎评估。 检查近期是否有登录企业微信应用。确保企业至少有一个成员通过手机号验证/微信授权登录过企业微信应用。 如果还是有问题,可以发送邮件至 feedback@coze.cn 反馈。
2025-03-30
问题定义: 1. 核心问题陈述:创作一份个人参赛的、以光伏业务中财务工作与AI结合进行业务赋能为主题的展示类参赛方案框架。 2. 关键上下文信息:公司举办AI创新大赛,个人参赛,主题方向为工作和AI结合限定在业务赋能,公司业务是光伏领域。 3. 问题的具体范围界定:聚焦光伏业务中财务工作与AI结合进行业务赋能的展示方案框架创作。 答案要求: 1. 内容范围: - 必须包含:整体参赛方案思路、光伏财务业务与AI结合的具体方向、展示方案大致框架。
很抱歉,您提供的知识库内容中没有与光伏业务中财务工作与 AI 结合进行业务赋能的参赛方案框架相关的信息。但以下是为您生成的一个可能的参赛方案框架示例: 一、整体参赛方案思路 本次参赛方案旨在探索如何将 AI 技术应用于光伏业务中的财务工作,以实现更高效、精准和智能化的业务赋能。通过深入分析光伏行业的特点和财务工作的需求,结合先进的 AI 技术,提出创新的解决方案,提升财务工作的效率和质量,为公司的光伏业务发展提供有力支持。 二、光伏财务业务与 AI 结合的具体方向 1. 财务预测与分析 利用机器学习算法对光伏项目的成本、收益进行预测,为投资决策提供数据支持。 分析市场趋势和政策变化对财务状况的影响,提前制定应对策略。 2. 风险评估与管理 运用大数据和人工智能技术,对光伏项目的风险进行实时监测和评估。 建立风险预警模型,及时发现潜在的财务风险。 3. 成本优化与控制 通过智能算法优化供应链管理,降低采购成本。 分析生产过程中的能耗数据,实现成本的精细化控制。 4. 财务报表自动化生成与审计 利用自然语言处理技术自动生成财务报表,提高工作效率。 运用 AI 辅助审计,提高审计的准确性和效率。 三、展示方案大致框架 1. 项目背景与目标 介绍光伏行业的发展现状和公司的业务情况。 阐述将财务工作与 AI 结合的目标和意义。 2. 技术方案与实现 详细介绍所采用的 AI 技术和算法。 展示技术方案的实现过程和关键步骤。 3. 应用案例与效果 分享实际应用案例,展示 AI 在财务工作中的具体应用场景。 分析应用效果,如成本降低、效率提升、风险控制等方面的成果。 4. 未来展望与挑战 展望 AI 在光伏财务领域的未来发展趋势。 探讨可能面临的挑战及应对策略。 5. 总结与结论 总结方案的核心内容和创新点。 强调对公司光伏业务的价值和贡献。 以上框架仅供参考,您可以根据实际情况进行进一步的细化和完善。
2025-03-28
推荐一些优质AI信息源,X上的
以下是为您推荐的一些优质 AI 信息源: 1. 在,Grok 能通过 X 平台实时了解世界,还能回答多数其他 AI 系统拒绝的棘手问题,独具幽默回答模式,可避免恶意提问,留下邮件可申请早期测试。 2. 「AI 研究报告》中文版,这是对 2022 年 10 月2023 年 10 月 AI 现状及进展最为全面的报告。 3. 即刻 App 的“”等免费圈子,这里有前沿信息线索,很多 Twitter 上的开发者大牛也会在此分享。 此外,AI 知识库的信息来源还有赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等,推荐大家订阅获取最新信息并投稿。对于初学者入门,推荐看 Open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。还有经典必读文章,如介绍 GPT 运作原理、Transformer 模型、扩散模型等的文章,以及软件 2.0 时代相关内容。
2025-03-28
图片信息提取
图片信息提取主要包括以下几个方面: 1. 实现工作流: 上传输入图片。 理解图片信息,提取图片中的文本内容信息。 场景提示词优化/图像风格化处理。 返回文本/图像结果。 零代码版本:选择 Coze 平台,将本地图片转换为在线 OSS 存储的 URL 以便调用,封装图片理解大模型和图片 OCR 为工作流插件。 2. 银海的工程视角 TrickleOnWeChat 方案: 设计信息整合和提炼的 Prompt 提示词,将 OCR 文本信息与图片识别信息关联整合,按信息分类分析方法整理并按指定格式输出,增加标签分类。 3. 星流一站式 AI 设计工具: 左侧图片案例板块包含大量图像例图与生图信息,滑动鼠标到“info”区域可直接将图像发送到画布与生图信息调取。 图像筛选功能包括推荐(根据生图参数推荐)、热门(推荐浏览量最高的图片)、搜索(输入描述进行图像搜索)。 图像调取包括点击“发送到画布”直接将图像发送到“无限画布”,生图参数调取包括整体调取(点击“发送到生成器”调取全部参数)和单个调取(点击右侧单独的发动键调取单个参数)。
2025-03-24