直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
COMFY UI中的Repeat或Tile功能
ComfyUI 中的 Repeat 或 Tile 功能: 分块长度(t_tile_length):时间维度上每次处理的帧数,用于处理长视频,如设置为 16。当分块长度与帧数一致时,画面较稳定但变化少。例如,帧数 32 时分块长度可为 24 或 32。 分块重叠(t_tile_overlap):相邻时间块之间重叠的帧数,如设置为 8。 其工作原理为: 1. 将长视频分割成多个重叠的短片段(tiles)。 2. 对每个片段单独进行处理。 3. 在重叠区域使用混合或平滑技术,确保片段之间的过渡自然。 ComfyUI 相关动态: 发布了相对大的版本更新 0.10,支持在 ComfyUI 中使用循环和条件语句,前端代码迁移到 TypeScript,新的搜索和设置 UI,实验性 FP8 算法支持以及 GGUF 量化支持。 ComfyUI 视频背景替换工作流: 用了一个 tile 来固定画面,让采样生成后的视频与原来一致。 资料链接: https://pan.baidu.com/s/1NomdtOR6TbaurTuzGwoMUw?pwd=cycy https://xiaobot.net/post/0e6aa76398a24cc5867c44aca7e887ea 更多内容收录在:https://xiaobot.net/p/GoToComfyUI 网盘:https://pan.quark.cn/s/4e5232c92746 工作流:https://www.liblib.art/modelinfo/23c073ff88194c32be15fe56977223ef?from=personal_page 视频:https://www.bilibili.com/video/BV1NZHfeREAp/?vd_source=ecb7194379e23ea8b1cb52e3bd5d97ef workflow:https://openart.ai/workflows/e3H4DwH55TlMBlT7MI4A https://www.shakker.ai/modelinfo/9f06f370c1614be89180c1c9fb9864eb?from=personal_page video:https://youtu.be/nf753qp1pLg
2024-12-26
我想借助AI帮我理解学术名词,需要如何操作?
要借助 AI 帮助您理解学术名词,您可以采取以下几种操作方式: 1. 使用在线智能语言模型工具,如 ChatGPT 等,向其清晰准确地描述您想要理解的学术名词,并提出您的疑问和需求。 2. 利用知识问答类的 APP 或网站,输入相关学术名词,获取相关的解释和说明。 3. 对于一些特定领域的学术名词,还可以查找专门针对该领域的 AI 辅助学习工具。 在与 AI 交流时,尽量详细地描述您的困惑和期望,以便获得更准确和有用的回答。
2024-12-26
AI图生视频前沿
以下是关于 AI 图生视频前沿的相关信息: 在近半年闭源产品趋势方面: 1. 服务头部创作者方面,产品将逐渐增强编辑器能力,强化视频细节可控性,并智能化后期制作任务。 2. 影视后期方向,可将动捕演员表演转化为虚拟角色,提高特效制作效率。 3. 专业领域,创作者能通过草图分镜快速验证效果,但目前效果不够成熟。 4. 随着实时生成能力提升和成本下降,AI 实验性艺术在博物馆、展览等互动应用将增多。 5. 在 C 端大众消费侧,AI 视频在小说、网文阅读、短情景剧等内容消费方向有潜力,人物识别和替换可衍生电商平台虚拟试衣间能力。 6. 模板套用能力若以低成本开放在短视频产品中,可能带来新的爆发周期。 其他动态包括: 1. Krea 用开放的 API 做了自己的 AI 视频功能,支持对任何视频输入提示词进行延长。 2. Runway 发布 ActOne 功能,支持将现实视频的人物表情和动作迁移到生成的视频上,且已全量开放。 3. Ideogram 发布 Ideogram Canvas,可在无限画布上对生成的图片进行编辑。 4. Meta 的图像分割模型 SAM 更新了 2.1,大幅加强了相似物体和小物体的分割和识别效果。 在 2024 年国内外 AI 企业竞争方面: 1. 中国开源项目赢得全球粉丝,成为积极开源贡献者。DeepSeek 在编码任务中表现出色,阿里巴巴的 Qwen2 系列视觉能力令人印象深刻,清华大学的 OpenBMB 项目催生了 MiniCPM 项目。 2. 国外 Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,并在定制化方面进步显著。今年 3 月推出的 Stable Video 3D 可预测三维轨道。 3. OpenAI 的 Sora 能生成长达一分钟的视频,保持三维一致性等,还使用原始大小和纵横比的视觉数据训练。 4. Google DeepMind 的 Veo 将文本和可选图像提示与嘈杂压缩视频输入结合,创建并解码独特的压缩视频表示。
2024-12-26
AI直播主要财务假设
以下是关于 AI 直播的主要财务假设相关内容: AI 数字人直播盈利方式: 1. 直接销售数字人工具软件,实时驱动类一年价格在 4 6 万往上(标准零售价),非实时驱动类一个月 600 元,但效果差,市场价格混乱。 2. 提供数字人运营服务,按直播间成交额抽佣。 AI 直播卖货适用品类和场景: 1. 适用于不需要强展示的商品,如品牌食品饮料;不适用于服装,过品快且建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,涉及主播话术、套路和调动氛围能力等。 4. 电商直播中,数字人直播在店播方面效果较好,数据基本能保持跟真人一样。 AI 直播的壁垒和未来市场格局: 1. 长期来看技术上无壁垒,但目前仍有技术门槛,如更真实的对口型、更低的响应延迟等。 2. 不会一家独大,可能有 4 5 家一线效果的公司,大多为二三线效果公司。 3. 真正把客户服务好、能规模化扩张的公司更有价值,疯狂扩代理割韭菜、不考虑客户效果的公司售后问题麻烦。 4. 有资源、有业务的大平台下场可能带来降维打击,例如剪映若不仅提供数字人,还提供货品供应链、数据复盘分析等全环节服务,会绑定商家,竞争难度大。 RPA + 财务税务问答机器人制作教程相关: 1. 关于 AI 税务机器人的直播准备与开场,包括封面制作、声音测试、人员分工等,并进行了直播开场。 2. AI 在税务工作中的应用及实现方式,包括利用引刀 AP 创建网页实现智能解答税务问题,结合飞书避免信息泄露和实现自动回复等。 3. 使用引到 AP 创建税务 AI 智能助手及相关部署,包括搭建知识库、创建并部署 AI 工作流,还提及结合飞书功能使用的原因。 4. 飞书机器人与引到 AP 的结合及相关问题,包括操作步骤、常见问题及与其他产品的区别等。 5. RPA 产品介绍及应用场景,杭州分叉智能公司成立三四年,获几亿美金融资,其 RPA 产品可控制桌面软件,实现办公流程自动化。RPA 是流程自动化机器人,可替代电脑办公中的重复有逻辑工作,为企业降本增效,底层语言用 Python,使用界面为全中文。适用场景如开具大量发票、查询大量出租车违章、朋友圈点赞等,在财务领域可用于开票、网银流水下载等。还展示了创建 RPA 机器人的流程,通过指令控件让机器人执行任务,操作比代码更简单。公司多人多部门使用 RPA 可实现无人化办公专区,提高办公效率,节省人力时间成本。
2024-12-26
ai视频前沿
以下是关于 AI 视频前沿的相关信息: AI 视频学社: 简介:为方便大家测试学习 AI 视频相关知识和内容而建立,可通过参与每周比赛、观看高手直播分享来快速学习,涵盖 AI 视频和影视创作领域最前沿的知识。 目标: 不定期直播,AI 视频方向高手直播分享。 每周固定 1 次 video battle 视频挑战赛,周一发布主题,周日 18 点前交稿,有奖品。 不定期组织线上或者线下活动。 一起学习 AI 视频最新软件和最新知识,学习图生视频、视频生视频等技巧。 软件教程: 每周一赛: 2024 人工智能报告: 2024 年是 AI 图像视频迅速发展的一年,赛道竞争激烈。 国内:中国开源项目赢得全球粉丝,成为积极开源贡献者。几个模型在个别子领域表现出色,如 DeepSeek 在编码任务中受青睐,阿里巴巴的 Qwen2 系列视觉能力印象深刻,清华大学的 OpenBMB 项目催生了 MiniCPM 项目。 国外:Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,还推出了 Stable Video 3D。OpenAI 的 Sora 能生成长达一分钟的视频,保持三维一致性等。Google DeepMind 的 Veo 将文本和图像提示与视频输入结合生成高分辨率视频。 AI 视频生成产品推荐及实践教学: Runway:年初在互联网爆火,由总部位于旧金山的 AI 创业公司制作,2023 年初推出的 Gen2 代表当前 AI 视频领域前沿模型,能通过文字、图片等生成 4s 左右视频,致力于专业视频剪辑领域的 AI 体验,同时扩展图片 AI 领域能力。目前支持网页、iOS 访问,网页端有 125 积分免费试用额度(可生成约 105s 视频),iOS 有 200 多,两端额度不同步。官方网站:https://runwayml.com/ Gen1 和 Gen2 的区别和使用方法:Gen1 的主要能力有视频生视频、视频风格化、故事版、遮罩等,仅支持视频生视频是与 Gen2 的最大差异。Gen1 使用流程: Gen1 能力介绍:https://research.runwayml.com/gen1 Gen1 参数设置:https://help.runwayml.com/hc/enus/articles/15161225169171 学习视频:https://youtu.be/I4OeYcYf0Sc
2024-12-26
给多张图片生成一个3d建模
以下是一些可用于将多张图片生成 3D 建模的工具: 1. Tripo AI:是 VAST 发布的在线 3D 建模平台,基于数十亿参数级别的 3D 大模型,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,实现快速的 2D 到 3D 转换,并提供 AI 驱动的精准度和细节。在“Create”界面底部输入框输入提示词(不支持中文),或点击输入框左侧的“</>”按钮随机生成提示词,点击“Create”生成 3D 模型,每次生成 4 个基础模型,不满意可点击“Retry”重新生成,有满意的模型点击“Refine”精修,精修进度在“My Models”中查看,一般 5 分钟左右完成。还可通过点击输入框右侧的图标上传图片生成 3D 模型,图生 3D 一次生成一个基础模型,同样支持“Retry”重生成和“Refine”精修。 2. Meshy:功能全面,不仅支持文本生成 3D,还支持图片生成 3D 以及 AI 材质生成。用户可通过上传图片并描述需要的材质和风格来生成高质量的 3D 模型。 3. CSM AI:支持从视频和图像创建 3D 模型,其“Realtime Sketch to 3D”功能支持通过手绘草图实时设计 3D 形象,再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域的模型生成。用户可上传图片或输入文本提示词来生成 3D 模型。 5. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能够将图像或文本快速转换成 3D 模型,并提供了图像到 3D、文本到 3D 和文本到纹理等多种功能。 6. Polycam:只需上传至少 20 张图片或至少 20 秒的视频,Polycam 自动处理并构建一个 3D 模型。生成后还可以编辑模型,支持 12 种以上的格式导出到流行的 3D 软件中,如 Blender、SketchUp、Unreal、Unity 等。100 张图像的云处理建模时间只需要大约 1 2 分钟。可以在网站以及 iOS 和 Android 应用中来创建、编辑和存储 3D 模型,完全免费。Polycam 还可以轻松将无人机拍摄的图像转换为广阔的 3D 模型。只需上传关键帧无人机图像,就可以快速得到 3D 模型。Polycam 与所有流行的无人机兼容,包括 DJI Mavic 3、DJI Mini 4 Pro 和 DJI Phantom 4 Pro。 这些工具通常具有用户友好的界面,允许用户通过简单的操作来生成 3D 模型,无需专业的 3D 建模技能。它们可以广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。
2024-12-26
各个国家对人工智能的接受态度
不同国家对人工智能的接受态度存在差异: 美国:稳居对人工智能兴趣的榜首,在 12 个月里,其人工智能行业访问量达 55 亿次,占总流量的 22.62%。美国拥有超过 1.8 万亿美元的全球领先科技市场。 印度:紧随美国之后,访问量达 21 亿人次,占总流量的 8.52%。印度是全球最大的 IT 和 BPO 服务出口国之一。 印度尼西亚、菲律宾和巴西:兴趣水平相似,去年产生了 1.3 至 14 亿人次的访问量。巴西在南美洲处于领先地位,其产生的流量几乎是排在第二位的英国、日本和德国的两倍。 中国:尽管拥有 14 亿人口,但未跻身前 20 名。 从全球视角看教育与 AI 的融合程度: 北欧国家如芬兰,全社会重视教育和技术创新,政府重点投资教育技术研发和应用,实现个性化教学,培养学生批判性思维和解决复杂问题的能力。 许多发展中国家,尤其是撒哈拉以南的非洲国家,在教育资源基础配置上严重不足,基础设施薄弱,电力和网络连接不可靠,难以实现 AI 技术的高级应用。 在 AI 地缘政治方面: 最先进的 AGI 世界模型不开源,开源模型会落后闭源一个代际,但服务更广泛的专业应用。 美国对中国的硬件 科技限制进一步升级。 AGI 对全行业科技发展起推动作用,有更好 AGI 的国家会有更快的全面技术进步。 对于 AI 的立法、监管、伦理讨论大范围落后于技术发展,全世界主要国家都急于拥有自己的 AI,目前只有欧洲有相关讨论,但也仅在纸面上,我国相关法规讨论出发点在于“对于舆论的影响”,未触及 AGI 本身的伦理问题。
2024-12-26
人工智能各个国家的态度
不同国家对人工智能的态度和相关情况如下: 欧洲:《欧盟人工智能法案》获得批准并正式生效,成为世界上第一个全面采用人工智能监管框架的地区。执行将分阶段进行,对“不可接受的风险”的禁令将于 2025 年 2 月生效。 美国:大型实验室努力应对欧洲监管。美国商务部对中国实施更严格的出口管制和投资限制,包括要求美国制造商停止向我国半导体制造商进行最先进设施的销售,阻止或限制对中国初创企业的投资。 中国:是第一个开始制定生成式人工智能监管框架的国家,审查机构已介入。持续生产 SOTA 模型,由国家互联网信息办公室监督,发布模型前须提交测试以校准拒绝率。禁止访问 Hugging Face 等国外网站,但官方批准的“主流价值观语料库”可作为训练数据源。 美国在人工智能行业的访问量方面,稳居第一。在研究的 12 个月里,访问量达到 55 亿次,占总流量的 22.62%。印度紧随其后,访问量达到 21 亿人次,占总流量的 8.52%。印度尼西亚、菲律宾和巴西的兴趣水平相似,产生了 1.3 至 14 亿人次的访问量。巴西在南美洲处于领先地位,其流量几乎是排在第二位的英国、日本和德国的两倍。有趣的是,尽管中国拥有 14 亿人口,但未跻身前 20 名。
2024-12-26
人工智能教育领域的应用
人工智能在教育领域的应用广泛且具有颠覆性,主要体现在以下几个方面: 1. 个性化学习平台:通过集成算法和大数据分析,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源。例如 Knewton 平台,通过对数百万学生行为模式分析,精准预测学习难点并提前给出解决方案,大幅提升学习效率。 2. 自动评估:利用自然语言处理技术(NLP)自动批改学生作文和开放性答案题。如 Pearson 的 Intelligent Essay Assessor,能够分析和理解写作内容,给出准确评分和反馈,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学工具:使课堂教学更丰富和互动,如 AI 教师能引导学生通过对话学习、解答疑问并提供即时反馈。Google 的 AI 教育工具 AutoML 用于创建定制学习内容,提高学习动机,加深知识掌握。 4. 虚拟现实(VR)和增强现实(AR):学生可通过 VR 头盔进入虚拟实验室,安全进行实验操作并得到 AI 系统反馈。例如 Labster 的虚拟实验室平台,提供高科技实验室场景,让学生尝试复杂实验流程,无需昂贵设备或专业环境。 同时,北京大学教育学院教授汪琼指出,教育领域的数字化转型不能只是将传统教育方式搬到线上,还需新解决方案,技术创新应用和数据整合挖掘是关键。我们正进入新时代,AI 成为教与学的伙伴,但在迎接新一代人工智能发展带来的挑战时,必须注意“信息茧房”的危害,平衡其潜力与局限,注意技术引入的全局影响。 然而,AI 技术对传统教育体系的冲击也带来诸多挑战,如教育体系内部惯性、教师技能更新、课程内容适时调整、评估和认证机制改革等。
2024-12-26
海报自动生成
以下是一些可以自动生成海报的 AI 产品: 1. 字节即梦:其图像字幕功能出色,能满足普通人和商家的设计需求,并提供了海报自动生成的工具和体验入口。 三思同学教程: 即梦体验: 2. Canva(可画): 是非常受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可帮助选择合适颜色搭配和字体样式。 3. 稿定设计: 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 4. VistaCreate: 是简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 5. Microsoft Designer: 通过简单拖放界面,可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,简化设计流程。 请注意,上述内容由 AI 大模型生成,请仔细甄别。
2024-12-26