Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有没有实际案例

Answer

以下是一些 AI 在视频生成方面的实际案例:

  • 在 T2V-01-Director 模型使用教程中,有多种运镜示例,如镜头左摇并上摇,从一只小兔子抬头向左开始,慢慢移向天空;镜头从暗色调房屋屋顶开始,上升并左摇拍摄城市天际线等。
  • 为 AI 视频生成设计的结构化提示词模板中,包括史诗灾难场景、赛博朋克未来都市、奇幻神话场景等。例如史诗灾难场景中,提示词为燃烧的陨石群穿透血红色云层,主体是残破的自由女神像半埋于熔岩中等。
  • 在视频模型 MiniMax 海螺 AI 的实际运用案例中,如在一场戏的分镜头拆解梳理中,有男人无奈起身开门、开门、开门走出等情节的视频生成方式和结果。还有门外两个万圣节扮相的小女孩向男人要糖、男人嫌弃地拒绝女孩要糖请求等情节的视频生成处理。
Content generated by AI large model, please carefully verify (powered by aily)

References

T2V-01-Director 模型使用教程 副本

示例:|Prompt|对应运镜|示例||-|-|-||镜头左摇,同时上摇,从一只小兔子抬头向左开始,慢慢移向天空,气球顺着小兔子的视线飘向天空。|左摇<br>上摇|[1月26日(7)-3.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/U1TtbmFMPoicEyxZDTkcn9iVnQe?allow_redirect=1)||镜头从一栋暗色调房屋的屋顶开始,上升并向左摇,拍摄左侧壮丽的城市天际线。夜色中,城市灯火辉煌,远处的天空中,有一轮巨大的淡红色月亮。|左摇<br>上升|[1月26日(7)-2.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/DC4Wbnj0QoeDlvx8tmIc5WIgnrg?allow_redirect=1)||一位骑士站在废墟中央,手握断剑,仰望远处燃烧的天空。镜头从地面缓缓升起,展现出他周围的荒凉景象。然后镜头后拉,逐渐暴露出摇摇欲坠的城墙和远处熊熊燃烧的地狱。最后,镜头向上摇,对准天空中漂浮着的一个怪物的巨大阴影。|后拉<br>上摇|[1月26日(7)-1.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/XoNzbSbZCoOwUix8uwdcNxOQnth?allow_redirect=1)||镜头推进,同时变焦拉远,呈现出一位表情震惊的女性。背景是一片模糊的海滩,到处都是人。|推进<br>变焦拉远|[1月26日(7)-4.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/FMPUbkv0boHqS9xyrDucs6gXn98?allow_redirect=1)||镜头向左摇后向右摇,跟随拍摄一位红衣女士走向地铁站|左摇<br>右摇<br>跟随|[1月26日(7)-5.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/GYeab52Nko8AZhxZwr1cr3COnih?allow_redirect=1)|

为AI视频生成设计的 结构化提示词模板

1.史诗灾难场景提示词:[电影级广角镜头][缓慢推近]燃烧的陨石群穿透血红色云层,[主体:残破的自由女神像半埋于熔岩中][细节:雕像表面裂纹蔓延,熔岩飞溅到镜头前][背景:纽约城在冲击波中崩塌,桥梁断裂坠入海湾][光影:暗红色天空与地面熔岩的冷暖对比][氛围:末日压迫感][技术参数:25mm焦距,慢速镜头抖动,时长8秒]1.赛博朋克未来都市提示词:[无人机俯冲视角][从高空云层急速下降至街道]霓虹全息广告覆盖的巨型摩天楼群,[主体:悬浮跑车与机械义体人街头追逐][细节:车窗反射数据流,地面雨水倒映全息鲸鱼][背景:空中轻轨穿过全息樱花雨][光影:蓝紫色暗调中的高饱和霓虹][氛围:科技迷幻与危险交织][技术参数:动态模糊+0.5,帧率60fps,镜头旋转30度]1.奇幻神话场景提示词:[环绕运镜][由下至上仰拍]发光的半透明巨龙盘踞在倒塌的巴别塔上,[主体:龙鳞折射出星云纹理][细节:塔身缠绕发光藤蔓,碎片悬浮空中][背景:双月当空,较小月球正在裂解][光影:冷色月光与龙焰的橙红光晕][氛围:神性悲壮感][技术参数:Cinemascope画幅,烟雾粒子密度70%]

视频模型:MiniMax海螺AI

场戏分镜头拆解梳理(视频声音为后期制作)|镜头|情节需求|视频生成方式|视频结果||-|-|-|-||5|男人无奈起身开门|需要男性从第一幕中的状态改改变为起身去开门的动作。这里对于主体一致性的要求很高,且需要在相同的场景/光影条件下进行,使用文生视频对第1镜头的尾帧进行续生成。|[教程使用-18.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/T6ucbA2cLob0kaxhVRdcBY8Dn7e?allow_redirect=1)||6|男人开门|这里没有完整主体出现,只有主体的局部特征,使用文生视频生成伸手开门的特写画面。|[教程使用-19.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/TBDHbWbAKo47JaxEcfqc1YBQnBn?allow_redirect=1)||7|男人开门走出|此时男人已经出门,给到一个正面的交代镜头,因为是全新的场景空间环境,利用文生视频来提供更多的画面视觉元素更加便捷。使用相似的主体外形描述以稳固主体形象。|[教程使用-20.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/AdRXbmZnWor2TQxEga6c7Iikn6b?allow_redirect=1)||8|门外两个万圣节扮相的小女孩向男人要糖|这里是两个小女孩角色的第一次出场,采用文生视频,筛选最佳表现的画面内容作为正片素材|[教程使用-22.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/SGw5b5S9mooZB6x4MC2cYfvvn1h?allow_redirect=1)||9|男人嫌弃地拒绝女孩的要糖请求|这里需要使用过肩镜头交代女孩和男人的位置关系,同时展示男人的细节表情。使用文生视频进行生成,选择镜头/主体表情神态最符合需求的素材作为正片。|[教程使用-23.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/QphObrmMDofE3pxs0f6cjCSdnOc?allow_redirect=1)|成片效果:

Others are asking
请找到 AI 用于知识管理的案例
以下是一些 AI 用于知识管理的案例: 1. 在法学领域,当模型培训针对组织内特定的基于文本的知识体系进行微调时,生成式人工智能可以有效地管理组织的知识。例如摩根士丹利正在与 OpenAI 的 GPT3 合作,微调财富管理内容的培训,以便财务顾问既可以搜索公司内部的现有知识,又可以轻松地为客户创建量身定制的内容。 2. 在构建高效的知识管理体系方面,可以通过一系列创新的 AI 应用来实现。比如,AI 可以通过分析工作模式和内容类型,自动生成提示词,帮助将信息和知识分类到 PARA(项目、领域、资源、档案)的相应部分,还能帮设计笔记标签系统。此外,知识助手 Bot 可以根据学习进度和兴趣点,定期推送相关的文章、论文和资源,实现渐进式积累领域知识。 3. 在代码库相关的知识管理中,Cursor 有针对大代码库精准找到相关函数,并利用其信息帮助撰写代码的功能。对于非开发性质的问答,它是一个天然的 RAG 引擎。在问答窗口使用特定操作时,它会先在当前文件夹下搜索并显示相关文档和相关度,最后用这些信息构建提示词完成生成。而且,它能与私有文档自然结合进行问答,并将新生成的见解沉淀成新文档,形成知识闭环,提高知识检索和管理的效率。
2025-04-14
飞书+AI的应用案例
以下是飞书+AI的应用案例: 在企业运营方面,包括日常办公文档材料撰写整理、营销对话机器人、市场分析、销售策略咨询,以及法律文书起草、案例分析、法律条文梳理和人力资源简历筛选、预招聘、员工培训等。 在教育领域,协助评估学生学习情况,为职业规划提供建议,针对学生情况以及兴趣定制化学习内容,论文初稿搭建及论文审核,帮助低收入国家/家庭通过 GPT 获得平等的教育资源。 在游戏/媒体行业,有定制化游戏、动态生成 NPC 互动、自定义剧情、开放式结局,出海文案内容生成、语言翻译及辅助广告投放和运营,数字虚拟人直播,游戏平台代码重构,AI 自动生成副本。 在零售/电商领域,包括舆情、投诉、突发事件监测及分析,品牌营销内容撰写及投放,自动化库存管理,自动生成或完成 SKU 类别选择、数量和价格分配,以及客户购物趋势分析及洞察。 在金融/保险行业,有个人金融理财顾问、贷款信息摘要及初始批复、识别并检测欺诈活动风险、客服中心分析及内容洞。 线下活动方面: 活动宣传:用飞书文档制作活动宣传页面,用 AI 快速制作海报,用 GPTs 写人员分配和主持人台词,活动从策划到开始仅用 2 天时间。 活动报名:使用飞书的多维表格完成报名表及数据统计。 活动过程:大家在线协同,一起编辑文档,演示时共同展示一个文档。 活动记录:有相关的记录页面。 办活动的初衷是宣扬 AI 不只是降本增效的工具,还有很多乐趣等待挖掘,例如大理户外圆桌讨论、清迈的 AI 逛古城、杭州的 AI 玄学小组。
2025-04-13
有AI在各个行业的案例吗
以下是 AI 在各个行业的一些应用案例: 汽车行业: 1. 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定,如特斯拉、Waymo 和 Cruise 等公司在开发和测试自动驾驶汽车。 2. 车辆安全系统:AI 用于增强自动紧急制动、车道保持辅助和盲点检测等系统,通过分析数据预防事故。 3. 个性化用户体验:根据驾驶员偏好和习惯调整车辆设置,如座椅位置、音乐选择和导航系统。 4. 预测性维护:分析车辆实时数据预测潜在故障和维护需求,减少停机时间和维修成本。 5. 生产自动化:在汽车制造中用于自动化生产线,提高生产效率和质量控制。 6. 销售和市场分析:汽车公司用 AI 分析市场趋势、消费者行为和销售数据,制定营销策略和优化产品定价。 7. 电动化和能源管理:在电动汽车的电池管理和充电策略中发挥作用,提高能源效率和延长电池寿命。 8. 共享出行服务:如 Uber 和 Lyft 等,使用 AI 优化路线规划、调度车辆和定价策略,提高服务效率和用户满意度。 9. 语音助手和车载娱乐:AI 驱动的语音助手允许驾驶员通过语音控制车辆功能、获取信息和娱乐内容。 10. 车辆远程监控和诊断:AI 系统远程监控车辆状态,提供实时诊断和支持。 其他行业: 1. 企业运营:包括日常办公文档材料撰写整理、营销对话机器人、市场分析和销售策略咨询等。 2. 教育:协助评估学生学习情况,为职业规划提供建议,定制化学习内容,论文初稿搭建及审核,帮助低收入国家/家庭获得平等教育资源。 3. 游戏/媒体:定制化游戏、动态生成 NPC 互动、自定义剧情、开放式结局,出海文案生成、语言翻译及辅助广告投放和运营,数字虚拟人直播,游戏平台代码重构,AI 自动生成副本。 4. 零售/电商:舆情、投诉、突发事件监测及分析,品牌营销内容撰写及投放,自动化库存管理,自动生成或完成 SKU 类别选择、数量和价格分配,客户购物趋势分析及洞察。 5. 金融/保险:个人金融理财顾问,贷款信息摘要及初始批复,识别并检测欺诈活动风险,客服中心分析及内容洞察。
2025-04-12
用AIGC生成的单镜头循环视频案例
以下是一些用 AIGC 生成的单镜头循环视频的案例: OpenAI 的 Sora 视频生成模型:能够生成长达 1 分钟的视频,在时长、稳定性、一致性和运动幅度上表现出色。它可以根据提供的图像和提示生成视频,还能在时间上向前或向后扩展视频以产生无缝的无限循环。此外,能零镜头地改变输入视频的风格和环境,在两个输入视频之间逐渐进行插值创建无缝过渡,也能够生成图像。 Luma 视频生成工具 Dream machine 增加了尾帧生成视频的功能和循环视频生成功能。 智谱 AI 发布的 DiT 视频生成模型“智谱清影”,支持文生和图生视频,目前免费使用,加速生成需要付费。 此外,还有一些其他相关项目: Google 的 Genie 采用 STtransformer 架构,包括潜在动作模型、视频分词器与动力学模型,拥有 110 亿参数。 DeepMind 的 WaveNet 是一种生成模型,可以生成非常逼真的人类语音。 OpenAI 的 MuseNet 是一种生成音乐的 AI 模型,可以在多种风格和乐器之间进行组合。 ElevenLabs 的 Multilingual v2 是一种语音生成模型,支持 28 种语言的语音合成服务。 Stability 发布了 Stable Video 4D 模型,可以从视频中生成更多角度的新视频。 Pixverse 更新了 V2 版本 DiT 视频模型,支持 8 秒时长视频生成、细节和动作增强、支持最多 5 段内容一次性生成,无缝衔接。
2025-04-10
推荐知识库中用ai做学术的案例
以下是知识库中与用 AI 做学术相关的案例和信息: B 站 up 主的课程:每节 15 分钟,免费且内容好,涵盖 AI 艺术字等。 炼丹操作:16 号晚上中老师会带大家动手炼丹,炼丹需提前准备一些图,会让老师提前发布内容让大家准备。 高效 PB 及相关案例:高效 PB 投入力度大,有厉害的伙伴,案例在社区,有多种 battle 方式,会有菩萨老师专门介绍。 初学者入门推荐:推荐看 open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。 经典必读文章:如介绍 GPT 运作原理、Transformer 模型、扩散模型等的文章,还包括软件 2.0 时代相关内容。 历史脉络类资料:整理了 open AI 的发展时间线和万字长文回顾等。 6 月 29 日更新:翻译完 a16z 推荐的 AI 典藏文章其中两篇:。
2025-04-01
有AI+游戏的最新案例吗
以下是一些 AI+游戏的最新案例: 由 5 人独立游戏工作室 Proxima 开发的 AI 冒险独立游戏 Suck Up!上线三周油管播放超千万。这是一款沙盒社交冒险游戏,团队尝试加入了名为 Nemo 的 AI NPC,基于 LLM 驱动,Nemo 能在接收到用户命令或其他线索后,调动感知、记忆,并转化为可执行的游戏行动。去年上半年,该工作室因获得 160 万美元投资引起轰动,上线后也受到资本关注。玩家对其玩法和模式提出了很多创意想法,如设计成就系统、上线多人模式等。 开发者正在使用 AI 生成音乐来填充游戏过程与游戏 UI 中需要使用到的各类音效、不同游戏场景中用以渲染氛围的各种音乐。像 MusicLM 等模型已经支持生成多音轨的作品。 2023 年 Genfun.ai 和 Meshy 联合制作的游戏《Soul Chronicle》,是首款实时 3D+AIGC+UGC 的 MMO 手游,最大突破是制作出了与游戏完美融合的 3D AIGC 技术,可在游戏中实时生成角色皮肤。 2024 年 Bitmagic 释出的《Roleverse》平台,可在平台内使用提示在游戏内定制角色,对角色进行缩放、挤压和拉伸,也能轻松对游戏世界进行编辑。 AI 技术在游戏行业的应用由来已久,且不断发展。从最初的简单内容和随机元素生成,到辅助游戏设计,再到如今能够生成更复杂的游戏内容,如动态场景、智能 NPC 行为等。AI 对游戏创作的影响包括美术与风格、剧情与叙事、关卡与玩法、音效与音乐、测试与优化等方面。同时,AI 能基于玩家游戏行为评估玩家技能水平和游戏风格,动态调整游戏难度等,提升玩家体验。此外,游戏还能成为 AI 模型能力的最佳试验场。
2025-04-01
有没有能根据描述,生成对应的word模板的ai
目前有一些可以根据描述生成特定内容的 AI 应用和方法。例如: 在法律领域,您可以提供【案情描述】,按照给定的法律意见书模板生成法律意见书。例如针对商业贿赂等刑事案件,模拟不同辩护策略下的量刑结果,对比并推荐最佳辩护策略,或者为商业合同纠纷案件设计诉讼策略等。 在 AI 视频生成方面,有结构化的提示词模板,包括镜头语言(景别、运动、节奏等)、主体强化(动态描述、反常组合等)、细节层次(近景、中景、远景等)、背景氛围(超现实天气、空间异常等),以及增强电影感的技巧(加入时间变化、强调物理规则、设计视觉焦点转移等)。 一泽 Eze 提出的样例驱动的渐进式引导法,可利用 AI 高效设计提示词生成预期内容。先评估样例,与 AI 对话让其理解需求,提炼初始模板,通过多轮反馈直至达到预期,再用例测试看 AI 是否真正理解。 但需要注意的是,不同的场景和需求可能需要对提示词和模板进行针对性的调整和优化,以获得更符合期望的 word 模板。
2025-04-18
对于用cursor来开发,有没有好好用prompt来使cursor变得更加好用
以下是关于如何用 prompt 使 Cursor 变得更好用的相关内容: 在 prompt 方面,Devin 有一个特别有帮助的文档(https://docs.devin.ai/learnaboutdevin/prompting),它会教您什么样的 prompt 在与 Devin 沟通时最有效,比如明确定义成功的标准,如跑通某个测试或访问某个链接能对得上等。将同样的原则应用到 Cursor 中,会发现 Cursor 变得聪明很多,能自主验证任务完成情况并进行迭代。 Cursor 在生成单测方面表现出色。相对 GPT 等工具,Cursor 解决了上下文缺失和难以实现增量更新的问题。它可以向量化整个代码仓库,在生成单测代码时能同时提供目标模块及对应的上下游模块代码,生成结果更精确。例如,使用适当的 Prompt 能返回基于 Vitest 的结果,调整成本较小。 Cursor 支持使用.cursorrules 文件设定项目的系统提示词,针对不同语言可设定不同的 Prompt。@AIChain 花生做了一个 Cursor 插件解决提示语管理问题,可选择不同的.cursorrules 文件,还可从 https://cursor.directory/ 和 https://cursorlist.com/ 寻找提示词。此外,还有一个提示语小技巧,给已有的提示语追加上特定规则,可使模型在搜索资源和思考时默认使用英语,回复转换成中文,或更灵活地根据提问语言进行回复。
2025-04-14
有没有把pdf转成word的ai
以下是一些可以将 PDF 转换成 Word 的 AI 工具和方法: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-04-14
有没有AI面试
有的,目前有一些 AI 面试官的相关产品。例如: 1. 用友大易 AI 面试产品:具有强大的技术底座、高度的场景贴合度、招聘全环节集成的解决方案、先进的防作弊技术以及严密的数据安全保障。能帮助企业完成面试,借助人岗匹配模型自主完成初筛,并对符合企业要求的候选人自动发送面试邀约。 2. 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上。同时候选人体验也得到改善、到面率比之前提升最高达 30%。 3. InterviewAI:这是一个在线平台,提供与面试职位相关的问题和由 AI 生成的推荐答案。候选人可以使用设备上的麦克风回答每个问题,每个问题最多回答三次。对于每个答案,候选人将收到评估、建议和得分。 不过,使用这些产品时,企业需要考虑到数据安全性和隐私保护的问题。 此外,在 3 月 19 日的 XiaoHu.AI 日报中,提到了一些其他的 AI 相关内容: 1. 克隆一个自己,用 AI 面试:创新的克隆 AI 面试应用。链接:https://x.com/imxiaohu/status/1770011969229390287?s=20 2. SystemAnimatorOnline,全身运动捕捉:基于 AI 的全身运动捕捉方案,仅需网络摄像头。新交互方式,适用于虚拟直播和视频制作。链接:https://github.com/ButzYung/SystemAnimatorOnline… 、https://x.com/imxiaohu/status/1769957973252796634?s=20 3. Apollo 机器人,自主制作果汁:展示与英伟达 Project GROOT 合作,实现任务自主完成。从人类示范中学习,无需回初始位置。链接:https://x.com/imxiaohu/status/1770047098731577481?s=20 4. MindEye2,重建大脑所见图像:仅需 1 小时 fMRI 数据,重建观察者所见图像。能识别多个图像选项中的实际所见。实现不同受试者数据的有效泛化。链接:https://medarcai.github.io/mindeye2/ 、https://arxiv.org/abs/2403.11207 、https://github.com/MedARCAI/MindEyeV2 、https://x.com/imxiaohu/status/1770021233129885989?s=20 5. 英伟达 Blackwell GPU
2025-04-14
有没有优质的系统的coze入门网课?
以下是一些优质的系统的 Coze 入门网课推荐: 另外,还有“一泽 Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力”,这可能是全网最好的 Coze 教程(之一),即使是非技术出身的爱好者也能上手跟学,一站式学会 AI Agent 从设计到落地的全流程方法论。其核心看点包括通过实际案例逐步演示用 Coze 工作流构建能够稳定按照模板要求生成结构化内容的 AI Agent、开源 AI Agent 的设计到落地的全过程思路、10+项常用的 Coze 工作流的配置细节、常见问题与解决方法等。适合任何玩过 AI 对话产品的一般用户,以及希望深入学习 AI 应用开发平台(如 Coze、Dify),对 AI Agent 工作流配置感兴趣的爱好者。但需注意,本文不单独讲解案例所涉及 Prompt 的撰写方法。文末「拓展阅读」中,附有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容,以供前置或拓展学习。
2025-04-14
有没有免费制作数字人的网站?
以下是一些免费制作数字人的网站及使用方法: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。上传后效果如图所示,My Avatar处显示上传的照片。点开大图后,点击Create with AI Studio,进入数字人制作。写上视频文案并选择配音音色,也可以自行上传音频。最后点击Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的Create vedio。选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。配音时,可以选择提供文字选择音色,或者直接上传一段音频。最后,点击Generate vedio就可以生成一段视频。打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法:点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。点击开始创作,选择自定义照片。配音时,可以选择提供文字选择音色,或者直接上传一段音频。打开绿幕按钮,点击背景,可以添加背景图。最后,点击生成视频。 此外,在剪映中也可以生成数字人:在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。软件会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成,可点击预览按钮查看效果。还可以为视频增加背景图片,删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,通过拖拽轨道右侧竖线使其与视频对齐。
2025-04-11
低代码实际应用
低代码在实际应用中有多种场景和实现方式: 在构建本地小应用方面,可通过以下两种方法实现工作流: 直接使用 Coze 的 API 对接前端 UI 框架,将工作流逻辑集中在工程模板端,实现前后端分离。 直接调用大模型 API,并通过前端代码实现提示词处理和逻辑控制,将交互流程完全放入前端代码中。 实现文件上传可通过 Coze 的,用户可将本地文件上传至 Coze 的云存储。 关于 API 的使用及工作流执行流程可以参考。 若用户需要通过前端展示文件或流程结果,搭建 Demo 最简单的方式是首先绘制草图,然后借助多模态 AI 工具(如 GPT/Claude)生成初步的前端结构代码。 前端开发语言包括用于构建网页基础框架、定义整体页面结构的 HTML,负责网页布局样式美化、使页面视觉效果更优美的 CSS,以及实现交互逻辑,如信息处理、网络请求及动态交互功能的 JavaScript。 有人在手搓 Bot 的过程中体验到了低代码的快乐,写很少的代码就能快速把想法实现并做成产品发布。例如,用 Coze 这样的平台,降低了技术门槛,又提供了相当的可定制性,灵活度比 OpenAI 的 GPTs 要强,可制作出更复杂的应用。 在解决生活中的决策问题方面,如选工作,通过具体例子展示决策模型在实际生活中的应用,让理论产生价值。
2025-04-01
教育行业有那些基于aigc的业务实际落地的产品和案例?
以下是教育行业基于 AIGC 的一些业务实际落地的产品和案例: 教师的 AI 减负指南生成式人工智能在教学中的应用,包括教师使用 AI 的小技巧。涉及人员有张亚丽、富露露、张亚玲、张楚璇、吴箭枢等,学校有深圳大学附属中学、苏州工业园区娄葑学校、上海市静安区风华初级中学南校、江苏省苏州工业园区教师发展中心中学、苏州工业园区唯亭学校初中、中央民族大学附属中学等。 AIGC 人机协同国家课程项目化学科实践设计与实施,例如以科学《计量时间博物展》为例,以及基于思维可视化的项目式主题学习设计与实践,如以智驾未来课程为例。相关人员有祝琛、崔琴、张然、刘敏、王国庆、吴沁珂等,学校有深圳市南方科技大学教育集团实验二小、成都经济技术开发区实验小学校。 Al 创作家:用 AI 辅助设计桌游,解决学校实际问题,如北京市新英才学校的魏一然所做的工作。 生成式人工智能与教学变革:AI 领雁行动的探索与实践,相关人员有邹贤莲、向雪萍、陈治佑、余初冉、阊洪娇,学校有重庆两江新区行远小学校。 北京市新英才学校的跨学科项目老师带着学生用 AIGC 做学校地图桌游,英语老师在 AIGC 的帮助下备课和授课,生物和信息科技老师合作一起带着学生用训练 AI 模型,用以识别植物。 AIGC 常见名词解释,如 AIGC 意为人工智能生成内容,能进行 AIGC 的产品项目和媒介众多,包括语言文字类的 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等,语音声音类的 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等,图片美术类的 Midjourney、Stable Diffusion 等。
2025-03-13
通义灵码实际使用体验
通义灵码的实际使用体验如下: 在 Pytharm 中,通过“文件”“设置”“插件”红色框位置搜索“通义灵码”,安装通义灵码插件(目前免费)。 通义灵码是基于通义大模型的 AI 研发辅助工具,提供代码智能生成、研发智能问答、多文件代码修改、自主执行等能力,为开发者带来智能化研发体验,引领 AI 原生研发新范式。 通义灵码 AI 程序员具备多文件代码修改和工具使用的能力,可以与开发者协同完成编码任务,如需求实现、问题解决、单元测试用例生成、批量代码修改等。其核心能力包括:从片段级到多文件级的 AI 编码、协同完成复杂编码任务、多文件代码 Diff 生成和审查、面向任务的多轮对话迭代编程。 未来将与通义灵码合作推出 AI 编程课程。
2025-03-07
在室内软装设计领域,ai实际可以如何运用
在室内软装设计领域,AI 有以下实际运用方式: 1. 工具辅助: Maket.ai:主要面向住宅行业,在户型设计和室内软装设计方面有探索。设计师输入房间面积需求和土地约束,软件能自动生成户型图并提供详细设计结果。 2. 创意生成: 利用 AI 图像生成工具,输入相关关键词,生成多种室内软装创意设计方案,获取新颖独特的灵感。 3. 模拟可视化: 借助 AR/VR 等技术,将 AI 生成的设计方案在实际环境中模拟和可视化,更好地评估和验证设计。 4. 分析优化: 使用 AI 工具对室内软装设计方案进行采光、动线、材料等方面的分析和优化,以符合使用者需求和体验。 5. 自动化设计: 利用 AI 自动生成符合设计规范的室内软装平面图等,提高设计效率,缩短设计周期。 6. 协作模式: 人工设计师与 AI 工具形成互补,在创意、分析、优化等环节充分发挥各自优势。 同时,还有字节旗下的 Coze AI 的图像工作流可用于快速出家装设计效果图,并根据客户咨询信息收集用户联系方式形成销售线索,体验地址为:https://www.coze.cn/store/bot/7374039392832405554?panel=1&bid=6cq1cccs00017 。但需注意,每个工具都有其特定应用场景和功能,建议根据具体需求选择合适的工具。
2025-02-25
神经网络与大脑实际工作的原理区别
神经网络与大脑实际工作的原理存在以下区别: 1. 神经网络本质上是运行在多层面上的软件,由人工建立的一层层互相连接的神经元模型组成,模仿大脑处理复杂问题,如视觉和语言等。它可以自行学习与工作,不需要人为提示或参与控制。 2. 早期由于电脑处理能力不足,神经网络的发展受限。而大脑则具有强大的天然处理能力。 3. 神经网络的计算风格受神经元及其适应性连接启发,与传统的序列计算不同。 4. 对于循环网络,其连接图中存在定向循环,动态复杂,更具生物真实性。 5. ChatGPT 是通过获取大量人类创作的文本样本进行训练,生成类似的文本。其神经网络由简单元素组成,基本操作简单,从积累的“传统智慧统计数据”中提取“连贯的文本线索”,但不像大脑那样具有全面和复杂的功能。 总之,神经网络是对大脑的一种模拟,但与大脑真实的工作方式仍存在诸多差异。
2025-02-25
PATHON+AI 如何应用到实际工作中,你这边有没有实际案例教学
以下是一个关于 Python + AI 在实际工作中的应用案例: 在自动驾驶车辆领域,对于 AI 系统的可解释性需求程度高度取决于具体情境,包括应用的安全关键程度。例如,设计自动驾驶车辆的技术专家需要理解系统的决策能力以进行测试、评估和改进;普通用户可能仅需了解决策过程以安全使用车辆;若车辆发生故障并导致有害结果,监管机构可能需要有关系统如何运作的信息以分配责任。尽管 AI 可解释性仍是技术挑战和活跃的研究领域,但监管机构已在开展相关工作以解决此问题。如 2021 年,ICO 和艾伦图灵研究所共同发布了关于用 AI 解释决策的指导,为组织提供了实用建议,以帮助向受其影响的个人解释由 AI 交付或协助的流程、服务和决策。
2025-02-22