Navigate to WaytoAGI Wiki →
Home/All Questions
有制作爆款短视频的ai提示词吗?
以下是一些制作爆款短视频的 AI 提示词相关内容: 1. 写脚本方面: 可以选择 Kimi、Claude、Chatgpt 等大模型,对于科学上网困难的小伙伴,可优先选择免费好用的 kimi(https://kimi.moonshot.cn/),有条件可选功能更强大的 chatgpt(https://chatgpt.com/),本作品用的是 Claude(https://claude.ai/new),Claude 在脚本创作方面有优势。 脚本提示词的结构是:我要做什么样的视频+视频要包含哪些关键的元素+对脚本的输出有什么要求。例如,要做 30 秒时长的广告宣传片脚本、做一个孩子们喜欢的儿童绘本脚本等;重点要把产品的特性或者想要的广告风格说出来,如奔驰高端商务、豪华舒适的特性,苹果香脆多汁、红润饱满的特点;按照一定的格式输出,推荐使用 Markdown 格式输出,方便后续操作。 2. 单镜头内容注意:要给 AI 确切的画面描述,杜绝不确切描述,如将“一个女生备考,用纳米 AI 定制模拟专题练习,最后成功上岸”改为“一个中年妇女辅导 12 岁的女儿作业,女孩看着妇女,妇女挠挠头,表情沉重。然后拿出手机对着桌子上的书拍照,然后放下手机,跟小姑娘说话,表情舒缓,欣慰,温柔。侧面镜头,镜头环绕到正面”。 3. 提示词网站分享: Learn Prompting https://learnprompting.org/docs/intro AI Short https://www.aishort.top/en/ AIPRM https://www.aiprm.com/prompts/ Prompt Library https://promptlibrary.org/
2025-01-20
怎么可以变现赚钱创造价值
以下是关于变现赚钱创造价值的一些方式: 1. GPTs 模型变现: 直接盈利:开发者可为使用其 GPT 模型设定费用,通过直接销售获得收益,例如提供封装自媒体行业的 GPTs 辅助写爆文、出标题等产品绑定方式售卖。 间接盈利:即使模型免费使用,也可通过广告收入等方式获利,如放入商家广告、公众号信息、联系方式等,还可在封装 GPTs 时带上个人介绍、微信号、公众号名称等完成引流。 品牌收益:构建品牌影响力和个人 IP,获得声誉上的收益,例如提示词领域的知名人士通过封装的 GPTs 帮助他人解决问题或提供创意娱乐,获取口碑和影响力。 2. Coze 变现: 上节课分享了用 Zion 把 Coze bot 打造成赚钱工具,包括前端页面设计和用户支付链路搭建。 针对常见难题,如开发多个 Coze Bot 的整合及无企业支付宝和营业执照的收款账户对接,有“Coze 变现模板(多智能体版)”,个人用户无需企业支付宝账号也能轻松变现和收款。 可参考完整的,内含变现案例实操分享。 3. 扣子“AI 应用”变现: 在公司给自己贴 AI 大神标签。 在社交网络进行分享,扩大影响力。 承接项目开发。 二创方向包括增加画板节点,结合公司 Logo 生成一系列公司主题的产品邮票,承接类似需求扩充工作流,修改提示词调整生图内容方向。 总之,技术很关键,创意更重要,好技术加上好创意才能成就好产品,祝您在 AI 应用之路增加自己的收入。
2025-01-20
李飞飞关于aigent的文章
以下是李飞飞关于 AIgent 的相关文章: 《对话"AI 教母"李飞飞:我们究竟需要什么样的 AI Agent?如何正确把握这个风口》:李飞飞在访谈中探讨了 AI Agent 的发展及其未来。她强调 AI Agent 应作为工具和赋能者,而非主导者,确保人们的自主性。李飞飞回顾了 ImageNet 的创立背景,并提到正在推动的“空间智能”概念,旨在理解和融合物理与数字三维世界。她认为,未来这两者的界限将逐渐模糊,从而带来更大变革。 《[李飞飞:理解世界运作方式是 AI 的下一步,我们需要从大语言模型转向大世界模型》:李飞飞认为,人工智能的下一步应从大型语言模型转向大型模型,强调视觉智能在理解和与世界互动中的重要性。计算机需要具备空间智能,能够建模、推理并在三维空间中互动。通过最新的 AI 技术,机器可以根据文本提示完成任务,并在虚拟环境中导航。未来,这种以人为中心的人工智能将在家庭护理、医疗支持等领域发挥重要作用。
2025-01-20
ai语言模型记忆能力与什么相关,可以拥有人类相当的记忆吗
AI 语言模型的记忆能力主要与以下因素相关: 1. 长期记忆:主要有长文本(持久化)、总结、RAG 等实现方式。长文本处理中的 KV Cache 可通过缓存历史计算的 Key(K)和 Value(V)减少冗余计算,但需额外存储空间,可能导致显存占用增加,未来结合持久化 KV Cache、KV Cache 的压缩技术有望控制成本,从而打造出记忆力超越人类的智能体。 2. 短期记忆:主要存在于模型的上下文中,由对话内容(用户输入、模型输出)和系统提示词组成。 Inworld AI 开发的角色引擎,增加了可配置的安全性、知识、记忆、叙事控制、多模态等功能,其中长期记忆方面,角色能以类似人类的记忆功能操作,从闪存和长期记忆中检索信息。 人类的思维是由自然语言或感官记忆构成的超高维时间序列,而人工智能与人类不同,人类会为事物赋予意义与价值,人工智能则更追求“更准”。强化学习是人工智能的一个重要分支,通过定义状态、动作与奖励等元素,让 AI 求解如何选择动作以获得最大的期望奖励总和。
2025-01-20
ai语言模型是如何运作的
AI 语言模型的运作机制主要包括以下几个方面: 1. 对于大语言模型(LLM),如豆包在回复时是一个字一个字地推理生成内容,即流式输出。这类似于输入法的输入联想逻辑,会根据输入的单个字或上下文推测下一个字。但存在两个问题:一是全量数据计算算力吃不消,二是仅算字的概率易受不相干信息干扰。为解决这些问题,出现了词向量机制和 Transformer 模型中的 Attention 自注意力机制。 2. 大型语言模型通过大量的数据训练来学习语言的结构和模式,包括词汇、语法、句子结构以及上下文关系。当接收到输入时,会根据学习到的知识生成连贯的回答,类似于词语接龙游戏。 3. 以 Kimi Chat 为例,大模型会利用网页搜索工具,在互联网上检索相关内容,并基于检索结果进行总结分析,最后给出结论。同时,大模型还可以通过自行规划任务执行的工作流路径,如先识别男孩的姿势,再找到相关模型处理等。 4. 在多智能体协作方面,如吴恩达通过开源项目 ChatDev 举例,可让一个大语言模型扮演不同角色相互协作,共同开发应用或复杂程序。 5. OpenAI 的研究主管 Lilian Weng 提出了“Agent = LLM + 规划 + 记忆 + 工具使用”的基础架构,其中大模型 LLM 扮演了 Agent 的“大脑”。规划包括子目标分解、反思与改进,将大型任务分解为较小可管理的子目标,并对过去的行动进行自我批评和反思,以提高最终结果的质量。 需要注意的是,大模型并不拥有无限知识,其知识来源于训练过程中接触到的数据,这些数据是有限的。虽然大模型可以处理和生成大量信息,但只能回答在训练过程中见过或类似的问题,且训练后的知识库不会自动更新。
2025-01-20
文字转语音
以下是关于文字转语音的相关信息: Hedra: Hedra.com 放出了基础模型 Character1 的研究预览版,即日起在 http://hedra.com(桌面和移动)上提供。 具有无限期(打开预览为 30 秒)、每 60 秒产生 90 个(如果 H100 的供应保持不变)、富有表现力的说话、唱歌、说唱角色等特点。 其使命是建立一个人人都能使用的多模态创作工作室。 操作教程:可以直接文字转语音,目前有 6 个语音,也可以直接上传音频。 《神谕》: 为了提升交互体验,ChatGPT 返回的中文文字通过 TTS 服务选择合适的声音播放出来。 内部自研的 TTS 及代码平台可将游戏开发者输入的文本直接转成语音。
2025-01-20
lisp提示词
Lisp 语言在提示词编程中的应用具有以下特点: 1. Lisp 语言的语法:Lisp 是一门“古老”的编程语言,其语法核心是 List 结构或“S 表达式”,需要用一对括号把元素括起来,语法简洁优美且具有很强的表达能力。 2. 与 Markdown 的比较:平时写提示词更多用的是 Markdown 语法,它简单且大语言模型能很好理解,如标题、列表、加粗强调等。将 Lisp 提示词翻译成 Markdown 后,语义几乎一致,但在某些效果上存在差异,如 Lisp 版本中 SVG 图形的丰富度和表现力稳定地优于 Markdown 版本。此外,Markdown 版本在执行过程中会输出中间“思考”过程,多数场景下这样一步一步思考有正向收益,还能调试优化流程。而 Lisp 版本很难让大语言模型有条理地执行流程。 3. LLM 对 Lisp 程序的理解:一段 Lisp 提示词可能描述了简单的工作流,如对用户输入文本处理生成小确幸表达和生成 SVG 卡片等。虽然 Lisp 擅长描述程序且压缩信息能力强,但程序难懂,需要大量解码和按特定逻辑解读。大语言模型能解释 Lisp 程序,但作为提示词让其按程序逻辑运行很难,尤其对于复杂的函数调用,且难以保证程序里定义的子步骤被正确且无遗漏地执行。
2025-01-20
智谱清言
智谱清言是智谱 AI 和清华大学推出的大模型产品,其基础模型为 ChatGLM 大模型。2023 年 10 月 27 日,智谱 AI 于 2023 中国计算机大会(CNCC)上推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。 模型特点: 工具使用排名国内第一。 在计算、逻辑推理、传统安全能力上排名国内前三。 更擅长专业能力,但代码能力有优化空间,知识百科与其他第一梯队模型相比稍显不足。综合来看,是很有竞争力的大模型。 适合应用: 场景广泛,可优先推进在 AI 智能体方面相关的应用,包括任务规划、工具使用及一些长文本记忆相关的场景。 在较复杂推理应用上效果不错。 广告文案、文学写作方面也是很好的选择。 在对结构化 prompt 的测试和反馈中,输入智谱清言后,问题和文心一言一样,需先改写再看输出效果。改写后效果不错,能理解 prompt,输出内容感觉良好。这里最大的体会是结构化 prompt 非常重要,要从结构化开始,且要不断迭代,根据输出结果不断优化。
2025-01-20
静态图片如何通过ai生成动图
以下是将静态图片生成动图的两种方法: 方法一:使用 LivePortrait 1. LivePortrait 可以精确控制眼睛和嘴唇的动作,还能无缝拼接多个肖像,将不同人物特征合并成一个视频,确保过渡自然流畅。 2. 它使用了一种不同于主流扩散方法的隐式关键点框架,在计算效率和可控性之间取得了有效的平衡。生成的动画质量优于现有的非扩散和扩散模型方法。在 RTX 4090 GPU 上,生成速度为每帧 12.8 毫秒,效率显著高于现有的扩散模型。 3. 支持各种风格的图片,常见的动物面部迁移,并可以微调面部运动幅度。 4. 工作流与模型地址: https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy https://pan.quark.cn/s/8dfd7ace4f05 5. 教程: 在 comfyui 里使用工作流、模型:https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy 安装包解压即用链接:https://pan.baidu.com/s/1fh9vvLk8OHuIlCJxD7jiBg?pwd=282n 提取码:282n 项目地址:https://github.com/KwaiVGI/LivePortrait 节点地址:https://github.com/kijai/ComfyUILivePortraitKJ 方法二:使用星流一站式 AI 设计工具的图生图功能 1. 图生图功能允许用户上传一张图像,并基于该图像生成新的视觉内容。 2. 应用图生图: prompt 输入框下,点击“图生图”上传本地文件。 无限画布中,在图片功能区进行选择。 3. 调整“图生图”功能区参数: 参考程度: 更像原图:小幅度修改基底图像,有限的增加元素。 更创意:大幅度修改基底图像,可搭配增强模型加入更多的元素。 自定义:可自定义修改重绘幅度。 增加参考纬度:点击添加按钮,会自动的应用并打开“生成器”的图片参考功能。 替换图像:鼠标滑动到图像,点击“选择参考图”即可重新选择图片。 转换提示词:反推参考图信息填入进提示词框中。 同步生图尺寸:同步参考图尺寸到“生成器”的生图尺寸中。
2025-01-20
1. laptop 2. artificial intelligence 3. generative 4. log in 5. AI-driven 6. bluetooth headset 7. video call 8. platform Write some interesting sentences with these words
以下是为您生成的包含这些关键词的有趣句子: 当我使用配备强大 GPU 的 AI 笔记本电脑,如戴尔 Precision 移动工作站,通过蓝牙耳机关闭了周围的噪音,登录到专门的 AI 驱动平台,与远方的朋友进行视频通话,探讨生成式人工智能的奇妙之处,感觉真是太棒了! 在微星 Creator/Workstation 系列的 AI 笔记本上,我利用预装的深度学习框架,如 NVIDIA CUDA 和 cuDNN,进行着生成式模型的训练,同时通过蓝牙连接着蓝牙耳机,享受着不受干扰的创作过程,然后登录到特定的平台分享我的成果,这一切都由 AI 驱动,借助高速的网络实现了如同面对面的视频通话交流。 联想 ThinkPad P 系列的 AI 笔记本,拥有出色的散热和续航,让我能长时间专注于生成式项目的开发。我戴上蓝牙耳机,登录 AI 平台,与团队进行视频通话,共同推动项目前进,这一切都离不开 AI 驱动的强大力量。
2025-01-20