Chat with Wiki - WayToAGI

Navigate to WaytoAGI Wiki →

Home/All Questions

有制作爆款短视频的ai提示词吗？

以下是一些制作爆款短视频的 AI 提示词相关内容： 1. 写脚本方面：可以选择 Kimi、Claude、Chatgpt 等大模型，对于科学上网困难的小伙伴，可优先选择免费好用的 kimi（https://kimi.moonshot.cn/），有条件可选功能更强大的 chatgpt（https://chatgpt.com/），本作品用的是 Claude（https://claude.ai/new），Claude 在脚本创作方面有优势。脚本提示词的结构是：我要做什么样的视频+视频要包含哪些关键的元素+对脚本的输出有什么要求。例如，要做 30 秒时长的广告宣传片脚本、做一个孩子们喜欢的儿童绘本脚本等；重点要把产品的特性或者想要的广告风格说出来，如奔驰高端商务、豪华舒适的特性，苹果香脆多汁、红润饱满的特点；按照一定的格式输出，推荐使用 Markdown 格式输出，方便后续操作。 2. 单镜头内容注意：要给 AI 确切的画面描述，杜绝不确切描述，如将“一个女生备考，用纳米 AI 定制模拟专题练习，最后成功上岸”改为“一个中年妇女辅导 12 岁的女儿作业，女孩看着妇女，妇女挠挠头，表情沉重。然后拿出手机对着桌子上的书拍照，然后放下手机，跟小姑娘说话，表情舒缓，欣慰，温柔。侧面镜头，镜头环绕到正面”。 3. 提示词网站分享： Learn Prompting https://learnprompting.org/docs/intro AI Short https://www.aishort.top/en/ AIPRM https://www.aiprm.com/prompts/ Prompt Library https://promptlibrary.org/

怎么可以变现赚钱创造价值

以下是关于变现赚钱创造价值的一些方式： 1. GPTs 模型变现：直接盈利：开发者可为使用其 GPT 模型设定费用，通过直接销售获得收益，例如提供封装自媒体行业的 GPTs 辅助写爆文、出标题等产品绑定方式售卖。间接盈利：即使模型免费使用，也可通过广告收入等方式获利，如放入商家广告、公众号信息、联系方式等，还可在封装 GPTs 时带上个人介绍、微信号、公众号名称等完成引流。品牌收益：构建品牌影响力和个人 IP，获得声誉上的收益，例如提示词领域的知名人士通过封装的 GPTs 帮助他人解决问题或提供创意娱乐，获取口碑和影响力。 2. Coze 变现：上节课分享了用 Zion 把 Coze bot 打造成赚钱工具，包括前端页面设计和用户支付链路搭建。针对常见难题，如开发多个 Coze Bot 的整合及无企业支付宝和营业执照的收款账户对接，有“Coze 变现模板（多智能体版）”，个人用户无需企业支付宝账号也能轻松变现和收款。可参考完整的，内含变现案例实操分享。 3. 扣子“AI 应用”变现：在公司给自己贴 AI 大神标签。在社交网络进行分享，扩大影响力。承接项目开发。二创方向包括增加画板节点，结合公司 Logo 生成一系列公司主题的产品邮票，承接类似需求扩充工作流，修改提示词调整生图内容方向。总之，技术很关键，创意更重要，好技术加上好创意才能成就好产品，祝您在 AI 应用之路增加自己的收入。

李飞飞关于aigent的文章

以下是李飞飞关于 AIgent 的相关文章：《对话"AI 教母"李飞飞：我们究竟需要什么样的 AI Agent？如何正确把握这个风口》：李飞飞在访谈中探讨了 AI Agent 的发展及其未来。她强调 AI Agent 应作为工具和赋能者，而非主导者，确保人们的自主性。李飞飞回顾了 ImageNet 的创立背景，并提到正在推动的“空间智能”概念，旨在理解和融合物理与数字三维世界。她认为，未来这两者的界限将逐渐模糊，从而带来更大变革。《[李飞飞：理解世界运作方式是 AI 的下一步，我们需要从大语言模型转向大世界模型》：李飞飞认为，人工智能的下一步应从大型语言模型转向大型模型，强调视觉智能在理解和与世界互动中的重要性。计算机需要具备空间智能，能够建模、推理并在三维空间中互动。通过最新的 AI 技术，机器可以根据文本提示完成任务，并在虚拟环境中导航。未来，这种以人为中心的人工智能将在家庭护理、医疗支持等领域发挥重要作用。

ai语言模型记忆能力与什么相关，可以拥有人类相当的记忆吗

AI 语言模型的记忆能力主要与以下因素相关： 1. 长期记忆：主要有长文本（持久化）、总结、RAG 等实现方式。长文本处理中的 KV Cache 可通过缓存历史计算的 Key（K）和 Value（V）减少冗余计算，但需额外存储空间，可能导致显存占用增加，未来结合持久化 KV Cache、KV Cache 的压缩技术有望控制成本，从而打造出记忆力超越人类的智能体。 2. 短期记忆：主要存在于模型的上下文中，由对话内容（用户输入、模型输出）和系统提示词组成。 Inworld AI 开发的角色引擎，增加了可配置的安全性、知识、记忆、叙事控制、多模态等功能，其中长期记忆方面，角色能以类似人类的记忆功能操作，从闪存和长期记忆中检索信息。人类的思维是由自然语言或感官记忆构成的超高维时间序列，而人工智能与人类不同，人类会为事物赋予意义与价值，人工智能则更追求“更准”。强化学习是人工智能的一个重要分支，通过定义状态、动作与奖励等元素，让 AI 求解如何选择动作以获得最大的期望奖励总和。

ai语言模型是如何运作的

AI 语言模型的运作机制主要包括以下几个方面： 1. 对于大语言模型（LLM），如豆包在回复时是一个字一个字地推理生成内容，即流式输出。这类似于输入法的输入联想逻辑，会根据输入的单个字或上下文推测下一个字。但存在两个问题：一是全量数据计算算力吃不消，二是仅算字的概率易受不相干信息干扰。为解决这些问题，出现了词向量机制和 Transformer 模型中的 Attention 自注意力机制。 2. 大型语言模型通过大量的数据训练来学习语言的结构和模式，包括词汇、语法、句子结构以及上下文关系。当接收到输入时，会根据学习到的知识生成连贯的回答，类似于词语接龙游戏。 3. 以 Kimi Chat 为例，大模型会利用网页搜索工具，在互联网上检索相关内容，并基于检索结果进行总结分析，最后给出结论。同时，大模型还可以通过自行规划任务执行的工作流路径，如先识别男孩的姿势，再找到相关模型处理等。 4. 在多智能体协作方面，如吴恩达通过开源项目 ChatDev 举例，可让一个大语言模型扮演不同角色相互协作，共同开发应用或复杂程序。 5. OpenAI 的研究主管 Lilian Weng 提出了“Agent = LLM + 规划 + 记忆 + 工具使用”的基础架构，其中大模型 LLM 扮演了 Agent 的“大脑”。规划包括子目标分解、反思与改进，将大型任务分解为较小可管理的子目标，并对过去的行动进行自我批评和反思，以提高最终结果的质量。需要注意的是，大模型并不拥有无限知识，其知识来源于训练过程中接触到的数据，这些数据是有限的。虽然大模型可以处理和生成大量信息，但只能回答在训练过程中见过或类似的问题，且训练后的知识库不会自动更新。

文字转语音

以下是关于文字转语音的相关信息： Hedra： Hedra.com 放出了基础模型 Character1 的研究预览版，即日起在 http://hedra.com（桌面和移动）上提供。具有无限期（打开预览为 30 秒）、每 60 秒产生 90 个（如果 H100 的供应保持不变）、富有表现力的说话、唱歌、说唱角色等特点。其使命是建立一个人人都能使用的多模态创作工作室。操作教程：可以直接文字转语音，目前有 6 个语音，也可以直接上传音频。《神谕》：为了提升交互体验，ChatGPT 返回的中文文字通过 TTS 服务选择合适的声音播放出来。内部自研的 TTS 及代码平台可将游戏开发者输入的文本直接转成语音。

Lisp 语言在提示词编程中的应用具有以下特点： 1. Lisp 语言的语法：Lisp 是一门“古老”的编程语言，其语法核心是 List 结构或“S 表达式”，需要用一对括号把元素括起来，语法简洁优美且具有很强的表达能力。 2. 与 Markdown 的比较：平时写提示词更多用的是 Markdown 语法，它简单且大语言模型能很好理解，如标题、列表、加粗强调等。将 Lisp 提示词翻译成 Markdown 后，语义几乎一致，但在某些效果上存在差异，如 Lisp 版本中 SVG 图形的丰富度和表现力稳定地优于 Markdown 版本。此外，Markdown 版本在执行过程中会输出中间“思考”过程，多数场景下这样一步一步思考有正向收益，还能调试优化流程。而 Lisp 版本很难让大语言模型有条理地执行流程。 3. LLM 对 Lisp 程序的理解：一段 Lisp 提示词可能描述了简单的工作流，如对用户输入文本处理生成小确幸表达和生成 SVG 卡片等。虽然 Lisp 擅长描述程序且压缩信息能力强，但程序难懂，需要大量解码和按特定逻辑解读。大语言模型能解释 Lisp 程序，但作为提示词让其按程序逻辑运行很难，尤其对于复杂的函数调用，且难以保证程序里定义的子步骤被正确且无遗漏地执行。

智谱清言是智谱 AI 和清华大学推出的大模型产品，其基础模型为 ChatGLM 大模型。2023 年 10 月 27 日，智谱 AI 于 2023 中国计算机大会（CNCC）上推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。模型特点：工具使用排名国内第一。在计算、逻辑推理、传统安全能力上排名国内前三。更擅长专业能力，但代码能力有优化空间，知识百科与其他第一梯队模型相比稍显不足。综合来看，是很有竞争力的大模型。适合应用：场景广泛，可优先推进在 AI 智能体方面相关的应用，包括任务规划、工具使用及一些长文本记忆相关的场景。在较复杂推理应用上效果不错。广告文案、文学写作方面也是很好的选择。在对结构化 prompt 的测试和反馈中，输入智谱清言后，问题和文心一言一样，需先改写再看输出效果。改写后效果不错，能理解 prompt，输出内容感觉良好。这里最大的体会是结构化 prompt 非常重要，要从结构化开始，且要不断迭代，根据输出结果不断优化。

静态图片如何通过ai生成动图

以下是将静态图片生成动图的两种方法：方法一：使用 LivePortrait 1. LivePortrait 可以精确控制眼睛和嘴唇的动作，还能无缝拼接多个肖像，将不同人物特征合并成一个视频，确保过渡自然流畅。 2. 它使用了一种不同于主流扩散方法的隐式关键点框架，在计算效率和可控性之间取得了有效的平衡。生成的动画质量优于现有的非扩散和扩散模型方法。在 RTX 4090 GPU 上，生成速度为每帧 12.8 毫秒，效率显著高于现有的扩散模型。 3. 支持各种风格的图片，常见的动物面部迁移，并可以微调面部运动幅度。 4. 工作流与模型地址： https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy https://pan.quark.cn/s/8dfd7ace4f05 5. 教程：在 comfyui 里使用工作流、模型：https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy 安装包解压即用链接：https://pan.baidu.com/s/1fh9vvLk8OHuIlCJxD7jiBg?pwd=282n 提取码：282n 项目地址：https://github.com/KwaiVGI/LivePortrait 节点地址：https://github.com/kijai/ComfyUILivePortraitKJ 方法二：使用星流一站式 AI 设计工具的图生图功能 1. 图生图功能允许用户上传一张图像，并基于该图像生成新的视觉内容。 2. 应用图生图： prompt 输入框下，点击“图生图”上传本地文件。无限画布中，在图片功能区进行选择。 3. 调整“图生图”功能区参数：参考程度：更像原图：小幅度修改基底图像，有限的增加元素。更创意：大幅度修改基底图像，可搭配增强模型加入更多的元素。自定义：可自定义修改重绘幅度。增加参考纬度：点击添加按钮，会自动的应用并打开“生成器”的图片参考功能。替换图像：鼠标滑动到图像，点击“选择参考图”即可重新选择图片。转换提示词：反推参考图信息填入进提示词框中。同步生图尺寸：同步参考图尺寸到“生成器”的生图尺寸中。

1. laptop 2. artificial intelligence 3. generative 4. log in 5. AI-driven 6. bluetooth headset 7. video call 8. platform Write some interesting sentences with these words

以下是为您生成的包含这些关键词的有趣句子：当我使用配备强大 GPU 的 AI 笔记本电脑，如戴尔 Precision 移动工作站，通过蓝牙耳机关闭了周围的噪音，登录到专门的 AI 驱动平台，与远方的朋友进行视频通话，探讨生成式人工智能的奇妙之处，感觉真是太棒了！在微星 Creator/Workstation 系列的 AI 笔记本上，我利用预装的深度学习框架，如 NVIDIA CUDA 和 cuDNN，进行着生成式模型的训练，同时通过蓝牙连接着蓝牙耳机，享受着不受干扰的创作过程，然后登录到特定的平台分享我的成果，这一切都由 AI 驱动，借助高速的网络实现了如同面对面的视频通话交流。联想 ThinkPad P 系列的 AI 笔记本，拥有出色的散热和续航，让我能长时间专注于生成式项目的开发。我戴上蓝牙耳机，登录 AI 平台，与团队进行视频通话，共同推动项目前进，这一切都离不开 AI 驱动的强大力量。