直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
文心一言的收费模式
文心一言将从 4 月 1 日起全面免费。申请开通文心一言的 API 需前往百度 。
2025-02-24
内容生成工具链
以下是关于内容生成工具链的相关信息: 1. Runway Act One 视频生成 角色通过文本生成,然后使用手机录制视频,将表情、声音和口型转移到虚拟角色上。 由于 Act One 不支持肢体动作转移,使用“图生视频”生成了肢体动作。 支持的视频时长上限为 30 秒。参考链接: 2. 单张图片生成精致 3D 小屋场景 工具链:Midjourney(生成等距图像)→Trellis(图像转 3D 模型)→Browser Lab(浏览器内 3D 编辑器)。 步骤: 使用 Midjourney 生成等距 3D 场景,提示词示例:3D isometric bedroom with a bed and desk。(DALLE 3 也可测试) 用 Trellis 工具将图像转为 3D 模型(支持 Tripo 3D 等其他工具)。工具地址: 下载生成的 3D 模型(GLB 文件或高斯分布文件),然后导入 Browser Lab 编辑器中进一步编辑。编辑器地址: 结合可灵 AI、Hailuo AI、Runway 等工具可让场景中的人物动起来。参考链接: 文字生成视频的 AI 产品 Pika:擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看: (内容由 AI 大模型生成,请仔细甄别。)
2025-02-24
你是智能体嘛
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 智能体是一种自主系统,通过感知环境(通常借助传感器)并采取行动(通常通过执行器)来达成目标。在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以几个关键组成部分: 1. 规划:包括子目标和分解,将大型任务分解为更小、可管理的子目标,以有效处理复杂任务。 2. 反思和完善:能够对过去的行为进行自我批评和反思,从错误中吸取教训,完善未来步骤,提高最终结果质量。 3. 记忆:包含短期记忆,用于所有的上下文学习;长期记忆,通过利用外部向量存储和快速检索实现长时间保留和回忆(无限)信息的能力。 4. 工具使用:学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 创建智能体时,输入人设等信息,放上相关工作流。配置完成后可进行测试,但注意工作流中的某些节点使用的插件 api_token 填的是个人 token,不能直接发布,可将其作为工作流最开始的输入,用户购买后输入 api_token 再发布。 OpenAI 和 Google 都在研究智能体相关项目,如 OpenAI 会通过 GPT4o 让 ChatGPT 具备 Assistant Agent 能力,Google 也计划推出 Gemini Live 支持类似功能。智能体除了端到端的多模态,还具有实时性特点,从文字语音聊天升级到视频直播,保持一直在线,这对算力开销大,需缩小参数规模、升级架构提升性能,让终端分担一部分计算量。智能体的发展将改变硬件产品和手机的设计,带来新的交互方式。
2025-02-24
有什么免费开源的数字人AI工具
以下为您推荐一些免费开源的数字人 AI 工具: 1. Aigcpanel: 特点:开源且适合小白用户,具有一键安装包,无需配置环境,简单易用。 功能:能够生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 使用步骤:下载 8G+3G 语音模型包,启动模型即可。 GitHub 链接: 官网: 2. Heygen: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 上传后效果如图所示,My Avatar 处显示上传的照片。 点开大图后,点击 Create with AI Studio,进入数字人制作。 写上视频文案并选择配音音色,也可以自行上传音频。 最后点击 Submit,就可以得到一段数字人视频。 3. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 点击上面的网址,点击右上角的 Create vedio。 选择人物形象,可以点击 ADD 添加自己的照片,或者使用 DID 给出的人物形象。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 最后,点击 Generate vedio 就可以生成一段视频。 打开自己生成的视频,可以下载或者直接分享给朋友。 4. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI。 使用方法: 点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 点击开始创作,选择自定义照片。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 打开绿幕按钮,点击背景,可以添加背景图。 最后,点击生成视频。
2025-02-24
AI变清晰
以下是关于让 AI 变清晰的相关内容: 对于老照片,可将其放入后期处理中,使用 GFPGAN 算法使人脸变清晰。具体可参考文章——。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免对原图产生干扰。 常见的 AI 画质增强工具包括:Magnific(https://magnific.ai/)、ClipDrop(https://clipdrop.co/imageupscaler)、Image Upscaler(https://imageupscaler.com/)、Krea(https://www.krea.ai/)。更多工具可查看网站的图像放大工具库:https://www.waytoagi.com/category/17 。这些工具具有不同特点和功能,可根据需求选择。
2025-02-24
请基于WHO提出的“健康老龄化”这个概念,论述AI和养老产业以及健康老龄化的关系,并举出在WHO、英国以及美国的实例
目前知识库中没有关于“基于 WHO 提出的‘健康老龄化’概念论述 AI 和养老产业以及健康老龄化关系,并列举 WHO、英国以及美国实例”的相关内容。但据现有知识,AI 在养老产业和健康老龄化方面具有重要作用。AI 可以通过智能监测设备实时收集老年人的健康数据,提前预警疾病风险;还能借助智能陪伴机器人为老年人提供心理支持和社交互动。 在 WHO 方面,可能尚未有明确的具体实例,但在理念倡导上可能会强调利用创新技术促进健康老龄化。 英国可能在一些养老机构中应用了 AI 技术来优化服务流程和提高护理质量。 美国或许在医疗保健领域利用 AI 辅助诊断和治疗,以更好地满足老年人的健康需求。但具体的实例还需要进一步查阅权威资料和最新研究。
2025-02-24
帮我找一些可以无损放大图片的ai 产品
以下是一些可以无损放大图片的 AI 产品: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ 此外,以下是图片增强方面的 AI 产品排名数据: 4 月访问量(万 Visit): 1. Cutout pro 图片增强 1608 相对 3 月变化 0.023 2. Upscale media 图片增强 432 相对 3 月变化 0.073 3. ZMO AI 图片增强 338 相对 3 月变化 0.161 4. Neural.love Art 图片增强 283 相对 3 月变化 0.072 5. Topaz Photo AI 图片增强 247 相对 3 月变化 0.047 6. VanceAI 图片增强 247 相对 3 月变化 0.078 7. bigjpgAI 图片无损放大 图片增强 203 相对 3 月变化 0.06 8. Img Upscaler 图片增强 203 相对 3 月变化 0.042 9. Let's Enhance 图片增强 167 相对 3 月变化 0.046 10. Akool 图片增强 122 相对 3 月变化 0.173 6 月访问量(万 Visit): 1. Cutout pro 图片增强 1408 相对 5 月变化 0.082 2. Upscale media 图片增强 433 相对 5 月变化 0.029 3. Neural.love Art 图片增强 253 相对 5 月变化 0.137 4. Img Upscaler 图片增强 244 相对 5 月变化 0.032 5. VanceAI 图片增强 239 相对 5 月变化 0.077 6. ZMO AI 图片增强 221 相对 5 月变化 0.153 7. bigjpgAI 图片无损放大 图片增强 180 相对 5 月变化 0.109 8. Topaz Photo AI/Topaz Video AI 图片增强 170 相对 5 月变化 0.224 9. Let's Enhance 图片增强 150 相对 5 月变化 0.102 10. Akool 图片增强 142 相对 5 月变化 0.193
2025-02-24
有没有输入点子可以生成视频文案的多维表格模板
以下是关于输入点子生成视频文案的多维表格模板的相关信息: 概述: 基于其他博主开源的视频生成工作流进行功能优化,实现视频全自动创建。感谢开源,现提供教程参考。 先看效果: 功能: 通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 涉及工具: 1. Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成) 2. 飞书(消息) 3. 飞书多维表格(字段捷径、自动化流程) 大体路径: 1. 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 2. 发布 coze 智能体到飞书多维表格。 3. 在多维表格中使用字段捷径,引用该智能体。 4. 在多维表格中创建自动化流程,推送消息给指定飞书用户。 获取字节火山 DeepSeek 系列 API 完整教程及使用方法: 邀请可拿 3000 万 tokens,附上宝藏飞书多维表格模板,包括营销类、投资和电商、工具论文效率类、有趣类等,如: 智能体发布到飞书多维表格: 1. 工作流调试完成后,加入到智能体中。可以选择工作流绑定卡片数据,智能体通过卡片回复。 2. 发布时选择需要的发布渠道,重点讲飞书多维表格。记得智能体提示词的 4 个变量,发布时会自动出现,目的是为了在多维表格中选择关联字段。填写上架信息(为快速审核,选择仅自己可用),确认发布等待审核,审核通过后即可在多维表格中使用。 多维表格的字段捷径使用: 1. 创建飞书多维表格,添加相关字段,配置后使用字段捷径功能,使用自己创建的 Coze 智能体。选择“自动更新”,输入 4 个字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 2. 表单分享,实现填写表单自动创建文案短视频。 自动化推送: 点击多维表格右上角的“自动化”,创建想要的自动化流程。
2025-02-24
Deepseek
DeepSeek 是一家具有独特特点和影响力的公司: 1. 秘方特点:DeepSeek 不是“中国式创新”的产物,其秘方具有硅谷风格。早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动,而在国内却被描摹成“大模型价格战的发起者”。无论如何,它赢得全球同行尊重的秘方也是硅谷味儿的。 2. V3 时刻:如果 V3 是 DeepSeek 的 GPT3 时刻,接下来的发展充满未知,但 DeepSeek 应会为全人类的人工智能事业做出更大贡献,且它已是中国最全球化的 AI 公司之一。 3. 提示词提升能力:一个提示词 HiDeepSeek 能让 DeepSeek 的能力更上一层楼。通过 Coze 做了效果对比测试,使用方法为:搜索 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 DeepSeek,认真阅读开场白后正式开始对话。其设计思路包括将 Agent 封装成 Prompt 并储存、实现联网和深度思考功能、优化输出质量等,还采用 XML 进行规范设定。特别鸣谢了李继刚和 Thinking Claude 等为项目提供的帮助和灵感。
2025-02-24
deepseek的提示词文档
以下是关于 DeepSeek 的相关信息: DeepSeek 爆火,价格亲民且实力超群,是智慧开源领航者,实时联网深度推理双冠王,用技术普惠重新定义了 AI 边界。便宜、开源且能联网,在 Appstore 排行第一,导致算力股大跌。 使用地址:https://chat.deepseek.com/(有手机客户端:扫描下面二维码) 模型下载地址:https://github.com/deepseekai/DeepSeekLLM?tab=readmeovfile API 文档地址:无 DeepSeek 的提示词使用方法比较长,单独列了一篇 魔改版本:https://huggingface.co/ValueFX9507/TifaDeepsex14bCoTGGUFQ4 、https://huggingface.co/mradermacher/DeepSeekR1DistillQwen7BabliteratedGGUF 一个提示词让 DeepSeek 能力更上一层楼的相关内容: 效果对比:用 Coze 做了小测试,对比视频 使用方法: Step1:搜索 www.deepseek.com,点击“开始对话” Step2:将装有提示词的代码发给 Deepseek Step3:认真阅读开场白之后,正式开始对话 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改 用 XML 来进行更为规范的设定,而不是用 Lisp(有难度)和 Markdown(运行不稳定) 完整提示词:v 1.3 特别鸣谢:李继刚(【思考的七把武器】在前期提供了很多思考方向)、Thinking Claude(项目是最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源)、Claude 3.5 Sonnet(最得力的助手)
2025-02-24