直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
自动生成ppt
以下是关于自动生成 PPT 的几种方法: 1. 卓 sir 的方法:先让 GPT4 生成 PPT 大纲,然后将大纲导入到 WPS 中,启用 WPS AI 一键生成 PPT。为增强 PPT 的灵动性和观感,让 chatPPT 添加动画,最后手动修改细节,如字体、事实性错误等。制作过程中,最耗时的是让 GPT4 生成符合要求的大纲,3 小时的制作时间里,大纲环节就花费 2 小时。 2. AIGC Weekly 16 中提到的方法:Motion Go 是一款国产的自动生成 PPT 工具,原本是做 PPT 附加插件的,现在可以通过自然语言自动生成 PPT 页面和对应内容智能增加动画。 3. 熊猫 Jay 的方法:点击文本转 PPT,并在提示框中选择确定,得到转换后的 PPT 后可进行在线编辑。
2024-08-27
免费的ai工具
以下为一些免费的 AI 工具: AI 视频软件: Runway:网址为 https://runwayml.com ,有网页和 app ,使用方便。工具教程: haiper:网址为 https://app.haiper.ai/ ,免费。 SVD:网址为 https://stablevideo.com/ ,有免费额度,对于景观更好用。工具教程: Pika:网址为 https://pika.art/ ,收费,可控性强,可以对嘴型,可配音。工具教程: PixVerse:网址为 https://pixverse.ai/ ,免费,人少不怎么排队,还有换脸功能。工具教程: Dreamina:网址为 https://dreamina.jianying.com/ ,剪映旗下,生成 3 秒,动作幅度有很大升级。工具教程: Morph Studio:网址为 https://app.morphstudio.com/ ,还在内测。 Heygen:网址为 https://www.heygen.com/ ,数字人/对口型。 Kaiber:网址为 https://kaiber.ai/ Moonvalley:网址为 https://moonvalley.ai/ Mootion:https://discord.gg/AapmuVJqxx ,3d 人物动作转视频。 美图旗下:https://www.miraclevision.com/ Neverends:网址为 https://neverends.life/create ,2 次免费体验,操作傻瓜。 SD:Animatediff SVD deforum ,免费,自己部署。 Leiapix:网址为 https://www.leiapix.com/ ,免费,可以把一张照片转动态。 Krea:网址为 https://www.krea.ai/ ,12 月 13 日免费公测。 luma:30 次免费。 Kling:网址为 kling.kuaishou.com AI 音乐: Vocs AI:网址为 https://www.vocs.ai/ ,提供免费的 AI 语音生成和转换工具。操作步骤为:上传一段清晰的无伴奏人声录音(wav 或 mp3 格式,更推荐 wav);从超过 20 名才华横溢的 AI 歌手、说唱歌手、叙述者、角色和配音艺术家中选择,将原始无伴奏声音转换成 AI 虚拟艺术家的声音;点击“转换”,Vocs AI 的语音技术将把上传的音频转换成 AI 版本的原声;下载转换后的音频。输入音频的质量将直接影响 AI 人声转换的输出质量,因此最好在进行 AI 转换之前,确保原始人声听起来符合期望。 用于写作的 AI 工具: 免费选项: 付费选项:带有插件的4.0/ChatGPT 。目前,GPT4 仍是功能最强的人工智能写作工具,可在 Bing(选择“创新模式”)上免费访问,或者通过购买 ChatGPT 的$20/月订阅来访问。Claude 紧随其后,也提供有限的免费选项。这些工具也被直接集成到常见的办公应用程序中,如 Microsoft Office 将包括一个由 GPT 提供支持的副驾驶,Google Docs 将整合 Bard 的建议。
2024-08-27
人工智能发展前景
人工智能的发展前景十分广阔。在我们的日常生活中,许多方面都已经有了人工智能的参与,比如交通、天气预测以及电视节目推荐等,其普及程度和发展速度都令人惊叹,使计算机能够以过去难以想象的方式观察、理解和与世界互动。 从未来进化的角度看,当计算机在各项任务上超越人类时,可能会在不断改进的过程中出现超级智能。届时,机器可能会具有自我意识和超级智能,我们对机器意识的概念将发生重大转变,甚至可能会出现真正的数字生命形式。这也带来了一系列有趣的问题,比如数字生命与人类之间合作和竞争的基础,以及对具有自我意识的数字生命模拟疼痛是否构成折磨等。 在产业发展方面,人工智能是引领新一轮科技革命和产业变革的基础性和战略性技术,正加速与实体经济深度融合,深刻改变工业生产模式和经济发展形态,对建设制造强国、网络强国和数字中国发挥重要支撑作用。其产业链包括基础层(算力、算法和数据)、框架层(用于模型开发的深度学习框架和工具)、模型层(大模型等技术和产品)、应用层(在行业场景的应用)等部分。近年来,我国人工智能产业在技术创新、产品创造和行业应用等方面快速发展,形成庞大市场规模。随着以大模型为代表的新技术加速迭代,人工智能产业呈现出创新技术群体突破、行业应用融合发展、国际合作深度协同等新特点,也亟需完善产业标准体系。
2024-08-27
生成文章摘要提示词
以下是一些生成文章摘要的提示词示例: 对于“熊猫大侠:Kimi Copilot 搜罗精华,一键高效网页总结”中的浏览器 Kimi 插件,提示词为:您是擅长总结长文本的助手,能总结用户给出的文本并生成摘要。工作流程是逐步思考,阅读提供的内容,一句话总结文章,标题为“概述”;总结文章内容并写成摘要,标题为“摘要”,用中文回答,输出标题时使用 Markdown 格式,若无法访问链接则根据文本内容回答。 在办公通用场景中,总结助手的提示词为:请帮我总结以下文章,将文本总结为 100 个单词,使其易于阅读和理解,摘要应简明扼要并抓住要点,避免复杂句子结构和技术术语。 周报生成器的提示词为:根据日常工作内容,提取要点并适当扩充以生成周报。使用提供的文本作为中文每周报告的基础,生成简明摘要,突出最重要观点,报告以降格编写,易于一般读者阅读和理解,注重提供对利益攸关方和决策者有用的见解和分析,也可根据需要使用其他信息或来源。
2024-08-27
怎么建设多模态知识库
建设多模态知识库可以参考以下方面: 1. 学习相关知识:例如了解 Vision Transformer 的入门知识及其相关应用,包括 ViT等。 2. 明确多模态任务、训练评测数据集和评测方法,例如 Video Action Recognition 任务、Image Text Retrival 任务、Image Caption 任务、Visual QA 任务、Visual Reasoning 任务、Visual Entailment 任务等。 3. 利用效率工具:有效组织各种文件,通过聊天界面访问存储的信息,与他人轻松共享知识,将有价值的内容从视频和音频中转录出来,创建多语言的知识库。 此外,还可以参考一些相关的知识库文章,如“ChatBot 是怎么炼成的?”等,了解大模型下游应用的研发过程。
2024-08-27
怎么学习是用GPT
以下是关于如何学习使用 GPT 的相关内容: 调用 TMDB 获取数据:前往 themoviedb.org 注册并申请 API KEY,完成邮箱验证,依次点击右上角头像账户设置API请求 API 密钥click here,选择 Developer 开发者,协议拉到最底下然后 Accept 接受。使用类型选网站,应用名称随便写,URL 填 ChatGPT 官网,简介用英文写,除邮箱外大概填填提交,支持中国手机号。获得 API 密钥和 API 读访问令牌后记下来备用。 构建 GPT:新创建一个 GPT,名字描述随便写,Instructions 使用特定内容,如当用户想找电影时,输出详细介绍、主视觉图、主要剧情、观影背景知识、网上评论总结等,并添加 Webpilot Action 和特定 Schema 内容。 英文学习:推特博主的英语老师制作了一个 GPT 工作流,基于日常需求生成定制素材。具体使用方法是先把特定 prompt 喂给 ChatGPT(建议开新对话),然后 ChatGPT 会扮演美国好朋友,对输入进行地道表达修改和举一反三,输入特定语句后会输出对话回顾和推荐任务。建议使用方式包括开窗口复制 prompt、手机端操作、打电话练习等。
2024-08-27
怎么学习使用AI工具
以下是关于学习使用 AI 工具的一些建议: 学习外语方面: 设定目标:明确学习目标和时间表,分阶段完成学习任务。 多样化练习:结合听、说、读、写多种方式进行练习,全面提升语言技能。 模拟真实环境:尽量多与母语者交流,或使用 AI 对话助手模拟真实对话场景。 定期复习:使用 AI 工具的复习功能,根据记忆曲线定期复习已学内容,巩固记忆。 对于 AI Agent 工具: 理解工具:全面了解工具的应用场景和调用方法,利用 LLM 的 zeroshot learning 和 fewshot learning 能力,通过描述工具功能和参数的 zeroshot demonstartion 或提供特定工具使用场景和相应方法演示的少量提示来获取工具知识。面对复杂任务时,将其分解为子任务,并有效组织和协调,这依赖于 LLM 的推理和规划能力以及对工具的理解。 使用工具:学习使用工具的方法主要包括从 demonstartion 中学习和从 reward 中学习(清华有一篇从训练数据中学习的文章)。包括模仿人类专家的行为,了解其行为的后果,并根据从环境和人类获得的反馈做出调整。环境反馈包括行动是否成功完成任务的结果反馈和捕捉行动引起的环境状态变化的中间反馈;人类反馈包括显性评价和隐性行为,如点击链接。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-08-27
如何让照片跟着语音说话
以下是让照片跟着语音说话的两种方法: 方法一:使用 SadTalker 1. 开源程序 SadTalker 可实现让照片说话唱歌并达到基本唇形同步。 GitHub 地址:https://github.com/OpenTalker/SadTalker 可独立使用或作为插件放入 stablediffusion 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 2. 对于编程、python、conda 不熟悉的,建议使用整合包: 史上最炸裂版 AI 工具箱来啦,SDAI 绘画、VITS 文本转语音,wav2lip、sadTalker 唇型同步,视频修复,支持 A 卡! 夸克网盘分享链接:https://pan.quark.cn/s/1d5ca9f57f5c 视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.searchcard.all.click&vd_source=35e62d366d8173e12669705f7aedd122 3. 具体步骤: 点我启动,在启动界面中,选择音频、图像口型同步的下载图标。 下载完毕后启动应用,会弹出独立窗口。 选择 sadtalker 同步器,分别导入图片和声音。 图片预处理方式中,crop 只截取图片的头部,full 就是保留整张照片,下面的勾选项已有文字解释,可自行尝试几次。 点击 generate。由于涉及到视频的推理和转换,输出时间要远远大于 ai 绘图和 sovits 的声音推理,需做好等待准备。例如导入 13 秒的音频,预计需要 3 5 分钟(3060 12g 显卡)。 最终生成的视频长度与音频一致,如果想制作长视频,最好剪成小段,分别推理,然后合并。完成后,可打开输出目录或下载视频文件查看效果。 方法二:使用 DID 1. 点击网址,点击右上角的 Create vedio。 2. 选择人物形象,可以点击 ADD 添加照片,或者使用 DID 给出的人物形象。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击 Generate vedio 就可以生成一段视频。 5. 打开自己生成的视频,可以下载或者直接分享给朋友。
2024-08-27
怎么使用AI写脚本
使用 AI 写脚本可以参考以下步骤: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 另外,综合应用 AI 工具制作短片和电影的过程包括: 1. 使用 ChatGPT 撰写脚本、分镜、人物设定和旁白。 2. 使用 Midjourney 生成静态分镜图片。 3. 使用 Runway 生成动态分镜片段。 4. 使用 AI 配音软件制作旁白。 在钉钉中,开发者可以通过编写脚本(JavaScript)来操作企业应用,实现现有系统的无侵入式快速 AI 集成。只需依照自适应插件描述协议来开发脚本,制定相应的插件描述清单,并将该协议的 JSON 内容复制粘贴到高级自定义能力开发页面中,就可以完成自定义能力的开发。具体的开发流程和细节参考。
2024-08-27
语音对话模型
以下是关于语音对话模型的相关信息: ChatTTS 是专门为对话场景设计的文本到语音 TTS 模型,支持中英文。可利用 Whisper + DeepSeek + ChatTTS 构建语音对话机器人。相关链接:https://xiaohu.ai/p/8702 、https://mp.weixin.qq.com/s/7bCUAkQ1LDmX70iy5Tt8w 、https://mp.weixin.qq.com/s/8ltuF1XnauOxGRVT3xZwGQ 、https://mp.weixin.qq.com/s/JAhm5KTxZ5kSiqHTxFzg ,还有源码分析:https://mp.weixin.qq.com/s/ol2TTDLBnhHZ3bykk4DaAg 。ChatTTS 的 TTS 模型全称是 Text To Speech(文本转语音模型),经过超过 10 万小时的训练,公开版本在 HuggingFace 上提供了一个 4 万小时预训练的模型,作者还留着一个 10 万小时训练数据的版本。 SpeechGPTGen 是具有跨模态对话能力的大语言模型,能处理和生成语音数据,实现文本与语音的无缝对话,包含 8 亿参数,有效处理语义和知觉信息。相关链接:https://arxiv.org/abs/2401.13527 、https://github.com/0nutation/SpeechGPT 、https://x.com/xiaohuggg/status/1750694801517969900?s=20 。 OpenAI 推出新一代嵌入模型,包括 textembedding3small 和 textembedding3large,新模型性能普遍优于上一代,特别是在多语言检索方面。GPT4 Turbo 预览版模型更新,提高了代码生成等任务的完成度。相关链接:https://x.com/xiaohuggg/status/1750688990104330481?s=20
2024-08-27