直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
怎么用数字人
以下是几种常见的数字人使用方法: Heygen: 1. 点击网址注册后,进入数字人制作,选择“Photo Avatar”上传自己的照片。 2. 上传后效果如图所示,“My Avatar”处显示上传的照片。 3. 点开大图后,点击“Create with AI Studio”,进入数字人制作。 4. 写上视频文案并选择配音音色,也可以自行上传音频。 5. 最后点击“Submit”,就可以得到一段数字人视频。 DID: 1. 点击上面的网址,点击右上角的“Create vedio”。 2. 选择人物形象,可以点击“ADD”添加自己的照片,或者使用 DID 给出的人物形象。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击“Generate vedio”就可以生成一段视频。生成的视频可以打开下载或者直接分享给朋友。 剪映: 1. 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。 2. 选择数字人形象时,软件会马上播放出该数字人的声音,可以判断是否是需要的,点击右下角的“添加数字人”,就会将选择的数字人添加到当前视频中。剪映 App 会根据之前提供的内容,生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染何时完成,然后可以点击预览按钮,查看生成的数字人效果。 3. 增加背景图片:可以直接删除先前导入的文本内容,为视频增加背景图片。点击左上角的“媒体”菜单,并点击“导入”按钮,选择本地的一张图片上传。选择一张图片上传后,点击图片右下角的加号,将图片添加到视频的轨道上(会覆盖数字人)。
2024-08-22
AI infra
以下是关于“AI infra”的相关信息: AI 模型的计算成本: GPT3 约有 1750 亿个参数,对于 1024 个令牌的输入和输出,计算成本约为 350 万亿次浮点运算。训练像 GPT3 这样的模型需要约 3.14×10^23 次浮点运算,其他模型如 Meta 的 LLaMA 有更高的计算要求。训练此类模型是人类迄今计算量最大的任务之一。AI 基础设施昂贵的原因在于底层算法问题计算难度极大,相比之下,对一百万个条目的数据库表进行排序的算法复杂性微不足道。因此,应选择最小的模型来解决具体用例。同时,根据变换器的经验法则,可轻松估计特定大小模型的算力和内存消耗,进而选择合适的硬件。 Generative AI 的开发工具和基础设施的趋势: 有一张图描绘了其趋势,代表了在 AI 开发领域中,为满足不同需求,工具和基础设施正逐渐模块化和专业化。图中的公司被分为四个主要类别: 1. Orchestration(编排):如 DUST、FIAVIE、LangChain 等公司提供的工具帮助开发人员管理和协调各部分和任务,确保系统流畅运行。 2. Deployment, Scalability, & PreTraining(部署,可扩展性和预训练):如 UWA mosaicm、NMAREL、anyscale 等公司提供工具,帮助开发人员部署模型,保证模型的可扩展性,以及进行预训练。 3. Context & Embeddings(上下文和嵌入):如 TRUDO,Llamalndex,BerriAI 等公司提供工具,帮助模型处理和理解语言上下文,以及将词语和句子转化为计算机可理解的形式。 4. QA & Observability(质量保证和可观察性):如 Pinecone,drant,Vald 等公司提供工具,确保模型表现,并能监控模型的性能和状态。 AI 基础设施的考虑因素: 一些创业公司,尤其是训练新的基础模型或构建垂直集成 AI 应用程序的公司,不可避免直接在 GPU 上运行自己的模型。这要么是因为模型本身就是产品,团队正在寻找“模型市场契合度”,要么是因为需要对训练和/或推理进行细粒度的控制,以实现某些功能或大规模降低边际成本。无论哪种方式,管理基础设施都可以成为竞争优势的来源。
2024-08-22
帮我创建一个用来写公众号额度提示词
以下是为您创建的用来写公众号的提示词示例: “请根据我们收集的关于及其可能产生的影响,结尾处提出一些引人深思的问题或观点。” 这样的提示词为 AI 提供了明确的指导,设定了文章的基本结构和内容要求。AI 会据此生成一篇结构完整、内容丰富、观点鲜明的文章。不过,最终产出的内容可能需要您进行一些微调,以确保完全符合您的预期和公众号的风格。 在校对文章时,要注意以下几个关键点: 1. 内容准确性:核实文章中的信息和数据是否准确无误,引用的来源是否可靠。对于科技资讯类文章,这一点尤为重要,因为错误的信息可能会误导读者。 2. 表达清晰:检查文章是否流畅易读,语言是否清晰。确保专业术语和概念对目标读者群体来说是易于理解的。 3. 逻辑连贯:确保文章的结构合理,论点和论据之间的逻辑关系清晰,避免出现逻辑跳跃或混乱。
2024-08-22
AI在教育领域的应用
以下是 AI 在教育领域的应用: 1. 个性化学习平台:通过集成算法和大数据分析,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源。例如 Knewton 平台,通过对数百万学生行为模式的分析,精准预测学习难点并提前给出解决方案,大幅提升学习效率。 2. 自动评估:利用自然语言处理技术(NLP)自动批改学生的作文和开放性答案题。如 Pearson 的 Intelligent Essay Assessor,能够分析和理解学生写作内容,给出准确评分和反馈,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学工具:使课堂教学更丰富和互动,如 AI 教师引导学生通过对话学习、解答疑问并提供即时反馈。Google 的 AI 教育工具 AutoML 用于创建定制学习内容,提高学习动机,加深知识掌握。 4. 虚拟现实(VR)和增强现实(AR):学生可通过 VR 头盔进入虚拟实验室进行安全实验操作并得到 AI 系统反馈。例如 Labster 的虚拟实验室平台,提供高科技实验室场景,让学生尝试复杂实验流程,无需昂贵设备和专业环境。 同时,需要注意的是,AI 技术在教育领域的广泛应用也带来了对传统教育体系的冲击,如教育体系内部惯性、教师技能更新、课程内容调整、评估和认证机制改革等问题。目前,人工智能教育已基本覆盖“教、学、考、评、管”全链条,并在幼教、K12、高等教育、职业教育、在线教育、教育决策等各类细分赛道加速落地。教育类 AI 应用的主要方向包括自适应/个性化学习、虚拟导师、教育机器人、基于编程和机器人的科技教育和基于虚拟现实/增强现实的场景式教育。
2024-08-22
如何用coze搭建一个agent
以下是用 Coze 搭建一个 Agent 的步骤: 1. 规划: 制定任务的关键方法,总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施: 进入 Coze,点击「个人空间 工作流 创建工作流」,打开创建工作流的弹窗。 根据弹窗要求,自定义工作流信息,点击确认后完成工作流的新建。 按照流程图,在编辑面板中拖入对应的 LLM 大模型、插件、代码节点,完成工作流框架的搭建。其中,左侧「选择节点」模块中,根据子任务需要,实际用上的有: 插件:提供一系列能力工具,拓展 Agent 的能力边界。 大模型:调用 LLM,实现各项文本内容的生成。 代码:支持编写简单的 Python、JS 脚本,对数据进行处理。 3. 完善: 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。 最后,我们可以通过 Coze 建定时任务,执行工作流,并添加其他如分析文章和搜索文章的能力,变成一个消息情报官的 Agent。然后发布到想要的平台,如 Coze 商店、豆包、飞书、微信、微信公众号、微信小程序等,即可使用。还可以构建多个分身,收集整理不同领域和行业的情报信息。
2024-08-22
有没有那种工具,把一个都是外文的excel表格扔进去,帮我直接翻译成中文的excel格式输出给我的 比较精准好用的
目前市面上有一些工具可以实现将外文 Excel 表格翻译成中文并输出,例如: 1. 百度翻译:具有文档翻译功能,能处理 Excel 表格,但翻译精准度可能会受到一定影响。 2. 腾讯翻译君:支持多种文档格式的翻译,包括 Excel 表格,翻译效果较好。 3. 有道翻译:提供文档翻译服务,在处理 Excel 表格翻译时有一定的表现。 不过,这些工具的翻译精准度可能会因表格内容的复杂性和专业性而有所不同,您可以根据实际需求进行选择和尝试。
2024-08-22
一个把真人视频转化成动漫视频的工具
以下为您介绍把真人视频转化成动漫视频的相关工具和信息: 利用图生图功能可以实现真人转二次元。此功能除了文本提词框,还有图片输入口,可通过图片给 AI 创作灵感。随便照一张照片拖入,文本输入框旁有两个反推提示词的按钮:CLIP 能通过图片反推出完整含义的句子;DeepBooru 能反推出关键词组。但两种方式生成的提示词可能有瑕疵,需手动补充信息,还可调整宽度和高度使红框匹配图片。 有爽文转简单动漫的视频上了 B 站热门,涨粉十万,如链接:https://www.bilibili.com/video/BV1Pc411Q77b/?spm_id_from=333.999.0.0&vd_source=4f7659a23dafc8b331c8f784bf762298 。这类视频可简单拆解为人物站位调度+DNF/LOL 特效(纯视觉特效不考虑),随机摆放 SD 生成图片的小说改视频也有一定传播力。有人想验证“人物站位的调度”这个步骤是否可以让 openai 的 GPT 来自动完成。
2024-08-22
视频转动画视频
以下是关于视频转动画视频的相关信息: 有爽文转简单动漫的视频上了 B 站热门,一本小说改编的涨粉十万,链接为:https://www.bilibili.com/video/BV1Pc411Q77b/?spm_id_from=333.999.0.0&vd_source=4f7659a23dafc8b331c8f784bf762298 。此类视频可简单拆解为人物站位调度+DNF/LOL 特效,纯视觉特效不考虑。随机摆放 SD 生成图片的小说改视频也有一定传播力。 有人想验证“人物站位的调度“这个步骤是否可以让 openai 的 GPT 来自动完成。 介绍了 AI 视频工具 viggle,其具有以下功能: 视频换脸、动作模仿。 相关网址:http://viggle.ai ,discord 免费体验:https://discord.com/invite/viggle 。 具体操作包括: /mix:将角色图像混合到动态视频中,需上传一张字符清晰的图片和一段清晰运动的视频。 /animate:使用文本运动提示为静态角色设置动画,需上传一张字符清晰的图片,并描述想让角色做的动作(也可从 https://viggle.ai/prompt 中复制动作提示词)。 /ideate:纯粹从文本创建角色视频,需描述想要创造的角色和希望角色执行的动作(或从 https://viggle.ai/prompt 中复制动作提示词)。 /character:通过文本提示创建角色并将其动画化,需描述想要创造的角色,从四个结果中选择一个图像,再描述希望角色执行的动作(或从 https://viggle.ai/prompt 中复制动作提示词)。 /stylize:使用文本提示符重新设计角色的样式并将其动画化,操作是上传一张字符清晰的图片,描述想改变角色的任何地方来重新塑造它,从四个结果中选择一个图像,再描述想要角色做的动作(或者从 https://viggle.ai/prompt 中复制动作提示词)。
2024-08-22
有没有媒体平台KOL研究的AI工具推荐
以下是为您推荐的一些与媒体平台 KOL 研究相关的 AI 工具: 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,助于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,能提供文献推荐和引用分析。 百度学术智能助手:结合百度自然语言处理和大数据分析技术,可快速找资料、提供推荐、整合及研究趋势分析。 内容生成和辅助写作: Grammarly:通过 AI 提供文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化内容。 知网 AI 智能写作:适用于各类文档写作场景,如研究报告等。 AI 研究工具: Claude ChatGPT Bing Chat Perplexity 视频配音效: Speechify:支持 50 多种语言配音,音质自然流畅,有实时配音功能,能转录语音为文本,与多种工具整合。 Vidnoz AI:支持 23 多种语言配音,音质高保真,支持文本转语音和语音克隆,可自定义语音参数和添加背景音乐,有经济实惠的定价方案。 在选择工具时,请考虑支持的语言数量、语音质量、自定义选项和价格等因素。
2024-08-22
最好的创建数字人的软件是?
以下是一些创建数字人的软件: 1. 剪映:在剪映右侧窗口顶部打开“数字人”选项,可选取免费且适合的数字人形象,如“婉婉青春”。软件会播放数字人的声音,您可判断是否需要,点击右下角“添加数字人”将其添加到视频中,左下角会提示渲染完成时间,还能点击预览查看效果。此外,还能为视频增加背景图片、字幕等。 2. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 3. Synthesia:这是一个 AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 4. DID:这是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-08-22