直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
如何创建数字人
以下是创建数字人的方法: 1. 在剪映中生成数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。 选择数字人形象后,可根据其声音判断是否需要,点击右下角“添加数字人”将其添加到当前视频中。软件会生成对应音视频并添加到轨道,左下角会提示渲染完成时间,之后可点击预览查看效果。 2. 增加背景图片: 删除先前导入的文本内容,因为视频音频已包含文字。 点击左上角“媒体”菜单并“导入”,选择本地图片上传。 点击图片右下角加号将其添加到视频轨道(会覆盖数字人),将轨道最右侧竖线向右拖拽至与视频对齐。 选中背景图片所在轨道,在显示区域拖动图片角放大至合适尺寸,并将数字人拖动到合适位置。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 完成后点击右上角“导出”按钮导出视频备用。 此外,以下是一些制作数字人的工具: 1. HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音并合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关使用条款和隐私政策,并注意生成内容的版权和伦理责任。
2024-10-06
which tools can help me write perfect essay?
在论文写作方面,以下是一些能够帮助您写出完美论文的工具: 1. 文献管理和搜索: Zotero:结合 AI 技术,能自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,方便进行数据分析和可视化。 Knitro:用于数学建模和优化的软件,助力复杂数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 此外,在 AIGC 论文检测方面,常用的网站和工具包括: 1. Turnitin:广泛使用的学术剽窃检测工具,新增检测 AI 生成内容的功能。使用时上传论文,系统自动分析并提供报告,标示出可能由 AI 生成的部分。 2. Copyscape:主要检测网络剽窃行为,虽非专门的 AIGC 检测工具,但能发现可能被 AI 生成的重复内容。输入文本或上传文档,系统扫描网络查找相似或重复内容。 3. Grammarly:提供语法检查和剽窃检测功能,其剽窃检测部分可识别可能由 AI 生成的非原创内容。将文本粘贴到编辑器中,选择剽窃检测功能,系统提供分析报告。 4. Unicheck:基于云的剽窃检测工具,适用于教育机构和学术研究,能检测 AI 生成内容的迹象。上传文档或输入文本,系统分析生成报告,显示潜在剽窃和 AI 生成内容。 5. :专门设计用于检测 AI 生成内容的工具,使用先进算法分析文本,识别是否由 GPT3 或其他 AI 模型生成。上传文档或输入文本,系统提供详细报告。 在构建外脑和知识管理方面,以作者自身习惯为例,在确定写长文输出前,先整理信息结构和叙事框架,若涉及不熟悉或新兴领域,需提前阅读相关书籍或博客。Notion 是主要的信息整理工具,为主题建立 PAGE 用于关联链接收藏、深度阅读摘录和创作草稿,最终通过 Google Docs 汇总成文输出。输出即学习,所有输入都是为了合适的表达。目前可能不存在搭建理想外脑的完美工具集,新工具应具备的特性将在后续讨论。
2024-10-06
怎么让mj生成的图片色调保持一致
要让 MJ 生成的图片色调保持一致,可以参考以下方法: 1. 在关键词中限制颜色时,同一种情绪最好多生成几张不同色系的图片,这样可以减少后续训练中模型把情绪和颜色做挂钩。但如果您需要将情绪和颜色关联,也可以反其道而行之。 2. 注意数据集中正面情绪与负面情绪的比例应差不多。如果都是正面积极的,在生成一些负面情绪(如 sad、cry)的图片时,可能会出现奇怪的问题(如训练的是兔子形象,但 AI 认知的 sad 可能是人的形象,可能会出现人物特征)。 3. 为保证人物一致性,在生成人物图片时,可确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 MJ 中生成直到得到满意的人物图像,并取 iw 2。 4. 为保证画面的一致性,可以使用 MJ 的 cref 参数。
2024-10-06
最近有什么新的AI方面的资讯
以下是一些新的 AI 方面的资讯: 在医疗领域,ChatGPT 和 Google Bard 极大加速了医疗健康生物制药的研究。AI 在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用,例如提前三年诊断胰腺癌、发现与胶质母细胞瘤相关的新靶基因、帮助抗衰老、寻找阿尔兹海默症的治疗方法以及早期诊断帕金森。相关进展的链接如下: AI 提前三年诊断胰腺癌:https://hms.harvard.edu/news/aipredictsfuturepancreaticcancer 高中生与医疗技术公司合作发现新靶基因:https://finance.yahoo.com/news/teenagegeniusesaiuncovercancer163541619.html AI 帮助抗衰老:https://www.earth.com/news/artificialintelligenceidentifiesnewantiagingcompounds/ 使用 AI 寻找阿尔兹海默症的治疗方法:https://medicalxpress.com/news/202305scientistsaidrugalzheimer.html AI 帮助早期诊断帕金森: 新手学习 AI 要持续学习和跟进,关注 AI 领域的新闻、博客、论坛和社交媒体,加入相关社群和组织,参加研讨会、工作坊和会议,与他人交流。 AIGC Weekly 32 中的资讯: Netflix 列出了年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位:https://jobs.netflix.com/jobs/278437235 Shopify 的 AI 助手 Sidekick 已上线:https://techcrunch.com/2023/07/26/shopifysidekickislikechatgptbutforecommercemerchants/ Artifact 推出自定义内容阅读语音的功能:https://twitter.com/Artifact_News/status/1684631632374902784?s=20 OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛以确保 AI 模型的安全发展:https://openai.com/blog/frontiermodelforum Open AI 下线了 ChatGPT 生成内容的检测器:https://techcrunch.com/2023/07/25/openaiscuttlesaiwrittentextdetectoroverlowrateofaccuracy/
2024-10-06
什么是RAG技术
RAG 是检索增强生成(RetrievalAugmented Generation)的缩写,是一种结合了检索模型和生成模型的技术。其核心目的是通过某种途径把知识告诉给 AI 大模型,让大模型“知道”我们的私有知识,变得越来越“懂”我们。 RAG 的核心流程是根据用户提问,从私有知识中检索到“包含答案的内容”,然后把“包含答案的内容”和用户提问一起放到 prompt(提示词)中,提交给大模型,此时大模型的回答就会充分考虑到“包含答案的内容”。 RAG 由两部分组成:一个“检索器”和一个“生成器”。检索器从外部知识中快速找到与问题相关的信息,生成器则利用这些信息来制作精确和连贯的答案。这种结合使得 RAG 非常适合处理需要广泛知识的任务,如问答系统,能够提供详细而准确的回答。 一个 RAG 的应用可以抽象为 5 个过程: 1. 文档加载(Document Loading):从多种不同来源加载文档。 2. 文本分割(Splitting):把 Documents 切分为指定大小的块,称为“文档块”或者“文档片”。 3. 存储(Storage):包括将切分好的文档块进行嵌入(Embedding)转换成向量的形式,以及将 Embedding 后的向量数据存储到向量数据库。 4. 检索(Retrieval):通过某种检索算法找到与输入问题相似的嵌入片。 5. Output(输出):把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。
2024-10-06
以图片为主的PDF文件向量化的本地大模型推荐
以下是关于以图片为主的 PDF 文件向量化的本地大模型的相关信息: RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。大模型训练数据有截止日期,当需要依靠不在训练集中的数据时,可通过检索增强生成 RAG 技术实现。RAG 应用包括 5 个过程: 1. 文档加载:从多种来源加载文档,如包括 PDF 在内的非结构化数据、SQL 在内的结构化数据以及代码等。 2. 文本分割:把文档切分为指定大小的块。 3. 存储:包括将切分好的文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。 4. 检索:通过检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,生成更合理的答案。 PDF 翻译的 AI 产品: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择相关翻译选项。 3. Calibre(电子书管理应用):,下载安装并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传多种格式文件,支持选择领域和导出格式。 6. 彩云小译(App):下载后点击「文档翻译」,可导入多种格式文档,但有免费次数限制且进阶功能需付费。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-06
科大讯飞星火大模型
科大讯飞星火大模型是科大讯飞发布的大模型。在 2023 年的大模型发展中,科大讯飞发布了星火 1.0,并在后续进行了升级,如升级到星火 3.0。在众多大模型中,星火模型目前的体验效果较好,感觉最接近 GPT3.5(0301 版本)的 80%90%。在大模型的测试中,通常从基础能力、职场能力、探索对话等方面评估,而星火模型在基础能力方面表现不错,如语言生成和语言理解等。
2024-10-06
免费数字人
以下是关于免费数字人的相关信息: 剪映数字人的优势: 剪映是字节跳动旗下的产品,在抖音平台广泛应用于短视频创作和编辑。其海外版 CapCut 登顶过美国 App Store,在全球各国 App Store 和 Google Play 平台上的安装总量已超过 2.5 亿次,在美国市场内的安装总量接近 950 万次。剪映的六大 AI 功能解决了用数字人做视频的痛点,能在编辑器里完成脚本生成、语音克隆、数字人口播等环节。 剪映数字人的制作流程: 1. 打开剪映,添加文本到文字轨道,修改好需要朗读的文字。 2. 点击朗读并进行声音克隆,念一句话即可完成克隆。 3. 克隆完成后,选择喜欢的数字人形象,并换上自己的克隆音色。 4. 一键智能生成字幕,自行调整文字样式并校准。 生成数字人的具体步骤: 1. 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,软件会生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,可点击预览查看效果。 2. 增加背景图片:删除先前导入的文本内容,点击左上角“媒体”菜单,点击“导入”按钮选择本地图片上传,将图片添加到视频轨道上,可通过拖拽轨道右侧竖线使其与视频对齐,选中背景图片轨道,调整图片大小和数字人位置。 数字人“私有化”: 尽管剪映有很多公模数字人,但私模数字人更受欢迎。可使用 AI 换脸软件完成最后一步。 注意:需要谷歌账号(淘宝或者在我们账号解决平台“”就可以直接购买) 1. 第一步:打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的 URL 就会打开操作界面。 2. 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成。 3. 第三步:等着自己专属的数字人视频出炉。 有关数字人使用上的问题,欢迎在底部评论区留言交流。同时如果对数字人课程感兴趣,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程! 在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0 ?:aiwarts101 剪映下载地址: capcut 下载地址:
2024-10-06
请介绍论文写作工具
以下是为您介绍的论文写作工具: 文献管理和搜索: Zotero:结合 AI 技术,能自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,方便进行数据分析和可视化。 Knitro:用于数学建模和优化,助力复杂数据分析和模型构建。 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 AI 文章排版工具: Grammarly:不仅是语法和拼写检查工具,还具备排版功能,改进文档风格和流畅性。 QuillBot:AI 驱动的写作和排版工具,改进文本清晰度和流畅性。 LaTeX:常用于学术论文排版,使用标记语言描述格式,有 AI 辅助的编辑器和插件简化排版。 PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适用于商业和技术文档。 Wordtune:AI 写作助手,重新表述和改进文本,使其更清晰专业。 Overleaf:在线 LaTeX 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 文章润色工具: Wordvice AI:集校对、改写转述和翻译等功能于一体,基于大型语言模型提供全面英文论文润色服务。 ChatGPT:由 OpenAI 开发的大型语言模型,用于多方面写作辅助。 Quillbot:人工智能文本摘要和改写工具,可快速筛选和改写文献资料。 HyperWrite:基于 AI 的写作助手和大纲生成器,帮助写作前头脑风暴和大纲规划。 Wordtune:AI 驱动的文本改写和润色工具,优化语言表达。 Smodin:提供 AI 驱动的论文撰写功能,生成符合要求的学术论文。 使用这些工具时,应结合自己的写作风格和需求,选择最合适的辅助工具。
2024-10-05
视频智能解说
以下是关于视频智能解说的相关内容: 使用 Gemini 进行视频拆解: 思路:可以拿库布里克的电影来分析,学习大师手法;b 站大学复习有救了;可用于影视二创长剪短,生成特定故事,警察查监控找出可疑现象,替代长剪短工具等。 测试者阿强:将前几天用 AI 做的功夫熊猫之离谱村版丢进去分析,效果很好,能准确认出“如来神掌”,并给出极致详细的每个镜头描述,包括物体、动作、形变、分镜设计原因等。 测试者张余、Ling、洋洋:均有拆解结果。 Han 基于现有能力项目应用的思考: MMVid 是一个集成的视频理解系统,能处理和理解长视频内容并进行问答。 应用场景包括快速的视频剪辑、图生视频、快速诊断等。 由 Microsoft Azure AI 开发,结合了 GPT4V 的能力和其他视觉、音频和语音处理工具,能自动识别和解释视频中的元素,将多模态信息转录成详细的文本脚本。 使用 GPT 的视觉功能和 TTS API 处理和讲述视频: 在冬季的广袤白色景观中,一群灰狼从牛群中挑出一头野牛,展开了一场生存的激烈斗争。狼群精心策划攻击,包围猎物,野牛坚守阵地。双方的每一个动作、每一次佯攻都关乎生死。最终,随着斗争不可避免地结束,展现了自然界残酷而美丽的生存法则。之后可将脚本传递给 TTS API 生成画外音的 mp3。
2024-10-05