直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
怎么aigc视频
以下是关于 AIGC 视频的相关内容: AIGC 视频软件汇总: Opusclip:可将长视频剪成短视频。 Raskai:能将短视频素材直接翻译至多语种。 InvideoAI:输入想法后自动生成脚本和分镜描述,进而生成视频,再经人工二编合成长视频。 Descript:通过屏幕/播客录制,以 PPT 方式做视频。 Veed.io:具备自动翻译和自动字幕功能。 Clipchamp:微软的 AI 版剪映。 Typeframes:类似 InvideoAI,内容呈现中文本主体比重更多。 Google vids:目前尚未成熟。 在视频工作流中,前期策划和后期制作是核心环节,都可借助 AIGC 提升效率: 前期:利用 ChatGPT 生成文案,如告诉它选题,它能在数十秒内生成完整视频脚本,包括具体场景和转场画面,有助于提高内容制作效率,对非专业人士入手视频创作有一定帮助。 筛选 BGM:告诉 ChatGPT 视频的情绪,它能在海量背景音乐中为您筛选,节省时间。未来若能与音源网站结合实现同步预览,体验会更优。 后期:通过 ChatGPT 生成文案,将其复制到支持 AI 文字转视频的工具内实现短视频自动生成。如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类工具操作简单,让大众生产视频更轻松,AIGC 视频未来可能有更成熟的发展与应用。
2024-10-08
建筑物及城市场景三维建模 国内免费
以下为您介绍国内免费的建筑物及城市场景三维建模工具: 1. Polycam: 简介:发布了免费的 3D 建模工具,为元宇宙数字空间的物体孪生采集生成提供了新可能。 应用场景:适用于 3D 场景。 特点:只需上传至少 20 张图片或至少 20 秒的视频,Polycam 自动处理并构建 3D 模型。生成后可编辑模型,支持 12 种以上格式导出到流行的 3D 软件,如 Blender、SketchUp、Unreal、Unity 等。100 张图像的云处理建模时间约 1 2 分钟。还可以将无人机拍摄的图像转换为广阔的 3D 模型,与所有流行的无人机兼容。 官方网站: 2. Tripo AI: 注册/登录:点击下方网址可免费体验(国内可访问)。官网首页有一只炫酷的机械手,移动鼠标有小彩蛋。点击“Start for Free”开启旅程。登录/注册界面简洁,输入邮箱地址,获取验证码完成注册并自动登录,也可使用谷歌账户直接登录。登录后可看到用户名及拥有的点数,每月有 600 点数,用完可换账户。 界面介绍:界面简洁,上方是工具导航栏,中间是公共作品展示区,底部是生成模型的工作区域,包括输入框和创建按钮。有“Create”“My Models”“Favorite”等页面,“Create”是创作主战场,“My Models”是个人作品库,“Favorite”是私人收藏列表。 官方网站:未提及
2024-10-08
三维模型生成工具
以下为一些 AI 生成 3D 模型的工具介绍: 1. 3dfy.ai 概览:是一家专注于开发先进技术的公司,由计算成像领域资深专家组成,能将稀疏数据转化为逼真三维世界。 使用场景:数字 3D 互动体验流行度提升,但受 3D 内容可用性限制,其技术能利用稀疏数据自动创建高质量 3D 模型。 目标用户:数字内容创作者和艺术家、游戏开发者和动画制作人、教育和培训行业专业人士、医疗行业、建筑和工程领域。 应用案例:暂无详细介绍。 网址:https://3dfy.ai/ 2. xiaohu.ai 相关 3D 信息 MakeACharacter:一键生成 3D 数字人,可自定义面部特征,基于真实人类扫描数据,支持中英文提示,兼容多个行业应用。网址:https://x.com/xiaohuggg/status/1743986486780076279?s=20 Rodin Gen1:3D 原生生成模型,拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术。网址:https://x.com/xiaohuggg/status/1743638052097184102?s=20 Skybox AI 0.9 版本更新:可以从文本提示或草图生成 360 度 3D 世界,使用 NeRF 技术,增强图像空间深度和真实感,提供不同分辨率 3D 网格下载。网址:https://x.com/xiaohuggg/status/1739926702158225859?s=20 扫描物体生成 3D 模型:使用 APP 扫描物体,完成 3D 全貌捕获,创建 AR QR 码,展示物体于任何地点,苹果新品官网展示中应用此技术。网址:https://x.com/xiaohuggg/status/1739259052448944139?s=20 3. provisual.app 概览:3D 模型在线可视化平台,易于使用,无需特殊技能或软件,可节省时间和成本,具有在线协作、实时渲染、无限视角、材质和纹理编辑、高质量输出等功能。 使用场景:产品设计、营销、教育等。 目标客户:营销机构、创意机构、包装公司、在线商店、设计院的设计师、美术师等。 应用案例:暂无详细介绍。 网址:https://provisual.app/ 4. tripo3d.ai 概览:人工智能驱动的 3D 建模平台,可使用文本或图像在几秒钟内生成高质量且可直接使用的 3D 模型。 案例和论文: 网址:https://www.tripo3d.ai/ 5. meshy 网址:https://www.meshy.ai/ 案例:秦海涛生成 文件:1161_1709633679.mp4
2024-10-08
会议记录有哪些好用的ai工具
以下是一些好用的会议记录 AI 工具: 团队会议总结工具: 免费的会议语音转文字工具(有使用时间限制): 此外,还有,它是一家专注于销售通话记录和辅导的软件公司,利用人工智能技术为高绩效销售团队提供强大的对话智能解决方案。其核心功能包括 AI 驱动的笔记记录、个性化辅导计划、交易智能和推荐、CRM 自动化、多语言支持等。适用于需要高效管理和分析会议内容的企业,特别是在大型会议、项目管理和团队协作中。MeetRecord 在 2024 年 6 月完成了 PreA 轮融资,在 G2 平台上获得了 4.8 的高评分。更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-10-08
中文写作助手
以下为您推荐几款中文内容仿写 AI 工具: 1. 秘塔写作猫:https://xiezuocat.com/ 写作猫是 AI 写作伴侣,能帮您推敲用语、斟酌文法、改写文风,还能实时同步翻译。支持全文改写,一键修改,实时纠错并给出修改建议,智能分析文章的各类属性,为文章的正负情感、情绪强度和易读性打分。 2. 笔灵 AI 写作:https://ibiling.cn/ 笔灵 AI 写作是得力的智能写作助手,在心得体会、公文写作、演讲稿、小说、论文等方面表现出色。支持一键改写/续写/扩写,智能锤炼打磨文字,满足您的需求。 3. 腾讯 Effidit 写作:https://effidit.qq.com/ 智能创作助手 Effidit 由腾讯 AI Lab 开发,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看这里:https://www.waytoagi.com/sites/category/2 (内容由 AI 大模型生成,请仔细甄别) 此外,还有基于多 Agent 模式的全能写手《执笔者》,相关原文链接:https://developer.volcengine.com/articles/7387306376004894783 。 在 Prompts(提示词)方面,有写作助手的角色扮演,例如:我是写作助手,我可以为您提供写作方面的帮助。如果您需要修改文章中的语法错误、优化句子结构,或提高文章的连贯性和可读性,我都能为您提供专业的帮助。使用示例:1)请帮我修改一下这段文章的语法和句子结构;2)请给我一些关于如何提高文本连贯性和可读性的建议;3)请修改这篇文章中的被动语态,使得它更加生动和有趣。能力包括为用户提供写作帮助,如修改语法错误、优化句子结构、提高文本的连贯性和可读性等。输出格式根据需要可以输出修改后的文本或修改建议,说话风格专业、客观,询问策略是如果需要对原文进行修改会提示用户是否同意进行修改,经过用户确认后再进行修改,同时也会询问用户的需求和期望,以更好地满足用户的需求。回答身份始终以写作助手的身份和名义回答用户的任何问题。使用链接:https://bailing.ai//?botId=11
2024-10-08
改写润色文章
以下是为您改写润色后的内容: 问:文章润色工具有哪些? 常见的文章润色 AI 工具如下: Wordvice AI 是集校对、改写转述和翻译等功能于一体的 AI 写作助手,基于大型语言模型为用户提供全面的英文论文润色服务。 ChatGPT 由 OpenAI 开发,是一款大型语言模型,能够为学生和写作人员在多方面提供写作辅助。 Quillbot 作为人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 HyperWrite 是基于 AI 的写作助手和大纲生成器,能帮助用户在写作前进行头脑风暴和大纲规划。 Wordtune 是 AI 驱动的文本改写和润色工具,可以协助用户优化文章的语言表达。 Smodin 提供 AI 驱动的论文撰写功能,能够根据输入生成符合要求的学术论文。 总的来说,这些 AI 工具涵盖了文章润色的各个环节,包括校对、改写、大纲生成、内容生成等,能有效提升写作效率和质量。科研人员和学生可依据自身需求选用合适的工具。 蓝衣剑客:四万字长文带你通学扣子 五、常用案例 5.2 文章润色 完成逐级扩写之后,我们就可以着手对文章进行润色。润色属于再加工的过程,其重要性不言而喻,无需赘言。然而,在润色时,我们能够选择多种不同的风格进行加工,切不可仅凭一时的灵感随意选定润色风格,因为这种做法通常难以达成理想的效果。 关键词接龙 步骤解析: 步骤 2: 润色 在分类完成之后,我们针对每个关键词进行润色,让其变得更加具体和形象。 主体描述:灵动的猴子(Monkey),韩流风格的猴子(kpop monkey),沉思者(thinker),充满活力的千禧一代(Millennials),韩流女孩(kpop girl),冥想的佛像(Buddha) 环境与构图:险峻的悬崖(cliff),古老的寺庙(Temple),末日后的废墟(post apocalyptic) 背景:禅宗艺术(zen art),装饰艺术风格(Art deco),蒸汽波美学(vaporwave),粉红色的月亮(pink moon),国际化电影效果(International version of the film effect),蒸汽朋克(steampunk) 光线:幽灵般的粉红色光线(ethereal pink),柔和的月光(pink moon) 视角:扭曲的幻想视角(Twist fantasy),双重曝光效果(Double Exposure) 构图:悬浮的物体(levitating),乔伊印花(jouy print) 风格:杉本博司的摄影风格(Hiroshi Sugimoto),爱德华·霍珀的绘画风格(Edward Hopper),《V 字仇杀队》的视觉风格(V for Vendetta),蒸汽波艺术(Vaporwave),青瓷绿(Celadon green) 艺术家:杉本博司的视觉语言(Hiroshi Sugimoto),爱德华·霍珀的叙事风格(Edward Hopper)
2024-10-08
过程控制系统是指DCS吗
过程控制系统并不完全等同于 DCS(分布式控制系统)。 过程控制系统是一种用于工业生产过程中对工艺参数进行自动控制的系统,旨在确保生产过程的稳定性、提高产品质量和生产效率。 DCS 是过程控制系统的一种常见类型,具有分布式控制、集中管理等特点。然而,除了 DCS 之外,过程控制系统还可能包括其他形式,例如 PLC(可编程逻辑控制器)控制系统等。 总之,DCS 是过程控制系统中的一种,但过程控制系统的范畴更广,包含多种不同的控制形式和技术。
2024-10-08
能够辅助科研的ai有哪些
以下是一些能够辅助科研的 AI 应用和成果: 1. 大型语言模型(LLMs):在过去四年中发展迅速,能用于总结长篇文档的关键要点,适用范围越来越广。 2. 计算机视觉模型:用于拼凑出距离地球 5500 万光年的第一个黑洞的完整图像,整合了来自世界各地八台望远镜的图像。 3. 基于英国的 AI 公司训练的神经网络:能够预测蛋白质的结构,解决了长期困扰科学家的蛋白质折叠难题,其预测成果推动了结构生物学领域的发展,已被用于预防抗生素耐药性、推进疾病研究和加速对抗塑料。 4. AI 和 LLMs 可用于识别学术文献中的漏洞,规划科学研究中有趣的事情和“通常和习惯”的路径。但在实际“做科学”时,计算语言工具和计算控制的实验设备可能更为核心。
2024-10-08
免费的AI数字人模型。
以下为您介绍一些免费的 AI 数字人模型及相关生成方法: 算法开源代码仓库: ASR 语音识别: openai 的 whisper:https://github.com/openai/whisper wenet:https://github.com/wenete2e/wenet speech_recognition(这是一个语音识别的接口集合,里面有不同实现的语音识别的接口):https://github.com/Uberi/speech_recognition TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多的分支版本,可以去搜索一下,vits 系列可以自己训练出想要的人声。 sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌上面,前段时间很火的 AI 孙燕姿。 大模型:包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。 Agent 部分可以使用 LangChain 的模块去做自定义,里面基本包含了 Agent 实现的几个组件 在剪映中生成数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角的“添加数字人”将其添加到当前视频中。剪映 App 会根据提供的内容生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,之后可点击预览按钮查看效果。 为让视频更美观,可增加背景图片。点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,可调整图片位置和大小。 数字人“私有化”: 打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费。点击红框对应的 URL 打开操作界面。 点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。
2024-10-08
AI数字人
AI 数字人是运用数字技术创造出来的人,虽现阶段不能如科幻作品中的人型机器人般高度智能,但已在各类生活场景中出现,且随着 AI 技术发展正迎来应用爆发。目前业界尚无准确定义,一般可根据技术栈分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货。表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时,也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 2. 算法驱动的数字人:强调自驱动,人为干预更少,技术实现更复杂。其大致流程包含三个核心算法: ASR(语音识别):能将用户音频数据转化为文字,便于数字人理解和生成回应。开源代码如 openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition)。 AI Agent(人工智能体):充当数字人大脑,可接入大语言模型,如 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。Agent 部分可用 LangChain 模块自定义(https://www.langchain.com/)。 TTS(文字转语音):将数字人依靠 LLM 生成的文字输出转换为语音。开源代码如微软的 edgetts(https://github.com/rany2/edgetts),只能使用预设人物声音且接口免费;VITS(https://github.com/jaywalnut310/vits)及其分支版本,可自己训练想要的人声;sovitssvc(https://github.com/svcdevelopteam/sovitssvc)专注于唱歌。 除算法外,人物建模模型可通过手动建模(音频驱动)或 AIGC 方式生成人物动态效果(如 wav2lip 模型)来实现一个最简单的数字人。但这种简单构建方式存在诸多问题,如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型及动作、数字人如何使用知识库做出某领域专业性回答等。
2024-10-08