直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
ai生产3D模型
以下是关于 AI 生产 3D 模型的相关信息: 使用 Tripo AI 生产 3D 模型: 在「Create」界面底部的输入框中输入提示词(不支持中文),不会写提示词可点击输入框左侧的</>按钮随机生成并自动填入。填写好后点击右侧的「Create」生成 3D 模型,每次会生成 4 个基础模型,不满意可点击最下方白色的「Retry」重新生成。若有满意的模型,点击单个模型下方黄色的「Refine」精修,在「My Models」中可查看精修进度,一般 5 分钟左右完成。 其他 AI 生成 3D 模型的工具: 1. xiaohu.ai 相关: BakedAvatar 动态 3D 头像:从视频创建逼真 3D 头部模型,实时渲染和多视角查看,兼容多种设备,交互性编辑。链接:https://buaavrcg.github.io/BakedAvatar/ 、https://x.com/xiaohuggg/status/1744591059169272058?s=20 MakeACharacter:一键生成 3D 数字人,可自定义面部特征,生成逼真 3D 角色,基于真实人类扫描数据,使用 Unreal Engine 渲染,支持中英文提示,兼容多个行业应用。链接:https://x.com/xiaohuggg/status/1743986486780076279?s=20 Rodin Gen1:3D 原生生成模型,拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术,类似于 Stable Diffusion。链接:https://x.com/xiaohuggg/status/1743638052097184102?s=20 Skybox AI 0.9 版本更新:可以从文本提示或草图生成 360 度 3D 世界,使用 NeRF 技术,增强图像的空间深度和真实感,提供不同分辨率的 3D 网格下载。 2. CSM_ai:文本、图像或草图转换为 3D 素材,可直接应用于游戏中,无需后期处理。体验地址:https://cube.csm.ai ,链接:https://x.com/xiaohuggg/status/1763758877999587757?s=20 3. Move AI 推出 Move API:从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。链接:https://move.ai/api ,https://x.com/xiaohuggg/status/1761590288576061573?s=20 4. ComfyUI 3D Pack:快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。链接:https://github.com/MrForExample/ComfyUI3DPack/tree/main ,https://x.com/xiaohuggg/status/1755824687811346514?s=20 5. Medivis 的 SurgicalAR 手术应用:将 2D 医疗图像转化为 3D 互动视觉,提高手术精度,支持 3D 模型的放大、缩小、旋转,精确手术计划。链接:https://t.co/3tUvxB0L4I
2024-09-14
目前国内最好的文生图工具是什么
目前国内比较受欢迎的文生图工具包括: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 此外,阿里的通义万相在文生图方面有一定特点,如生图效果还可以但不稳定,提示词有难度,文字理解能力较弱,每日有 50 灵感值限制出图次数,但有相似图像生成和图像风格迁移功能。 而 Dreamina 也有很多惊喜,如基本功能实用,可直接用自然语言出图且理解到位,新手友好,导入参考图方式多样,目前文生图限时免费且无出图次数限制。 您可以根据自己的需求选择使用。在 WaytoAGI 网站(https://www.waytoagi.com/category/104),可以查看更多文生图工具。
2024-09-14
文档自动生成PPT
以下是关于文档自动生成 PPT 的相关内容: 生成 PPT 的方法: 1. 点击文本转 PPT,并在提示框中选择确定,得到转换后的 PPT 后可在线编辑。 2. 利用讯飞智文等工具,它是由科大讯飞推出的 AI 辅助文档编辑工具,利用了科大讯飞在语音识别和自然语言处理领域的技术优势,可能提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 3. 目前市面上大多数 AI 生成 PPT 的思路是:AI 生成 PPT 大纲,手动优化大纲,导入工具生成 PPT,优化整体结构。 相关案例: 卓 sir 的做法是先让 GPT4 生成 PPT 大纲,然后把大纲导入到 WPS 当中,启用 WPS AI 一键生成 PPT,为了让 PPT 更有灵动性和观感,让 chatPPT 添加一些动画,最后手动修改细节,比如字体、事实性错误等。 扩展阅读: 1. 《》 2. 《》 相似问题: 1. 有没有生成 PPT 的应用推荐,不用翻墙的 2. 免费生成 PPT 的网站有哪些 3. 推荐一款文字生成 ppt 的工具
2024-09-14
开源的数字人方案
以下是开源的数字人方案: 1. 第一步:先剪出音频,使用 https://elevenlabs.io/speechsynthesis 或使用 GPTsovits克隆声音,做出文案的音频。 2. 第二步:使用 wav2lip 整合包,导入视频和音频,对口型得到视频。基础 wav2lip+高清修复整合包下载地址为 https://github.com/Rudrabha/Wav2Lip 。这就是目前的本地跑数字人的方案,效果都差不多,都是用的 wav2lip 。产品为 https://synclabs.so/ 。 3. 构建数字人躯壳:笔者的开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。
2024-09-14
想利用AI修改视频
如果您想利用 AI 修改视频,可以按照以下流程进行: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 另外,还有一些相关案例和资源供您参考: 爽文转简单动漫的视频,上了 B 站热门,一本小说改编的涨粉十万,链接:https://www.bilibili.com/video/BV1Pc411Q77b/?spm_id_from=333.999.0.0&vd_source=4f7659a23dafc8b331c8f784bf762298 。此视频可以简单拆解为人物站位调度+DNF/LOL 特效,纯视觉特效不考虑。随机摆放 SD 生成图片的小说改视频,都能看下去。这种简单构图的视频会比文本更有传播力,想要用 Ai 自动做这种视频,至少替换大量人为操作部分。本篇文章是想验证“人物站位的调度“这个步骤是否可以让 openai 的 GPT 来自动完成。 3 月 29 日的 Xiaohu.AI 日报中提到的相关资源: VideoSwap:替换视频中的人物、物体在不改变背景的情况下更换视频主体。提供交互式操作,实现个性化编辑。https://videoswap.github.io http://X.AI 发布 Grok1.5 128k 上下文长度,性能翻倍。在 MATH、HumanEval、GSM8K、MMLU 测试中表现出色。http://x.ai/blog/grok1.5 Looi:让你的手机变成桌面机器人集成 ChatGPT,实现富有表情的对话互动。支持情感识别、自适应互动等 AI 功能。正在众筹,129 美金!http://looirobot.com LTX Studio 发布一键生成电影工具由阿里福尔曼使用@LTXStudio 制作宣传片。展示将梦境变成现实影像的 AI 技术。
2024-09-14
市面上有哪些ai批阅相关的ai产品
目前市面上有一些 AI 批阅相关的产品,例如: 1. 用友大易 AI 面试产品:具有强大的技术底座、高度的场景贴合度、招聘全环节集成的解决方案、先进的防作弊技术以及严密的数据安全保障。能帮助企业完成面试,借助人岗匹配模型完成初筛,并对符合要求的候选人自动发送面试邀约。 2. 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上,候选人体验得到改善,到面率提升最高达 30%。 3. InterviewAI:在线平台,提供与面试职位相关的问题和由 AI 生成的推荐答案。候选人可用设备麦克风回答问题,每个问题最多回答三次,会收到评估、建议和得分。 使用这些产品时,企业需要考虑数据安全性和隐私保护的问题。
2024-09-14
AI生成3D模型
以下是关于 AI 生成 3D 模型的相关信息: 使用 Tripo AI 生成 3D 模型: 在「Create」界面底部的输入框中输入提示词(不支持中文)。不会写提示词可点击输入框左侧的</>按钮随机生成并自动填入。填写好后点击右侧的「Create」生成 3D 模型,每次会生成 4 个基础模型。若不满意可点击最下方白色的「Retry」重新生成 4 个。若有满意模型,点击单个模型下方黄色的「Refine」精修,在「My Models」中可查看精修进度,一般 5 分钟左右完成。 其他 AI 生成 3D 模型工具: 1. xiaohu.ai 相关: BakedAvatar 动态 3D 头像:从视频创建逼真 3D 头部模型,实时渲染和多视角查看,兼容多种设备,交互性编辑。链接:https://buaavrcg.github.io/BakedAvatar/ 、https://x.com/xiaohuggg/status/1744591059169272058?s=20 MakeACharacter:一键生成 3D 数字人,可自定义面部特征,基于真实人类扫描数据,使用 Unreal Engine 渲染,支持中英文提示,兼容多个行业应用。链接:https://x.com/xiaohuggg/status/1743986486780076279?s=20 Rodin Gen1:3D 原生生成模型,拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术。链接:https://x.com/xiaohuggg/status/1743638052097184102?s=20 Skybox AI 0.9 版本更新:可以从文本提示或草图生成 360 度 3D 世界,使用 NeRF 技术,增强图像的空间深度和真实感,提供不同分辨率的 3D 网格下载。 2. CSM_ai:文本、图像或草图转换为 3D 素材,直接应用于游戏中,无需后期处理。体验地址:https://cube.csm.ai 链接:https://x.com/xiaohuggg/status/1763758877999587757?s=20 3. Move AI 推出 Move API:从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。链接:https://move.ai/api 、https://x.com/xiaohuggg/status/1761590288576061573?s=20 4. ComfyUI 3D Pack 引入 3D 图像处理:快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。链接:https://github.com/MrForExample/ComfyUI3DPack/tree/main 、https://x.com/xiaohuggg/status/1755824687811346514?s=20 5. Medivis 的 SurgicalAR 手术应用:将 2D 医疗图像转化为 3D 互动视觉,提高手术精度,支持 3D 模型的放大、缩小、旋转,精确手术计划。链接:https://t.co/3tUvxB0L4I
2024-09-14
如何用ai学习初中英语
以下是使用 AI 学习初中英语的一些方法: 智能辅助工具: 利用 AI 写作助手如 Grammarly 进行英语写作和语法纠错,有助于改进英语表达和写作能力。 语音识别和发音练习: 使用语音识别应用如 Call Annie 进行口语练习和发音纠正,AI 会提供实时反馈和建议。 自适应学习平台: 借助自适应学习平台如 Duolingo,其利用 AI 技术为您量身定制学习计划,提供个性化的英语学习内容和练习。 智能导师和对话机器人: 利用智能对话机器人如 ChatGPT 进行英语会话练习和对话模拟,能够提高交流能力和语感。 此外,还可以利用 Coze 免费制作一个 24 小时英语陪练,随时随地进行练习,不用担心说错或费用问题。 需要注意的是,这些内容由 AI 大模型生成,请仔细甄别。
2024-09-14
推荐分析PDF文档 提炼标注关键词的AI
以下是一些可以分析 PDF 文档、提炼标注关键词的 AI 产品或方法: 1. DeepL(网站):点击页面“翻译文件”按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部“更多”按钮,选择“制作双语 BPUB 电子书”、“翻译本地 PDF 文件”、“翻译 THML / TXT 文件”、“翻译本地字幕文件”。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件“Ebook Translator”。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译“Document”按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏“文件翻译”,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击“文档翻译”,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方“切换成电子书”,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-14
蛟龙16pro配置(处理器R7-7745HX,显卡RTX4060 8G,硬盘512GPCIE4.0SSD)可以用于审计人员本地化部署大模型用于数据分析工作吗
蛟龙 16pro 的配置(处理器 R77745HX,显卡 RTX4060 8G,硬盘 512G PCIE4.0 SSD)对于审计人员本地化部署大模型用于数据分析工作来说,可能存在一定的局限性。 处理器 R77745HX 具有一定的计算能力,但在处理大规模数据和复杂的模型运算时,其性能可能不够强劲。 显卡 RTX4060 8G 对于一些较为复杂的图形处理和计算任务能够提供一定的支持,但对于大规模的深度学习模型训练和数据分析,可能会显得不足。 512G 的 PCIE4.0 SSD 硬盘容量相对较小,在存储大量数据时可能会很快耗尽空间。 综上所述,该配置在一定程度上可以用于简单的数据分析任务,但对于较为复杂和大规模的大模型本地化部署及数据分析工作,可能需要更强大的硬件配置,例如更高性能的处理器、更大容量和更高性能的显卡,以及更大的存储空间。
2024-09-14