直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
lama模型
Llama 模型相关信息如下: 基于多模态大模型给现实世界加一本说明书:后端采用 llama.cpp 挂载 LLaVA 模型,为应用提供推理服务。同时,部署了一个 Flask 应用用于数据前处理和后处理,提供 Stream 流服务。前端页面采用 HTML5,用于采集画面和用户输入。 LLM 开源中文大语言模型及数据集集合:未直接提及 Llama 模型的具体内容。 LayerStyle 副本中的 LayerUtility 中的 LaMa:根据图像遮罩擦除物体,是对 IOPaint 的封装,由 SOTA AI 模型提供支持。提供 LaMa 等模型以及多种擦除方法,可下载模型文件放到指定位置,并对节点选项进行了说明,如选择模型或方法、设备选择、遮罩反转、遮罩扩张幅度、遮罩模糊幅度等。
2024-11-14
语音转文字的工具
以下是一些语音转文字的工具: 1. 飞书妙记:https://www.feishu.cn/product/minutes ,是飞书的办公套件之一。 2. 通义听悟:https://tingwu.aliyun.com/home ,阿里推出的 AI 会议转录工具。 3. 讯飞听见:https://www.iflyrec.com/ ,讯飞旗下智慧办公服务平台。 4. Otter AI:https://otter.ai/ ,用于转录采访和会议纪要。 此外,还有 OpenAI 的 wishper,相关链接为: 1. https://huggingface.co/openai/whisperlargev2 2. https://huggingface.co/spaces/sanchitgandhi/whisperjax 。这个项目在 JAX 上运行,后端支持 TPU v48。与 A100 GPU 上的 PyTorch 相比,它要快 70 多倍,是目前最快的 Whisper API。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。需要注意的是,大部分免费工具都有使用的时间限制,超过一定的免费时间后可能需要付费。同时,在使用时请仔细甄别内容。
2024-11-14
使用ai工具教程
以下是一些常见的 AI 工具使用教程: AI 画示意图: 假设您需要创建一个项目管理流程图,可以按照以下步骤使用 Lucidchart: 1. 注册并登录: 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据您的项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表的外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 利用这些 AI 工具,您可以快速、高效地创建专业的示意图,满足各种工作和项目需求。 AI 视频相关: 以下是一些 AI 视频软件的教程链接: AI 线上绘画: 如果您在工作中需要用到大量图片,又想使用能够商用且具有较强艺术美感的图片,AI 生图是高效的解决办法。不论是人像、动物、自然风景或是人造景观的图,都可以用 AI 完成。 但主流的两款工具 midjourney(MJ)付费成本较高,stable diffusion(SD)硬件门槛不低。不过,还有像这样的免费在线 SD 工具网站。 本教程适用于入门玩家,计划让您在半个小时内自由上手创作绘图。如果半个小时内您无法理解工具如何使用,可通过评论区或加微信 designurlife1st(记得备注来意:ai 绘图交流)与作者联系。教程内容会持续更新,欢迎关注和催更。
2024-11-14
AI 配音
以下是一些给视频配音效的 AI 工具: Vidnoz AI:支持 23 多种语言的配音,音质高保真,支持文本转语音和语音克隆功能,提供语音参数自定义和背景音乐添加工具,有面向个人和企业的经济实惠的定价方案。 Wavel Studio:支持 30 多种语言的配音,音质自然流畅,能自动去除背景噪音和杂音,提供添加字幕和文本叠加层的工具,界面友好且有多种自定义选项。 Elai.io:支持 65 多种语言的配音,音色和语调真实,能自动将唇形与语音同步,生成字幕以提高视频的可访问性,支持多位配音者,适合复杂对话场景。 Rask AI:支持 130 多种语言的配音,包括稀有和濒危语言,采用先进语音合成技术,音质高保真,提供语音参数自定义和音效添加工具,与多种视频编辑平台和工作流程整合。 Notta:提供快速实惠的多语言配音解决方案,能保留原声说话风格和细微差别,提供调整语音速度和音调的工具,支持批量处理,高效完成多视频配音。 Dubverse:支持 60 多种语言的配音,音质接近真人,提供文本转语音和语音克隆功能,提供语音参数自定义和情感添加工具,与多种视频平台和社交媒体渠道整合。 此外,魔音工坊(moyin.com)也是一款短视频达人联袂推荐的 AI 配音神器,能高效、高品质地将文本一键转换为音频,可为多种类型的作品完成专业配音,并已与多位配音演员和大咖进行深度合作,推出众多配音员和配音风格。注册并输入 CDK 兑换码:WaytoAGI,即可获得 2 天 SVIP 全场声音的使用体验。
2024-11-14
AI做工作计划
以下是关于 AI 做工作计划的相关内容: Agentic Workflow: 大模型如 Kimi Chat 会利用「网页搜索」工具,在互联网检索相关内容并总结分析给出结论。 Agent 能自行规划任务执行的工作流路径,适用于简单或线性流程的运行。例如,先识别男孩姿势,再用相关模型合成新的女孩图像,最后语音合成输出。 吴恩达通过开源项目 ChatDev 举例,大语言模型可扮演不同角色相互协作开发应用或复杂程序。 OpenAI 的研究主管 Lilian Weng 提出 Agent 的基础架构为“Agent = LLM + 规划 + 记忆 + 工具使用”,其中大模型 LLM 是 Agent 的“大脑”。 规划包括子目标分解、反思与改进,将大型任务分解为较小可管理的子目标,还能对过去行动进行自我批评和反思以提高结果质量。 OpenAI 通用人工智能(AGI)的计划:暂未获取到关于 OpenAI 通用人工智能(AGI)计划在做工作计划方面的直接相关内容。 AI+工作场景案例: 办公方面,包括编写 Excel 公式、写邮件、会议总结等。 项目管理方面,ChatGPT 可创建和维护跨团队项目协作计划。 销售方面,可总结话术的优缺点,涵盖产品特点、服务优势等多方面。
2024-11-14
免费的数字人
以下是关于免费数字人的相关内容: 在剪映中生成免费数字人的方法如下: 1. 打开剪映右侧窗口顶部的“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择后软件会播放数字人的声音,可判断是否需要,然后点击右下角的“添加数字人”将其添加到当前视频中。左下角会提示渲染完成时间,完成后可点击预览查看效果。 2. 增加背景图片:可删除先前导入的文本内容,为视频增加背景图片。点击左上角的“媒体”菜单并导入本地图片,将图片添加到视频轨道上,可通过拖拽轨道右侧竖线使其与视频对齐,再调整图片尺寸和数字人的位置。 剪映作为字节跳动旗下的产品,具有以下优势: 1. 在抖音平台广泛应用于短视频创作和编辑,海外版 CapCut 成绩斐然。 2. 拥有声音克隆和公模数字人等六大 AI 功能,能在编辑器内完成脚本生成、语音克隆、数字人口播等环节。 制作流程: 1. 打开剪映,添加文本到文字轨道,修改朗读文字,点击朗读并进行声音克隆。 2. 选择喜欢的数字人形象,换上克隆音色。 3. 一键智能生成字幕,调整文字样式并校准。 数字人“私有化”: 可使用 AI 换脸软件完成。 1. 打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进入运行界面,在右上角点击“代码执行程序”选择“全部运行”。 2. 点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 有关数字人使用问题可在评论区留言交流,对数字人课程感兴趣可查看相关课程。 剪映下载地址: capcut 下载地址:
2024-11-14
本地运行Llama3需要的电脑是什么配置的?
本地运行 Llama3 所需电脑配置的相关信息如下: 1. 安装 Docker Desktop: 点击/复制到浏览器下载:https://docs.docker.com/desktop/install/windowsinstall/ 。 下载后,双击下载项目,出现相关界面点击 ok 开始加载文件。注意下载相对较快,完成后不要点击“close and restart”,以免导致 llama3 下载中断。等待终端的模型下载完成后再点击重启。 重启后,点击“Accept”,选择第一个,点击“Finish”。 然后会提示注册账号,若打不开网页,可能需要科学上网。按照正常流程注册账号并登录 Docker 即可。 2. 下载 Llama3 模型: 打开终端。如果是 Windows 电脑,点击 win+R,输入 cmd 点击回车;如果是 Mac 电脑,按下 Command(⌘)+ Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”,然后从搜索结果中选择“终端”应用程序。 复制相关命令行,粘贴进入并回车,会开始自动下载,文件下载较慢,可同时进行安装 Docker 的步骤。 3. 下载 Open WebUI: 回到桌面,再打开一个新的终端窗口。如果是 Windows 电脑,点击 win+R,输入 cmd 点击回车;如果是 Mac 电脑,按下 Command(⌘)+ Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”,然后从搜索结果中选择“终端”应用程序。 将相关命令输入,等待下载。 点击或复制相关地址进入浏览器,进行注册登录。 登入后,点击顶部的 Model,选择“llama3:8b”。 需要注意的是,模型的回复速度取决于您电脑的配置。另外,您还可以参考开源项目 。同时,有教程提到可以通过购买算力解决本地电脑配置不够的问题,但需要充值 50 元。
2024-11-14
llama3是什么?
Llama 3 是 Meta 发布的语言模型。以下是关于 Llama 3 的一些重要信息: 模型版本:包括 8B 和 70B 双模型。 数据集:比 Llama 2 的数据集大 7 倍以上。 性能特点:具有 128K token,更强的推理和编码能力,训练效率比 Llama 2 高 3 倍,已集成到 Meta AI。 能力表现:8B 的能力远超 Llama 2 70b。 模型架构:使用 128K 词库的标记化器,8B 和 70B 模型采用分组查询关注 以提升推理效率。 训练数据:超过 15T 词库的预训练,包含的代码数量是 Llama 2 的四倍,预训练数据集含 5%以上的非英语数据,覆盖 30 多种语言,并采用数据过滤管道。 使用方式:将支持 AWS、Databricks、Google Cloud 等平台,得到 AMD、AWS 等硬件平台支持,可在 Meta AI 官方助手上体验。 未来发展:未来几个月将推出新功能、更长上下文窗口、更多型号尺寸,性能将进一步提升,并将分享 Llama 3 研究论文。 此外,现在 llama370BInstruct 已经可以在刚刚推出的 Hugging Chat 上直接使用,网页为:https://huggingface.co/chat/ ,app 下载:https://apps.apple.com/us/app/huggingchat/id6476778843?l=zhHansCN 。还可以在 Amazon SageMaker 上部署 Llama 3 ,相关博客介绍了如何设置开发环境、硬件要求、部署步骤、运行推理并与模型聊天、进行基准测试以及清理等内容。目前 Llama 3 400B 还在训练中。
2024-11-14
可以写小说的ai软件
以下是一些可以写小说的 AI 软件: Novel.ai:AI 写小说领域的头部应用,是典型的 LLM 产品。其产品功能复杂,但使用模式简单,利用 LLM 的续写能力将写作改造成交互式的文本生成,渐进式生成小段,用户可自由更改或继续生成下一个小段,并基于写作业务抽象出模型风格、写作方式、故事世界、记忆等细分功能。本质上还是构造 Prompt,交互式、渐进式的 Prompt 构建会极大降低使用门槛。 Character.ai:大名鼎鼎的角色扮演类 AI 陪伴产品,服务游戏和二次元用户。使用简单,就是选角色对话,创建也很简单,角色的核心差异靠不同的详细描述,开放用户角色 Prompt 可见。 如果您想用 AI 把小说做成视频,这是一个涉及多个步骤的过程,通常包括以下方面: 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 以下是一些可以利用的工具及网址: Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址: Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址: Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: Clipfly:一站式 AI 视频生成和剪辑平台。网址: VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 故事 AI 绘图:小说转视频的 AI 工具。网址: 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-11-14
可以写小说得ai
以下为您介绍一些关于可以写小说的 AI 相关内容: 2016 年,由人工智能撰写的《电脑写小说的那一天》小说成功通过了日本“星新一文学奖”的初选。Sony 开发的 DeepBach AI 在深度学习巴赫后,创作出的仿巴赫音乐,在 1600 位听众里,骗过了超过一半的人。如今,人工智能已经能生成真假难辨的视频、极具艺术感的图像,并在挑战文学、音乐、绘画、影视等原本属于艺术创作的领域。 Novel.ai 是 AI 写小说领域的头部应用,是典型的 LLM 产品。其产品功能复杂但使用模式简单,包括利用续写能力将写作改造成交互式文本生成、渐进式生成小段、抽象出模型风格等细分功能,本质上还是构造 Prompt,交互式、渐进式的 Prompt 构建会极大降低使用门槛。 如果想用 AI 把小说做成视频,制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-11-14