直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
腾讯混元大模型网址
腾讯混元大模型的开源地址为:https://github.com/Tencent/HunyuanVideo 。普通用户也可以去腾讯元宝 APP,进入 AI 应用查看该模型,可能需要申请资格,但腾讯处理速度较快。此外,模型下载地址为:https://huggingface.co/tencent/TencentHunyuanLarge ,详细介绍可参考:https://xiaohu.ai/p/15254 ,技术报告:https://arxiv.org/pdf/2411.02265 。
2024-12-09
ai 教育
以下是关于 AI 教育的相关内容: 在 Sam Altman 的《The Intelligence Age》一文中提到,人工智能将成倍增强人类能力,放大社会共享智慧,深度学习的可扩展性是关键驱动力,有望实现全球繁荣和问题解决,获得充足计算和能源对实现民主化和防止不平等至关重要,控制风险对发挥优势和确保未来积极发展也很重要。文中还指出,在智能时代,孩子将拥有虚拟导师,提供个性化教学,类似概念可应用于医疗保健等领域。 人们对 AI 时代的教育怀有期待,是因为当前的应试教育存在诸多弊端,如题海战术、考试制度等,导致学生创造性和创新性思维较差,对学习丧失兴趣。虽然教育资源比过去充裕,但学生学习能力未明显提升,对于三四五六线城市的学生选择有限。 北京市新英才学校已经在行动,跨学科项目老师带学生用 AIGC 做学校地图桌游,英语老师借助其备课授课,生物和信息科技老师合作带学生训练 AI 模型识别植物。数字与科学中心 EdTech 跨学科小组组长魏一然参与其中,她表示学生对 AIGC 的认知和理解差异大,学校领导层重视并给予自由空间,目前处于探索初级阶段但有一定成果。
2024-12-09
输入拍摄好的图片和视频,自动合成并生成视频的工具
以下是一些能够输入拍摄好的图片和视频,并自动合成生成视频的工具及相关操作: 1. TecCreative 创意工具箱: 数字人口播配音:输入口播文案,选择期望生成的数字人形象及目标语言,即可生成数字人口播视频。操作指引:输入口播文案——选择目标语言——选择数字人角色——选择输出类型——点击开始生成。 图片换脸:上传原始图片和换脸图片,即可一键实现素材换脸。操作指引:上传原始图片——上传换脸图片——点击开始生成。注意:图片大小上限 5M,支持 JPG、PNG 格式。 视频换脸:自动识别视频中的人脸,并将其替换为选择的脸部。操作指引:上传原始视频——上传换脸图片——点击生成。 音频合成数字人:上传音频文件,即可基于音频合成对应的数字人视频,工具支持使用 100+数字人模板。操作指引:上传音频文件——选择数字人角色——选择输出类型——点击开始生成。注意:音频文件支持 MP3 和 WAV 格式,文件大小上限 5M。 AI 配音:多语种(包含菲律宾语、印地语、马来语等小语种)智能配音,同时支持区分男声和女声。操作指引:输入需配音文案——选择音色——点击立即生成。注意:输入的配音文案需和选择音色语种保持一致。 AI 字幕:智能识别视频语言并生成对应字幕。操作指引:点击上传视频——开始生成——字幕解析完成——下载 SRT 字幕。注意:支持 MP4 文件类型,大小上限为 50M。 2. 如果想用 AI 把小说做成视频,制作流程如下: 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 3. 生成带有文本提示和图像的视频:在 Adobe 产品(https://www.adobe.com/products/fi )的 Camera 部分,使用 Shot size 下拉菜单指定视频中主要主题的框架。包括极度特写、特写镜头、中景照片、远景、极远镜头等不同的拍摄方式。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-12-09
midjouney
以下是关于 Midjourney 的相关信息: 动漫创作提示:在通过 Midjourney 创作出色的动漫时,可在提示中包含动漫艺术家、漫画艺术家或漫画家的名字,如宫崎骏、织田荣一郎、竹内直子等。并给出了一些具体的提示示例,如“一个穿着传统日本服装的女孩,旁边有白狼,站在一个神奇的托里神社前,artgerm,吉卜力工作室— ar 3:2 — niji 5”等,且对比了 Niji V4 和 Niji V5 在细节和艺术风格上的表现。 添加到服务器:如果您有服务器的管理员权限,可以将 Midjourney bot 添加到该服务器。添加时选择用户列表中的 Midjourney Bot,然后单击 Add to Server,选择要添加的服务器并按照 discord 的说明操作。同时,在任何服务器中使用 Midjourney Bot,用户必须有有效的 Midjourney 试用或订阅。 最新编辑器更新:今天早上 3 小时前,MJ 测试了全新的“外部图像编辑器、图像重纹理化功能”以及下一代 AI 审核系统。图像编辑器允许上传图像,然后进行扩展、裁剪、重绘、添加或修改场景元素,还推出了“图像重纹理化模式”。同时,MJ 还在测试一个更加智能、细致的 V2 AI 审核系统。在第一个发布阶段,这些功能开放给已生成至少 10,000 张图像的用户和年度会员。
2024-12-09
专业园林设计AI软件
以下是一些专业的园林设计 AI 软件和相关设计工具: CAD 图绘制的 AI 工具: 1. CADtools 12:这是 Adobe Illustrator 的插件,添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:Autodesk 开发的云端 3D CAD/CAM 软件,集成了 AI 功能,能创建复杂几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 主流 CAD 软件(如 Autodesk 系列、SolidWorks 等)中的生成设计工具:可根据用户输入的设计目标和约束条件自动产生多种设计方案。 其他设计相关的 AI 工具: 1. 星流一站式 AI 设计工具:在右侧生成器的入门模式中,可使用图像控制功能,如空间关系、线稿、人物长相、姿势等精准控制生成图像的内容和风格。入门模式下有多种参考功能,如全部图片参考功能、原图、景深、线稿轮廓、姿势、Lineart 线稿、Scribble 线稿、光影、Segmant 构图分割等。 2. 生成 Logo 的 AI 产品: Looka:在线 Logo 设计平台,使用 AI 理解用户品牌信息和设计偏好,生成多个设计方案供选择和定制。 Tailor Brands:AI 驱动的品牌创建工具,通过回答问题生成 Logo 选项。 Designhill:Logo 制作器使用 AI 技术创建个性化 Logo,用户可选择设计元素和风格。 LogoMakr:提供简单易用的 Logo 设计工具,可利用拖放和 AI 建议的元素、颜色方案。 Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,能根据输入快速生成方案。 标小智:中文 AI Logo 设计工具,利用人工智能技术创建个性化 Logo。 这些工具通常需要一定的相关知识和技能才能有效使用。对于初学者,建议先学习基本技巧,然后尝试使用这些 AI 工具来提高设计效率。您还可以访问网站的 AI 生成 Logo 工具版块,获取更多好用的工具。
2024-12-09
flux怎么提升生图速度需要哪些依赖
要提升 Flux 的生图速度,以下是一些相关的依赖和要点: 1. 条件引导:在去噪过程中,模型使用编码后的文本向量来引导图像生成,确保生成的图像与输入的文本描述相符。 2. 采样器:ComfyUI 提供了多种采样算法(如 Euler、DDIM、DPM++等)来控制去噪过程,不同的采样器可能会影响生成速度和结果。 3. Vae 编码:VAE 由编码器和解码器组成。编码器输入图像并输出表示其特征的概率分布,解码器将概率分布映射回图像空间。 4. 结果输出:ComfyUI 最终将生成的图像显示在界面上,用户可进行保存、编辑或用于其他目的。 5. 额外控制:ComfyUI 支持多种高级功能,如图像到图像、Lora、ControlNet、ipadapter 等。 6. 低配置方案:对于显存不够 16G 的情况,开源社区有优化方案。如 NF4 来自 controlnet 的作者,GGUF 包含多个版本。NF4 模型可从 https://huggingface.co/lllyasviel/flux1devbnbnf4/blob/main/flux1devbnbnf4.safetensors 下载,放置在 ComfyUI/models/checkpoint/中,其配套节点插件可通过 git clone https://github.com/comfyanonymous/ComfyUI_bitsandbytes_NF4.git 获取。GGUF 模型可从 https://huggingface.co/city96/FLUX.1devgguf/tree/main 下载,配套节点插件为 https://github.com/city96/ComfyUIGGUF 。在最新版本的 ComfyUI 中,GGUF 的节点插件可在 Manager 管理器中搜到下载安装,NF4 的配套节点插件则搜不到。使用精度优化的低配模型时,工作流和原版不同。相关生态发展迅速,有 Lora、Controlnet、IPadpter 等,字节最近发布的 Flux Hyper lora 可实现 8 步快速生图。
2024-12-09
ai小白怎么入行
对于 AI 小白入行,以下是一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 入行敲门砖: 一个点子。 一张图。 7. 岗位技能学习: 对于“AI 提示词工程师”岗位,如果是零基础小白,可在网上找基础课程学习。 推荐看科普类教程,阅读 OpenAI 的文档,理解每个参数的作用和设计原理。 推荐一些练手的 Prompt 工具和相关教程文档。
2024-12-09
ai的工作岗位
以下是关于 AI 工作岗位的相关信息: 一、行业应用中的 AI 工作岗位 1. 企业运营:包括日常办公文档材料撰写整理、营销对话机器人开发与维护、市场分析、销售策略咨询等。 2. 教育:协助评估学生学习情况,为职业规划提供建议;针对学生情况以及兴趣定制化学习内容;论文初稿搭建及论文审核;帮助低收入国家/家庭通过 GPT 获得平等的教育资源。 3. 游戏/媒体:定制化游戏开发,动态生成 NPC 互动,自定义剧情,开放式结局;出海文案内容生成,语言翻译及辅助广告投放和运营;数字虚拟人直播;游戏平台代码重构;AI 自动生成副本。 4. 零售/电商:舆情、投诉、突发事件监测及分析;品牌营销内容撰写及投放;自动化库存管理;自动生成或完成 SKU 类别选择、数量和价格分配;客户购物趋势分析及洞察。 5. 金融/保险:个人金融理财顾问;贷款信息摘要及初始批复;识别并检测欺诈活动风险;客服中心分析及内容洞。 二、医疗保健领域的 AI 相关岗位 医生将把文档工作交给 AI 书记员;初级医疗服务提供者将依赖聊天机器人进行分诊。 三、AI stylist 岗位 岗位职责: 1. 负责 AI 风格的开发和调试工作,参与项目的整体风格和审美定义。 2. 根据产品需求完成风格渲染的研发、测试、配置和维护。 3. 熟练使用 StableDiffusion Web UI 等 AI 框架进行风格研发。 4. 负责 AI 模型(如 LoRA,Prompt/Prompt Sentence)的训练、参数调整以及性能优化。 5. 编写高质量的渲染记录文档,进行配置和模型训练质量控制。 6. 为团队提供技术支持和指导,解决技术难题。 任职要求: 1. 具有至少半年的 StableDiffusion Web UI 使用经验,知道如何安装对应插件和 models 并使用。 2. 英文水平需要能看懂 Web UI,Hugging Face 上的英文文档。 3. 能根据需求去完成对应的渲染测试,包括但不局限于 t2i,i2i 以及视频渲染。 4. 能熟练的根据不同的 check point,prompt 和 LoRA 来结合 CFG(和 i2i 的 DS 指)和 ControlNet 来达到测试需求。 5. 能够独立进行模型训练和参数调优。 6. 拥有良好的记录和沟通习惯,结构清晰,命名规范,逻辑性强,能够对团队进行技术指导。 7. 思路清晰、积极主动、认真踏实、良好的沟通能力和团队合作精神,有敏捷研发经验优先。
2024-12-09
有cursor的教学吗?
以下是关于 Cursor 的一些教学资源和相关信息: 1. 中文教程网站:,提供中文教程,帮助用户更好地掌握 AI 代码编辑器 Cursor 的使用方法,适合想深入了解和学习 Cursor 的用户。 2. 课程“和 Cursor AI 一起学 Python 编程”: 第一节课程内容包括 Python 是什么、Cursor 使用、notebook 远程编程。 时间为 45 分钟。 教学内容涵盖 Python 简介、发展历史和特点、在数据分析和人工智能等领域的优势及应用、数字人文领域的项目介绍,以及 Cursor 编程环境介绍,包括其是结合了 AI 功能的编程编辑器,具有 AI 辅助代码补全和生成、实时语法和错误检查、简洁友好的用户界面等功能和优势,还介绍了 Bohrium 在线编程平台。 3. 白九龄的经历:9 月下旬参加了名为 cursor 的共学,有了关于改善沟通和交流产品的想法,但用 cursor 做相关产品未成功。
2024-12-09
生成短视屏
以下是关于生成短视频的相关知识: Sora 原理解释: Sora 是可作为世界模拟器的视频生成模型。以往许多研究对视频数据生成建模的方法存在局限性,而 Sora 是视觉数据的通用模型,能生成持续时间、纵横比和分辨率各异的视频和图像,长达一分钟的高清视频。训练文本到视频生成系统需要大量带相应文本标题的视频,应用如 DALL·E 3 中的重新标题技术,先训练高度描述性的标题生成模型为训练集中的视频生成文本标题,能改善文本忠实度和视频整体质量。类似于 DALL·E 3,利用 GPT 将简短用户提示转换为更长详细标题发送给视频模型,使 Sora 能生成准确遵循用户提示的高质量视频。 为 Generate video(beta)编写有效的文本提示: 1. 明确定义操作:若希望视频涉及角色动作,用特定动词和副词描述,建议使用动态动词如跑步、飞行、游泳或跳舞,并包括节奏如慢、快或逐渐。例如“一只狗兴高采烈地冲过海滩,在空中接住了一个球。” 2. 使用描述性形容词:编写有效提示时,获得正确视频氛围至关重要,具体说明希望的整体氛围,使用描述性很强的形容词唤起希望视频传达的感觉。例如“海滩上一个宁静、薄雾缭绕的早晨,柔和的阳光透过沙滩椅洒进来。”
2024-12-09