直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
midjourney的学习教程
以下是关于 Midjourney 的学习教程: 1. 基础准备: 注册 Discord 账号并加入 Midjourney 服务器,Midjourney 也推出了在线版本,可以直接使用。 2. 掌握关键知识: 掌握 Midjourney 的提示词(Prompt)结构,了解其基本组成部分,如“主体”“媒介”“环境”等,学习构建有效的 Prompt 来生成理想的图像。 熟悉 Midjourney 的常用参数和命令,如放大、细节等参数设置,掌握常用的命令,如/imagine、/test 等。 3. 实践练习: 针对插画、游戏、框架等不同应用场景练习创作,通过实践不断提高 Prompt 编写和图像生成的技巧。 学习他人的优秀作品并进行模仿,观察和学习其他用户的 Prompt 技巧,通过模仿练习提高自己的创作水平。 4. 学习资源: 新手学习手册&干货网站(必看):https://ciweicui.feishu.cn/docx/DPbidgdBeoNw55xKjO6c7ao3nbc?from=from_copylink MJ 官方学习手册(至少看 1 遍):https://docs.midjourney.com/ B 站·莱森 LysonOber 免费视频教程(基础操作必看):https://space.bilibili.com/630876766?spm_id_from=333.337.0.0 【腾讯文档】野菩萨 AI 课程(小红书@野菩萨)摄影范式:https://docs.qq.com/sheet/DSXRNUGJIQ0tMWkhu?tab=BB08J2 【腾讯文档】副本野菩萨 AI 课程(小红书@野菩萨)绘画范式:https://docs.qq.com/sheet/DSWlmdFJyVVZPR3VN?tab=y0u7ta 【腾讯文档】野菩萨 AI 课程(小红书@野菩萨)Niji 二次元范式:https://docs.qq.com/sheet/DSUxaRmprc0FrR25W?tab=c7lsa8 【腾讯文档】野菩萨 AI 课程(小红书@野菩萨)三维和抽象:https://docs.qq.com/sheet/DSUlaSHVXT1daaFlJ?tab=BB08J3 【腾讯文档】野菩萨 AI 课程(小红书@野菩萨)AI 产品制作与展现:https://docs.qq.com/sheet/DSW1jSFVZTER4Rnlq?tab=BB08J4 需要注意的是,Midjourney 模型强大,能生成高质量图像,可进行充分个性化设置,但使用过程不太便捷,需要通过 Discord 应用加入其频道或创建自己的频道并邀请 Midjourney 机器人才能开始生成图片,学习难度较大,在用户体验和易用性方面还有待改进。内容由 AI 大模型生成,请仔细甄别。
2024-09-12
提示词
提示词通常指直接输入到 AI 模型中的问题、请求或指示,是提示工程的一部分。它可以简单如“给我总结这篇文章的主要观点”,也可以复杂如设计包含多个步骤和条件的任务。 提示词由一些要素组成,包括指令(想要模型执行的特定任务或指令)、上下文(包含外部信息或额外的上下文信息,引导语言模型更好地响应)、输入数据(用户输入的内容或问题)、输出指示(指定输出的类型或格式)。例如,在一个旨在完成文本分类任务的提示中,“将文本分类为中性、否定或肯定”是指令,“我认为食物还可以”是输入数据,“情绪:”是输出指示。需要注意的是,提示词所需的格式取决于想要语言模型完成的任务类型,并非所有要素都是必须的。 提示词的本质是给模型提供指令或者上下文,让它知道如何回应。当给出提示词时,实际上是在给模型提供方向或背景信息,模型会据此理解意图并生成合适的回应。提示词可以是问题、一段话、某种情景描述甚至是专业结构化提示词。
2024-09-12
AI做ppt
以下是关于 AI 做 PPT 的相关内容: 目前有多种 AI 辅助的 PPT 工具可供选择: 1. 讯飞智文:由科大讯飞推出,利用其在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能,提高文档编辑效率。网址:https://zhiwen.xfyun.cn/ 2. Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 3. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ 4. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能。网址:https://www.mindshow.fun/ 制作 AI 生成的 PPT 通常按照以下思路: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 此外,卓 sir 分享了自己的制作经验,先让 GPT4 生成 PPT 大纲,再把大纲导入到 WPS 中启用 WPS AI 一键生成 PPT,之后让 chatPPT 添加动画,最后手动修改细节。 推荐两篇市场分析的文章供参考: 1. 《》 2. 《》 相似问题: 1. 有没有生成 PPT 的应用推荐,不用翻墙的 2. 免费生成 PPT 的网站有哪些 3. 推荐一款文字生成 ppt 的工具
2024-09-12
有没有语音转文字的API或者是应用呢?
以下是一些语音转文字的 API 或应用: 基于开源大型v2 Whisper 模型的语音转文本 API,提供转录和翻译两个端点,可用于将音频转录为任何语言或翻译并转录成英语。目前文件上传限制为 25MB,支持的输入文件类型包括 mp3、mp4、mpeg、mpga、m4a、wav 和 webm。 OpenAI 的 wishper:https://huggingface.co/openai/whisperlargev2 ,还有相关项目:https://huggingface.co/spaces/sanchitgandhi/whisperjax ,该项目在 JAX 上运行,后端支持 TPU v48,与 A100 GPU 上的 PyTorch 相比,速度快 70 多倍,是目前最快的 Whisper API。 出门问问的语音合成(TTS)API: 接口请求域名:https://open.mobvoi.com/api/tts/v1 接口请求频率限制:5 次/秒 可以将任意文本转化为语音,应用场景广泛,如视频 APP 配音解说、小说 App 有声阅读、移动 App 语音播报新闻、智能设备语音提醒、车载导航语音合成的个性化语音播报等。提供普通话、台湾腔、粤语、四川话、东北话等多种方言,数百个发音人,上千种风格,实时合成支持 SSML,语法详见 SSML 标记语言。请求参数方面,HTTP Method 支持 POST 请求。
2024-09-12
AI 数字人最新消息
以下是关于 AI 数字人的最新消息: 目前业界对于数字人的定义尚未统一,一般可根据技术栈分为真人驱动和算法驱动两类。算法驱动数字人的相关开源代码有很多,如 ASR 语音识别方面的 openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition,这是一个语音识别的接口集合,包含不同实现的语音识别接口)。AI Agent 大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可使用 LangChain 的模块进行自定义(https://www.langchain.com/)。TTS 方面,有微软的 edgetts(https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费)、VITS(https://github.com/jaywalnut310/vits)以及专注于唱歌的 sovitssvc(https://github.com/svcdevelopteam/sovitssvc,前段时间很火的 AI 孙燕姿就与其相关)。 4 月 25 日的消息: Synthesia 推出新型虚拟数字人 Expressive1,能通过脚本预测表情,数字人可自动解析和理解文本情绪,实现表情和声音同步。链接:https://x.com/imxiaohu/status/1783505405488054433 360 AI 浏览器新版增加了视频总结、提问、转录和翻译功能,支持本地和网络视频的内容分析,但无法提取无对白视频摘要。链接:http://browser.360.cn/ai https://x.com/imxiaohu/status/1783495437422649719 全球最大 AI 知识库“通往 AGI 之路”网站访问量突破 1000 万,网站内容丰富,旨在推动 AI 知识的普及。链接:http://WaytoAGI.com https://x.com/imxiaohu/status/1783475002815471669 日本横须贺市使用 AI 技术克隆市长,用于发布英语信息,技术应用广泛,包括灾难信息传播和旅游信息发布。
2024-09-12
AI数字人的最新消息
以下是关于 AI 数字人的最新消息: 4 月 25 日,Synthesia 推出新型虚拟数字人 Expressive1,能通过脚本预测表情,可自动解析和理解文本情绪,实现表情和声音同步。链接:https://x.com/imxiaohu/status/1783505405488054433 11 月 7 日,百度虚拟数字人“度晓晓”携文心一言入驻淘宝。链接:https://x.com/xiaohuggg/status/1721876724798136544?s=20
2024-09-12
有哪些数字人方案
以下是一些常见的数字人方案: 1. 算法驱动的数字人: 开源代码: ASR 语音识别:openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(这是一个语音识别的接口集合,里面有不同实现的语音识别的接口:https://github.com/Uberi/speech_recognition) AI Agent 大模型:ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。Agent 部分可以使用 LangChain 的模块去做自定义,里面基本包含了 Agent 实现的几个组件(https://www.langchain.com/) TTS:微软的 edgetts(https://github.com/rany2/edgetts),只能使用里面预设的人物声音,目前接口免费;VITS(https://github.com/jaywalnut310/vits),还有很多的分支版本,可以去搜索一下,vits 系列可以自己训练出想要的人声;sovitssvc(https://github.com/svcdevelopteam/sovitssvc),专注到唱歌上面,前段时间很火的 AI 孙燕姿。 核心算法: ASR(Automatic Speech Recognition,语音识别):能将用户的音频数据转化为文字,便于数字人理解和生成回应。 AI Agent(人工智能体):充当数字人的大脑,可以直接接入大语言模型,强调 Agent 的概念是为了让数字人拥有记忆模块等更加真实。 TTS(Text to Speech,文字转语音):将数字人依靠 LLM 生成的输出文字转换为语音,保持语音交互一致性。 2. 剪映数字人“个性化“—无限免费私模数字人:Heygen 的访问限制太强,正好剪映已经有了声音克隆和公模数字人两项能力,搭配 facefusion 的换脸技术,能轻松实现零成本的口播数字人。
2024-09-12
文字生成流程图
生成流程图主要有以下两种方式: 1. 可视化拖拽: 代表产品有:(web 工具)、visio(本地软件)。 优点:直观。 缺点:需要花时间在布局上。 2. 语法渲染成图形: 代表语法:。 优点: 只用关注逻辑,文本即图形,方便直接嵌入在 markdown 文件中,比如在用 tyora、markdown 写文档时。 多样性,不同渲染引擎可渲染成多种样式。 缺点:有点抽象。 使用 ChatGPT 生成流程图的流程如下: 1. 确定制作目标。 2. 通过自然语法描述逻辑,将自然语言描述转化为 Mermaid 图形语法。 3. 在线校验测试是否成功,在线测试地址:。经过测试,效果非常完美。
2024-09-12
学习comfyui有哪些技术或者文章可以学习和参考?
以下是一些学习 ComfyUI 的技术、文章和资源: 飞书学习群中的相关内容: 陈旭常用节点讲解和简单的节点制作 长风归庭基础教程+工作流创建 ヘヘ阿甘采样器原理与优化 王蓉? ? Wang Easy 基础搭建和转绘 唯有葵花向日晴基础教程,工作流开发,实际应用场景 热辣 HuolarrAI 系统课私聊图生视频 咖菲猫咪基础教程/工作流搭建思路/各版本模型使用的优缺点 傅小瑶 Lucky 如何制作多人转绘视频 云尚工作流节点搭建思路 FǎFá 热门节点功能,搭建 森林小羊基本报错解决方式及基础工作流逻辑分析 苏小蕊基础教程 Sophy 基础课程 蜂老六装一百个最新常用插件后如何快速解决冲突问题 阿苏工作流框架设计 aflyrt comfyui 节点设计与开发 老宋&SD 深度解释虚拟环境部署和缺失模型的安装 Liguo 模型训练 啊乐福基础课程 塵优秀案例 风信基础课程➕平面设计应用场景 北南基础课程 视频工作流框架设计 8 月 13 日 ComfyUI 共学的相关内容:算力和资源获取方面,飞翔提供了 50 个小时的算力时间,可在飞书群填问卷获取,分享模型较少可提建议,相关文档在飞书和公众号中。AI 绘图相关技术与工具的介绍及交流公众号文章包含 AGI 相关信息:通往 AGI 之路的公众号最新文章中有相关信息,内置工作流和启动器方便,Mac 系统因无 CUDA 生态不太好用。推荐提示词辅助插件:如 SDXL 的 S1XL style,可对提示词进行风格化扩充,还有能翻译提示词的插件,如沙拉查词、沉浸式翻译等。解释 CLIP 和 CFG 的区别:CLIP 用于解析提示词,将其转化为模型可理解的向量,CFG 是提示词对画面影响的强度,即提示词引导系数。搭建带 Lora 的图生图工作流:介绍了加载模型、设置 clip 跳过层、处理图像、连接采样器和解码器等步骤,并展示效果。关于 Lora 串联和图像放大模型的讨论 Lora 串联:多个 Lora 串联时左右顺序不影响结果,可复制并点对点连接。CLIP 层调整:CLIP 层1 和2 的效果不同,加 Lora 时某些 Lora 可能更适合2。 相关网站: ComfyUI 官方文档:提供了 ComfyUI 的使用手册和安装指南,适合初学者和有经验的用户。可在找到相关信息。 优设网:提供了一篇详细的 ComfyUI 入门教程,适合初学者,详细介绍了 ComfyUI 的特点、安装方法以及如何使用 ComfyUI 生成图像等内容。教程地址是。 知乎:有用户分享了 ComfyUI 的部署教程和使用说明,适合有一定基础并希望进一步了解 ComfyUI 的用户。可在找到相关教程。 Bilibili:提供了一系列的 ComfyUI 视频教程,涵盖了从新手入门到精通的各个阶段。可在找到视频教程。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-12
目前市面上有哪些AI辅助工具,能结合信息科技课堂项目教学,并且能助力信息的课堂教学。
目前市面上结合信息科技课堂项目教学、助力信息课堂教学的 AI 辅助工具有以下几种: 数学学习方面: 1. 自适应学习系统,如 Khan Academy,结合 AI 技术为您提供个性化的数学学习路径和练习题,根据您的能力和需求进行精准推荐。 2. 智能题库和作业辅助工具,如 Photomath,通过图像识别和数学推理技术为您提供数学问题的解答和解题步骤。 3. 虚拟教学助手,如 Socratic,利用 AI 技术为您解答数学问题、提供教学视频和答疑服务,帮助您理解和掌握数学知识。 4. 交互式学习平台,如 Wolfram Alpha,参与其数学学习课程和实践项目,利用 AI 技术进行数学建模和问题求解。 制作 PPT 方面: 1. Gamma:在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。允许用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,用户可根据需求选择不同风格和主题的模板,快速打造出适合多种场合的 PPT。网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供一系列的智能设计功能,如自动布局、图像选择和文本优化等,还包括一些互动元素和动画效果,以增强演示文稿的吸引力。网址:https://www.mindshow.fun/ 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-12