Navigate to WaytoAGI Wiki →
Home/All Questions
图片扩展
以下是关于图片扩展的相关内容: 使用 SD 进行图片扩展: 1. 将图片导入到图生图界面。 2. 根据情况选择大模型,卡通类一般选“revAnimated”,真实类一般选“Realistic Vision”,效果不好可尝试其他模型。 3. 图生图中重要的参数:“缩放模式”选择“缩放后填充空白”;根据扩展方向调整尺寸;单批数量按需填写;加大“重绘幅度”到“0.8”以上。 4. 升级到最新的 ControlNet 版本,将图片导入,启用插件,“控制类型”选择“局部重绘”,预处理器选择“inpaint_only+lama”,控制模式选择“更倾向 ControlNet”,缩放模式选择“缩放后填充空白”。 5. 为使风格统一,可增加“reference_only”通道。 6. 设置好后点击生成,选择满意的结果。 7. 试验时可通过反推提示词增加文本控制,但效果不一定每次都好,可能存在色差,需调整参数修正。 8. 以建筑图为例,调整尺寸,分别放入“图生图”和“ControlNet”中点击生成即可。记住工作流,替换图片改尺寸就能快速扩图。 悠船中的图片调整: 1. 常用内容包括变化(细微或强烈改变)、高清(“直接”或“创意”放大)、风格变化(基于垫图再创作)、拓展(上下左右扩展图片)、缩放(镜头调整)、局部重绘(选择区域建议大些)。 2. 使用图片即垫图,使用风格即参考风格,使用提示词即复制提示词。 3. 在悠船中可利用垫图和提示词配合生成符合要求的建筑、风景、文物等,将图片复制到提示词框并填写提示词描述。 悠船的其他操作: 1. 基础页面操作包括想象历史(创作记录、创建文件夹、筛选器、预览形式)和套餐选择(年费模式、月费模式,价格越高对应做图数量、同时出图数量越多、生成速度越快,初次使用者可先从免费版开始,同时出图 3 指三列图,每列 4 张)。
2025-01-20
flux提示词示例
以下是一些关于 flux 提示词的示例: 在不同主题方面,如文本概括(https://www.promptingguide.ai/zh/introduction/examples%E6%96%87%E6%9C%AC%E6%A6%82%E6%8B%AC)、信息提取(https://www.promptingguide.ai/zh/introduction/examples%E4%BF%A1%E6%81%AF%E6%8F%90%E5%8F%96)、问答(https://www.promptingguide.ai/zh/introduction/examples%E9%97%AE%E7%AD%94)、文本分类(https://www.promptingguide.ai/zh/introduction/examples%E6%96%87%E6%9C%AC%E5%88%86%E7%B1%BB)、对话(https://www.promptingguide.ai/zh/introduction/examples%E5%AF%B9%E8%AF%9D)、代码生成(https://www.promptingguide.ai/zh/introduction/examples%E4%BB%A3%E7%A0%81%E7%94%9F%E6%88%90)、推理(https://www.promptingguide.ai/zh/introduction/examples%E6%8E%A8%E7%90%86),通过示例介绍说明如何使用精细的提示词来执行不同类型的任务。 在 Claude2 中文精读中,构建提示词时可以添加示例(可选)。您可以通过在提示词中加入一些示例,让 Claude 更好地了解如何正确执行任务。提供示例的方式可以是以先前对话的形式,用不同的对话分隔符,例如用“我”代替“Human:”,用“你”代替“Assistant:”;也可以直接提供例子。决定哪种方法更有效取决于具体任务,建议尝试两种方法以确定更好的结果。 在市场营销类中,如赛博佛祖(Kyle)的示例,其角色设定为熟悉佛教经典、境界很高的佛学大师,能为对人生感到迷茫的人指引方向。具体设定包括引用相关佛教经典语录并解释含义,提供有效建议等,并给出了详细的约束条件和链接地址()。
2025-01-20
AI语音
以下是一些人工智能音频初创公司的列表: 语音合成(TTS): :为所有人提供开放的语音技术。 :基于 AI 的语音引擎能够模仿人类语音的情感和韵律。 :基于 NLP 的最先进文本和音频编辑平台,内置数百种 AI 声音。 :使用突触技术和脑机接口将想象的声音转化为合成 MIDI 乐器的脑控仪器。 :为出版商和创作者开发最具吸引力的 AI 语音软件。 :Wondercraft 使用户能够使用文本转语音技术生成播客。 :基于生成机器学习模型构建内容创作的未来。 :从网页仪表板或 VST 插件生成录音室质量的 AI 声音并训练 AI 语音模型。 :我们的演员优先、数字双重声音由最新的 AI 技术驱动,确保它们高效、真实和符合伦理。 :将书面内容转化为引人入胜的音频,并实现无缝分发。 :专业音频、语音、声音和音乐的扩展服务。 (被 Spotify 收购):提供完全表达的 AI 生成语音,带来引人入胜的逼真表演。 :利用合成媒体生成和检测,带来无限可能。 :一键使您的内容多语言化,触及更多人群。 :生成听起来真实的 AI 声音。 :为游戏、电影和元宇宙提供 AI 语音演员。 :为内容创作者提供语音克隆服务。 :超逼真的文本转语音引擎。 :使用单一 AI 驱动的 API 进行音频转录和理解。 :听起来像真人的新声音。 :从真实人的声音创建逼真的合成语音的文本转语音技术。 :生成听起来完全像你的音频内容。 语音增强与操作: :实时语音和口音转换流媒体服务。 :为高效在线会议提供的 AI 驱动软件解决方案。 :免费的实时语音变换器。 :为创作者、开发者和虚拟会议提供的降噪产品。 :我们的软件在复杂声学环境中提升语音的清晰度和可懂度。 :我们不制作音频,我们让音频更好。 :会议和音频的降噪。 :采用最先进的 AI 技术消除视频会议通话中的所有背景噪音。 :一套 AI 驱动的音频质量增强工具。 :将智能手机变成高级语音增强设备的应用程序。 :去除干扰性背景噪音的智能手机应用程序。 :用于音频和语音产品的智能音频解决方案。 :通过引入机器学习功能来革新麦克风。 :生成式 AI 音频增强。
2025-01-20
企业标书模拟评分系统
很抱歉,目前知识库中没有关于企业标书模拟评分系统的相关内容。但一般来说,企业标书模拟评分系统通常会涉及对标书的各项指标进行量化评估,包括但不限于技术方案的可行性、项目经验、价格合理性、服务保障等方面。您可以进一步明确您关于这个系统的具体问题,以便我为您提供更有针对性的帮助。
2025-01-20
图片扩展
以下是关于图片扩展的详细介绍: 使用 SD 进行图片扩展: 1. 将图片导入到图生图界面。 2. 根据情况选择大模型,卡通类一般选“revAnimated”,真实类一般选“Realistic Vision”,效果不好可尝试其他模型。 3. 图生图中重要的参数设置: 缩放模式选择“缩放后填充空白”。 按需求增加宽度或高度来调整尺寸。 单批数量可按需填写以增加抽卡概率。 将“重绘幅度”加大到“0.8”以上。 4. ControlNet 的设置: 升级到最新版本,导入图片。 启用插件,“控制类型”选择“局部重绘”,预处理器选择“inpaint_only+lama”,控制模式选择“更倾向 ControlNet”,缩放模式选择“缩放后填充空白”。 还可增加一个 reference_only 的通道巩固扩图风格。 5. 点击生成,等待结果并选择满意的图片。 使用悠船进行图片扩展: 1. 点击进入对应的图片,常用的操作有变化、高清、重塑、扩图等。 变化:细微改变幅度小,强烈改变幅度大。 高清:“直接”表示直接出高清,“创意”表示在原图基础上进行微小优化调整。 风格变化:基于上传图片(垫图)再创作。 拓展:可上下左右扩展图片。 缩放:指镜头,如 2x 表示镜头拉远 2 倍。 局部重绘:选择区域建议大一些,太小无法修改。 2. 操作时,使用图片即垫图,使用风格即参考图片风格,使用提示词即复制图片的提示词。 在进行图片扩展时,可能不是每次效果都非常好,新生成部分和原图可能存在色差,需要通过调整各项参数来修正。记住工作流,替换图片改尺寸即可快速扩图。
2025-01-20
AI漫画怎么生成
以下为生成 AI 漫画的相关内容: 工具教程:AI 漫画 Anifusion Anifusion 是一款基于人工智能的在线工具,可帮助用户轻松创建专业质量的漫画和动漫作品,即使没有绘画技能,只需输入文本描述,AI 就能将其转化为完整的漫画页面或动漫图像。 主要功能: AI 文本生成漫画:输入描述性提示,AI 会根据文本生成相应的漫画页面或面板。 直观的布局工具:提供预设模板,也可自定义漫画布局,设计独特的面板结构。 强大的画布编辑器:在浏览器中直接优化和完善 AI 生成的艺术作品,调整角色姿势、面部细节等。 多种 AI 模型支持:高级用户可访问多种 LoRA 模型,实现不同的艺术风格和效果。 商业使用权:用户对在平台上创作的所有作品拥有完整的商业使用权,可自由用于商业目的。 使用案例: 独立漫画创作:有抱负的漫画艺术家无需高级绘画技能即可将他们的故事变为现实。 快速原型设计:专业艺术家可以在详细插图之前快速可视化故事概念和布局。 教育内容:教师和教育工作者可以为课程和演示创建引人入胜的视觉内容。 营销材料:企业可以制作动漫风格的促销漫画或用于活动的分镜脚本。 粉丝艺术和同人志:粉丝可以基于他们最喜欢的动漫和漫画系列创作衍生作品。 优点: 非艺术家也可轻松进行漫画创作。 基于浏览器的全方位解决方案,无需安装额外软件。 快速迭代和原型设计能力。 创作的全部商业权利。 缺点: 对特定艺术细节的控制有限。 AI 生成的艺术作品可能缺乏独特性。 需要订阅才能使用高级功能。 可能无法完全替代专业级工作的熟练人类艺术家。 定价: Anifusion 提供免费和高级订阅选项: 免费层级:提供 50 个免费信用点和一个工作空间,适合初学者体验。 高级层级:每月 20 欧元,包含 10,000 个信用点、无限工作空间、无限漫画生成、多种 LoRA 模型支持,以及新功能的早期访问权限。 使用方法: 1. 注册账户:访问 anifusion.ai 并创建一个免费账户以开始使用。 2. 选择布局:从预设计的漫画预设中选择,或使用 Anifusion 的直观布局工具创建您自己的独特布局。 3. 描述页面内容:使用简单的文本提示来描述您漫画中每个页面或面板的内容。 4. 生成 AI 艺术:让 AI 根据您的文本描述生成动漫风格的艺术作品。 5. 优化结果:使用 Anifusion 强大的画布编辑器根据需要优化和调整 AI 生成的艺术作品。 6. 添加文本和效果:添加对话气泡、字幕和视觉效果以完成您的漫画页面。 7. 导出和分享:导出您完成的漫画并与世界分享。您对您的创作拥有完全的商业权利。 工具教程:即梦 2.1 提示词:皮克斯风格,三宫格漫画:一只小狗,坐在办公桌前,文字“KPI 达标了吗?”。一只小狗,拿着一个写满计划的大本子,微微皱着眉头,文字“OKR 写好了吗?”。一只小狗坐在电脑前,文字“PPT 做好了吗?”。 实操教程: 1. 打开即梦 AI:https://jimeng.jianying.com/aitool/home 2. 点击 AI 作图中的图片生成。 3. 填写绘图提示词,选择生图模型 2.1,点击立刻生成。 总而言之,Anifusion 和即梦 2.1 为漫画和动漫爱好者、创作者以及故事讲述者提供了极具潜力的创作平台,有望在未来的漫画和动漫行业中发挥重要作用。
2025-01-20
ai数字人怎么生成
生成 AI 数字人主要有以下步骤: 1. 在剪映中生成数字人: 打开剪映右侧窗口顶部的“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。 软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,软件会生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,可点击预览查看效果。 2. 增加背景图片: 删除先前导入的文本内容,因为视频音频已包含文字。 点击左上角“媒体”菜单并“导入”,选择本地图片上传,如一张书架图片,点击图片右下角加号添加到视频轨道(会覆盖数字人)。 拖动轨道最右侧竖线使图片与视频对齐,选中轨道,拖动图片角放大到合适尺寸,并将数字人拖动到合适位置。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段形成字幕。 4. 算法驱动的数字人实现流程: 核心算法包括 ASR(语音识别),能将用户音频数据转化为文字,便于数字人理解和生成回应。 AI Agent(人工智能体)充当数字人大脑,可接入大语言模型,拥有记忆模块等使其更真实。 TTS(文字转语音)将数字人依靠 LLM 生成的文字输出转换为语音。 完成上述步骤后,点击右上角“导出”按钮导出视频备用。若希望数字人换脸,则需使用其他工具。
2025-01-20
ai
以下是关于 AI 的相关信息: 1. AI 春晚: 是由 WaytoAGI 社区组织的一场由 AI 技术驱动的春节晚会,由 300 多位 AI 爱好者共同创作。 运用了多种先进技术,包括数字人 AI 生图文声视频、图声视频、AI 转会、Al 音乐模型训练等。 作品时长约 150 分钟,涵盖多种类型节目。 于 24 年大年初一直播,18 万人在线观看,后续视频播放量超 200 万,媒体曝光量超 500 万,被誉为 AI 视频寺庙时代的现象级作品。 完整版:https://www.bilibili.com/video/BV15v421k7PY/?spm_id_from=333.999.0.0 相关进度: 2. AI 绘画: 定义与发展:利用人工智能技术,通过算法和模型让计算机生成具有一定艺术效果的图像。早期成果简单粗糙,随着技术进步,尤其是深度学习算法的应用,如卷积神经网络等,能够生成更复杂、逼真和富有创意的图像,涵盖各种风格和题材,在与人类艺术家的互动和融合中不断创新,为艺术创作带来新的可能性和挑战。 场景应用:广告设计(可快速生成各种创意概念图,为广告策划提供灵感和初稿)、游戏开发(用于创建游戏场景、角色形象等,提高开发效率)、影视制作(辅助生成特效场景、概念设计等)、建筑设计(帮助设计师构想建筑外观和内部布局)。 体验:AI 绘画助手: BotID:7387390303403671587 3. 新手学习 AI:学习人工智能是一个既刺激又富有挑战的旅程,有一份详细的学习路径指南,可帮助从基础概念到实际应用,逐步建立起 AI 知识体系。
2025-01-20
如何生成一个c4d风格的抽象模型
以下是生成一个 C4D 风格抽象模型的步骤: 1. 字体设计: 在 Adobe Illustrator 中,先用钢笔工具勾出字体形状,然后加粗扩展外观,删掉多余的线或者直接填充白色摆放好正确的图层样式。 2. 到 SD 里做效果: 模型:revanimatedv122 Control Weight:0.85 1,低一点的话形状会稍微随意点。 Control 预处理器:lineart_standard,模型:control_v11p_sd15_lineart Lora: Wool felt v1.0 https://civitai.com/models/113321 felt_v1.0 羊毛毡质感 https://www.liblibai.com/modelinfo/5d37951d90684318b4c596eb4a2ecacf 关键词:felt style, cute, wool material, made yarn, Light and clean background, C4D style, 3D rendering, <lora:symaozhan:0.4>, rich color palette Negative prompt: lowres, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, blurry, black (可以替换另一个 lora 和颜色得到不一样的结果)
2025-01-20
声音转文字工具
以下是为您推荐的一些声音转文字工具: 1. 飞书妙记(https://www.feishu.cn/product/minutes):飞书的办公套件之一。 2. 通义听悟(https://tingwu.aliyun.com/home):阿里推出的 AI 会议转录工具。 3. 讯飞听见(https://www.iflyrec.com/):讯飞旗下智慧办公服务平台。 4. Otter AI(https://otter.ai/):转录采访和会议纪要。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。 此外,在某些场景中还会使用到 GVoice 提供的语音录制和识别能力,中文识别率优秀。听写字幕、翻译配音工具 memo.ac 以及通义听悟也可用于声音转文字。 内容由 AI 大模型生成,请仔细甄别。
2025-01-20