Navigate to WaytoAGI Wiki →
Home/All Questions
老照片修复
以下是关于用 AI 给老照片上色的详细步骤和方法: 1. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。 2. 在 PS 里进行角度调整和照片裁切。 3. 对于人物照片还原,选择 realisian 的写实大模型,提示词直接描述颜色和对应内容。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 4. 将照片放入后期处理,使用 GFPGAN 算法使人脸变清晰。 5. 把图片发送到图生图中,打开 stableSR 脚本放大两倍。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 6. 对于复杂的照片,如人物多、场景复杂、像素低的,可放弃人物服装颜色指定,只给场景方向,让 AI 自行决定颜色。还可加入第二个 controlnet 来控制颜色,使用 t2ia_color 的模型,给出简单的关键词,如蓝天、绿树、灰石砖。 相关文章参考: 1. 【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿:http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487422&idx=1&sn=9cdf7ef37c2acb3c0fc3328d0ba8af74&chksm=c251597af526d06c921ea6728cb2a32bdf1d5f699e19d6ba13b849994e4d01af8a5144132aad&scene=21wechat_redirect 2. 【Stable Diffusion】超清无损放大器 StableSR:http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487403&idx=1&sn=cbb96534fa6f58c37cf9fc64bc7ade0c&chksm=c251596ff526d0792b4bba0e21b69427b23e780824bdc75b22f1073e8bad6f61f30199fc8344&scene=21wechat_redirect
2024-12-04
AI集合工具
以下是一些 AI 集合工具: 对于产品经理: 用户研究、反馈分析:Kraftful(kraftful.com) 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 画原型:Uizard(uizard.io/autodesigner/) 项目管理:Taskade(taskade.com) 写邮件:Hypertype(hypertype.co) 会议信息:AskFred(fireflies.ai/apps) 团队知识库:Sense(senseapp.ai) 需求文档:WriteMyPRD(writemyprd.com) 敏捷开发助理:Standuply(standuply.com) 数据决策:Ellie AI(ellie.ai) 企业自动化:Moveworks(moveworks.com) 与思维导图相关的 AI 工具: GitMind:免费跨平台,支持多种模式,可自动生成思维导图。 ProcessOn:国内思维导图+AIGC 工具,可利用 AI 生成。 AmyMind:轻量级在线,无需注册登录,支持自动生成节点。 Xmind Copilot:基于 GPT 的助手,可一键拓展思路、生成文章大纲。 TreeMind:输入需求由 AI 自动完成生成。 EdrawMind:提供包括 AI 驱动的头脑风暴等功能,提升生产力。 能够帮助建筑设计师审核规划平面图的 AI 工具: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载建筑大模型。 Maket.ai:面向住宅行业,可自动生成户型图。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,能引入标准和规范约束设计结果。 Fast AI 人工智能审图平台:形成全自动智能审图流程,实现数据汇总与管理。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-04
用AI做PPT的工具
以下是一些用 AI 做 PPT 的工具: 1. Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,适用于多种场合,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 此外,在教学中帮助学生做好组会准备时,Claude + Gamma.app 这两个工具组合效果不错。Claude 能帮助快速寻找符合条件的论文、提取精炼论文中某部分信息,还能找到适合的 PPT 制作工具并教会使用。
2024-12-04
最新的开源的关于大语言模型的书有哪些?
以下是一些最新的开源的关于大语言模型的书籍和资源: 《LLM 开源中文大语言模型及数据集集合》: Awesome Totally Open Chatgpt: 地址: 简介:This repo record a list of totally open alternatives to ChatGPT. AwesomeLLM: 地址: 简介:This repo is a curated list of papers about large language models, especially relating to ChatGPT. It also contains frameworks for LLM training, tools to deploy LLM, courses and tutorials about LLM and all publicly available LLM checkpoints and APIs. DecryptPrompt: 地址: 简介:总结了 Prompt&LLM 论文,开源数据&模型,AIGC 应用。 Awesome Pretrained Chinese NLP Models: 地址: 简介:收集了目前网上公开的一些高质量中文预训练模型。 《AIGC Weekly 19》:包含了多篇相关文章,如腾讯的开源图像模型 Stable Diffusion 入门手册、马丁的关于 AIGC 的碎片化思考、多邻国创始人 Luis von Ahn 专访、Meta AI 发布的自监督学习 CookBook 等。 《进阶:a16z 推荐进阶经典》: 《GPT4 technical report》(2023 年):来自 OpenAI 的最新和最伟大的论文。 《LLaMA:Open and efficient foundation language models》(2023 年):来自 Meta 的模型。 《Alpaca:A strong,replicable instructionfollowing model》(2023 年):来自斯坦福大学的模型。
2024-12-03
如何输入文字生成视频和配音
目前有以下两种输入文字生成视频和配音的方式: 1. Meta Movie Gen 模型: 由视频生成和音频生成两个模型组成。 Movie Gen Video 是 30B 参数的 Transformer 模型,能从单个文本提示生成 16 秒、16 帧每秒的高清视频。 对于精确视频编辑,可执行添加、删除或替换元素等全局修改,在保持角色身份一致性和运动自然性方面性能出色。 Movie Gen Video 通过预训练微调范式完成,沿用了 Llama3 的许多设计,预训练阶段在海量视频和图像文本数据集上联合训练,微调阶段进行有监督微调,并引入流匹配作为训练目标。 Movie Gen Audio 是 13B 参数的 Transformer 模型,可接受视频输入及可选文本提示生成与视频同步的高保真音频。 2. PixVerse V3 模型: Lipsync 功能可以为视频配音配口型,生成视频最长可达 30 秒,目前只支持对 PixVerse 生成的视频进行口型适配。 支持多种语言,多样化音频适配,包括演讲、音乐、歌剧等。 使用时,先上传带有人脸的图片,写好提示词生成视频,然后点击生成的视频,在下方找到“Lipsync”,输入文案,从预设声音中选择合适的声音或上传音频,最后点击“create”生成视频。生成视频的长度取决于文案或音频的长度,最长为 30 秒。
2024-12-03
Ai教材
以下是为您推荐的与 AI 相关的教材和学习资料: 1. 神经科学方面: 《认知神经学科:关于心智的生物学》(作者:Michael S.Gazzaniga; Richard B.Lvry; George R.Mangun):世界权威的认知神经科学教材,涵盖认知神经科学的诸多方面,包括发展历史、细胞机制与认知、神经解剖与发展等。 《神经科学原理》(作者:Eric R.Kandel; James H.Schwartz):能让您系统了解神经元的细胞和分子生物学、突触传递、认知的神经基础等内容。 《神经生物学:从神经元到脑》(作者:John G.Nicholls 等著):神经生物学领域的世界级名著,涵盖神经科学的各个方面,介绍了其基本概念、功能及细胞和分子机制。 2. 学习路径方面:如果您是新手,学习人工智能(AI)可以遵循一份详细的学习路径指南,从基础概念到实际应用,逐步建立起 AI 知识体系。 3. 综合知识方面:在 AI 时代,您需要像博物学家一样,了解各个领域的知识,并在恰当的时候调用它们。例如心理学、人工智能、经济学、社会学、生态学、哲学、设计学等 13 个学科。相关书单权威、准确,有框架、成体系且好读,适合初学者。
2024-12-03
我想创作一个AI agent 在扣子平台,请问学习路径是什么
以下是在扣子平台创作 AI agent 的学习路径: 1. 先吃透 prompt 相关内容,因为提示词在智能体中很关键。 2. 了解智能体是由大语言模型衍生而来,扣子属于智能体范畴且更偏 ToC 应用。 3. 学习 Agent 工程(基础版)的迭代范式: 梳理工作流程 SOP,并拆解成多个单一「任务」和多个「任务执行流程」。 自动化每一个「任务」,形成一系列的小工具,让机器能完成每一个单一任务。 串联工具,基于 agent 框架让 bot 来规划「任务执行流程」。 不停迭代优化「任务」工具和「任务执行流程」规划,造就能应对实际场景的 Agent。 4. 参考数字员工“进化论”,在对 AI 能力基础上作出固化流程或让 AI 自主思考的妥协和平衡。 同时,您还可以参考以下具体内容: 扣子(Coze)是字节跳动旗下的新一代一站式 AI Bot 开发平台,无论是否具备编程基础,都能在该平台上迅速构建基于 AI 模型的各类问答 Bot,开发完成后可发布到各种社交平台和通讯软件上。 可以通过简单 3 步创建智能体,即起一个智能体的名称,写一段智能体的简单介绍,使用 AI 创建一个头像。
2024-12-03
寻找一个会撰写企业年终总结的AI工具
以下是一些可以帮助撰写企业年终总结的 AI 工具: 1. Kickresume 的 AI 写作器:使用 OpenAI 的 GPT4 语言模型,能为总结的各个部分编写内容,并保持一致语调。 2. Rezi:受到众多用户信任的领先 AI 构建平台,可自动化创建总结的每个方面。 更多相关工具,您还可以查看以下链接获取更多信息:https://www.waytoagi.com/category/79 。 以上内容由 AI 大模型生成,请仔细甄别。
2024-12-03
当前AI绘图的前沿图景
当前 AI 绘图的前沿图景包括以下几个方面: 定义与发展: AI 绘画是利用人工智能技术,通过算法和模型让计算机生成具有一定艺术效果的图像。早期成果较为简单粗糙,随着技术进步,尤其是深度学习算法如卷积神经网络的应用,能生成更复杂、逼真和富有创意的图像,涵盖各种风格和题材,并在与人类艺术家的互动融合中不断创新,为艺术创作带来新的可能和挑战。 场景应用: 1. 广告设计:可快速生成各种创意概念图,为广告策划提供灵感和初稿。 2. 游戏开发:用于创建游戏场景、角色形象等,提高开发效率。 3. 影视制作:辅助生成特效场景、概念设计等。 4. 建筑设计:帮助设计师构想建筑外观和内部布局。 艺术与科技的融合: 艺术与科技的融合呈现出前所未有的奇妙景象,AI 绘画作为杰出代表,将二者完美结合,开启探索之旅,引领艺术界走向未来。艺术创作通常依赖手工技艺和个人感悟,而人工智能技术的发展使艺术创作经历革命性变革,AI 绘画利用机器学习和深度学习等技术,能模拟创作过程并生成令人惊叹的作品,为艺术家提供新工具,为观众带来新体验,也打破了传统创作的局限,为缺乏绘画技巧的人提供参与机会,使艺术更具民主化和包容性。 商业实战案例: 如 Midjourney 在概念篇中生成令人惊叹的宇宙星空、未来主题等超现实主义的图片,包括宇宙飞船、星系、行星、太空等元素,呈现出高度详细、动态、富有表现力的效果,具有逼真的灯光和阴影,应用于未来太空科技风格等领域,带来震撼的视觉体验。 您可以通过以下链接体验 AI 绘画助手: BotID:7387390303403671587
2024-12-03
AI辅助搜索
以下是关于 AI 辅助搜索的相关内容: 存在能联网检索的 AI,它们通过连接互联网,实时搜索、筛选并整合所需数据,为用户提供更精准和个性化的信息。例如,ChatGPT Plus 用户可开启 web browsing 功能实现联网,Perplexity 结合了 ChatGPT 式的问答和普通搜索引擎的功能,Bing Copilot 旨在简化在线查询和浏览活动,还有 You.com 和 Neeva AI 等搜索引擎,提供基于人工智能的定制搜索体验并保护用户数据私密性。这些 AI 搜索工具的出现标志着信息检索领域的重要发展,大幅提升了数据集命中预期,为实际应用带来更多可能性。 从调研数据看,通过自然语言对话,单次或几次互动就可完成一次性任务是目前最常用 AI 工具处理的工作任务类型。90%的产品从业者使用 AI 工具辅助文本信息处理生成,63%的用户在工作中使用 AI 工具辅助搜索,甚至优先用 AI 搜索信息。45%的用户借助 AI 生成图片以及音视频用于快速制作 demo 演示效果,29%的用户将 AI 作为工作创意助手以及数据报告的处理。但 AI 工具在协助处理工作任务方面有可改进之处,如提高创新性和创新辅助能力,提升个性化和智能化程度,对合适场景进行更精准识别。 如果提封闭性问题,孩子用 AI 搜索迅速得到答案结束任务,AI 看起来是好奇心的毒药;但改成开放性问题或让 AI 帮助提更多拓展思考的问题,好奇心会被激发。AI 辅助写作文同理,可让孩子提交与 AI 共同完成作文的聊天记录,以孩子能否说清 AI 作文的优缺点及如何改作为评价关注点。 以上内容由 AI 大模型生成,请仔细甄别。
2024-12-03