直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
开源数字人
以下是关于开源数字人的相关信息: 组合方案: 1. 先剪出音频,使用 https://elevenlabs.io/speechsynthesis 或使用 GPTsovits克隆声音,做出文案的音频。 2. 使用 wav2lip 整合包,导入视频和音频,对口型得到视频。基础 wav2lip+高清修复整合包下载地址:https://github.com/Rudrabha/Wav2Lip 。 构建高质量的 AI 数字人: 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前。笔者的开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。 相关产品:https://synclabs.so/
2024-12-26
学习这些知识的方法
以下是关于学习 AI 相关知识的方法: 对于大语言模型(LLM)知识的学习路径: 首先,学习大语言模型入门者的课程,这是基础。 接着,进一步学习面向开发者的课程,以应用于实际项目。 系统学习 LLM 开发: 掌握深度学习和自然语言处理基础,包括机器学习、深度学习、神经网络等基础理论,以及自然语言处理基础,如词向量、序列模型、注意力机制等。相关课程有吴恩达的深度学习课程、斯坦福 cs224n 等。 理解 Transformer 和 BERT 等模型原理,包括 Transformer 模型架构及自注意力机制原理,以及 BERT 的预训练和微调方法。掌握相关论文,如 Attention is All You Need、BERT 论文等。 学习 LLM 模型训练和微调,包括大规模文本语料预处理,使用 LLM 预训练框架,如 PyTorch、TensorFlow 等,以及微调 LLM 模型进行特定任务迁移。相关资源有 HuggingFace 课程、论文及开源仓库等。 进行 LLM 模型优化和部署,包括模型压缩、蒸馏、并行等优化技术,模型评估和可解释性,以及模型服务化、在线推理、多语言支持等。相关资源有 ONNX、TVM、BentoML 等开源工具。 进行 LLM 工程实践和案例学习,结合行业场景进行个性化的 LLM 训练,分析和优化具体 LLM 工程案例,研究 LLM 新模型、新方法的最新进展。 持续跟踪前沿发展动态,关注顶会最新论文、技术博客等资源。 对于低年级小学生的 Genie 模型科普: Genie 模型通过“观看视频”的方法学习,就像小朋友通过看、听、读书和练习来学习新知识。它观看了大量互联网视频,从而学会很多事情。 Genie 模型运用“深度学习”技术让自己更聪明,通过分析学习到的视频内容找出规律和联系,然后根据提示创造全新的虚拟世界。 Genie 模型里有“模型参数”,就像玩具机器人的调节按钮,这些参数能调节模型做不同的事情。 Genie 模型在学习时无需人们告知每个动作的名称,而是通过不断尝试和练习来学习。
2024-12-26
初学编程,用什么AI辅助编程和学习比较好?
对于初学编程者,以下是一些较好的 AI 辅助编程和学习的工具及建议: 1. 可以借助流行的语言和框架(如 React、Next.js、TailwindCSS)来学习编程。 2. 先运行代码再进行优化,采用小步迭代的方式,一次解决一个小功能。 3. 借助 AI 生成代码后请求注释或解释,以帮助理解代码。 4. 遇到问题时按照复现、精确描述、回滚这三步来解决。 5. Cursor 是一款目前较好用的 AI 编程工具,它具有以下特点: 集成了强大的 AI 辅助编码功能,可帮助开发者更快速、高效地编写代码。 提供智能的代码自动补全建议,加快编码速度。 能够实时代码分析,提供改进建议和错误检测。 支持多种编程语言,适用于不同类型的项目开发。 内置终端,方便执行命令和管理项目。 内置 Git 支持,便于版本控制和协作开发。 提供多种自定义主题选择,可根据个人喜好定制界面。 跨平台,支持 Windows、macOS 和 Linux 等多个操作系统。 针对大型项目进行了性能优化,在处理大量代码时仍能保持流畅。 支持多人实时协作编辑,便于团队开发。 您可以通过 https://www.cursor.com/ 链接进入 Cursor 产品主页,在右上角点击下载,下载后解压安装即可使用。
2024-12-26
喜欢的AI产品,亮点以及原因
以下是为您推荐的一些 AI 产品及其亮点和原因: PPT 类产品: 爱设计 PPT(国内): 亮点:背后有实力强大的团队,技术过硬且对市场需求有敏锐洞察力;成功把握 AI 与 PPT 结合的市场机遇;在国内 AI 生成 PPT 产品中确立了市场领先地位。 原因:能够大大提高 PPT 制作效率,保证高质量输出,代表了当前国内 AI 辅助 PPT 制作的最高水平,并在不断进步。 健身类产品: Keep:中国最大的健身平台,为用户提供全面的健身解决方案,以帮助用户实现其健身目标。 Fiture:由核心 AI 技术打造,集硬件、丰富课程内容、明星教练和社区于一体。 Fitness AI:利用人工智能进行锻炼,增强力量和速度。 Planfit:健身房家庭训练与 AI 健身计划,AI 教练是专门针对健身的生成式人工智能,使用 800 多万条文本数据和 ChatGPT 实时提供指导。 其他类产品: 平安好医生 APP:AI 医疗诊断辅助系统,辅助医生进行疾病诊断,提高诊断准确性。 腾讯会议:AI 会议记录生成工具,自动生成会议记录,方便回顾和整理。 字体管家 APP:AI 书法字体生成器,生成各种风格的书法字体。 醒图 APP:AI 摄影构图建议工具,为摄影爱好者提供构图建议,提升照片质量。
2024-12-26
最喜欢的AI产品,阐述亮点和原因
以下为一些受欢迎的 AI 产品及其亮点和原因: 爱设计 PPT: 亮点:背后有实力强大的团队,技术过硬且对市场需求有敏锐洞察力;成功把握 AI 与 PPT 结合的市场机遇;在国内 AI 生成 PPT 产品中确立市场领先地位。 原因:团队的持续创新推动产品进步,前瞻性的市场洞察和快速执行能力使其成功,产品的优秀品质和用户的高度认可证明其价值。对于经常制作 PPT 的人,能提高效率并保证高质量输出,随着 AI 技术进步,未来有望带来更多惊喜功能和性能提升。 Grammarly、秘塔写作猫: 亮点:利用自然语言处理技术辅助用户进行高质量写作。 原因:Grammarly 可检查语法、拼写错误并提供改进建议,秘塔写作猫能进行智能润色和内容创作辅助。 淘宝拍照搜商品: 亮点:通过图像识别为用户推荐相似商品。 原因:在 AI 技术支持下,用户上传图片后系统能快速推荐类似商品。 小爱同学、Siri: 亮点:为不同需求定制专属语音助手。 原因:小爱同学可控制智能家居、回答问题等,Siri 能进行语音交互和任务处理。 Keep 智能训练计划: 亮点:根据用户数据制定个性化健身方案。 原因:结合用户身体状况和目标生成专属健身方案。 大众点评智能推荐: 亮点:基于用户口味偏好推荐美食。 原因:通过用户评价和偏好数据为用户推荐餐厅和美食。 阿里小蜜等电商客服: 亮点:为企业提供智能客服解决方案。 原因:可自动回答客户问题,处理订单查询等任务。 AI 游戏道具推荐系统: 亮点:根据玩家需求推荐游戏道具。 原因:利用 AI 分析玩家的游戏风格和进度,提供合适道具推荐。 AI 天气预报分时服务: 亮点:提供精准的分时天气预报。 原因:利用 AI 提供每小时的天气预报,方便用户安排出行和活动。 AI 医疗病历分析平台: 亮点:分析医疗病历,辅助诊断。 原因:利用 AI 分析病历中的症状、检查结果等信息,为医生提供辅助诊断建议。 AI 会议发言总结工具: 亮点:自动总结会议发言内容。 原因:在会议中利用 AI 自动总结发言者的主要观点和重点内容,方便回顾和整理。 AI 书法作品临摹辅助工具: 亮点:帮助书法爱好者进行临摹。 原因:利用 AI 识别书法作品的笔画和结构,为用户提供临摹指导和评价。
2024-12-26
最喜欢的AI产品,阐述亮点和原因
以下为一些受欢迎的 AI 产品及其亮点和原因: 爱设计 PPT: 亮点:背后有实力强大的团队,技术过硬且对市场需求洞察力敏锐;成功把握 AI 与 PPT 结合的市场机遇;在国内 AI 生成 PPT 产品中确立市场领先地位。 原因:团队的持续创新推动产品进步,前瞻性的市场洞察和快速执行能力使其成功,产品的优秀品质和用户的高度认可证明其价值。对于经常制作 PPT 的人,能提高效率并保证高质量输出,随着 AI 技术进步,未来有望带来更多惊喜。 Grammarly、秘塔写作猫: 亮点:利用自然语言处理技术辅助用户进行高质量写作。 原因:Grammarly 可检查语法、拼写错误并提供改进建议,秘塔写作猫能进行智能润色和内容创作辅助,满足用户对优质写作的需求。 淘宝拍照搜商品: 亮点:通过图像识别为用户推荐相似商品。 原因:在电商领域,方便用户快速找到心仪的商品,提升购物体验。 小爱同学、Siri: 亮点:为不同需求定制专属语音助手。 原因:能实现语音交互和任务处理,如控制智能家居、回答问题等,满足多样化的生活需求。 Keep 智能训练计划: 亮点:根据用户数据制定个性化健身方案。 原因:结合用户身体状况和目标生成专属健身计划,帮助用户科学健身。 大众点评智能推荐: 亮点:基于用户口味偏好推荐美食。 原因:通过用户评价和偏好数据为用户推荐餐厅和美食,方便用户选择。 阿里小蜜等电商客服: 亮点:为企业提供智能客服解决方案。 原因:可自动回答客户问题,处理订单查询等任务,提高客服效率。 AI 游戏道具推荐系统: 亮点:根据玩家需求推荐游戏道具。 原因:在游戏中分析玩家风格和进度,提供合适道具,增强游戏体验。 AI 天气预报分时服务: 亮点:提供精准的分时天气预报。 原因:利用 AI 提供每小时的天气预报,方便用户安排出行和活动。 AI 医疗病历分析平台: 亮点:分析医疗病历,辅助诊断。 原因:利用 AI 分析病历中的症状、检查结果等信息,为医生提供辅助诊断建议。 AI 会议发言总结工具: 亮点:自动总结会议发言内容。 原因:在会议中利用 AI 自动总结发言者的主要观点和重点内容,方便回顾和整理。 AI 书法作品临摹辅助工具: 亮点:帮助书法爱好者进行临摹。 原因:利用 AI 识别书法作品的笔画和结构,为用户提供临摹指导和评价。
2024-12-26
最喜欢的的AI产品,产品亮点和原因
以下是为您推荐的一些 AI 产品: PPT 类: 爱设计 PPT(国内): 产品亮点:背后有实力强大的团队,技术过硬且对市场需求有敏锐洞察力;成功把握 AI 与 PPT 结合的市场机遇;在国内 AI 生成 PPT 产品中确立了市场领先地位。 推荐原因:代表了当前国内 AI 辅助 PPT 制作的最高水平,能大大提高制作效率并保证高质量输出,且会不断进步带来更多惊喜功能和性能提升。 健身类: Keep(中国最大的健身平台):为用户提供全面的健身解决方案,以帮助用户实现其健身目标。(https://keep.com/) Fiture(沸彻魔镜):由核心 AI 技术打造,集硬件、丰富课程内容、明星教练和社区于一体。(https://www.fiture.com/) Fitness AI:利用人工智能进行锻炼,增强力量和速度。(https://www.fitnessai.com/) Planfit:健身房家庭训练与 AI 健身计划,AI 教练是专门针对健身的生成式人工智能,使用 800 多万条文本数据和 ChatGPT 实时提供指导。(https://planfit.ai/) 其他类: AI 菜谱口味调整工具(下厨房口味调整功能):根据用户反馈调整菜谱口味。 AI 语言学习纠错平台(英语流利说纠错功能):帮助语言学习者纠正错误。 AI 电影剧情分析系统(豆瓣电影剧情分析工具):分析电影剧情,提供深度解读。 AI 办公文件分类系统(腾讯文档分类功能):自动分类办公文件,方便管理。 AI 美容护肤方案定制平台(美丽修行定制方案功能):根据用户肤质定制护肤方案。
2024-12-26
绘画提示词中的“P”是什么意思?
在绘画提示词中,“P”通常不是一个具有特定普遍含义的独立符号或缩写。但“POV”是“Point of View”的缩写,意为“视角”。在美术创作中,尤其是绘画和摄影领域,视角指的是观察者或摄像机所在的位置和角度。选择不同的视角可以极大地影响作品的视觉效果和观众对作品的感受。 视角在绘画中的作用包括: 1. 视觉引导:可以用来引导观众的视线,通过选择特定的角度,艺术家可以强调作品中的某些元素,使它们更加突出。 2. 情感表达:不同的视角可以传达不同的情感和氛围。例如,从高处看的视角可能会让物体显得更小、更脆弱,而从低处看的视角可能会让物体显得更强大、更有威严。 3. 空间感:通过精确的透视技巧,视角可以帮助艺术家在二维平面上创造出深度和空间感,使画面更加立体和真实。 4. 故事叙述:视角可以用来讲述故事,通过选择与故事内容相匹配的视角,艺术家可以增强叙事的力度和清晰度。 在创作提示词时,有一些技巧: 1. 透视:了解和运用透视原理是掌握不同视角的关键。透视可以创造出深度感和空间感,使画面更加逼真。 2. 构图:选择合适的视角可以帮助艺术家更好地构图,通过角度和视点的选择来平衡画面,创造出和谐的画面效果。 3. 光影:不同的视角会影响光线的方向和强度,艺术家需要根据所选的视角来调整光影效果,以增强画面的真实感和表现力。 在提示词的语法方面,根据自己想画的内容写出提示词,多个提示词之间使用英文半角符号。一般而言,概念性的、大范围的、风格化的关键词写在前面,叙述画面内容的关键词其次,最后是描述细节的关键词。提示词的顺序很重要,越靠后的权重越低。关键词最好具有特异性,措辞越不抽象越好,尽可能避免留下解释空间的措辞。还可以使用括号人工修改提示词的权重。
2024-12-26
提示词编写技巧
以下是关于提示词编写技巧及如何学习提示词运用的相关内容: 编写提示词的技巧: 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:用简单、清晰的语言描述,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,在提示词中明确指出。 5. 使用示例:如有特定期望结果,提供示例帮助理解需求。 6. 保持简洁:简洁明了,避免过多信息导致模型困惑。 7. 使用关键词和标签:有助于模型理解任务主题和类型。 8. 测试和调整:生成文本后检查结果,根据需要调整提示词。 在 SD3 中的提示词相关内容: 提示词长度:可以传递非常长且描述性的提示,不再受限于 CLIP 文本编码器的 77 个 token 限制,可长达 10,000 个字符或超过 1,500 个单词。 不要使用负面提示:SD3 未针对负面提示词训练,使用可能引入随机变化,使图像结果不稳定。 提示词的技巧:可以使用更长的提示短语,用逗号分割关键词,详细明确描述具体东西有助于理解。 学习提示词运用的建议: 1. 理解提示词的作用:向模型提供上下文和指示,影响模型输出质量。 2. 学习构建技巧:明确任务目标,用简洁准确语言描述,给予背景信息和示例,使用清晰指令,明确特殊要求。 3. 参考优秀案例:在领域社区、Github 等资源中研究学习。 4. 实践、迭代、优化:多与语言模型互动,根据输出提高提示词质量,尝试变体并比较分析。 5. 活用提示工程工具:如 Anthropic 的 Constitutional AI 等。 6. 跟上前沿研究:持续关注最新研究成果和方法论。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-25
如何学习AI
以下是新手学习 AI 的方法: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-12-25