直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
ai抠图
以下是关于 AI 抠图的相关内容: 在制作游戏 PV《追光者》时,可以直接抠图,也可以安装 PS 里的进行操作。将图片上传即可抠图,可用于制作一些素材,如叶子飘落、战斗时石头等素材,以辅助做一些氛围动画。 若要进行简单的抠图,可以使用 Iphone 手机自带的抠图功能、美图秀秀或者在网上找一些网站,如 https://www.remove.bg/zh ,直接上传图片即可。 目前还没有特别好的图片融合软件,可使用 PS 把图片合在一起,并通过简单的 P 图叠加技巧,最后换一个纯色背景。
2024-11-06
现在国内语言生成式AI有多少个在做的,比如说百度的文心一言和阿里的通义
目前国内在做语言生成式 AI 的有不少,例如百度的文心一言、阿里的通义千问、讯飞的讯飞星火、智谱华章的智谱清言、字节跳动的豆包、腾讯的元宝、昆仑万维的天工 AI 等。 此外,还有一些在特定时间上线的大模型,如 8 月正式上线的包括北京的百度(文心一言)、抖音(云雀大模型)、智谱 AI(GLM 大模型)、中科院(紫东太初大模型)、百川智能(百川大模型),上海的商汤(日日新大模型)、MiniMax(ABAB 大模型)、上海人工智能实验室(书生通用大模型)。 需要注意的是,不同的大模型具有各自的特点和功能,在使用和应用场景上可能存在差异。
2024-11-06
算力怎么提高
提高算力的方法主要有以下几种: 1. 技术创新: 继续在硅基上发展,如采用 3D 堆叠形态,但需要解决更好的散热问题。 材料创新,包括硅基掺杂、石墨烯片等。 探索计算原理的创新,如量子计算,不过目前距离商用还有不少理论和技术需要突破。 2. 提升传输速度:高速网络会进一步进化,片间链接、片上内存等技术都会有明显的进展。 3. 解决能耗和散热问题:高温超导技术是这方面的关键。 4. 白嫖算力的思路: 利用 Groq 平台提供的个人免费 APIKEY 接口,不同模型有相应限制。以 llama370b 为例,每分钟 30 次 request,每分钟 6000 tokens,每天 14400 次。 将 API 调用接入各种平台提供方,无需购买和部署云服务器。 考虑通过代理的方式解决国内 IP 访问限制,如 Cloudflare 或 Deno Deploy 等。 5. 从模型变强的要素来看: 算力方面,根据预估,到 2027 年底很可能会再增加 2 个 OOM,甚至在微软和 OpenAI 的超算合作下,接近 3 个多 OOM 也是有可能的。 算法效率方面,通过对架构的优化,到 2027 年能提升 1 2 OOM。 额外的潜力方面,通过强化反馈学习 RLHF、思考链 CoT、工具和 Scaffolding 等方法微调来提升模型能力。
2024-11-06
ai音乐的出现,如何靠这个赚钱
以下是关于靠 AI 音乐赚钱的一些方法和相关信息: Suno 和 Udio 推出了上传音频文件生成音乐的功能,这一功能具有精确的控制力。有了前置旋律,可以精确控制每首歌的速度(Tempo),无需再背绕口的速度词,能精确控制想要的 BPM;控制旋律(Melody),自己制作简单旋律让 AI 补全并贯穿整首歌,还能实现一谱变速,节省大量 Roll 旋律的时间;控制配器(Instrumentation),按想法选择乐器,也可选择特殊音色;控制合成(synthesizer),对相同 BPM 和调性的音乐进行拆分组合尝试新效果。 节省了上传音频的点数消耗后,每月的点数可以这样使用:用提示词多 Roll 一些和流派、心情、场景相关的曲子,减少限制让 AI 音乐发挥更多创造力,把好旋律存起来作为制作素材;用于 roll 更多细节调整,如让某段曲子升调,提升作品品质。 LAIVE 是利用 AI 技术一次性生成音乐、歌词、主唱等的创作平台,使用者可选择喜欢的类型和情调,上传参考音源,AI 分析生成音乐,还能选择主唱和修改歌词,目前为开放测试阶段。输入促销代码“LAIVEcreator”可获得 50 代币(入口在个人资料),令牌有效期为输入代码后的 30 天,促销码失效日期为 4 月 17 日。 DataMind Audio 推出了 Combobulator 插件,这是一个基于 AI 的效果插件,利用神经网络通过样式转移的过程重新合成输入音频,从而使用自己的声音重现其他艺术家的风格。
2024-11-06
训练模型
训练模型的相关内容如下: 用 SD 训练一套贴纸 LoRA 模型的工作流: 原始形象:MJ 初步产出符合设计想法的贴纸原始形象。 二次加工:完成贴纸的白色边线等细节加工。 处理素材:给训练集图片打 tag,修改 tag。 训练模型:将上述处理好的数据集做成训练集,进行训练。 使用编码器解码器架构构建诗歌生成器的训练模型: 在训练模型之前,需要一个损失函数,由于本质上是多类分类问题,损失将是稀疏的分类交叉熵损失,配置从 logits 计算。 有了损失后,编译模型,将损失和优化器联系在一起,优化器在训练期间更新权重以减少损失。 开始训练模型,选择训练的时期,进行多次训练,并提供回调确保训练期间保存权重。 从实际字符串中提取字符序列,使用 TensorFlow 的 TF 字符串 Unicode 拆分功能。 将字符序列转化为数字,使用 TF Keras 层中的 StringLookup 函数进行字符到 ID 的映射,也可通过设置参数获取反向映射。 将处理后的数据作为神经网络的训练数据集,使用 TF Data Dataset API。 call 函数指定网络架构,输入是代表字符的 ID 序列,有嵌入层、循环层和密集层。 完成模型构建后,可使用 model.summary查看模型结构。 包括创建初始向量层、字符向量的演进、构建密集输出层等步骤。
2024-11-06
Wayto AGI的功能
WaytoAGI 具有以下功能: 1. 与 AI 知识库对话:您可以在此询问任何关于 AI 的问题。 2. AI 网站:集合了精选的 AI 网站,可按需求找到适合您的工具。 3. AI 提示词:集合了精选的提示词,能复制到 AI 对话网站使用。 4. 知识库精选:将每天知识库的精华内容呈现给大家。 WaytoAGI 是一个由开发者、学者和有志人士等参与的学习社区和开源的 AI 知识库。它不仅是一个知识库,还是连接学习者、实践者和创新者的社区,让大家在这里碰撞思想,相互鼓舞,一同成长。 此外,WaytoAGI 里有个离谱村,这是由 WaytoAGI 孵化的千人共创项目,能让大家学习和接触 AI 更轻松、更有趣。参与者不分年龄层,都可以通过 AI 工具快速简单地创作出各种各样的作品。离谱村是一个没有被定义的地方,在这里,想象力是至高无上的法则,奇迹是日常生活的一部分。
2024-11-06
我记得你有发布过google人工智能落地的案例
以下是为您整合的相关内容: Google 最近发布了 185 个全球企业生成式 AI 应用案例,涵盖客户服务、员工管理、代码开发、数据分析、安全管理和创意领域。案例展示了 AI 如何优化客户体验、提升员工效率、加速代码处理、改善数据分析、增强安全性及简化创意生产。详情可参考:《》 Coze 汽车售后服务知识库 Bot 旨在提升服务顾问和维修技师的专业水平和维修效率。该 Bot 通过提供标准化解决方案,辅助车辆故障分析和检查,弥补专业知识不足和技术支持文档标准化问题。主要目标是提升服务质量,减少对技师经验的依赖,为汽车售后服务提供智能化支持。详情可参考:《》
2024-11-06
各个ai工具的特点
以下是一些不同类型的 AI 工具及其特点: 根据视频脚本生成短视频的工具: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析并生成素材和文本框架,实现从文字到画面的快速转化。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频。 3. Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容,无需视频编辑经验。 4. VEED.IO:提供 AI 图像和脚本生成器,帮助从图像制作视频并规划内容。 5. Runway:能将文本转化为风格化视频内容,适用于多种场景。 6. 艺映 AI:专注人工智能视频,提供文生视频、图生视频、视频转漫等服务。 帮助建筑设计师审核规划平面图的工具: 1. HDAidMaster:云端工具,搭载建筑大模型,在建筑、室内和景观设计领域表现出色。 2. Maket.ai:面向住宅行业,能根据输入自动生成户型图。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,可引入标准和规范约束设计结果。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,实现建筑全寿命周期内信息的集成与管理。 制作网站的 AI 工具: 1. Wix ADI:基于用户信息自动生成定制化网站,提供多种设计选项和布局,集成 SEO 及分析功能。 2. Bookmark:通过简单问题快速生成网站,提供拖放编辑器和多种行业模板及营销工具。 3. Firedrop:Sacha 作为 AI 设计助手可根据指示创建和修改设计,支持实时编辑和预览。 4. The Grid:Molly 作为 AI 设计助手自动调整设计和布局,基于内容和互动优化,支持多种内容类型。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-06
视频生成的提示词
以下是关于视频生成提示词的相关内容: 基础篇: 提示词内容:使用自然语言详细描述希望生成视频的内容,尽可能简单、详细且避免抽象歧义、文言文、诗歌、俗语等表达方式。可参考主体+主体描述+运动+环境的公式,如“××在哪里干了什么”。例如“一艘白色邮轮缓缓驶过海面”“A white cruise ship sails slowly across the sea”。 指令参数:一般包括视频时长、分辨率、帧率等细节。PixVerse 默认生成 4 秒时长、1408×768 分辨率的视频,升级后可达 4K 分辨率,但生成时间会更长。 情感氛围:描述视频的情感基调或氛围,用于控制人物表情、环境氛围等。例如“一个长发女孩看向镜头,表情忧郁”“A girl with long hair looks at the camera with a melancholy expression”。 参考风格:可以输入参考的艺术风格等。例如“旧电影风格”“classic cinema,black and white,film grain,vintage aesthetic,flickering light,detective,a man leaning against the wall”。 进阶篇: 在基础篇的公式基础上进一步扩展提示词,使描述更详细。如“一只小狗在草地上散步”可拓展为“一只金色毛发的狗悠然自得地在阳光洒满的草地上行走,草叶轻轻地在它的爪下弯曲。微风拂过,它的毛发随风轻动,时不时低下头嗅闻着大地。远处,夕阳的余晖拉长了影子,营造出一种宁静祥和的氛围”。增加对各部分的详细描述,可使生成的视频更符合提示词且更稳定、美观。 更多示例及详细介绍可参考:
2024-11-06
各个ai的特点
以下是关于不同 AI 的特点: AGI 的五个等级: 聊天机器人:具备基本对话能力,依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者:具备人类推理水平,能解决复杂问题,如 ChatGPT,可根据上下文和文件提供详细分析和意见。 智能体:不仅具备推理能力,还能执行全自动化业务,但目前许多产品执行任务后仍需人类参与。 创新者:能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 组织:最高级别,能够自动执行组织的全部业务流程,包括规划、执行、反馈、迭代、资源分配和管理等。 辅助写邮件的 AI 工具: Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能,易于使用,支持多种平台和多种语言,网站:https://www.grammarly.com/ Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句,界面简洁,重点突出,适用于改善写作风格和简洁性,网站:http://www.hemingwayapp.com/ ProWritingAid:全面的语法和风格检查,提供详细的写作报告和建议,功能强大,支持多种平台和集成,特别适合专业写作者,网站:https://prowritingaid.com/ Writesonic:基于 AI 生成各种类型的文本,包括电子邮件、博客文章、广告文案等,生成速度快,适合需要快速创作和灵感的用户,网站:https://writesonic.com/ Lavender:专注于邮件写作优化,提供个性化建议和模板,帮助用户提高邮件打开率和回复率。 人工智能的“智能”特质: 定义和特点:涵盖机器的学习、推理、适应和自我改进的能力,能从经验中学习,理解复杂概念,处理和分析大量数据,执行人类认为需智能完成的任务,关键特点包括算法驱动的决策过程、对大数据的处理能力、特定任务中的高效性和准确性。 行为模式: 信息处理:通过先进算法和计算模型处理信息,从大量数据输入中学习规律、做出预测并决策。 环境互动:能适应操作环境,从语音助手到自动驾驶汽车,可在特定环境中高效工作并适应新情况。 能量聚焦:执行任务时效率极高,持续工作不受疲劳影响。 深度与专注:采用深度学习技术的 AI 系统能对特定领域数据深入分析,识别复杂模式和关系。其“智能”特质在模拟和扩展人类智能过程中,与 MBTI 中的内倾特质有相似和可比性。
2024-11-06