直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
矢量图生成工具
以下是一些用于矢量图生成的工具: 1. UIzard:利用 AI 技术生成用户界面,能根据提供的信息快速生成 UI 设计。 2. Figma:基于云的设计工具,提供自动布局和组件库,其社区开发的一些 AI 插件可增强设计流程。 3. Sketch:流行的矢量图形设计工具,插件系统中部分插件利用 AI 技术辅助设计工作,如自动生成设计元素。 此外,还有一个超强 LOGO 生成器的相关教程及案例拆解: 设计一个 logo 生成工具,允许用户上传多张 logo 图片作为参考,若多张图片无法处理,可将四张合成一张处理。通过提示询问用户是否用这些图片创建新 logo 及自定义提示词风格,设定每张图片参考权重。利用 GPT4 Vision 识图能力提取关键特征,结合权重和提示词风格生成新 logo 设计(如不满意可重新生成)。创作完成后提示用户是否满意,满意则发送此链接让用户去转 LOGO 矢量图操作。默认语言是中文。
2024-12-23
AI 数字人哪家的好
以下为您介绍一些较好的 AI 数字人相关的资源和产品: 1. 数字人躯壳构建: 可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署。笔者的开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单。另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D。 2. 数字人课程: 强烈推荐卡尔的 AI 沃茨做的这门数字人课程,一共 15 节视频课,持续更新还会不定时增加最新的数字人内容,附赠课外社群辅导,专门解决数字人相关的问题。关于卡尔,从创建 AIGC 开源学习网站 learnpromptl.pro,到建立卡尔的 AI 沃茨万人社群,他一直致力于 AI 学习圈。这一次,他建立了一套完整的数字人学习体系,放在这门《克隆你自己》的课程中,带领大家全方位掌握数字人各技能。同时,他详细回顾了 2023 年数字人领域的破圈事件,如 AI 马斯克对谈 AI 乔布斯超 331.9k 播放、霉霉说中文火遍全网、AI 郭德纲讲英文相声、硅语翻译|海外明星送出中文新年祝福、通义千问|兵马俑跳科目三、小冰推出支持交互的多模态数字人、阿根廷新总统用 HeyGen 做演讲等。数字人的出现,可以极大程度上优化工作流,尤其在制作个人 ip 短视频、配音、直播甚至到智能客服、虚拟偶像等各种领域都可以完成赋能。如果您想加入这场数字人浪潮,拥有自己的数字分身,优化自己的工作流,这门具备完整数字人学习体系的课程,正是您的需求。(扫码可以查看课程详细内容和介绍) 3. 算法驱动的数字人相关开源代码: ASR 语音识别:openai 的 whisper:https://github.com/openai/whisper ;wenet:https://github.com/wenete2e/wenet ;speech_recognition:https://github.com/Uberi/speech_recognition 。 AI Agent:大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。Agent 部分可以使用 LangChain 的模块去做自定义,里面基本包含了 Agent 实现的几个组件 。 TTS:微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费;VITS:https://github.com/jaywalnut310/vits,还有很多的分支版本,可以去搜索一下,vits 系列可以自己训练出想要的人声;sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌上面,前段时间很火的 AI 孙燕姿。 当然这种简单的构建方式还存在很多的问题,例如:如何生成指定人物的声音?TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作?数字人如何使用知识库,做出某个领域的专业性回答?
2024-12-23
矢量图生成工具
以下是一些用于矢量图生成的工具: 1. UIzard:这是一个利用 AI 技术生成用户界面的工具,能根据您提供的信息快速生成 UI 设计。 2. Figma:基于云的设计工具,提供自动布局和组件库,其社区开发的一些 AI 插件可增强设计流程。 3. Sketch:流行的矢量图形设计工具,插件系统中部分插件利用 AI 技术辅助设计工作,如自动生成设计元素。 此外,还有一个超强 LOGO 生成器的相关教程及案例拆解。它允许用户上传多张 logo 图片作为参考,若无法处理多张图片,可将四张合成一张处理。通过提示询问用户是否用这些图片创建新 logo 并自定义提示词风格、设定图片参考权重,然后利用 GPT4 Vision 的识图能力提取关键特征生成新 logo。若用户不满意可重新生成,满意则可通过转 LOGO 矢量图。默认语言为中文。
2024-12-23
AGI是什么
AGI 即通用人工智能(Artificial General Intelligence),指能够像人类一样思考、学习和执行多种任务的人工智能系统。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 此外,AI 分为 ANI 和 AGI,ANI 得到巨大发展但 AGI 还没有取得巨大进展。ANI 即弱人工智能,只能做一件事,如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等。而 AGI 能做任何人类可以做的事。
2024-12-23
矢量图生成工具
以下是一些常见的矢量图生成工具: 1. UIzard:这是一个利用 AI 技术生成用户界面的工具,能根据提供的信息快速生成 UI 设计。 2. Figma:基于云的设计工具,提供自动布局和组件库,其社区也开发了一些 AI 插件用于增强设计流程。 3. Sketch:流行的矢量图形设计工具,插件系统中有些插件利用 AI 技术辅助设计工作,如自动生成设计元素。 此外,还有一个超强 LOGO 生成器的相关介绍: 它可以设计一个 logo 生成工具,允许用户上传多张 logo 图片作为参考,若多张图片无法处理,可将四张合成一个图片处理。通过提示询问用户是否使用这些图片创建新的 logo 设计,能自定义提示词风格,设定每张图片的参考权重。利用 GPT4 Vision 的识图能力提取图片关键特征,结合权重和提示词风格生成新 logo 设计。若用户不满意可重新生成,创作完提示用户是否满意,满意则发送让用户去转 LOGO 矢量图操作。默认语言是中文。
2024-12-23
ai工具在行业的运用以及未来的发展
AI 工具在行业中的运用十分广泛,以下为您详细介绍: 1. 客户服务领域: OpenAI 的 ChatGPT 等生成式人工智能应用程序在不到一年的时间里掀起革命,能以类似人类的方式处理并回答复杂问题,预计将使客户服务中心生产力提高 30%到 50%。 各行业公司已开始探索将生成式 AI 融入客户服务中心,如 Octopus Energy 引入后显著提高了电子邮件回复质量和客户满意度,带来更丰富全面的服务体验。 但发展中存在挑战,如受数据训练内在偏见影响产生不准确结果,目前阶段通常需要人工监督。预计其融入将经历几个阶段,最终几乎能在每个用户旅程中提供支持。 2. 医疗领域:利用大模型生成合成数据,如微调 Stable Diffusion 中的 UNet 和 CLIP 文本编码器,从大量真实胸部 X 射线及其报告生成大型数据集,产生高保真度和概念正确的合成 X 射线扫描数据,用于数据增强和自监督学习。 3. 机器人领域:苹果 Vision Pro 在机器人研究领域引起轰动,其高分辨率、高级跟踪和处理能力被用于远程操作控制机器人的运动和动作。 4. 企业自动化领域:传统机器人流程自动化面临高昂成本等问题,新方法如 FlowMind 和 ECLAIR 使用基础模型解决限制。FlowMind 专注金融工作流,通过 API 使用 LLM 生成可执行工作流,在工作流理解方面准确率高;ECLAIR 采取更广泛方法,使用多模态模型从演示中学习,直接与企业环境中的图形用户界面交互,提高网页导航任务完成率。 5. 小型企业领域:工具服务小型企业将是生成式 AI 的一个杀手级用例。AI 工具可为小型企业带来即时影响,如 Sameday 可接电话预约,Truelark 处理短信等,许多通用内容创建工具在中小企业中已获显著用户基础,也出现为特定类型企业工作流量身定制的垂直化工具。 未来,AI 工具在各行业的应用有望不断深化和拓展,为经济发展和社会进步带来更多机遇和挑战。
2024-12-23
ANI是什么
ANI 即 artificial narrow intelligence,指的是弱人工智能。这种人工智能只能做一件事,例如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等。与之相对的是 AGI(artificial general intelligence),AGI 能够做任何人类可以做的事。目前 ANI 得到了巨大发展,而 AGI 还没有取得巨大进展。
2024-12-23
矢量图生成工具
以下是一些常见的矢量图生成工具: 1. UIzard:这是一个利用 AI 技术生成用户界面的工具,能根据提供的信息快速生成 UI 设计。 2. Figma:基于云的设计工具,提供自动布局和组件库,其社区也开发了一些 AI 插件来增强设计流程。 3. Sketch:流行的矢量图形设计工具,插件系统中一些插件利用 AI 技术辅助设计工作,如自动生成设计元素。 此外,还有一个超强 LOGO 生成器的相关介绍: 它可以设计一个 logo 生成工具,允许用户上传多张 logo 图片作为参考,若多张图片无法处理,可将四张合成一张处理。通过提示询问用户是否用这些图片创建新 logo,可自定义提示词风格,设定每张图片参考权重。然后利用 GPT4 Vision 的识图能力提取关键特征,结合权重和提示词风格生成新 logo。若用户不满意可重新生成,创作完提示用户是否满意,满意则发送此链接让用户去转 LOGO 矢量图操作。默认语言是中文。
2024-12-23
ANI是什么
ANI 即 artificial narrow intelligence ,意为弱人工智能。这种人工智能只能做一件事,例如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等。目前 ANI 得到了巨大发展,而 AGI(artificial general intelligence,通用人工智能)还没有取得巨大进展。
2024-12-23
coze中图片 string如何转image
在 coze 应用中,将图片 string 转换为 image 的步骤如下: 1. 把工作流的入参设置为 File>Image。 2. 注意,这是最关键也是最容易出错的地方,一个引号、一个大括号都不能错。图片下方会提供具体的文本供您复制。代码内容中,ImageUpload1 部分可以替换成您实际的文件上传组件的组件名称。由于 value 里没有提供 url 地址,所以只能用上传后的 file_id 从 coze 存储的图片中获得索引。具体原理程序员可能更清楚,您记住操作方法即可。 3. 接下来获得图片 URL 就比较简单了。在工作流中您可以直接用这个 image 变量,也可以用 string 模式输出,它会神奇地在工作流中变成图片的 URL。当您使用文本组件显示其地址时,能清晰看到图片地址,在图片组件上也能正常显示图片。如果不知道怎么显示,只要绑定工作流的 image 输出即可。 欢迎加入社区共同学习免费的 AI 智能体课程!如果有需要,也可以联系微信号:wx_stuart(请备注 coze 共学或外包需求)帮您对接社区的小伙伴外包您的 agent 开发需求。
2024-12-22