直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
对比sdk 用什么工具推荐
以下是关于对比相关内容的介绍: Midjourney v6.0 与 v6.1 版本对比: 在 Discord 上输入/settings 打开,或者描述词后面输入v 6.1 即可;网页端默认选择 v6.1 版本,直接使用即可。 对比的前提包括文字的摆放是否更完整,实物物体能否从 v6.0 版本复杂化到简单化,人物面部细节处理,肢体和图画比例是否协调,以及插画类在这次版本中的表现。 文字测试结果:v6.0 版本文字方面已不错,但 v6.1 版本表现更好。 实物测试结果:左侧细节过于复杂,右侧简洁合理,此次版本更新情况较诡异。 不同大型语言模型的性能对比: 需考虑多个维度,如理解能力(对语法、语义、上下文和隐含意义的理解)、生成质量(文本的流畅性、相关性和准确性)、知识广度和深度(对广泛主题的知识掌握程度及特定领域的理解深度)、泛化能力(处理未见过的任务或数据的表现)、鲁棒性(对错误输入等的应对能力)、偏见和伦理(生成文本是否存在偏见及是否遵循伦理标准)、交互性和适应性(在交互环境中的表现)、计算效率和资源消耗(模型大小、训练和运行所需的计算资源)、易用性和集成性(是否易于集成到不同应用和服务中及提供的 API 和工具的易用性)。 为进行有效比较,可采用标准基准测试(如使用 GLUE、SuperGLUE、SQuAD 等)、自定义任务(根据特定需求设计)、人类评估(结合主观评价)、A/B 测试(在实际应用场景中比较)、性能指标(如准确率、召回率、F1 分数、BLEU 分数等)。
2024-11-08
图片对话模型有哪些
以下是一些常见的图片对话模型: ChatGLM: 地址: 简介:中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。 VisualGLM6B: 地址: 简介:一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数;图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。依靠来自于 CogView 数据集的 30M 高质量中文图文对,与 300M 经过筛选的英文图文对进行预训练。 ChineseLLaMAAlpaca: 地址: 简介:中文 LLaMA&Alpaca 大语言模型+本地 CPU/GPU 部署,在原版 LLaMA 的基础上扩充了中文词表并使用了中文数据进行二次预训练。 智谱·AI 开源的图片对话模型有: CogAgent18B:基于 CogVLM17B 改进的开源视觉语言模型。拥有 110 亿视觉参数和 70 亿语言参数,支持 11201120 分辨率的图像理解,在 CogVLM 功能的基础上,具备 GUI 图像的 Agent 能力。 代码链接: 模型下载:、始智社区 CogVLM17B:强大的开源视觉语言模型(VLM)。基于对视觉和语言信息之间融合的理解,CogVLM 可以在不牺牲任何 NLP 任务性能的情况下,实现视觉语言特征的深度融合。是目前多模态权威学术榜单上综合成绩第一的模型,在 14 个数据集上取得了 stateoftheart 或者第二名的成绩。 代码链接: 模型下载: Visualglm6B:一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数;图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。 代码链接: 模型下载: 智谱·AI 开源的 Chat 模型有: ChatGLM6Bint4:ChatGLM6B 的 Int4 版本。最低只需 6GB 显存即可部署,最低只需 7GB 显存即可启动微调() 上下文 token 数:2K 代码链接: 模型权重下载链接:魔搭社区、始智社区、启智社区 ChatGLM6Bint8:ChatGLM6B 的 Int8 版本 上下文 token 数:2K 代码链接: 模型权重下载链接:魔搭社区、始智社区、启智社区 AgentLM7B: 简介:1. 提出了一种 AgentTuning 的方法;2. 开源了包含 1866 个高质量交互、6 个多样化的真实场景任务的 Agent 数据集 AgentInstruct;3. 基于上述方法和数据集,利用 Llama2 微调了具备超强 Agent 能力的 AgentLM7B、AgentLM13B、AgentLM70B。 上下文 token 数:4K 代码链接: 模型权重下载链接: AgentLM13B: 上下文 token 数:4K 模型权重下载链接: AgentLM70B: 上下文 token 数:8K 模型权重下载链接:
2024-11-08
帮我用AI生成流程图
以下为使用 AI 生成流程图的几种方法: 1. 使用 Lucidchart 生成项目管理流程图: 注册并登录:。 选择模板:在模板库中搜索“项目管理流程图”。 编辑图表:根据项目需求添加和编辑图形和流程步骤。 优化布局:利用 AI 自动布局功能,优化图表的外观。 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 2. 使用 ChatGPT 生成各种流程图: 确定制作目标,如生成时序图或流程图。 通过自然语法描述逻辑,将其转换成图形语法。 在线校验测试是否成功。 3. 利用 AI 拆解工作流程: 思考 AI 在当前任务中的帮助作用。 例如,对于公众号写作,使用简单提示词让 Claude 给出大致框架,并要求其更详细。 对于不同场景,如写 PPT 或学术论文,也可尝试让 AI 拆解。 得到拆解结果后,可用 Xmind 画成时间轴图等图表展示。 需要注意的是,虽然 AI 能帮忙画流程图,但根据马斯克的成事五步法,第一步是质疑需求。画图的目的是加深理解,亲自动手画图能巩固印象。而且当前 AI 画出的流程图可能不太好看且难以修改。
2024-11-08
如何输入图片,根据图片生成流程图
以下是关于输入图片生成流程图的相关内容: “镜子画布”小游戏: 需求分析: 这是一种帮助孩子理解和掌握对称概念的教育类小游戏。 内容需求方面,加入“选择难易度等级”概念,根据不同年龄和等级提供不同玩法。 图片生成:用户选择主题后画出相关内容。 图片处理:对图片以中心点分割,右侧内容进行“橡皮擦”处理,包括完全擦掉、给出辅助线、线条做浅等方式。 用户输入:包括输入主题(关键词)或随机生成主题、所选等级(简单、中等、困难)、描图的辅助线等级(无辅助线、“田字格”辅助线、“描红”辅助线)。 制作个人奥运头像: 需求分析:用自己的图片、照片生成漫画形式的以照片人物为主体的运动员头像图。 输入:先使用 ChatGPT 完成工作,输入奥林匹克项目生成人物描述,结合范例提示词添加中国人、中国运动服和项目场景描述,再使用重绘、垫图等参数调整。 “数独游戏”小游戏: 游戏设计: 答案验证:用户把填写内容以 9×9 矩阵形式输给 GPTs,GPTs 利用 Python 与 solution 矩阵对比,出错留红色“X”标记。 答案:用户可要求直接打印答案页。 做成图片的原因:方便用户理解和打印。
2024-11-08
Claude提示词结构 如何应用
以下是关于 Claude 提示词结构及应用的相关内容: 标注提示词的不同部分:可以使用多种语法结构分隔文本与提示,分隔符既可以是复杂的 html 结构、纯文本,也可以自定义语言标记和格式,甚至 emoji 都可以成为分隔符。常用的语法结构有 Markdown、XML、HTML、JSON 等编程语言。 分解任务:这是做总结性输出或处理长文档时的有效方法,例如从原文中提取相关引文。 提示词链:分解并跨提示词使用。 使用 XML 标签:缺乏“结构”的提示词对 Claude 较难理解,而 XML 标签类似于“章节标题”,Claude 已针对其进行专门训练。
2024-11-08
提示词结构 如何应用
提示词结构在应用时遵循清晰的结构最为有效,可将场景、主题和相机运动的细节划分为单独部分。以下是一些常见的结构和示例: 简单公式: 复杂公式: 例如,无结构提示词为“小男孩喝咖啡”,有结构的提示词则是“摄影机平移(镜头移动),一个小男孩坐在公园的长椅上(主体描述),手里拿着一杯热气腾腾的咖啡(主体动作)。他穿着一件蓝色的衬衫,看起来很愉快(主体细节描述),背景是绿树成荫的公园,阳光透过树叶洒在男孩身上(所处环境描述)”。在提示的不同部分重复或强调关键思想可以帮助提高输出的一致性。使用这种结构,提示一个女人站在热带雨林可能是“”。在超高速拍摄中,相机会快速飞过场景,应尝试将提示集中在场景中应该出现的内容上,比如输入晴朗的天空,而不是没有云的天空。
2024-11-08
国内ai产品排名
以下是国内部分 AI 产品的排名情况: |排行|产品名|分类|6 月 APP 下载量(k)|相对 5 月变化| |||||| |1|抖音豆包 AI|通用 Chatbot|16924|1.01| |2|CapCut Dreamina|视频编辑|11540|0.005| |3|星野|虚拟角色|1934|0.458| |4|百度网盘云一朵|其他|1797|0.041| |5|Kimi 智能助手|通用 Chatbot|1404|0.109| |6|作业帮|教育|1038|0.17| |7|文心一言|通用 Chatbot|941|0.061| |8|百度文库文档助手|通用 Chatbot|929|0.228| |9|AnyDoor|通用 Chatbot|804|0.844| |10|大学搜题酱|教育|777|0.151| |11|美图证件照|图像生成|621|0.192| |12|小猿搜题|教育|589|0.048| |13|天工 AI 助手|通用 Chatbot|517|0.27| |14|美图设计室|图像生成|465|0.151| |15|讯飞星火|通用 Chatbot|360|0.18| |16|通义千问|通用 Chatbot|337|0.286| |17|佐糖|图像编辑|239|0.077| |18|智谱清言|通用 Chatbot|210|0.106| |19|TalkAI 练口语|教育|201|0.047| |20|海螺 AI|通用 Chatbot|188|0.099| |21|腾讯元宝|其他|163|2.075| |22|ProKnockOut|图像编辑|154|0.115| |23|讯飞听见|其他|140|0.125| |24|开拍|图像编辑|137|0.074| |25|脸猫|图像生成|131|0.598| |26|流利说|教育|123|0.054| |27|千颜|图像编辑|95|6.917| |28|妙鸭相机|图像生成|85|0.063| |29|说得相机|图像编辑|63|0.1| |30|河马爱学|教育|54|0.019| |31|剪同款|图像生成|50|0.138| |32|Unidream|图像生成|47|0.892| |33|SuperAI|通用 Chatbot|44|0.375| |34|智能口语大师|教育|38|0.664| |35|创意喵|视频编辑|35|0.079| |36|我在 AI|通用 Chatbot|29|0.381| |37|MJ 中文极速版|图像生成|28|0.3| 此外,在图像类 AI 产品方面,为您推荐以下两款: 可灵:由快手团队开发,主要用于生成高质量的图像和视频。图像质量高,但价格相对较高,重度用户年费最高可达几千元,平均每月 400 600 元,临时或轻度使用有每日免费点数和 60 多元单月的最便宜包月选项。 通义万相:在中文理解和处理方面表现出色,用户可选择多种艺术和图像风格,生成图像质量高、细节丰富,操作界面简洁直观、用户友好度高,且目前免费,每天签到获取灵感值即可。但存在一定局限性,如某些类型图像因国内监管要求无法生成,处理非中文语言或国际化内容可能不如国际工具出色,处理多元文化内容可能存在偏差。
2024-11-08
我想生成一段音乐可以用什么呢?
以下是使用 Udio 生成音乐的相关信息: 基本操作:使用 Udio 制作音轨很容易。在提示框中输入您想创建的描述,比如“一首关于夏雨的歌曲,爵士乐,醇厚,温暖,比莉·哈乐黛的风格”或“关于纽约的爵士乐曲”,然后点击创建。 提示帮助:为了帮助您进行提示,在文本输入下方,您将找到两种类型的建议标签,您可以单击将其添加到提示中。您可以将插入符号移动到提示的任何部分,这将相应地更改完成。如果您不确定要输入什么内容,请尝试单击骰子图标以使用随机示例提示填充提示框。 提示构成:典型的提示由自由文本和标签组合而成。不同部分用逗号分隔。提示可以包含任意数量的任意顺序的自由形式部件和标签。此外,提示可以引用艺术家风格,这样可以更轻松地描述您想要创作的音乐。 延伸音轨:除了更改每个部分的提示之外,您还可以指定单独的自定义歌词。构建 1.5 分钟长的独立歌曲的最简单工作流程如下:使用常规创建模式生成中间(主要)部分,这是曲目的“核心”;为刚刚创建的部分输入扩展模式,在扩展放置区域中选择添加介绍选项,然后单击扩展,生成的两部分轨道现在长 1 分钟;进入 1 分钟曲目的扩展模式,选择“添加尾奏”并单击“扩展”,即可创作一段有正确开头和结尾的音乐。 请注意,Udio 不会使用艺术家的声音生成歌曲,并且在幕后,风格参考会被一组相关标签替换。
2024-11-08
让GPT陪聊的prompt
以下是一些关于让 GPT 陪聊的 prompt 相关知识: 夙愿提出了使用 GPT 模仿创作内容的万能思路。在 Prompt 迭代方面,特别是 GPT 优化 Prompt 时,0.3 版创作的标题存在太夸张的问题。可通过与 GPT 深入交流来优化,如向 GPT 提问为何标题夸张,受哪些提示影响。影响因素包括修辞手法、日常口语风格、情感色彩和提供的示例等。 像高手一样编写 GPT 时,和上一个例子相同的是顶部有和 GPT 使用搜索和画图一样的小图示“Talk to”。其中包含两个英文单词,对应在 GPT 里设置的两个 Action,一个代表 themoviedb 的某条数据,一个代表使用 webpilot 这个工具,且有类似网址的内容。 南瓜博士提到让 AI 的回复更有灵性(人味儿)的 Prompt 小技巧。GPT 回答问题常很古板,常见方法是让其扮演特定角色、给出明确输出要求,但效果有限。要让其更有趣,可让它在回复中加点感情,如营造特定环境,用括号写出动作,通过示范给予上下文学习的机会,使其后续回复更具画面感。
2024-11-07
创建知识库
创建知识库的方法如下: 手动清洗数据创建智能体的知识库: 在线知识库:点击创建知识库,创建画小二课程的 FAQ 知识库。飞书在线文档中每个问题和答案以分割,可点击编辑修改和删除,添加 Bot 后可在调试区测试效果。 本地文档:对于本地 word 文件,注意不能将大量内容一股脑全部放入训练,应先放入大章节名称内容,再按固定方式人工标注和处理章节内详细内容,然后选择创建知识库自定义清洗数据。 发布应用:点击发布,确保在 Bot 商店中能搜到。 在扣子(https://www.coze.cn/home)创建并上传文本内容: 登录扣子,在左侧导航栏的工作区区域选择进入指定团队。 在页面顶部进入知识库页面,单击创建知识库,配置知识库名称、描述并确认。一个团队内的知识库名称需唯一。 在单元页面,单击新增单元,选择要上传的数据格式和文本内容上传方式完成内容上传。 在 Coze 中创建知识库: 来到个人空间,找到知识库导航栏,点击创建知识库。知识库是共享资源,多个 Bot 可引用同一知识库。 选择知识库的格式(目前支持文档、表格、图片),填写相关信息。如选择本地文档和自定义的文档切割,数据处理完成后,一个问答对会被切割成一个文档片。
2024-11-07