「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
如何详细学习coze
以下是关于学习 Coze 的详细内容: 新知识学习方法:推荐使用 Claude + Coze 的组合。Claude 是目前强大的 AI 大模型,每月 20 美元,性能出色。Coze 是一款 AI Agent 的衍生产品,其价值主要体现在跟进 AI Agent 工具发展情况、发现商业化机会以及制作产品 Demo 等方面。对于学习 RAG,可先通过 Claude 了解细节概念,再通过 Coze 搭建 Demo 并在实践中学习。在学习过程中创建了产品资料问答机器人等 4 个 Bot,相关资料可参考公开分享:。 数据库概念:在学习 AI Agent 过程中,记忆离不开数据库组件。本文从非编程人士角度讲解数据库概念和基本使用,不涉及传统的 SQL 语法,而是通过与 Excel 对比帮助理解,旨在让您更好地利用 ChatGPT 等工具辅助学习。同时预告了关于 AI 时代编程基础系列的大纲。 变现方式:本期 Coze 变现模板(多智能体版)课程大纲包括制作完成后的“变现网站”用户体验、开发者体验以及深入学习 Zion 等内容。未注册过 Zion 需按特定步骤注册并填写邀请码“coze”领取代金券;已注册 Zion 可通过填写表单申请代金券。工作人员将手动发券到账户,两种方式均可获得 VIP 券,后续可用该券建站,使用“coze 变现模板(多智能体版)”模板。
2025-02-13
大模型相关术语中,参数和Token分别指什么?
在大模型相关术语中: 参数:主要指模型中的权重(weight)与偏置(bias),大模型的“大”通常体现在用于表达 token 之间关系的参数数量众多,例如 GPT3 拥有 1750 亿参数,其中权重数量达到了这一量级。 Token:大模型有着自己的语言体系,Token 是其语言体系中的最小单元。人类语言发送给大模型时,会先被转换为大模型的语言,这种转换的基本单位就是 Token。不同厂商的大模型对 Token 的定义可能不同,以中文为例,通常 1 Token 约等于 1 2 个汉字。大模型的收费计算方法以及对输入输出长度的限制,通常都是以 Token 为单位计量的。Token 可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization),在将输入进行分词时,会对其进行数字化,形成一个词汇表。
2025-02-13
有哪些主流的大模型?介绍一下每个大模型的具体信息,用英文回答
Some of the mainstream large models and their specific information are as follows: BERT: It is an encoderonly model commonly used in natural language understanding tasks such as classification and sentiment analysis. T5: An encoderdecoder model from Google, used for tasks like translation and summarization. GPT3: It has a large number of parameters and can complete tasks based on user input descriptions or examples. ChatGPT: Users can complete tasks by having conversations with it like with a human. The "large" in large models refers to the large amount of pretraining data, often from the Internet, including papers, code, and public web pages, usually at the terabyte level. Also, they have a large number of parameters. For example, GPT3 has 170 billion parameters.
2025-02-13
有哪些主流的大模型?用英文回答
The mainstream large models include: OpenAI: GPT3.5 and GPT4. GPT3.5 initiated the current AI boom in November, and GPT4 was first released in spring with more powerful functions. A new variant uses plugins to connect to the internet and other applications. Microsoft's Bing uses a mixture of GPT4 and GPT3.5 and is often the first to introduce new features in the GPT4 family. Google: Bard, driven by various base models, recently a model named PaLM 2. Anthropic: Claude 2, which is notable for having a very large context window.
2025-02-13
有哪些主流的大模型?
目前主流的大模型主要包括以下几类: 1. 大型语言模型:专注于处理和生成文本信息,例如 GPT3 等。通过分析大量的文本数据来理解和生成自然语言,拥有海量的参数和训练数据。 2. 大型多模态模型:能够处理包括文本、图片、音频等多种类型的信息。 3. 基于 Transformer 架构的模型: Encoderonly 模型:通常适用于自然语言理解任务,例如分类和情感分析,最知名的代表模型是 BERT。 Encoderdecoder 模型:同时结合了 Transformer 架构的 encoder 和 decoder 来理解和生成内容,例如翻译和摘要,代表是 Google 的 T5。 Decoderonly 模型:更擅长自然语言生成任务,典型使用包括故事写作和博客生成,如 ChatGPT 等。 大模型的特点包括: 1. 预训练数据量大,往往来自于互联网上的论文、代码、公开网页等,一般用 TB 级别的数据进行预训练。 2. 参数众多,如 GPT3 拥有 1750 亿参数。
2025-02-13
AI视频,用海螺走T台的案例
以下是关于 AI 视频中用海螺走 T 台的相关内容: 全新 AI 整活计划第三期:巨大萌物 奖励方式:使用海螺 AI 进行视频制作,海螺 AI 会评选出预计 10 位创意奖,给大家颁发海螺会员+现金奖励。 制作教程: 第一步:点开 whisk 网站(https://labs.google/fx/zh/tools/whisk),找到两张图(如:皮卡丘和埃菲尔铁塔),然后传上去,样式风格空着,写一句 Prompt(如:巨大的皮卡丘抱着埃尔菲铁塔)合成出来一张图片。 第二步:点开海螺网站(https://hailuoai.com),例如 Prompt:巨大的可达鸭在斗兽场上熟睡并打呼,肚皮缓慢起伏,马路上的车在行驶,突然斗兽场塌了,冒出滚滚沙尘,可达鸭突然惊恐地睁大眼睛;巨大的卡比兽,把一碗雪倒扣在富士山上,富士山瞬间被雪覆盖。并提供了相关视频案例的链接。 视频模型:MiniMax 海螺 AI 中级实现精准的画面控制和高画面表现,精准美学控制,给出了现代都市街道上摩托车与警车追逐的 Prompt 示例及相关视频。 实际运用案例(电影、广告片、宣传片、短视频),包括场戏分镜头拆解梳理,如男人无奈起身开门、开门、开门走出、门外小女孩要糖、男人拒绝等情节的视频生成方式及相关视频链接。
2025-02-13
图片转视频
以下是关于图片转视频的相关内容: 一、用 AI 做 3d 新年表情包 1. 生成场景 可直接生成 1:1 的新年场景,或先将角色抠出合成绿幕,再生成无人物的场景图,方便后期控制。 背景是重要元素,输入“新年、中国新年、喜庆热闹、恭喜发财”等关键词获得合适背景。 在即梦图片生成界面中,选项为智能参考,导入参考图,模型选择图片 2.0 Pro,输入提示词生成图片后选择高清放大。 提示词示例:“戴着醒狮帽,双手抱拳,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆”“拿着‘福’字,新年气氛,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆” 2. 图转视频 使用可灵 AI 1.6 图生视频工具,抽卡性价比不错,简单效果一般抽两三次即可。 提示词:可爱的拟人小鹿拿着红包对你说谢谢老板,非常开心忍不住跳舞,背后下着红包雨 二、Joey 的创作思路分享 1. 让想象来到现实 制定分镜,定画面风格和人物是相对难的环节,需与团队达成共识。 定下风格和人物后进行常规的 AI 出图。 2. 动画与代码共舞 图片转视频主要用到了 runway 的笔刷,即梦的前后帧,Pixverse、pika 等。 介绍了三个转场画面: 360 人物环绕:先用 MJ 做不同角度的人物站立图,通过 comfyui 的首尾帧进行视频制作。 母亲的影子:在 SDXL 工作流中加入两个 controlnet,先在 base 里控制构图,再在 refiner 里控制母亲在画面中的强度。 上帝之手:先出一张伸手的图,用 runway 跑相互接近,转视频序列帧后在 comfyui 里用 controlnet 控制构图,按顺序自动出图跑一晚上,最后剪辑序列帧。 三、离谱村的共创故事 1. 出图 图片用 Midjourney 生产,AI 离谱村黄社长业务水平高且高产,其他小伙伴辅助。 2. 图转视频 每张图片转视频进行了大量尝试,各种工具如 pika,runway,Pixverse 轮番上场。 中间找 ZHO 做技术指导,用 SVD1.1 做出精美的视频,甚至上了 stablevideo.com 的首页官方推荐。 3. 配音部分 配音用 Audiobox 捏出来,每个人物角色有专属声音,用 GPTsovits 对离谱熊的声音做专属训练。
2025-02-13
如何建立自己知识库
建立自己的知识库可以参考以下方法: 1. 利用 GPT 打造个人知识库: 给 GPT 输入(投喂)定制化的知识,但需注意 GPT3.5(即当前免费版的 ChatGPT)一次交互(输入和输出)只支持最高 4096 个 Token,约等于 3000 个单词或 2300 个汉字,容量对于绝大多数领域知识可能不够。 OpenAI 提供了 embedding API 解决方案,embeddings 是一个浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性,小距离表示高关联度,大距离表示低关联度。向量是数学中表示大小和方向的一个量,通常用一串数字表示,在计算机科学和数据科学中,向量通常用列表(list)来表示。向量之间的距离是一种度量两个向量相似性的方法,最常见的是欧几里得距离。 可以先把大文本拆分成若干个小文本块(也叫 chunk),通过 embeddings API 将小文本块转换成 embeddings 向量,这个向量跟文本块的语义相关。在一个地方(向量储存库)中保存这些 embeddings 向量和文本块,作为问答的知识库。当用户提出一个问题时,该问题先通过 embeddings API 转换成问题向量,然后将这问题向量与向量储存库的所有文本块向量比对,查找距离最小的几个向量,把这几个向量对应的文本块提取出来,与原有问题组合成为新的 prompt,发送给 GPT API。 2. 本地部署大模型以及搭建个人知识库: 利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用,在进行本地知识库的搭建实操之前,需要先对 RAG 有一个大概的了解。 RAG 应用包括文档加载(从多种不同来源加载文档,LangChain 提供了 100 多种不同的文档加载器)、文本分割(把 Documents 切分为指定大小的块)、存储(将切分好的文档块进行嵌入转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库)、检索(通过某种检索算法找到与输入问题相似的嵌入片)、Output(把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案)。 文本加载器就是将用户提供的文本加载到内存中,便于进行后续的处理。
2025-02-13
能直接导入md文件的ai
以下是为您整理的相关内容: 关于导入 md 文件的 AI 工具 Process ON: 输入大纲和要点: 导入大纲和要点: 手动复制,相对比较耗时间。 导入方式: 1. 复制最终大纲的内容,到本地的 txt 文件后,将后缀改为.md。如果看不见后缀,可以自行搜索开启后缀。 2. 打开 Xmind 软件,将 md 文件导入 Xmind 文件中。 3. Process ON 导入 Xmind 文件。以导入方式新建思维导图,选择准备好的 Xmind 文件,导入成功。 输入主题自动生成大纲和要求:新增思维导图,输入主题,点击 AI 帮我创作,生成结束。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版,再点击下载。如果喜欢用 Process ON 的小伙伴,没有会员,可以某宝买个一天会员。 Agentic AI 相关: 在使用 Windsurf 时,如果要进行相关操作,为了安全考虑,不允许 AI 直接更改.windsurfrules 文件。需要把相关内容拆成两个部分,一个比如叫 scratchpad.md,在.windsurfrules 文件里提及:当每次进行思考前,要先看一眼 Scratchpad,并在里面更新计划。这种间接方式虽效果可能不如直接放在..cursorrules 里好,但试下来也是可以工作的。 用 Claude 进行各种设计: 自从 Claude 3.5 sonnet 更新到新版后,增强了视觉理解与编程质量,词生卡效果已完美进化到下一个 Level。 用 Claude 画公众号封面:效果示例,如果第 1 版效果一般,可以多尝试通用改进提示词或直接提出针对性意见,如主题色改为浅色调、增加文字投影效果。 用 Claude 画海报:如果需要调整海报内容,可给出具体提示,如白色底,浅绿色主题,轻微投影。 用 Claude 绘制可视化概念图,用于 PPT 等插图场景:有浅色版和深色版示例。 用 Claude 绘制微信 UI:发挥脑洞,只要是网页、软件界面设计能做出的图片效果,只要没有专业要求,大部分都能靠 Claude AI 来实现。 尝试途径: 1. :一个优秀的 AI 助手工具,付费后可使用 Claude 3.5 sonnet、ChatGPT4O 等顶级大模型(也是目前最常用的 AI 对话助手;?是邀请链接,如介意可自行搜索 Monica) 2. :claude 官方原版,注册后可每日限额免费体验(但存在较高的封号风险) 也可以通过 Cursor、Windsurf 等 AI 编程产品,调用 Claude AI API,但不支持 Artifacts 这种即时预览的使用方式,需要单独保存代码文件后查看。不过好处是,可以用 MD、CSV 等格式的文件,存储提示词、更新记录和 AI 交互数据。
2025-02-13
哪个ai 适合做教学 ppt
以下是一些适合用于制作教学 PPT 的 AI 工具: 1. Claude:能够帮助快速寻找符合条件的论文、提取精炼论文信息、找到适合的 PPT 制作工具并教会使用。 2. Gamma.app:在制作 PPT 方面有一定的帮助。 3. Kimi.ai:可以将思维导图图片转成 PPT。 4. 讯飞智文(http://zhiwen.xfyun.cn ):免费的 AI 制作 PPT 工具。 5. Mindshow.fun:支持 Markdown 导入。 6. Tome.app:AI 配图效果好。 7. Chatppt.com:自动化程度高。 此外,还有一些相关的网站和产品,如百度文库(https://cp.baidu.com ),橙篇是百度文库于 2024 年 5 月 30 日发布的综合性 AI Native 产品,集多种功能于一身。在使用 AI 制作 PPT 时,其原理和作用包括减轻排版工作压力、生成打底内容、根据用户输入生成大纲列表等,用户不满意还可自行选择模板。
2025-02-13