直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
agent什么意思
“智能体”(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 从以下几个方面详细介绍: 1. 定义:智能体是一种自主系统,通过感知环境(通常通过传感器)并采取行动(通常通过执行器)来达到某种目标。 2. 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以几个关键组成部分: 规划:将大型任务分解为更小、可管理的子目标,有效处理复杂任务。 反思和完善:对过去的行为进行自我批评和反思,从错误中吸取教训,完善未来步骤,提高最终结果质量。 记忆:包括短期记忆(所有的上下文学习利用模型的短期记忆来学习)和长期记忆(为 Agents 提供长时间保留和回忆无限信息的能力,通常通过利用外部向量存储和快速检索实现)。 工具使用:学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 从产品角度思考 Agent 设计: Who:Agent 可以是一个历史新闻探索向导,具有知识渊博、温暖亲切、富有同情心的性格,主导新闻解析和历史背景分析。为使角色生动,可为其设计背景故事,明确起源、经历和动机,定义性格特点、说话方式和风格,设计对话风格,明确核心功能及附加功能。 在 AI 大模型中,agent 是比较火的概念,被认为是大模型未来的主要发展方向。中间的“智能体”其实就是 LLM 或大模型,四个箭头分别是为 LLM 增加的工具、记忆、行动、规划四个能力。目前行业里主要用到的是一个叫 langchain 的框架,它把 LLM 和 LLM 之间以及 LLM 和工具之间通过代码或 prompt 的形式进行串接,在 prompt 层和工具层完成主要的设计逻辑。
2024-10-08
RAG什么意思
RAG 是检索增强生成(RetrievalAugmented Generation)的缩写,是一种结合了检索模型和生成模型的技术。其核心目的是通过某种途径把知识告诉给 AI 大模型,让大模型“知道”我们的私有知识,变得越来越“懂”我们。 RAG 的核心流程是根据用户提问,从私有知识中检索到“包含答案的内容”,然后把“包含答案的内容”和用户提问一起放到 prompt(提示词)中,提交给大模型,此时大模型的回答就会充分考虑到“包含答案的内容”。 RAG 的最常见应用场景包括知识问答系统,用户提出问题,RAG 模型从大规模的文档集合中检索相关的文档,然后生成回答。 大模型存在一些缺点,如无法记住所有知识尤其是长尾知识、知识容易过时且不好更新、输出难以解释和验证、容易泄露隐私训练数据、规模大导致训练和运行成本高,而 RAG 具有一些优点,如数据库对数据的存储和更新稳定、数据更新敏捷且可解释、能降低大模型输出出错的可能、便于管控用户隐私数据、可降低大模型的训练成本。 一个 RAG 的应用可以抽象为 5 个过程:文档加载(从多种不同来源加载文档)、文本分割(把文档切分为指定大小的块)、存储(将切分好的文档块进行嵌入转换成向量形式并存储到向量数据库)、检索(通过检索算法找到与输入问题相似的嵌入片)、输出(把问题以及检索出来的嵌入片一起提交给 LLM 生成答案)。
2024-10-08
我想修改制度中的错字和语病,那个AI软件能帮我
以下是一些能够帮助您修改制度中错字和语病的 AI 软件及相关信息: OpenAI 的相关功能中,有“Grammar correction”,其提示词为“You will be provided with statements,and your task is to convert them to standard English”,Claude 的对应提示词为“Your task is to take the text provided and rewrite it into a clear,grammatically correct version while preserving the original meaning as closely as possible.Correct any spelling mistakes,punctuation errors,verb tense issues,word choice problems,and other grammatical mistakes.” 飞书文档带有纠错功能。如果使用 prompt 纠错,文本量不能太大,可直接告诉大模型:检查下列文本中的错别字、语法错误和格式错误,指出并改正,重新生成新的文本。
2024-10-08
黑白简笔画风格的AI漫画可以参考谁的
以下是一些黑白简笔画风格的 AI 漫画参考: Sarah Andersen: 主题风格: 通常使用简单的黑白线条作画,配以极富表现力的角色表情。 作品经常探讨如焦虑、社交尴尬、性别问题以及对生活中普通但难以言说的瞬间的幽默呈现。 通常使用清晰简洁的线条,这有助于表达画面的情感和幽默。 大多数作品是黑白的,有时会使用颜色来强调特定的元素或情感。 角色常常显示出戏剧性的表情,这反映了各种情绪状态。 作品经常用幽默和讽刺来处理生活中的不如意。 技巧: 在主要描述语后面加上“by Sarah Andersen”或者“style reference Sarah Andersen”。 在提示中加入情感色彩的描述,比如使用“joyful,” “awkward,”或“anxious”等词,来帮助 AI 捕捉 Sarah Andersen 作品中的情感深度。 利用cref 命令保持人物的一致性。 应用: 社交媒体上进行漫画创作。 使用这种风格的插图,可以使故事更加生动有趣。 个性化礼物和商品设计(需注意版权问题)。 擅长创作表情包 Meme: Prompt 4:Black and white photo illustration of a doge face in the center, looking utterly baffled with a humorous 'shrug' gesture. Adjacent to the doge, three doge face icons are displayed for 'Like', 'Repost', and 'Collect'. The 'Like' doge is smitten with heart eyes, the 'Repost' doge is dizzy with spiraled eyes, and the 'Collect' doge is greedily drooling over a bone. Prompt 5:Vector meme in black and white of a doge depicted with three heads and six arms, exuding a calm, Buddhalike aura. Surrounding comical diagram elements point to the doge with arrows labeled '70% tranquility', '20% deep thought', and '10% in the moment'. Prompt 6:如果想要呈现出特定的表现结果,还可以用比喻,类比等方法达到类似的画面。比如这里想生成很多 Doge,那么也可以借助九头蛇等提示词。 教程:线稿上色 Midjourney + Stable Diffusion: 在学习 AI 绘画这段时间,发现 AI 绘画并不会完全替代设计师,而是可以让出图质量更好,效率更高。比如上面是用 midjourney 生成线稿,PS 稍微做一些修正,再用 controlnet 控制,stable diffusion 上色,多套 AI 组合拳,可以快速生成效果惊艳的图。 线稿产出:mj 关键词:Black and white line drawing illustration of a cute cat cartoon IP character, black line sketch, wearing a fortune hat, wearing a collar around the neck, Carrying a huge bag containing scrolls and ingots, matching rope and straps at his wrists, Chinese element style, popular toys, blind box toys, Disney style, white background niji 5 style expressive PS 手动手动重绘错误的地方:有些图出来没有阴影容易飘,可以自己画一个出来。
2024-10-08
生成表格的ai用什么
以下是一些可用于生成表格的 AI 工具: GPT3.5 Tableinator:输入主题,它将生成带有维基百科链接的信息表,但需要使用自己的 Open AI API key。来源: Excel Labs:Excel 插件,新增基于 OpenAI 技术的生成式 AI 功能,用于数据分析和决策支持。 Microsoft 365 Copilot:微软推出的整合 Word、Excel、PowerPoint、Outlook、Teams 等办公软件的 AI 工具,以聊天形式完成用户需求,如数据分析或格式创建。 Formula Bot:提供数据分析聊天机器人和公式生成器功能,支持自然语言交互进行数据分析和生成 Excel 公式。 Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,可生成公式、相关文本内容、执行情感分析、语言翻译等任务。 随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中以提高效率和智能化水平。但请注意,部分内容由 AI 大模型生成,请仔细甄别。
2024-10-08
AGI 和 AI 的关系
AGI(通用人工智能)和 AI(人工智能)的关系如下: AGI 是 AI 的一个高级发展阶段。AI 涵盖了各种具有特定功能和应用场景的技术和系统,例如具备基本对话能力的聊天机器人、能够解决复杂问题的推理者等。 OpenAI 一直将实现 AGI 作为战略目标之一,随着技术的发展,如 ChatGPT、多模态大模型和 AI Agent 等的出现,我们在逐渐接近这一目标。 AGI 具有更高级的能力和更广泛的应用范围,其发展等级包括聊天机器人、推理者、智能体、创新者和组织等。例如,推理者如 ChatGPT 能根据上下文和文件提供详细分析和意见,创新者如谷歌 DeepMind 的 AlphaFold 模型能协助人类完成新发明。 除了智能方面,AGI 还关注广义机器人的数量,例如无人驾驶汽车、无人机、传感器等,通过这些收集更多数据以促进自身进化。
2024-10-08
用什么AI工具,绘画出的美女,如同真人照片。
以下几种 AI 工具可以绘画出如同真人照片的美女: 1. 谷歌的文生图 AI 模型 Imagen 2,实测效果逼真细腻,生成的美女图仿佛真人照片,其对提示的还原程度已经超越了 DALL·E 3 和 Midjourney。 2. Visual Electric 是一个不需要操心技术的 AI 绘画网站,您只需要发挥创意就行。 需要注意的是,使用 AI 绘画工具时可能会遇到一些问题,比如在独立游戏开发中使用 AI 绘画可能会出现风格不合适、缺乏叙事性、素材有限、泛化性差等情况。但通过不断尝试和优化,如更换 Embedding、CKPT、Lora 等方式,以及进行一些特殊处理,如为引导前景后景区分明显的画专门绘制引导图、对人物朝向做镜像处理等,也能获得较为理想的效果。
2024-10-08
模拟真人绘画的AI有哪些
以下是一些模拟真人绘画的 AI 相关内容: 小码哥:提供了多种以汉服为主题的 AI 绘画描述,如可爱的小老鼠、小龙、小猴、小鸡等穿着汉服的形象,涉及 Pixar 风格、超清晰细节、电影灯光等元素。 探讨了 AI 艺术的相关概念,包括从语言学角度研究提示词,以及对 AI 艺术本体形态的思考,如生成式空间计算的使命是创造生命体验。 提到生成式 AI 在视觉效果方面的应用,以漫画家 Yoko Li 为例,训练的模型能够模仿生成图像,在经济效益、创造新风格和概念的灵活性以及生成完整工作成果的能力等方面具有优势,这种变化不仅限于图像,还适用于整个设计领域。但 AI 模型生成的图像拥有一个非白色背景。
2024-10-08
常用ai语音工具
以下为您推荐一些常用的 AI 语音工具: 在线 TTS 工具: Eleven Labs:https://elevenlabs.io/ ,是一款功能强大且多功能的 AI 语音软件,能生成逼真、高品质的音频,高保真地呈现人类语调和语调变化,并能根据上下文调整表达方式。 Speechify:https://speechify.com/ ,人工智能驱动的文本转语音工具,可作为多种平台的应用使用,用于收听网页、文档、PDF 和有声读物。 Azure AI Speech Studio:https://speech.microsoft.com/portal ,提供支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供自定义的语音模型。 Voicemaker:https://voicemaker.in/ ,可将文本转换为各种区域语言的语音,并允许创建自定义语音模型。 适合 4 岁儿童练习英语口语的工具: LingoDeer:https://www.lingodeer.com/ ,通过游戏和互动活动教孩子英语,提供各种课程,还有家长仪表板可跟踪孩子进度。 Busuu:https://www.busuu.com/ ,提供英语等多种语言课程,使用多种教学方法,还有社区功能可与其他孩子练习口语。 Memrise:https://www.memrise.com/ ,使用抽认卡和游戏教孩子英语,提供多种课程,还有社交功能。 Rosetta Stone:https://www.rosettastone.com/ ,使用沉浸式方法教孩子英语,具有语音识别功能帮助练习发音。 Duolingo:https://www.duolingo.com/ ,免费的语言学习应用,使用游戏化方法让学习有趣。 对于想求职外企提升练习口语的工具,至少推荐三个: Speak:这是一款 AI 英语学习 APP,利用先进的 AI 语言学习技术,提供全面实时反馈,方便随时随地练习口语。 Duolingo:提供游戏化学习平台,通过 AI 辅助教学,帮助学习新词汇和短语,有口语练习功能。 Call Annie:可以通过视频或语音进行英语对话,在发音过程中能根据发言调整表情和动作,仿佛与真人对话。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-08
dify的部署和ollama联动
以下是关于 Dify 与 Ollama 联动部署的相关信息: Ollama 的特点和功能: 1. 支持多种大型语言模型,如通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 2. 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 CPU 和 GPU。 3. 提供模型库,用户可从中下载不同参数和大小的模型,通过 https://ollama.com/library 查找。 4. 支持自定义模型,可修改温度参数调整创造性和连贯性,或设置特定系统消息。 5. 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 6. 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 Ollama 的安装和使用: 1. 访问 https://ollama.com/download/ 下载安装。 2. 安装完后,确保 Ollama 后台服务已启动。在 Mac 上启动 Ollama 应用程序,在 Linux 上通过 ollama serve 启动。可通过 ollama list 确认。 3. 通过 ollama 命令下载模型。 Google Gemma 的本地部署: 1. 进入 ollama.com 下载程序并安装(支持 Windows、Linux 和 macOS)。 2. 在命令提示符中输入 ollama v 检查版本,安装完成后版本应为 0.1.26。 3. 输入 cls 清空屏幕,然后输入 ollama run gemma 运行模型(默认是 2b),首次需要下载。若想用 7b,运行 ollama run gemma:7b 。 4. 完成后可直接对话。2b 反应速度快但互动话题有限,7b 输出内容质量相对高但可能卡顿,对非英文语种反馈不稳定。 5. 常用内部指令:/set 显示设置界面可调整的设置项;/show 显示模型信息;/load <model> 加载已有模型;/bye 退出。 整体框架设计思路: 可先采取 Langchain + Ollama 的技术栈作为 demo 实现,后续也可考虑使用 dify、fastgpt 等更直观易用的 AI 开发平台。本次开发的运行环境是 Intel Mac,其他操作系统也可行。下载模型等可能需要梯子。 Langchain 简介: Langchain 是当前大模型应用开发的主流框架之一,提供一系列工具和接口,使与 LLM 交互变简单。其核心在于“链”概念,是模块化组件系统,包括 Model I/O、Retrieval、Chains、Agents、Memory 和 Callbacks 等组件,可灵活组合支持复杂应用逻辑。其生态系统还包括 LangSmith、LangGraph 和 LangServe 等工具,帮助开发者高效管理从原型到生产的各个阶段以优化 LLM 应用。
2024-10-08