直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
deepseek在世界上是什么水平
DeepSeek 在世界上具有一定的水平: 1. 华尔街分析师的反应:展示出媲美领先 AI 产品性能的模型,成本仅为一小部分,在全球主要市场的 App Store 登顶。但也有不同观点,如 Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑,高盛预测其可能改变竞争格局并降低行业进入门槛。 2. 实际使用体验:在文字能力上表现突出,尤其在中文场景中符合日常写作习惯,但在专业论文总结方面稍弱。数学能力经过优化表现不错,编程能力略逊于 GPT。 3. 在文学创作方面:很火,在 Benchmark 表现出色,做数学和代码题达 O1 标准,处于国际领先。文风优秀,有哲学思考,能触动人情感,文创能力顶尖,甚至因其“发疯”在创作上更出色。但使用时需在控制和自由间平衡,旧模型在文学创作时存在一些弊端。
2025-02-11
生成漫画动作参考图
以下是一些生成漫画动作参考图的方法: 1. 喂参考图:先上传喜欢的参考图,复制其链接。在关键词处填写“图片链接+这张图的关键词”,例如“链接图片.png,a Super cute sports girl,wearing a basketball vest,blueshortsbig watery eyes,clean bright basketball court background,super cute boy IP by pop mart,Bright color,mockup blind box toydisney stylefine luster,3D render,octane render,best quality,8k brightfront lightingFace Shot,fine luster,ultra detail,ar 9:16”。还可以通过修改关键词改变服装颜色等细节。 2. 使用 panels 命令:此命令可生成连续的动作和表情设计,将模型设置改为 niji mode 画动漫角色效果更好。例如“a Super cute sports anime girl,style by Miyazaki Hayao,6 panels with different poses 8K”,也可以使用“continuous running”生成更稳定的连续动作,甚至做成 gif 动画。 3. 利用 character sheet 命令:创建一个角色的多角度以及特写细节,例如“a Super cute sports anime girl,style by Miyazaki Hayao,character sheet,full body,8k”。 4. 使用 emoji、expression sheet:emoji 代表表情包,expression sheet 代表各种表情组合,可用此核心关键词设计出表情包。例如“图片链接.png a Super cute sports anime girl,style by Miyazaki Hayao,emoji,expression sheet,8k”。 另外,使用 ControlNet 插件也能生成漫画动作参考图。首先进入文生图,填写提示词生成一张图。然后将图片拖入到 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,保真度数值越高,对图片的参考越强。可以通过添加关键词的方式给人物换装、更改服装和表情、更改动作和表情、更改姿态、环境和表情等。这个功能在绘制系列插画、漫画、小说插图等工作时,能保持主角形象的统一,也能根据情况实时调整,后期配合 lora 潜力巨大。
2025-02-11
ai的数学原理是什么
AI 的数学原理包括以下几个重要方面: 1. 统计学基础:熟悉均值、中位数、方差等统计概念。 2. 线性代数:了解向量、矩阵等线性代数基本概念。 3. 概率论:掌握基础的概率论知识,如条件概率、贝叶斯定理。 在算法和模型方面: 1. 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)等,其目标是通过有标签的训练数据学习输入和输出之间的映射关系,包括分类和回归。 2. 无监督学习:熟悉聚类、降维等算法,此类学习的数据没有标签,算法需自主发现规律,例如对新闻文章进行聚类。 3. 强化学习:从反馈里学习,以最大化奖励或最小化损失,类似训练小狗。 在神经网络基础方面: 1. 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)等。 2. 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh 等。 此外,2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制(SelfAttention)来处理序列数据,比 RNN 更适合处理文本的长距离依赖性。对于生成式 AI,生成的内容称为 AIGC,相关技术名词众多,如 AI 即人工智能,机器学习包括监督学习、无监督学习、强化学习等。
2025-02-11
直播实时语音转文字的软件
以下是一些直播实时语音转文字的软件及相关信息: Vidnoz AI:支持 23 多种语言的配音,音质高保真,支持文本转语音和语音克隆功能,提供语音参数自定义和背景音乐添加工具,并提供面向个人和企业的经济实惠的定价方案。 OpenAI 的 wishper:https://huggingface.co/openai/whisperlargev2 ,还有在 JAX 上运行的相关项目:https://huggingface.co/spaces/sanchitgandhi/whisperjax ,此项目后端支持 TPU v48,与 A100 GPU 上的 PyTorch 相比,速度快 70 多倍,是目前最快的 Whisper API。 语音识别(Automatic Speech Recognition,ASR)可以将音视频中包含的人类声音转换为文本,适用于多种场景,如会议记录、客户服务、媒体制作、市场研究及多样化的实时交互场景,包括会议、课堂录音记录、客服电话分析、字幕生成、市场研究与数据分析等,能显著提升工作效率、服务质量与人机交互体验。在实时语音模型方面,可应用于会议、直播、客服、游戏、社交聊天、人机交互等场景,为直播带货、赛事直播等提供实时字幕。
2025-02-11
生图之后怎么保持原图改尺寸扩展
以下是关于生图后保持原图改尺寸扩展的方法: 对于 SD : 1. 将原图导入到图生图界面。 2. 根据情况选择大模型,卡通类一般选“revAnimated”,真实类选“Realistic Vision”,效果不好可尝试其他模型。 3. 图生图中重要参数设置:“缩放模式”选择“缩放后填充空白”;根据扩展方向增加宽度或高度;单批数量按需填写;“重绘幅度”加大到“0.8”以上。 4. 升级到最新的 controlnet 版本,将图片导入。 5. 启用插件,“控制类型”选择“局部重绘”,预处理器选择“inpaint_only+lama”,控制模式选择“更倾向 Controlnet”,缩放模式选择“缩放后填充空白”。 6. 为了出图更统一,可增加一个 reference_only 的通道巩固扩图风格。 7. 设置好后点击生成,选择满意的结果。 对于 Midjourney : 1. 放大(Upscale):包括精细放大(Subtle)尽量保持原样,创意放大(Creative)会调整或改变某些细节。 2. 重混(Remix):微妙(Subtle)为较小微调,较强(Strong)有较大差异。若没看到 Remix 按钮,点击右上方 More options 文字把常用的打上对勾。 3. 扩展(Pan):根据选定方向自动扩展图像边界。若没看到此按钮,可能是图像已在 Discord 中生成最满意的一张不可再扩展,或 More options 文字里没打上 Pan 对勾。 4. 缩放(Zoom):实际为“缩小视图”,会在图像周围添加额外空间展示更多内容。 5. 更多(More):包括重新运行提示词,或打开图像的编辑模式。重新生成(Rerun)再次运行相同提示,编辑器(Editor)编辑图像特定部分。 对于星流一站式 AI 设计工具: 1. 应用图生图:在 prompt 输入框下点击“图生图”上传本地文件,或在无限画布中图片功能区进行选择。 2. 调整“图生图”功能区参数:参考程度分为更像原图(小幅度修改基底图像,有限增加元素)、更创意(大幅度修改基底图像,可搭配增强模型加入更多元素)、自定义(可自定义修改重绘幅度)。 3. 增加参考纬度:点击添加按钮,会自动应用并打开“生成器”的图片参考功能。 4. 替换图像:鼠标滑动到图像,点击“选择参考图”即可重新选择图片。 5. 转换提示词:反推参考图信息填入进提示词框中。 6. 同步生图尺寸:同步参考图尺寸到“生成器”的生图尺寸中。 需要注意的是,新生成的部分和原图可能会存在色差,需要通过调整各项参数来修正,且不是每一次效果都能非常好。只要记住这个工作流,扩图还是很快的,只要替换图片改尺寸就可以了。
2025-02-11
有没有推荐的游戏编程ai
以下是为您推荐的一些游戏编程相关的 AI 工具和应用: 1. 生成性 AI 方面:建议现在就开始探索生成性 AI,一些工作室已经启动内部实验项目来探索其对生产的影响。 2. AI 游戏道具推荐系统:在一些游戏中,利用数据分析和机器学习为玩家推荐合适的游戏道具,如武器、装备等。 3. 游戏开发 AI 工具集合: 语音生成:Coqui Studio(https://coqui.ai)、Bark(https://github.com/sunoai/bark)、Replica Studios(https://replicastudios.com) 语音识别:OpenAI Whisper(https://huggingface.co/openai/whisperbase)、Facebook Wav2Vec2(https://huggingface.co/facebook/wav2vec2largexlsr53) 对话模型:ChatGPT(https://chat.openai.com)、HuggingChat(https://huggingface.co/chat) 故事讲述模型:MPT7BStoryWriter65k+(https://huggingface.co/mosaicml/mpt7bstorywriter)、Claude 100k(https://www.anthropic.com/index/100kcontextwindows)、GTP4 32k(https://platform.openai.com/docs/models/overview) 游戏设计:Ludo.ai(https://ludo.ai) 搜索引擎:Haddock(https://www.haddock.ai) AI NPC:Inworld(https://inworld.ai) 希望这些推荐能够满足您的需求,帮助您在游戏编程中更好地运用 AI 技术。
2025-02-11
agent
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 智能体的定义: 智能体是一种自主系统,通过感知环境(通常通过传感器)并采取行动(通常通过执行器)来达到某种目标。在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以几个关键组成部分,包括规划、子目标和分解、反思和完善、记忆(短期记忆和长期记忆)、工具使用等。 智能体的类型: 1. 简单反应型智能体(Reactive Agents):根据当前的感知输入直接采取行动,不维护内部状态,也不考虑历史信息。例如温控器,根据温度传感器的输入直接打开或关闭加热器。 2. 基于模型的智能体(Modelbased Agents):维护内部状态,对当前和历史感知输入进行建模,能够推理未来的状态变化,并根据推理结果采取行动。例如自动驾驶汽车,不仅感知当前环境,还维护和更新周围环境的模型。 3. 目标导向型智能体(Goalbased Agents):除了感知和行动外,还具有明确的目标,能够根据目标评估不同的行动方案,并选择最优的行动。例如机器人导航系统,有明确的目的地,并计划路线以避免障碍。 4. 效用型智能体(Utilitybased Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动的优劣,权衡利弊。例如金融交易智能体,根据不同市场条件选择最优的交易策略。 5. 学习型智能体(Learning Agents):能够通过与环境的交互不断改进其性能,学习模型、行为策略以及目标函数。例如强化学习智能体,通过与环境互动不断学习最优策略。 以下是一些关于智能体 Agent 的相关链接:
2025-02-11
ai室内设计平面图工具
以下是一些能够帮助进行 AI 室内设计平面图的工具: 1. HDAidMaster:这是一款云端工具,在建筑设计、室内设计和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster,软件 UI 和设计成果颜值在线,建筑师可使用主流 AIGC 功能进行方案创作。 2. Maket.ai:主要面向住宅行业,在户型设计和室内软装设计方面有探索,设计师输入房间面积需求和土地约束,软件能自动生成户型图并查看详细设计结果。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期阶段可引入相关标准和规范约束生成的设计结果,保证设计合规性。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,能自动导入、划分区域、识别构件、审查强条和导出结果,将建筑全寿命周期内信息集成,实现数据汇总与管理。 每个工具都有特定应用场景和功能,建议根据具体需求选择合适的工具。 关于使用 AI 进行室外设计的最佳实践包括: 1. 充分利用 AI 的创意生成能力,使用图像生成工具输入关键词生成多种方案,获取新颖灵感。 2. 结合 AI 的模拟和可视化功能,利用 AR/VR 等技术在实际环境中模拟和可视化设计方案。 3. 运用 AI 的分析和优化能力,对采光、动线、材料等方面进行优化,确保符合使用者需求。 4. 借助 AI 的自动化设计功能,自动生成符合设计规范的平面图、立面图等,提高效率。 5. 融合 AI 与人工设计的协作模式,形成良性互补,发挥各自优势。 此外,有开发者用 GPT 开发了一个相机 APP,其产品场景是利用室内设计规则和现实布局特点,重新渲染更协调的室内设计方案。优点包括自动选定室内设计主要风格和色系,找出风格不协调家具并指导调整;缺点是 Stable Diffusion 出图成功率不高,大约只有 10%,且细节存在崩坏情况,不能指导整个装修工程。
2025-02-11
我想知道如何在服务器做deepseek本地部署,作为本地知识专家
以下是在服务器进行 DeepSeek 本地部署的相关步骤: 1. 安装 AnythingLLM 软件:其安装地址为 https://useanything.com/download 。安装完成后进入配置页面,主要分为三步: 第一步:选择大模型。 第二步:选择文本嵌入模型。 第三步:选择向量数据库。 2. 构建本地知识库: 在 AnythingLLM 中创建自己独有的 Workspace 与其他项目数据进行隔离。 首先创建一个工作空间。 上传文档并且在工作空间中进行文本嵌入。 选择对话模式,AnythingLLM 提供了两种对话模式: Chat 模式:大模型会根据自己的训练数据和上传的文档数据综合给出答案。 Query 模式:大模型仅仅会依靠文档中的数据给出答案。 测试对话。 3. 实现联网版的 DeepSeek R1 大模型的核心路径:通过工作流 + DeepSeek R1 大模型。 4. 拥有扣子专业版账号:如果是普通账号,请自行升级或注册专业号后使用。 5. 开通 DeepSeek R1 大模型:访问地址 https://console.volcengine.com/cozepro/overview?scenario=coze ,打开火山方舟,找到开通管理,找到 DeepSeek R1 模型,点击开通服务,添加在线推理模型,添加后在扣子开发平台才能使用。 6. 创建智能体:点击创建,先完成一个智能体的创建。 需要注意的是,看十遍不如实操一遍,实操十遍不如分享一遍,如果您对 AI Agent 技术感兴趣,可以联系相关人员或者加免费知识星球(备注 AGI 知识库)。
2025-02-11
如何写好Prompt
写好 Prompt 可以参考以下要点: 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:避免模糊或歧义词汇,用简单清晰的表述。 4. 给出具体要求:明确格式、风格等要求。 5. 使用示例:提供期望结果的示例,助 AI 理解需求。 6. 保持简洁:避免过多信息导致 AI 困惑。 7. 使用关键词和标签:帮助 AI 理解任务主题和类型。 8. 测试和调整:生成文本后检查结果,根据需要调整。 优化和润色 Prompt 可尝试以下方法: 1. 明确具体描述:使用更具体、细节的词语和短语。 2. 添加视觉参考:插入相关图片参考。 3. 注意语气和情感:用合适的形容词、语气词调整整体氛围。 4. 优化关键词组合:尝试不同搭配和语序。 5. 增加约束条件:如分辨率、比例等限制。 6. 分步骤构建:将复杂需求拆解为子 Prompt 逐步引导。 7. 参考优秀案例:借鉴有效的范例和写作技巧。 8. 反复试验、迭代优化:多次尝试并根据效果反馈完善。 在即梦 AI 视频生成中,Prompt 是直接描述或引导视频生成的文本或指令,类似给 AI 的提示,包含主体、运动、风格等信息,影响视频内容和质量,可将输入的文字变成对应的画面和运动形式。在图片生视频和文本生视频中都有相应的输入位置。
2025-02-11