「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
微软认证AI工程师
以下是关于微软认证 AI 工程师的相关信息: MQ 老师是知乎的 AI 讲师,考过了国家工信部、微软、讯飞三个初级人工智能工程师证书,在教育行业工作 15 年以上,过去半年一直在探索教育场景中的 AI 实践。 胡凯翔是微软、讯飞认证提示词工程师,曾担任破局俱乐部企业培训和 AI+教育行动营教练,共创有约 10 万字 AI+教育手册。 韦恩是微软提示词工程师,智能体创业者,WayToAGI 共建者,多平台 Agent 开发者,企业级 AI Agent 定制专家,荣获多家 AI 开发平台的比赛奖项,有 12 年程序开发背景,是多家企业的 AI 落地顾问。
2025-03-02
安防行业如何应用好AI
在安防行业应用好 AI 可以从以下几个方面考虑: 1. 技术层面: 大模型时代,训练大模型涉及 GPU 调用、模型架构设计、数据处理、调优等多个环节,具有较高的资源门槛和技术复杂度。 2. 竞争态势: 当计算机视觉的商业化场景转向安防后,创业公司面临来自安防行业巨头的竞争。创业公司虽更懂 AI 视觉识别,但需从头学习研发硬件产品、搭建营销体系;而巨头有完善的供应链和销售体系,但需要引入 AI 技术。 大模型时代的创业公司对手从海康威视换成了资源更多、决心明确的 BAT 和字节等大公司。 3. 创新与生态: 新技术能否找到新生态至关重要,包括新的供应链、新的硬件载体、新的渠道和新的需求与用户来源。 创业公司和大公司间的竞赛结果取决于新技术能在多大程度上颠覆原有体验,新技术的进入门槛、赛道长度以及能否找到新生态。 此外,在管理方面,要善于为 AI 应用提供明确的沟通和上下文,明晰其能力边界,合理授权并监督检查,擅长任务拆解和整合以提升协作效率。同时,医保严禁 AI 自动开处方,而在其他领域如 Coinbase 全面推动 AI 应用,提高了效率并广泛应用于多个方面。
2025-03-02
如何让文生图片保持形象一致
要让文生图片保持形象一致,可以参考以下方法: 1. 首先进入文生图,填写提示词,例如“,一头白发的女孩坐在绿植和鲜花的田野里,温暖的灯光,模糊的前景”,设置常规参数生成一张图。 2. 若想以该人物为主角生成一系列其他图,将图片拖入到 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,先将保真度数值设置为 1。 3. 在没有明确指向性提示词的情况下,人物形象能保持一致,但表情、动作、服装可能产生随机变化。 4. 可以通过添加关键词来给人物换装、更改服装和表情、更改动作和表情、更改姿态、环境和表情等,比如添加“红裙子”“黑色校服、哭泣”“抱手、生气”“在花丛中奔跑、开心”“红色棒球帽,时尚卫衣,在商场逛街”。 5. 像制作典籍类作品时,可对主要人物先出一版形象照,后续所有画面用“cref”做人物一致性的操作。 通过以上一系列操作和测试,可以发现这些功能在绘制系列插画、漫画、小说插图等工作时,能保持主角形象的统一,也能根据情况做实时的调整,若后期再配合 lora,潜力非常大。
2025-03-02
深度搜索
以下是为您提供的关于深度搜索的相关信息: Jina AI 推出了 DeepSearch 功能,专为深入研究复杂问题设计,能够自动进行多轮搜索,阅读、分析搜索到的内容,推理优化答案,确保逻辑性和可靠性,且与 OpenAI Chat API 兼容,可轻松接入现有应用。相关链接: 。 在国内月活榜中,deepseek 作为聊天机器人,网址为 chat.deepseek.com,活跃用户达 7068 万人,环比变化为 24.3616%,所属公司为深度求索。
2025-03-02
prompt 知识解释
以下是关于 prompt 的知识解释: 什么是 prompt: Prompt 是您提供给模型(如 Claude)的文本,用于引发相关输出。它通常以问题或指示的形式出现,例如“为什么天空是蓝色的?”。模型给出的回答被称为“响应”“输出”或“完成”。在不同领域,Prompt 的定义有所不同。在自然语言处理领域,它通常由一个问题或任务描述组成,如“给我写一篇有关人工智能的文章”“翻译这个英文句子到法语”等。在图像识别领域,Prompt 可以是一个图片描述、标签或分类信息。 支持的语言: 支持英语,不用担心英语不好的问题,。另外,emoji 也可以使用,如?、?等。 语法规则: 1. 用英文半角符号逗号,来分隔 tag。逗号前后有空格或者换行都不影响效果。 2. 改变 tag 权重: :数值从 0.1 到 100,默认状态是 1,低于 1 就是减弱,大于 1 就是加强。 括号,权重就重 1.1 倍,每加一层括号就反向减弱 1.1 倍。 3. 进行 tag 的步数控制(高级玩法): ,数字大于 1 理解为第 X 步前为 tag1,第 X 步后变成 tag2,数字小于 1 理解为总步数的百分之 X 前为 tag1,之后变成 tag2。 每个单独的提示词叫 tag(关键词)。
2025-03-02
文生视频怎么使用?
以下是关于文生视频使用的相关信息: Vidu: Web 端访问:https://www.vidu.studio/ 极速生成,实测 30 秒最快推理速度 动漫风格,万物皆可二次元 角色可控,任意场景、任何动作,角色保持一致 精准理解,镜头、文字、动作,理解更准、生成更稳 大片质感,影视级画面和特效一键直出 Vidu 提示词指南: 如何使用“文生视频”: 如何使用“图生视频(用作起始帧)”: 如何使用“参考人物角色生成视频”: PixVerse V2: 单个视频生成(8s):8s 的视频生成需要花费 30Credits,5s 的视频生成需要花费 15Credits,且只能使用 PixVerse V2 模型,生成时请注意模型选择。目前仅支持 16:9 画面比例的视频生成。 文生视频:点击“Text to Video”,在“Model”选择“PixVerse V2”,视频时长。支持多风格的视频生成,您可以通过在提示词中加入“Anime”,“Realistic”等词语做到这点。 图生视频:点击“Image to Video”,在“Model”选择“PixVerse V2”,视频时长。图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能,如需要使用上述功能,请将模型切换至“PixVerse V1”。 文字生成视频的 AI 产品: Pika:一款非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,不过是收费的。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看这里: 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-02
有好用切免费的文字转语音工具吗
以下是一些好用且免费的文字转语音工具: 1. 飞书妙记(https://www.feishu.cn/product/minutes):飞书的办公套件之一。 2. 通义听悟(https://tingwu.aliyun.com/home):阿里推出的 AI 会议转录工具。 3. 讯飞听见(https://www.iflyrec.com/):讯飞旗下智慧办公服务平台。 4. Otter AI(https://otter.ai/):转录采访和会议纪要。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。 此外,还有一些在线 TTS 工具推荐: 1. Eleven Labs:https://elevenlabs.io/ ,是一款功能强大且多功能的 AI 语音软件,能高保真地呈现人类语调和语调变化,并能根据上下文调整表达方式。 2. Speechify:https://speechify.com/ ,是一款人工智能驱动的文本转语音工具,可作为 Chrome 扩展、Mac 应用程序、iOS 和 Android 应用程序使用,用于收听网页、文档、PDF 和有声读物。 3. Azure AI Speech Studio:https://speech.microsoft.com/portal ,Microsoft Azure Speech Studio 是一套服务,提供了支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供了自定义的语音模型。 4. Voicemaker:https://voicemaker.in/ ,可将文本转换为各种区域语言的语音,并允许创建自定义语音模型,易于使用,适合为视频制作画外音或帮助视障人士。 Hedra 也支持文字转语音,目前有 6 个语音,还可以直接上传音频。Hedra.com 放出了基础模型 Character1 的研究预览版,即日起在 http://hedra.com(桌面和移动)上提供。
2025-03-02
AI能不能帮人写小说赚钱
AI 可以帮助人写小说赚钱。例如,南瓜博士上个月参加了一场 AI 创作微信小说的比赛,尽管在提交过程中出现了一些小失误,但仍凭借 AI 的帮助获奖。此外,使用 AI 可以草拟各种类型的初稿,如博客文章、论文、宣传材料、演讲、讲座、剧本、短篇小说等。通过与 AI 系统互动,提高提示质量,能让写作效果更好。还可以将自己的文本粘贴到 AI 中,要求其改进内容、提供针对特定受众的建议、创建不同风格的草稿等。AI 也能帮助完成一些任务,如写邮件、创建销售模板、提供商业计划的下一步等。总之,合理利用 AI 能在写作方面提供支持,从而有机会通过写小说获得收益。
2025-03-02
企业本地化部署AI
企业本地化部署 AI 主要包括以下方面: RPA 与财务税务问答机器人:RPA 与 AI 结合具有多种应用和优势。操作流程简单,无需代码,适合小白和无 IT 经验者。有众多应用案例,如奥康和方太在各部门的订单处理等操作中搭建了大量脚本。封装了众多组件,还可通过触发器设置机器人每天工作。数字化包括标准化、自动化、RPA 加 AI 使机器人更智能三个阶段,交付的是动态能力,让用户自己搭建机器人。产品可本地化私有部署,面向企业有费用,私有化部署能保障数据安全,企业大模型可封装调用。RPA 有容错处理方式,但受多种因素影响。 LangChain 与 NVIDIA:NVIDIA NIM 是一系列用户友好的微服务,旨在加速企业内部生成式 AI 的部署进程。支持广泛的 AI 模型,基于强大的推理引擎和技术构建,提供无缝的 AI 推理体验。其自托管特性可保障数据安全,提供预构建容器,具有可扩展性。开始使用 NIM 可在 NVIDIA API 目录中获取多种 AI 模型,它是 NVIDIA AI Enterprise 的一部分。 从 LLM 大语言模型、知识库到微信机器人:以 windows10 系统为例,安装环境时先在系统中输入“cmd”打开命令窗口,确认是否有 python 和 pip。若没有则需安装,如安装 python 可下载安装包。部署项目时下载 COW 机器人项目并解压缩。
2025-03-02
deepseek
DeepSeek 是一家具有独特特点和影响力的公司: 1. 其秘方具有硅谷风格: 不是“中国式创新”的产物,不能简单地将其比喻成“AI 界的拼多多”或认为其秘方就是多快好省。 早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。 已成为中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷风格。 2. V3 可能是 DeepSeek 的 GPT3 时刻,未来发展充满未知但值得期待。 3. 关于提示词 HiDeepSeek: 效果对比:可通过 Coze 做小测试进行对比。 使用方法:包括搜索网站、点击“开始对话”,发送装有提示词的代码,阅读开场白后正式开始对话等步骤。 设计思路:将 Agent 封装成 Prompt 并储存于文件以减轻调试负担,实现联网和深度思考功能,优化输出质量,设计阈值系统,用 XML 进行规范设定等。 完整提示词:v 1.3。 特别鸣谢:李继刚的【思考的七把武器】提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。
2025-03-02