直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
如何构建一个检查word文档格式的智能体
构建一个检查 word 文档格式的智能体可以参考以下步骤: 1. 考虑到对照精读环节适合批处理形式,使用“分段输入正文”将正文分割,用 LLM 节点批处理每一段的对照精读,最终“拼合精读结果”以输出完整文本。 2. 用户输入原文时,在 AI 对话窗口中通过开场白提示用户按格式输入文章,用“”符标记标题句。 3. 用 Python 脚本去掉标题句,并把剩下内容按照段落的换行逐段输出为 Array<String>格式。附上相关 Python 代码。 4. 试运行以验证节点是否按预期运作,分次输出每一段原文。 此外,在创建智能体的知识库方面: 1. 手动清洗数据可提高准确性,如创建画小二课程的 FAQ 知识库,飞书在线文档中每个问题和答案以“”分割。 2. 对于本地 word 文件,注意不能一股脑将所有内容放入训练,应先放入大的章节名称内容,再按固定方式人工标注和处理章节内详细内容。 3. 完成后点击发布,确保在 Bot 商店中能搜到,否则无法获取 API。
2025-02-10
豆包和deepseek的区别
DeepSeek R1 与豆包存在以下区别: 1. 技术路线:DeepSeek R1 与 OpenAI 现在最先进的模型 o1、o3 一样,属于基于强化学习 RL 的推理模型。而豆包不属于此技术路线。 2. 思考方式:在回答用户问题前,DeepSeek R1 会先进行“自问自答”式的推理思考,以提升最终回答的质量,这种“自问自答”是模拟人类的深度思考。豆包可能没有这种特定的思考方式。 3. 输出效果:从相关对比来看,DeepSeek 的思考过程细腻、自洽、深刻、全面,输出结果在语气、结构、逻辑上天衣无缝,被认为碾压了包括豆包在内的其他模型。
2025-02-10
deepseek怎么样
DeepSeek 具有以下特点和表现: 华尔街分析师的反应:展示出媲美领先 AI 产品性能的模型,成本仅为一小部分,在全球主要市场的 App Store 登顶。但 Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑,高盛预测其可能改变科技巨头与初创公司的竞争格局,降低 AI 行业进入门槛。 实际使用体验:文字能力突出,尤其在中文场景中符合日常写作习惯,但在专业论文总结方面稍弱。数学能力经过优化表现不错,编程能力略逊于 GPT(据用户反馈)。采用 GRPO 算法替代传统 PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。 相关发布:深夜发布大一统模型 JanusPro,将图像理解和生成统一在一个模型中。JanusPro 是一种新型的自回归框架,统一了多模态理解和生成,通过将视觉编码解耦为独立路径解决先前方法局限性,仍利用单一统一变压器架构处理,解耦缓解视觉编码器角色冲突并增强框架灵活性,超越之前统一模型,匹配或超过特定任务模型性能,是下一代统一多模态模型有力候选者。 其他方面:爆火,价格亲民实力超群,智慧开源领航者,实时联网深度推理双冠王,用技术普惠重新定义 AI 边界,便宜开源能联网,在 Appstore 排行第一,导致算力股大跌。 其官方渠道包括微信公众号:DeepSeek,小红书:@DeepSeek(deepseek_ai),X(Twitter):DeepSeek 。模型(7B):https://huggingface.co/deepseekai/JanusPro7B ,模型(1B):https://huggingface.co/deepseekai/JanusPro1B 。
2025-02-10
明略科技:2024年中国AI Agent行业研究
以下是关于 2024 年中国 AI Agent 行业的相关研究报告: 2024 年 9 月: 《》 《》 2024 年 8 月: 《》深入分析了 AI Agent 的市场定义、发展阶段、核心组件及其在企业用户场景中的应用。 《》指出企业实施 AI Agent 的主要目标是降低运营成本,尤其是在知识库管理、数据分析、营销与客户服务等领域。 2024 年 5 月: 《》提到 AI Agent 市场处于早期阶段,其商业价值在于提升工作均值、实现行业知识库构建、改变工作流程及生产关系。未来,AI Agent 将作为数字生产力,通过与工作流的结合,成为企业知识资产积累与复用的关键角色,推动技术革命。
2025-02-10
通义千问电脑版安装
以下是通义千问电脑版的安装步骤: 1. 回到宝塔,选择 Docker。如果显示“当前未安装”,则进行安装,点击确定,等待安装完成。安装完成后,刷新当前页面,看到相应的样子即表示安装成功。 2. 打开左侧【终端】,粘贴以下两行,验证 Docker 是否可用。看见版本号则没问题。 3. 一条一条复制以下命令,依次粘贴进入。 4. 访问 OneAPI,访问地址:http://这里改成你自己宝塔左上角的地址:3001/(举例:http://11.123.23.454:3001/),账号默认 root,密码 123456。 5. 点击【渠道】,类型选择阿里通义千问,名称随意,类型不用删减。 6. 把千问里创建的 API Key 粘贴到秘钥里中,点击确认。 7. 点击【令牌】【添加新令牌】,名称随意,时间设为永不过期、额度设为无限额度,点击【提交】。 8. 点击【令牌】,会看到自己设置的,点击复制,出现 key,然后在标红那一行中,自己手动复制下来。 另外,您还可以通过以下步骤获取通义千问的模型 key:先去,点击创建 API key,复制保存即可。
2025-02-10
AIGC工程师
以下是为您整理的 AIGC 相关招聘信息: 猿印教育 AIGC 图像生成算法工程师/专家(北京五道口附近) 简历请发送至:stephen.wang@yyinedu.com 岗位职责: 面向 AIGC 领域,结合应用场景,开发针对性图像生成解决方案。 负责模型的部署和推理性能优化,确保模型在实际应用中的高效性和稳定性。 持续关注最新的技术发展和业界趋势,积极推动团队技术水平的提升,并将新技术应用到实际项目中。 任职要求: 计算机相关专业本科及以上学历,具备扎实的计算机基础知识。 熟练掌握 Python 语言,熟悉至少一种主流深度学习框架(TensorFlow/Pytorch 等)。 对深度学习和计算机视觉领域的基础理论和方法有深入理解,熟悉 DDPM,DDIM,Stable Diffusion 原理,了解 Dreambooth,ControlNet 等可控生成技术。 具有强烈的技术兴趣和钻研精神,具备良好的学习能力、沟通能力和团队合作精神。 数字银行 AIGC 产品经理(深圳) 请直接飞书联系@Eason 任职要求: 相信 AIGC:有过第一次用 chatgpt 时的兴奋,记得去年那个 AI 疯狂的 3 月份,熬夜看过 gpt4、copilot 的发布会,想过各种办法搞定 plus 账号,现在在翘首以盼 gpt5。 喜欢用:用过各种 AIGC 应用,如 GPT4,newbing,Kimi,Perplexity,Suno 等等。看到新的爆款产品,就会第一时间玩一玩。 能上手:可以简单的上手,不限于调用 api 做个小 demo,会写复杂的提示词,做一个简单的 RAG 应用,文生图、视频,微调模型等。 岗位职责: 构建赋能海量用户的大模型工程化产品,帮助某数字银行塑造技术领先性。 探索和设计工程化产品,来支持更快的 AI 原生应用构建(类似 Langchain,Llamaindex 等等,或者由您亲自来颠覆它们,做一个 Langxx,Llamaxx)。 在重点业务场景中深入探索大模型的应用落地,用最新的理念,做出真正能在海量金融业务场景中跑起来的应用(把类似 MetaGPT,AutoGen,Advanced RAG 真正落地,或者创造自己的 multi agent 应用)。 此外,3 月 2 日接龙中涉及 AIGC 相关人员的工作内容包括: 雯琋(Vinci)AIGC 不会编程但会鼓励编程。 AI 译文打杂文案。 AI 译然,AI 视频相关的都会一点,就是完全不会做网站。 Stanico,产品、运营、prompt。
2025-02-10
自由画布
自由画布是一类 AIGC 创作工具的统称,具有高度自由的创作平台,允许上传、拖拽、组合等自由创作方式,基于 AI 构建 WorkFlow 并生成内容(图文、音乐、设计、虚拟世界、运行程序等)。 ChatGPT 问世后,人类与 LLM 的交互长时间被约束在一维的、线性的文本对话框里,直到“自由画布”工具出现让人眼前一亮。 ShowMeAI 周刊整理了近期发布(更新)的一批“自由画布”类创作工具,如国产应用 Refly,它集成了“知识库+自由画布+AI 搜索+内容编辑”等功能,能覆盖主题搜索、思维拓展、在线文档、文本优化等完整创作链条的每一个环节。画布中的每个内容节点都有丰富编辑功能,节点内容可一键复制到右侧在线文档并继续编辑和优化,是全站式文本创作工具。 星流一站式 AI 设计工具的无限画布区域包括浏览视图、操作快捷键查询、图像快捷修改。浏览视图方面,可通过修改视图百分比调节画面大小,点击可回到生成最后一张图的视图,若框选图像则以被选中图像为中心,鼠标左键双击图像也能实现。操作快捷键可查看 Windows 与 mac 下的情况。图像快捷操作包括调整、使用、图片等功能,当鼠标滑动到图像会弹出快捷修改功能界面。此外,还有图像分享与信息查看功能,如滑动鼠标到图像上可查看生成信息,点击分享标志可生成分享链接与发送到 LiblibAI 等。
2025-02-10
给一段文字和场景描述,如何生成图文
以下是关于根据文字和场景描述生成图文的方法: 对于儿童绘本制作: 描述故事场景:利用 ChatGPT 或者自行构思一段适合画绘本的故事,分为场景 1/2/3/...,用一句包含环境、人物、动作的话描述每个场景。例如,故事名《Lily 的奇妙之旅》,场景 1 是“Lily 来到一个阳光明媚的森林,跳过清澈的小溪,愉快玩耍。在路上结识了一只友善的棕熊,她们成为了旅伴。” 生成场景图片:确定 prompt,包括场景和风格(一套绘本中风格词语不要改变)。为了使得熊和人物有更好的互动感,生成场景时也包括人物主角。如场景 2 的 prompt 是“Walking in a mysterious cave with glittering gems,little girl Lily wearing a yellow floral skirt,her friend brown bear,dim,dreamlike,super high details,HDsmooth,by Jon Burgerman,s 400niji 5style expressivear 3:4”。抠图时,由于只需要得到一张场景图像,使用 mj 的 region vary 工具将小女孩完全框选,在提示词中完全删除 Lily 的描述词,依次得到各个场景的图像。 对于将小说做成视频: 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 此外,还有一些创意工具的操作指引: 文生图:仅需输入文本描述,即可一键生成图片素材。操作指引为输入文本描述(关键词或场景描述等)——选择模型(注意 FLUX 模型不可商用)————开始生成——下载。 AI 翻译:支持多语种文本翻译,翻译结果实时准确。操作指引为输入原始文本——选择翻译的目标语言——开始生成。 TikTok 风格数字人:适配 TikTok 媒体平台的数字人形象上线,100+数字人模板可供选择。操作指引为输入口播文案——选择数字人角色——点击开始生成,视频默认输出语言和输入文案语言保持一致,默认尺寸为 9:16 竖版。 多场景数字人口播配音:支持生成不同场景下(室内、户外、站姿、坐姿等)的数字人口播视频。操作指引为输入口播文案——选择数字人角色和场景——选择输出类型——点击开始生成,视频默认输出语言和输入文案语言保持一致。 音频驱动多场景数字人:支持音频和场景数字人一键合成,快速生成数字人口播视频。操作指引为上传音频链接——选择数字人角色和场景——选择输出类型——点击开始生成,音频文件支持 MP3 和 WAV 格式,文件大小上限 5M。
2025-02-10
如何部署本地deepseek模型
以下是部署本地 DeepSeek 模型的步骤: 1. 拥有扣子专业版账号:如果您还是普通账号,请自行升级或注册专业号后使用。开通成功后会显示相应状态。 2. 开通 DeepSeek R1 大模型:访问地址 https://console.volcengine.com/cozepro/overview?scenario=coze ,打开火山方舟,找到开通管理,找到 DeepSeek R1 模型,点击开通服务。添加在线推理模型,添加后在扣子开发平台才能使用。添加过程包括添加模型和完成接入。 3. 创建智能体:点击创建,先完成一个智能体的创建。 需要注意的是,本地部署的版本能作为替补,很难作为长期使用的版本。
2025-02-10
如何将文字生产图文,可以发小红书
以下是将文字生成图文并适合发小红书的一些方法和要点: 1. 利用画小二的 Coze 工作流: 进行详细的参数配置,包括整体结构图、各模块的参数配置(如开始模块、Get_Video 模块、LinkReaderPlugin 模块、标题大模型、内容大模型、图片 Prompt 大模型、文生图 ImageToolPro 模块等)。 标题大模型方面,作为小红书爆款写作专家,需产出 3 个含适当 emoji 表情的标题,遵循二极管标题法等创作规则,使用爆款关键词和符合平台特性的方式创作。 内容大模型方面,产出 1 篇正文,每段含适当 emoji 表情,文末有合适的 tag 标签,遵循写作风格、开篇方法、文本结构、互动引导方法等规则,语言口语化、简短,200 字左右。 图片 Prompt 大模型方面,将输入内容转成 AI 更容易理解的绘画 Prompt。 2. 亲子共创绘本的创作流程: 对同一角色多出几个不同动作的图,方便后续多角色使用。 排版方面,根据不同需求选择工具和尺寸。如打印可选 4:3 比例,发小红书或小绿书选 3:4 竖版,制作 H5 选 9:16 竖版。PPT 是 0 门槛工具,且有好用的删除背景功能。用 PPT 另存为图片时,先另存为“增强型 Windows 源文件”格式,再用画图软件打开另存为 JPG 可得到高清图。 希望以上内容对您有所帮助。
2025-02-10