直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

查看图像是否由ai生成

回答

以下是关于如何判断一张图片是否由 AI 生成的相关内容:

  1. 通过画面风格、物品 bug 等细节进行辨别。但需注意,AI 在不断修正作图 bug,相关方法可能随时失效。
  2. 整体看光影,细节看结构。通过累积对 AIGC 画作分析的量,人们会在脑中自发形成一个“判断模型”,但往往是“知其然,而不知其所以然”。
  3. 从本质上分析,人类绘画创作是线性发展的过程,通常先学习线稿表达、再理解色彩搭配、随后加入光影表现等,初级画手笔触生硬但完整。而 AI 是以积累数据、扩散噪声、再降噪收束的路径来生图,不是线性创作过程,常导致同一张图中呈现出不同绘画级别的细节。
  4. 曾在小红书、B站 等自媒体平台上以真迹混同 AI 仿品的形式让大家判别,发现大家对判断哪幅图是 AI 搞的有近乎直觉的感受,但进一步询问如何看出时,多半难以迅速回答出一套章程。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

如何判断一张图片是否 AI 生成的

本篇介绍了一些通过画面风格、物品bug等细节,辨别图像是否是AI生成的若干方法。当然,就在我们完成这篇经验帖的同时,AI也在飞速地修正这些做图bug。每一分钟,这份帖子所提供的方法,可能都在失效。AI在不停学习……

如何判断一张图片是否 AI 生成的

当我们看的AI制品越来越多,找出的画面bug也渐渐归类。我们把这些判断的具体方法大致总结为「整体看光影,细节看结构」的技术要点。通过累积对AIGC画作分析的量,人们会在脑中自发形成一个「判断模型」。前面所提到的整体观感和细节结构等内容,会作为「语料」,训练出我们对作品的判断直觉。这往往会给我们带来一种「这一眼假啊」「一眼AI」的判断技能,但却很少能迅速总结出为什么。这时,我们对鉴别AIGC的认知,是「知其然,而不知其所以然」。随着我们进一步深究为什么我们能感受到画面不对经,我们会有一个逐渐明晰起来的感受——AI之所以AI,是由于其创作逻辑的非人感。也就是说,AI在作画过程中留下的各种马脚,之所以让人类觉察出「非我族类」的破绽,究其根本是AIGC画作的创作逻辑和人工画作的逻辑不同。从本质上分析,人类的绘画创作,是一个线性发展的过程。具体表现为,我们通常都是先学习线稿表达、再理解色彩搭配、随后加入光影表现等高级技巧,一步一个脚印地创作。较为初级的人类画手,可能在形体上把握不尽准确。但多半会认真地完成每一笔的刻画,笔触虽生硬但完整。天才在外,普通人很少能在掌握线条之前,就很大胆地使用光影和色彩。而AI,是以积累数据、扩散噪声、再降噪收束的路径来生图的。这个过程往往不是一个线性的有先有后的创作过程,而是一个计算猜测并筛选的螺旋迸进过程。这就导致AI作画经常会在同一张图中呈现出不同绘画级别的细节。比如线条还没整利索,色彩却能用得尽善尽美;比如前后景透视都够呛,但光影却能媲美哈苏hasselblad全彩相机。

如何判断一张图片是否 AI 生成的

我们曾经在小红书、B站等自媒体平台上发布了以「AIGC鉴别」为话题的图文,以真迹混同AI仿品的形式,让大家来判别哪张图才是列宾、穆夏等名家真实绘制的作品。在这场「鉴赏」中,我们发现——大家对「判断出哪幅图是AI搞的」这件事上,都有一种近乎直觉的感受。“这个一眼AI。”但如果进一步询问是怎么看出来的,多半很难迅速回答出一套章程,来描述或者解释为什么只需要「看一眼」,就能辨别真伪。所以我们系统地总结了「AIGC鉴别」经验帖。聊聊如何一眼盯真,两眼打假。

其他人在问
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
图像翻译
图像翻译具有以下特点和功能: 多语言支持:涵盖 18 种语言,包括中文、英文、法语、日语、韩语和西班牙语。 保护图像主体:可选择不翻译品牌名称或重要信息,避免影响关键内容。 高分辨率处理:支持高达 4000×4000 像素的图像,确保翻译后画质清晰。 原始排版恢复:保留原字体、大小及对齐方式,确保设计一致性。 多行文本合并:将多行文本合并为段落翻译,避免逐行翻译造成误解。 清除文本痕迹:翻译后干净移除原文本,并恢复图像空白区域。
2025-04-14
gpt4o图像生成提示词有哪些
以下是一些 GPT4o 图像生成的提示词示例: 1. 将这张图更改为蓝色氛围,星星图标改为魔法棒图标,同时将里面文案描述的主题改为其他的。 2. 帮我生成一张这样的 UI 设计稿:Peerlist 邀请链接界面分析,界面内容。 3. 一张逼真的照片,描绘了一匹马在宁静的海洋表面从右向左奔驰,准确地描绘了飞溅的水花。 Realistic photograph of a horse galloping from right to left across a vast,calm ocean surface,accurately depicting splashes,reflections,and subtle ripple patterns beneath their hooves.Exaggerate horse movements but everything else should be still,quiet to show contrast with the horse's strength.clean composition,cinematographic.A wide,panoramic composition showcasing a distant horizon.Atmospheric perspective creating depth.zoomed out so the horse appears minuscule compared to vast ocean.horse is right at the horizon where ocean meets sky.use rule of thirds to position horse.size of horse is 1% size of entire image because camera is so far away from subject.camera view is super close to the ground/ocean like a worm's eye view.horse is galloping right where ocean meets the sky 4. 生成一张 2006 年夏天的周六多伦多农夫市场的逼真照片,那天是六月的美好时光,人们在购物和吃三明治。焦点应是一个穿着牛仔工装裤、啜饮草莓香蕉奶昔的年轻亚洲女孩——其余部分可以模糊。照片应让人联想到 2006 年的数码相机拍摄的效果,带有像打印照片一样的日期和时间戳。画幅比例应为 3:2
2025-04-11
图像识别模型
图像识别模型通常包括编码器和解码器部分。以创建图像描述模型为例: 编码器:如使用 inception resnet V2 应用于图像数据,且大部分情况下会冻结此 CNN 的大部分部分,因为其骨干通常是预训练的,例如通过庞大的数据集如图像网络数据集进行预训练。若想再次微调训练也是可行的,但有时仅需保留预训练的权重。 解码器:较为复杂,包含很多关于注意力层的说明,还包括嵌入层、GRU 层、注意力层、添加层归一化层和最终的密集层等。 在定义好解码器和编码器后,创建最终的 TF Keras 模型并定义输入和输出。模型输入通常包括图像输入进入编码器,文字输入进入解码器,输出则为解码器输出。在运行训练前,还需定义损失功能。 另外,还有一些相关模型的安装配置,如 siglipso400mpatch14384(视觉模型),由 Google 开发,负责理解和编码图像内容,其工作流程包括接收输入图像、分析图像的视觉内容并将其编码成特征向量。image_adapter.pt(适配器)连接视觉模型和语言模型,优化数据转换。MetaLlama3.18Bbnb4bit(语言模型)负责生成文本描述。
2025-03-28
gpt4o图像生成
GPT4o 是 OpenAI 推出的具有强大图像生成能力的多模态模型,能够实现精确、准确、照片级真实感输出。其核心功能包括生成美观且实用的图像,如白板演示、科学实验图解等。亮点功能有精确的文本渲染,能在图像中准确生成文字,如街道标志、菜单、邀请函等;支持多样化场景生成,从照片级真实感到漫画风格均可;具有上下文感知能力,能利用内在知识库和对话上下文生成符合语境的内容。技术上通过联合训练在线图像和文本的分布,学会了图像与语言及图像之间的关系,经过后期训练优化,在视觉流畅性和一致性方面表现出色。实际应用场景包括信息传递、创意设计、教育与演示等。但也存在某些场景或细节的限制。安全性方面,OpenAI 强调了保护。目前该功能已集成到 ChatGPT 中,用户可直接体验。 此外,在 3 月 26 日的 AI 资讯汇总中,OpenAI 推出了 GPT4o 图像生成能力。昨晚 Open AI 更新 GPT4o 图像生成功能后,其真正强大之处在于几乎可以通过自然语言对话完成复杂的 SD 图像生成工作流的所有玩法,如重新打光、扩图、换脸、融脸、风格化、风格迁移、换装、换发型等。
2025-03-28
免费增强图像分辨率的
以下是一些免费增强图像分辨率的工具和方法: 1. Kraken.io:主要用于图像压缩,但也提供免费的图像放大功能,能保证图像细节清晰度。 2. Deep Art Effects:强大的艺术效果编辑器,通过 AI 技术放大图像并赋予艺术效果,支持多种滤镜和风格。 3. Waifu2x:提供图片放大和降噪功能,使用深度学习技术提高图像质量,保留细节和纹理,简单易用效果好。 4. Bigjpg:强大的图像分辨率增强工具,使用神经网络算法加大图像尺寸,提高图像质量,处理速度快。 此外,还有以下相关资源: 1. 【超级会员 V6】通过百度网盘分享的 Topaz 全家桶,链接:https://pan.baidu.com/s/1bL4tGfl2nD6leugFh4jg9Q?pwd=16d1 ,提取码:16d1 ,复制这段内容打开「百度网盘 APP 即可获取」。 2. RealESRGAN:基于 RealESRGAN 的图像超分辨率增强模型,具有可选的人脸修复和可调节的放大倍数,但使用几次后要收费。 3. InvSR:开源图像超分辨率模型,提升图像分辨率的开源新工具,只需一个采样步骤(支持 1 5 的材料步骤)即可增强图像,可以高清修复图像。地址、在线试用地址:https://github.com/zsyOAOA/InvSR?tab=readme ov filerailway_car online demo 、https://huggingface.co/spaces/OAOA/InvSR 。 4. GIGAGAN:https://mingukkang.github.io/GigaGAN/ 。 5. Topaz Gigapixel AI:https://www.topazlabs.com/gigapixel ai 。 6. Topaz Photo AI:https://www.topazlabs.com/ 。 7. discord:https://discord.gg/m5wPDgkaWP 。
2025-03-24
图像生成
图像生成是 AIGC 的一个重要领域,离不开深度学习算法,如生成对抗网络(GANs)、变分自编码器(VAEs)以及 Stable Diffusion 等,以创建与现实世界图像视觉相似的新图像。 图像生成可用于多种场景,如数据增强以提高机器学习模型的性能,也可用于创造艺术、生成产品图像(如艺术作品、虚拟现实场景或图像修复等)。 一些具有代表性的海外项目包括: Stable Diffusion:文本生成图像模型,主要由 VAE、UNet 网络和 CLIP 文本编码器组成。首先使用 CLIP 模型将文本转换为表征形式,然后引导扩散模型 UNet 在低维表征上进行扩散,之后将扩散之后的低维表征送入 VAE 中的解码器,从而实现图像生成。 DALLE 3(Open AI):OpenAI 基于 ChatGPT 构建的一种新型神经网络,可以从文字说明直接生成图像。 StyleGAN 2(NVIDIA):一种生成对抗网络,可以生成非常逼真的人脸图像。 DCGAN(Deep Convolutional GAN):一种使用卷积神经网络的生成对抗网络,可生成各种类型的图像。 在图像生成的用法方面,图像生成端点允许您在给定文本提示的情况下创建原始图像。生成的图像的大小可以为 256x256、512x512 或 1024x1024 像素。较小的尺寸生成速度更快。您可以使用 n 参数一次请求 1 10 张图像。描述越详细,就越有可能获得您或您的最终用户想要的结果。您可以探索 DALL·E 预览应用程序中的示例以获得更多提示灵感。 图像编辑端点允许您通过上传蒙版来编辑和扩展图像。遮罩的透明区域指示应编辑图像的位置,提示应描述完整的新图像,而不仅仅是擦除区域。 AI 绘图 Imagen 3 具有以下功能点和优势: 功能点: 图像生成:根据用户输入的 Prompt 生成图像。 Prompt 智能拆解:能够自动拆解用户输入的 Prompt,并提供下拉框选项。 自动联想:提供自动联想功能,帮助用户选择更合适的词汇。 优势: 无需排队:用户可以直接使用,无需排队。 免费使用:目前 Imagen 3 是免费提供给用户使用的。 交互人性化:提供了人性化的交互设计,如自动联想和下拉框选项。 语义理解:具有较好的语义理解能力,能够根据 Prompt 生成符合描述的图像。 灵活性:用户可以根据自动联想的功能,灵活调整 Prompt 以生成不同的图像。
2025-03-23
兼职督学岗位,通过飞书平台为高中生服务,包括:1)解答学习方法等疑问;2)发送测试卷;3)提交测试卷后通知后端制作学习计划;4)发送学习计划链接;5)定期推送知识点和打卡提醒;6)查看打卡并反馈。所有文档通过飞书云文档链接发送。现在我想通过利用coze将deepseek等ai接入飞书的形式,制作出产品赋能督学在这一岗位的工作效率,并希望在这一过程中,锻炼我的ai能力,再想办法让上司或者老板为我这个产品支付报酬,请问我可以从哪些角度开发产品?
以下是一些您可以从以下角度开发产品来赋能兼职督学岗位的工作效率,并锻炼您的 AI 能力,以争取上司或老板为产品支付报酬: 1. 利用 Coze 的多语言模型支持,为解答高中生学习方法等疑问提供更准确和全面的回答。 2. 借助插件系统,集成与学习相关的插件,如学习资料查询、学习工具推荐等,丰富服务内容。 3. 运用知识库功能,上传各类学科知识点、优秀学习案例等,方便在服务中快速调用和推送。 4. 利用数据库和记忆能力,记住每个高中生的学习情况和需求,提供个性化服务。 5. 设计工作流,例如自动发送测试卷、自动通知后端制作学习计划、自动推送学习计划链接等流程,提高工作效率。 6. 采用多代理模式,针对不同学科或学习阶段设置专门的代理,提供更精准的服务。 7. 利用 Coze 易于发布和分享的特点,将服务产品推广给更多需要的高中生和督学人员。
2025-02-18
兼职督学岗位,通过飞书平台为高中生服务,包括:1)解答学习方法等疑问;2)发送测试卷;3)提交测试卷后通知后端制作学习计划;4)发送学习计划链接;5)定期推送知识点和打卡提醒;6)查看打卡并反馈。所有文档通过飞书云文档链接发送。现在我想通过利用coze将deepseek等ai接入飞书的形式,制作出产品赋能督学在这一岗位的工作效率,并希望在这一过程中,锻炼我的ai能力,再想办法让上司或者老板为我这个产品支付报酬,请问我可以从哪些角度开发产品?又该如何将它推销给上司?
以下是关于您利用 Coze 和 DeepSeek 等 AI 接入飞书来赋能兼职督学岗位工作效率的一些建议: 开发产品的角度: 1. 智能答疑系统:利用 AI 技术,对高中生常见的学习方法疑问进行自动分析和回答,提高答疑效率和准确性。 2. 个性化测试卷生成:根据学生的学习情况和需求,通过 AI 生成个性化的测试卷。 3. 学习计划优化:基于学生提交的测试卷结果,利用 AI 更精准地制定学习计划。 4. 知识点精准推送:运用 AI 分析学生的学习进度和薄弱环节,定期推送更具针对性的知识点。 5. 打卡提醒优化:通过 AI 实现更灵活、个性化的打卡提醒方式。 推销给上司的方法: 1. 展示效率提升:详细说明产品如何大幅提高兼职督学的工作效率,节省人力和时间成本。 2. 个性化服务优势:强调产品能够为高中生提供更个性化、精准的服务,提升学习效果。 3. 数据支持:提供相关的数据和案例,证明 AI 赋能后的积极效果。 4. 成本效益分析:说明开发和使用该产品的成本相对较低,而带来的收益显著。 5. 未来发展潜力:阐述产品在不断优化和拓展功能方面的潜力,适应更多的教育需求。 另外,Coze 是由字节跳动推出的 AI 聊天机器人和应用程序编辑开发平台,专为开发下一代 AI 聊天机器人而设计。它具有多语言模型支持、插件系统、知识库功能、数据库和记忆能力、工作流设计、多代理模式、免费使用、易于发布和分享等特点。这些特点可以为您的产品开发提供有力支持。
2025-02-18
可以查看GPTs是怎么设置的吗
以下是关于 GPTs 设置的详细步骤: 1. 放入完整的 Schema,并点击 Format 进行验证,如果不报错并显示出 Available Action 的列表,则代表成功。 2. 进行授权,输入 ClientID YOUR_ACCESS_KEY,如 ClientID 123456,并点击 Save。 3. 点击对应 Action 的 Test 验证 Action 是否可以调用。如果遇到返回数据过多造成异常的情况,也代表成功,只需在提示词中限定接口返回的数量即可。 4. 为了 GPTs 后期发布和分享,需要配置 Privacy Policy,其位置一般在网站的底部或者菜单的底部。复制 Privacy Policy 网页地址,如 Privacy policy 地址为:https://unsplash.com/privacy 。 5. 完善 GPTs 的基本配置。 6. 提示词调用方面,根据图片中各个对应关系,执行的操作需要指定 action 的名称,需要显示的字段名称指定具体的位置,比如图片作者,则使用 user.name,这样更加精确,不容易出错。完整提示词如下。注意,如果遇到图片目前无法直接显示,可以使用下载链接的方式查看,如下为应对方案的提示词和效果。如果有更好的方案,欢迎提供。 实操配置 Gapier Actions API 的步骤如下: 1. 登录地址:,点击 Copy Link 进行复制 Actions API 链接。 2. 打开 ChatGPT,点击创建 GPTs>Configure>Create new action。了解平台上支持的功能,输入来自 Gapier 的 Actions API 并点击 Import,导入成功。 3. 在 Gapier 复制授权码用于授权。在 Authentication 下选择配置图标,进入授权页面。开始配置授权码: Authentication Type:选择 API Key Auth Type:选择 Basic 输入从网站上复制的授权码,并点击 Save。若需要分享给他人或者公开发布,需要配置隐私策略码,在网页上寻找并复制,回到 GPT 上进行配置。 4. 确定调用的 Action,并在 Prompt 中引用。查看 Action 的方式分为两种,方式一:GPTs>Configure>Actions 页面;方式二:网页查看,地址为。回到 GPT>Configure 页面,引用 Action,比如调用思维导图的 API,直接输入调用 GenerateMindMap API 即可。此外,另外一种引用的方式是:只要在 Instructions 中申明清楚需求,GPT 会自动选择合适的 API。保存后试用。 创建一个 Http 服务让 GPTs 调用的步骤如下: 1. 创建一个每次产生一个随机数的 Http 服务,体验地址如下:https://gptaction.iaiuse.com/api/random 。 2. 直接在 Instructions 里面写,让它去调用接口。窗口最下面有个 Actions,这里就可以设置它和外部系统的接口。 3. 打孔 Add actions 界面,录入相关代码在 Schema 里面。点击下面的 Test 按钮,就能看到 ChatGPT 如何和服务进行交互。第一次允许它会提示是否允许外部服务,点击右边的小三角可以看到对话框,最右边那个隐私政策就是前面设置的。针对每个 action 都可以设置独立的隐私政策。通过这样一个简单的示例,了解 GPTs 如何和外部的服务进行交互,扩展它的能力。
2025-02-09
查看deepseek v3 技术报告
以下是关于 DeepSeek V3 的相关信息: Andrej Kaparthy 赞扬 Deepseek 的技术报告值得一读。 很多中国人将 DeepSeekV3 视作“国货之光”,它对高性能算力的依赖小,将训练和推理当作一个系统,给出诸多新的技术思路,注重用工程思维高效解决算法和技术问题。 DeepSeek 的创始人梁文锋出生于 1980 年代,来自广东省的一个五线城市,毕业于浙江大学,主修软件工程,本硕,人工智能方向,非常低调。 阅读 DeepSeek V3 的技术报告列出的研发人员名单近 200 人,均为本土 CS,很多核心是清北及大学应届的 CS 硕博,即便核心人员也是毕业 3 5 年 CS 博士,研发人员充分信任不断自我选择,这是中国最像 OpenAI 研发组织分工和氛围的 AI 研究机构。 您可以通过以下链接获取相关技术报告:
2025-01-31
Coze + 飞书 + 飞书多维表格:通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出。由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,无需开发任何插件、APP,能实现跨平台的稍后读收集与智能阅读计划的推荐。其设计思路包括简化“收集”,实现跨平台收集和通过输入 URL 完成收集;自动化“整理入库”,自动整理关键信息并支持跨平台查看;智能“选择”推荐,根据收藏记录和用户兴趣生成阅读计划——这个方法具体如何操作?
以下是关于通过飞书机器人与 Coze 搭建的智能体进行对话,并利用飞书多维表格存储和管理稍后读数据,实现跨平台的稍后读收集与智能阅读计划推荐的具体操作方法: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口完成收集输入。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用飞书·稍后读助手: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。但目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 至此,专属 AI 稍后读智能体大功告成,您可以尽情享受相关服务。
2025-01-27
如何查看文章是否是ai生成的?
以下是一些常用的查看文章是否为 AI 生成的方法和工具: 1. Turnitin:这是一个广泛使用的学术剽窃检测工具,最近增加了检测 AI 生成内容的功能。使用时,用户上传论文,系统会自动分析文本并提供详细报告,标示出可能由 AI 生成的部分。 2. Copyscape:主要用于检测网络上的剽窃行为,虽不是专门的 AIGC 检测工具,但能发现可能被 AI 生成的重复内容。输入文本或上传文档,系统会扫描网络查找相似或重复内容。 3. Grammarly:提供语法检查和剽窃检测功能,其剽窃检测部分可帮助识别可能由 AI 生成的非原创内容。将文本粘贴到 Grammarly 的编辑器中,选择剽窃检测功能,系统会提供分析报告。 4. Unicheck:基于云的剽窃检测工具,适用于教育机构和学术研究,可检测 AI 生成内容的迹象。上传文档或输入文本,系统会分析并生成报告,显示潜在的剽窃和 AI 生成内容。 5. :专门设计用于检测 AI 生成内容,使用先进算法分析文本,识别是否由 GPT3 或其他 AI 模型生成。上传文档或输入文本,系统会提供详细报告。 6. :提供免费的 AI 内容检测工具,可识别文本是否由 AI 生成。将文本粘贴到在线工具中,点击检测按钮,系统会提供分析结果。 7. GPTZero:专门设计用于检测由 GPT3 生成内容,适用于教育和出版行业。上传文档或输入文本,系统会分析并提供报告,显示文本是否由 GPT3 生成。 8. Content at Scale:提供 AI 内容检测功能,帮助用户识别文本是否由 AI 生成。将文本粘贴到在线检测工具中,系统会分析并提供结果。 此外,AIGC(人工智能生成内容)是利用人工智能技术生成各种类型内容的应用方式,在内容创作、广告、媒体等领域广泛应用,包括文字、图像、视频生成等。AIGC、UGC(用户生成内容)和 PGC(专业生成内容)是内容生成的不同方式,主要区别在于内容的创作者和生成方式。UGC 由用户生成,内容丰富多样,适用于社交媒体等平台;PGC 由专业人士或机构生成,内容质量高、专业性强,适用于新闻媒体等平台;AIGC 由人工智能生成,可快速大规模生成内容,适用于自动化新闻等场景。
2025-01-19
生成提示词的提示词
以下是关于生成提示词的相关内容: 生成提示词的思路和方法: 可以根据效果好的图片中的高频提示词去反推效果,结合不同字体效果的描述,打包到一组提示词中。提示词给到 AI 后,AI 会根据给定文字的文义,判断适合的情绪风格,然后给出适合情绪的字体和风格描述、情感氛围等,加上一些质量/品质词,形成输出提示词结构。为了让 AI 更能描述清晰风格,可以先给定多种参照举例。 具体操作步骤: 打开 AI 工具的对话框,将相关提示词完整复制粘贴到对话框。推荐使用 ChatGPT 4o。 当 AI 回复后,发送您想要设计的文字。可以仅发送想要的文字,也可以发送图片(适合有多模态的 AI)让 AI 识别和反推。 将 AI 回复的提示词部分的内容复制到即梦 AI。 对生成提示词的一些观点: 提示词生成提示词并非必要,不一定能生成最好的 Prompt 框架,修改过程可能耗时且不一定能修改好,不如花钱找人写。 一句话生成完整符合需求的 Prompt 非常困难,只能大概给出框架和构思,需要更低成本地调整需求和修改 Prompt。 不同生图工具生成提示词的特点: 即使是简短的描述,生成的提示词也非常细节、专业。 会解析需求,找出核心要点和潜在的诠释点,并给出不同的提示词方案。 提示词构建更多在于增强,而不是发散,生成的内容更符合期望。 同时生成中、英双版本,国内外工具通用无压力。 14 款 AI 生图工具实测对比: 本次实测用到的工具包括国内版的即梦 3.0(https://jimeng.jianying.com/aitool/home)、WHEE(https://www.whee.com)、豆包(https://www.doubao.com/chat)、可灵(https://app.klingai.com/cn/texttoimage/new)、通义万相(https://tongyi.aliyun.com/wanxiang/creation)、星流(https://www.xingliu.art)、LibiblibAI(https://www.liblib.art),以及国外版的相关工具。
2025-04-20
有没有能根据描述,生成对应的word模板的ai
目前有一些可以根据描述生成特定内容的 AI 应用和方法。例如: 在法律领域,您可以提供【案情描述】,按照给定的法律意见书模板生成法律意见书。例如针对商业贿赂等刑事案件,模拟不同辩护策略下的量刑结果,对比并推荐最佳辩护策略,或者为商业合同纠纷案件设计诉讼策略等。 在 AI 视频生成方面,有结构化的提示词模板,包括镜头语言(景别、运动、节奏等)、主体强化(动态描述、反常组合等)、细节层次(近景、中景、远景等)、背景氛围(超现实天气、空间异常等),以及增强电影感的技巧(加入时间变化、强调物理规则、设计视觉焦点转移等)。 一泽 Eze 提出的样例驱动的渐进式引导法,可利用 AI 高效设计提示词生成预期内容。先评估样例,与 AI 对话让其理解需求,提炼初始模板,通过多轮反馈直至达到预期,再用例测试看 AI 是否真正理解。 但需要注意的是,不同的场景和需求可能需要对提示词和模板进行针对性的调整和优化,以获得更符合期望的 word 模板。
2025-04-18
如何自动生成文案
以下是几种自动生成文案的方法: 1. 基于其它博主开源的视频生成工作流进行优化: 功能:通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 涉及工具:Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。 大体路径:通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频;发布 coze 智能体到飞书多维表格;在多维表格中使用字段捷径,引用该智能体;在多维表格中创建自动化流程,推送消息给指定飞书用户。 2. 生成有趣的《图文短句》: 实现原理: 先看工作流:包括第一个大模型生成标题、通过“代码节点”从多个标题中获取其中一个(可略过)、通过选出的标题生成简介、通过简介生成和标题生成文案、将文案进行归纳总结、将归纳总结后的文案描述传递给图像流。 再看图像流:包括提示词优化、典型的文生图。 最终的 Bot 制作以及预览和调试。 3. 腾讯运营使用 ChatGPT 生成文案: 步骤:通过 ChatGPT 生成文案,将这些文案复制到支持 AI 文字转视频的工具内,从而实现短视频的自动生成。市面上一些手机剪辑软件也支持文字转视频,系统匹配的素材不符合要求时可以手动替换。例如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类 AI 视频制作工具让普罗大众生产视频变得更轻松上手。
2025-04-15
如何通过输入一些观点,生成精彩的口播文案
以下是通过输入观点生成精彩口播文案的方法: 1. 基于其它博主开源的视频生成工作流进行功能优化,实现视频全自动创建。 效果展示:可查看。 功能:通过表单输入主题观点,提交后自动创建文案短视频,并将创建完成的视频链接推送至飞书消息。 涉及工具:Coze平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。 大体路径: 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 发布 coze 智能体到飞书多维表格。 在多维表格中使用字段捷径,引用该智能体。 在多维表格中创建自动化流程,推送消息给指定飞书用户。 2. 智能体发布到飞书多维表格: 工作流调试完成后,加入到智能体中,可以选择工作流绑定卡片数据,智能体则通过卡片回复。 选择发布渠道,重点是飞书多维表格,填写上架信息(为快速审核,选择仅自己可用),等待审核通过后即可在多维表格中使用。 3. 多维表格的字段捷径使用: 创建飞书多维表格,添加相关字段,配置后使用字段捷径功能,使用自己创建的 Coze 智能体。 表单分享,实现填写表单自动创建文案短视频的效果。 4. 自动化推送:点击多维表格右上角的“自动化”,创建所需的自动化流程。 另外,伊登的最新 Deepseek+coze 实现新闻播报自动化工作流如下: 第一步是内容获取,只需输入新闻链接,系统自动提取核心内容。开始节点入参包括新闻链接和视频合成插件 api_key,添加网页图片链接提取插件,获取网页里的图片,以 1ai.net 的资讯为例,添加图片链接提取节点,提取新闻主图,调整图片格式,利用链接读取节点提取文字内容,使用大模型节点重写新闻成为口播稿子,可使用 Deepseek R1 模型生成有吸引力的口播内容,若想加上自己的特征,可在提示词里添加个性化台词。
2025-04-15
小红书图文批量生成
以下是关于小红书图文批量生成的详细内容: 流量密码!小红书万赞英语视频用扣子一键批量生产,这是一个保姆级教程,小白都能看得懂。 原理分析: 决定搞之后,思考生成这种视频的底层逻辑,进行逆推。这种视频由多张带文字图片和音频合成,带文字图片由文字和图片生成,文字和图片都可由 AI 生成,音频由文字生成,文字来源于图片,也就是说,关键是把图片和文字搞出来。 逻辑理清后,先找好看的模版,未找到好看的视频模版,最后看到一个卡片模版,先把图片搞出来,才有资格继续思考如何把图片变成视频,搞不出来的话,大不了不发视频,先发图片,反正图片在小红书也很火。 拆模版: 要抄这种图片,搞过扣子的第一反应可能是用画板节点 1:1 去撸一个,但扣子的画板节点很难用,Pass 掉。用 PS 不行,太死板不灵活,html 网页代码可以,非常灵活。经过 2 个多小时和 AI 的 battle,用 html 代码把图片搞出来了。这里不讲代码怎么写,直接抄就行。要抄,首先要学会拆,不管用什么方式批量生成这样的图片,都必须搞清楚里面有哪些是可以变化的参数,也就是【变量】,如主题、主题英文、阶段、单词数、图片、正文、翻译、普通单词、重点单词等。 想方法: 大概知道批量生成这样的图片需要搞清楚哪些参数,图片用 html 代码搞出来了。但问题是视频怎么搞,这种视频由多张不同的【带文字的图片】生成,比如读到哪句,哪句就高亮起来,图片也可以随着读到的句子变更。最后,视频就是用这样的图片一张张拼起来的。
2025-04-14
ai如何什么生成表格
AI 生成表格通常可以通过以下技术实现: 1. 利用变分自编码器(VAEs)和序列到序列模型(Seq2Seq)等技术生成表格文件、表格公式,并清理、创建、转换和分析表格中的文本数据,例如表格结构设计、数据分析表、表格自动化等。 2. 借助一些办公软件中的 AI 插件,如飞书中的相关插件,先通过 AI 理解图片中的内容并填充到表格列中,然后利用自带插件总结生成相关指令。 此外,在多模态数据生成中,结构化数据生成包括表格生成,多模态合成数据从大类来看有非结构化数据(图片、视频、语音等)和结构化数据(表格等)两大类。非结构化数据生成包括文本生成、图像生成、音频和语音生成、视频生成、3D 生成、合成数据生成等。
2025-04-14