Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI开发游戏

Answer

以下是用国产 AI 开发游戏的过程:

  1. 元素设计:
    • 狼:图片放进去,调整大小。
    • 栅栏:图片放进去,调整大小。
    • 洞:调整背景颜色,让 AI 提供。
    • 槌子:点一下转动,实现方式从动画效果改为点一下马上旋转 90 度,放开时恢复,点击时洞的高度变短。
    • 羊:生成 20 只羊时出现重叠问题,通过让 AI 调整每只羊间隔 10PX 解决。控制羊的移动花费较多时间,重写多轮代码。
  2. 图片生成:
    • 直接让智普生成羊、狼、锤子、栅栏、胜利图片、失败图片。其中羊、狼、锤子、栅栏生成无背景的,用 PS 做成透明 PNG。栅栏和胜利、失败图片生成多次。
  3. 框架搭建:
    • 让智普生成 HTML 的大框架,验证元素摆放位置。生成的 HTML 代码简洁,CSS 结构不错但 position 定位模式不对,修改为 position:fixed 修复 BUG。
  4. 效果制作:
    • 失败判断在羊的跑的动作中实现,羊跑光显示失败图像。
    • 胜利判断在槌子事件中,洞全部修好即胜利。
    • 第二关在胜利时多一个步骤跳转到第二页,复制代码并修改,增加一只凶狠的狼,用 AI 作图。
  5. 完成与测试:
    • 2024 年 5 月 11 日 17:34:04 完成所有内容,上传服务器测试,存在小 BUG 但先凑合用。

开发过程中发现 AI 生成的内容不能完全信任,可能 90%能用,但剩下 10%需要人工调整,学习还是有必要的,AI 只是辅助,有条件问专家是好的解决方案。

Content generated by AI large model, please carefully verify (powered by aily)

References

案例教程:记一次用国产AI开发游戏给孩子玩

狼:不用动,没啥动作栅栏:从上到下完整的一条杆子,做个洞的DIV。洞:和栅栏一样宽度,和背景草坪一个颜色,高度变0的时候就是修好了。放在顶部,这样羊的动作简化很多,只要向右移动就好了槌子:点一下转动,代表在修栅栏,然后洞变短。羊:在左边,向右移动。不管狼了,反正看起来就是没掉了,直接超出屏幕就消失。然后下一只。开发过程:狼:不用动,就是图片放进去,调整一下大小,完成了。栅栏:从上到下图片放进去,调整一下大小,完成了。洞:调整背景颜色,叫AI给一个,然后背景颜色也这时候改进去。槌子:点一下转动几度,结果AI给的代码发现没有实现动的动画,那我直接简化?事实证明确实还行。改成这样了:点一下,马上旋转90度,不要动画效果了。放开的时候恢复。然后点击的时候洞的高度变短,代表在修复洞口。羊:这个部分最费时了。生成20只羊,实现后发现羊都重叠在一起了,看不出来,然后叫AI每只羊间隔10PX,还行。找到第一只,向右移动,结果AI给的代码,所有的羊都在动。重写了好几轮。后来写出了第一只羊可以动了,叫它写到屏幕右边的时候删除这只羊。然后要动下一只羊,又没思路了。还是叫AI写。把前面的羊的代码给AI,说我要动完第一次羊,删除这个羊,然后下一只羊继续跑出来。

案例教程:记一次用国产AI开发游戏给孩子玩

2024年5月11日14:14:28开始直接智普,叫它生成羊,狼,锤子,栅栏,胜利图片,失败图片其中:羊,狼,锤子,栅栏叫它生成没有背景的。然后用PS做成透明PNG。因为东西相对简单,所以都是一次过。栅栏生成了比较多次,因为我自己也想像不出来要啥样的比较好,只能生成多个看效果。胜利图片,失败图片,也生成了多次,因为AI无法理解我要的东西,我需要狼,人,羊都在一个画面。目前生成的也不是很理想。直接智普,图片先不放进去。叫它生成HTML的大框架,验证是否能够生成我期望的各个元素的摆放位置。生成HTML代码比较简洁,符合期待。多生成了js现在没啥用,因为JS是属于后期的事情,需求还没给,所以现在不管。到时候写业务逻辑了重新单独写。生成的CSS结构不错,但是position的定位模式不对,导致羊和狼的位置错误。为了快速完成,我直接修改position:fixed;修复该BUG。(个人感觉:AI生成的东西还是不能完全信任,可能有90%能用,但是剩下的10%还是需要有经验的人,或者说是专家进行人工调整。这个让我对于AI生成的其他东西也不敢完全信任。自己学习还是有必要的AI就是个辅助,不知道的东西,有条件的话,问专家应该还是很好的解决方案。)2024年5月11日15:52:52 UI和HTML完成,开始制作JS效果

案例教程:记一次用国产AI开发游戏给孩子玩

这个又是改了几轮,然后才行。(感觉AI要出现人工需要的东西,可能需要多轮干预才行。比我期望的差一些些。)失败判断:失败其实这个是放在羊的跑的动作里头实现的,就是羊跑光了,显示失败图像。胜利判断:放在槌子事件里头判断。洞全部修好,就胜利。第二关:胜利的时候多一个步奏跳转到第二页,第二页完全复制刚刚的代码,改改用,就是加一只长相凶狠点的狼,还是AI作图。其他没有了。2024年5月11日17:34:04完成所有内容,并上传到服务器,测试了几下。时间到了,要回去给孩子用了。先这样凑合用吧,还是有一点点小BUG的。

Others are asking
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
你知道哪些ai游戏
以下是为您介绍的一些 AI 游戏: 1. 《Suck Up!》:这是一款由 Proxima 工作室开发的“喜剧欺骗游戏”。玩家在游戏中扮演吸血鬼,通过换装、与 LLM 驱动的 NPC 对话来使其放下警惕,最终成功吸血足够多的居民获得胜利。上线仅三周,在全网播放火速突破千万,在 youtube 上引起大量关注,评论区网友赞不绝口,主创对其未来很有信心。 2. 《PUBG:BATTLEGROUNDS》:其中的 AI 队友可帮助玩家寻找战利品、驾驶载具,并协作完成目标。能模拟真人队友行为,实时分析战场情况,互动分享战利品并提供战略建议,提升了游戏中的战术协作性和乐趣。 3. 采用 NVIDIA ACE 全新 AI 游戏角色引擎的游戏:让 NPC 拥有感知、思考、决策和行动能力,可与玩家互动、适应环境变化,并根据玩家行为进行调整,成为“活角色”。
2025-04-08
有AI+游戏的最新案例吗
以下是一些 AI+游戏的最新案例: 由 5 人独立游戏工作室 Proxima 开发的 AI 冒险独立游戏 Suck Up!上线三周油管播放超千万。这是一款沙盒社交冒险游戏,团队尝试加入了名为 Nemo 的 AI NPC,基于 LLM 驱动,Nemo 能在接收到用户命令或其他线索后,调动感知、记忆,并转化为可执行的游戏行动。去年上半年,该工作室因获得 160 万美元投资引起轰动,上线后也受到资本关注。玩家对其玩法和模式提出了很多创意想法,如设计成就系统、上线多人模式等。 开发者正在使用 AI 生成音乐来填充游戏过程与游戏 UI 中需要使用到的各类音效、不同游戏场景中用以渲染氛围的各种音乐。像 MusicLM 等模型已经支持生成多音轨的作品。 2023 年 Genfun.ai 和 Meshy 联合制作的游戏《Soul Chronicle》,是首款实时 3D+AIGC+UGC 的 MMO 手游,最大突破是制作出了与游戏完美融合的 3D AIGC 技术,可在游戏中实时生成角色皮肤。 2024 年 Bitmagic 释出的《Roleverse》平台,可在平台内使用提示在游戏内定制角色,对角色进行缩放、挤压和拉伸,也能轻松对游戏世界进行编辑。 AI 技术在游戏行业的应用由来已久,且不断发展。从最初的简单内容和随机元素生成,到辅助游戏设计,再到如今能够生成更复杂的游戏内容,如动态场景、智能 NPC 行为等。AI 对游戏创作的影响包括美术与风格、剧情与叙事、关卡与玩法、音效与音乐、测试与优化等方面。同时,AI 能基于玩家游戏行为评估玩家技能水平和游戏风格,动态调整游戏难度等,提升玩家体验。此外,游戏还能成为 AI 模型能力的最佳试验场。
2025-04-01
小白如何通过学习AI跨行进入游戏行业
对于小白想要通过学习 AI 跨行进入游戏行业,以下是一些建议: 1. 学习基础的 AI 知识:包括机器学习、深度学习的基本概念和算法,了解常见的模型如神经网络等。 2. 掌握相关编程语言:例如 Python,它在 AI 开发中广泛应用。 3. 研究游戏中的 AI 应用:了解游戏中的智能角色、路径规划、策略制定等方面是如何运用 AI 技术的。 4. 实践项目:通过参与开源项目或自己创建小型的游戏 AI 项目,积累实际经验。 5. 学习游戏开发知识:了解游戏引擎、游戏设计原则等,以便更好地将 AI 技术融入游戏开发中。 6. 参加相关培训课程或在线学习资源:获取系统的学习和指导。 7. 建立人脉:与游戏行业的专业人士交流,了解行业动态和需求。 8. 制作优秀的作品集:展示自己在游戏 AI 方面的成果和能力,增加求职竞争力。
2025-03-21
什么AI软件可以做游戏
以下是一些可以用于制作游戏的 AI 软件和工具: 1. Scenario 和 Iliad:可以创建游戏资源。 2. Promethean:能够构建整个虚拟世界的平台。 3. Inworld、Charisma 和 Convai:可用于生成非玩家角色(NPC)。 4. AI Dungeon 和 Hidden Door:基于文本的游戏。 5. 用于抠图的 remove,可以直接抠图或在 PS 里安装操作,用于制作素材。 6. Aive 可尝试制作背景音乐,但可能难以满足要求,可利用分离人声的 AI 软件处理音乐。 7. 微软 AI 语音:可制作旁白,语音库支持 147 种语言,还有定制声音。 8. Cursor:通过对话获得代码,使用的语言模型包括 Claude3.5sonnet、GPT4o 等,指令详细效果更好。 9. Deepseek(新手推荐):方便获取游戏代码,国内能访问,网页登录方便,目前完全免费。 10. 通义灵码:在 Pytharm 中安装插件使用。 11. JetBrains 自身的助手插件:在 Pytharm 中安装,收费,有 7 天免费试用。 12. Marscode 及 Tencent cloud AI code Assistant 等。 13. 无影的晓颖 AI 助手:内置在云电脑里,使用流畅,但需要在无影的云电脑中。 需要注意的是,AI 不太可能完全取代人类艺术家在高质量 AAA 游戏中的工作和愿景,但会为其注入动力,提高效率和降低成本。同时,不同的 AI 工具在生成游戏的不同方面各有优势,具体使用效果可能因个人需求和实践而有所不同。
2025-03-21
AI可以做游戏吗
AI 可以做游戏。生成式 AI 有望在游戏中发挥重要作用,能使生产高质量游戏变得更简单、快速和低成本,让玩家定制游戏体验。 例如,像 Scenario、Iliad 这样的工具可以创建游戏资源,Promethean 这样的平台能构建虚拟世界,Inworld、Charisma、Convai 等产品能生成非玩家角色(NPC)。基于文本的游戏如 AI Dungeon 和 Hidden Door 也是早期例子。 在游戏制作方面,最受欢迎的游戏成本高昂,开发人员需生成大量媒体资源。但 AI 不会完全取代人类艺术家,而是为其注入动力,让他们更高效工作,更快更低成本发布游戏。 像 Microsoft Flight Simulator 这样的游戏通过与 blackshark.ai 合作,利用 AI 从 2D 卫星图像生成逼真的 3D 世界。未来,游戏制作中涉及的每个资产都可能有生成式 AI 模型,内容价格将大幅下降,生产时间和成本也会大幅降低。 随着游戏中生成式人工智能革命的进展,它将重塑用户生成内容(UGC),使任何人都能创建游戏,游戏创作将变得民主化,创造出更多新的游戏制作者。
2025-03-21
有什么使用AI驱动的游戏项目吗?其中有哪些比较热门
以下是一些使用 AI 驱动的游戏项目及热门情况: 1. 《Among Us》:由只有 5 名员工的工作室 Innersloth 制作。 2. 《微软模拟飞行》:有新的游戏类型和与新内容实时生成结合的特点。 3. 《AI Dungeon》和《Hidden Door》:基于文本的早期游戏例子。 4. 《Suck Up!》:2023 年 12 月由 Proxima 工作室开发的“喜剧欺骗游戏”,玩家扮演吸血鬼与 LLM 驱动的 NPC 对话,上线仅两周全网播放火速突破千万。 此外,还有以下趋势和特点: 1. 由人工智能辅助的“微型游戏工作室”逐步崛起,小型工作室能创造的游戏规模将增长。 2. 每年发布的游戏数量会增加。 3. 新的游戏类型将会被创造出来,例如以人工智能创造的角色为特色的 Spellbrush 的 RPG 游戏 Arrowmancer。 4. 有的游戏开发商使用人工智能让玩家在游戏中创建自己的头像。 生成式 AI 将使生产高质量游戏变得更加简单、更快和更便宜,同时使玩家能够真正定制他们的游戏体验。我们已经看到像 Scenario、Iliad 这样可以创建游戏资源的 AI 工具,以及像 Promethean 这样可以构建整个虚拟世界的平台。甚至可以用像 Inworld、Charisma 和 Convai 这样的产品生成非玩家角色(NPC)。
2025-03-18
stable video diffusion开发
以下是关于 Stable Video Diffusion 开发的相关信息: SVD 介绍: 简介:Stable Video Diffusion 是 Stability AI 于 2023 年 11 月 21 日发布的视频生成式大模型,用于高分辨率、先进的文本到视频和图像到视频生成的潜在视频扩散模型。它支持多种功能,用户可调整多种参数,但对硬件要求较高,支持的图片尺寸较小,应用场景受限。 模型版本:开源了两种图生视频的模型,一种能生成 14 帧的 SVD,另一种是可以生成 25 帧的 SVDXL,发布时通过外部评估超越了人类偏好研究中领先的封闭模型。 主要贡献:提出系统的数据管理工作流程,将大量未经管理的视频集合转变为高质量数据集;训练出性能优于现有模型的文本到视频和图像到视频模型;通过特定领域实验探索模型中运动和 3D 理解的强先验,预训练的视频扩散模型可转变为强大的多视图生成器,有助于克服 3D 领域数据稀缺问题。 部署实战避坑指南: 直接使用百度网盘里准备好的资源,可规避 90%的坑。 若一直报显存溢出问题,可调低帧数或增加 novram 启动参数。 云部署实战中,基础依赖模型权重有两个 models–laion–CLIPViTH14laion2Bs32Bb79K 和 ViTL14.pt,需放到指定路径下。 总结: Sora 发布后,此前的视频生成模型相形见绌,但 Stable Video Diffusion 作为开源项目可在自己机器上自由创作无需充值。SVD 生成的视频画质清晰,帧与帧过渡自然,能解决背景闪烁和人物一致性问题,虽目前最多生成 4 秒视频,与 Sora 的 60 秒差距大,但在不断迭代。我们会持续关注其技术及前沿视频生成技术,尝试不同部署微调方式,介绍更多技术模型,更多精彩内容后续放出。 同时,您还可以加入「AIGCmagic 社区」群聊交流讨论,涉及 AI 视频、AI 绘画、Sora 技术拆解、数字人、多模态、大模型、传统深度学习、自动驾驶等多个方向,可私信或添加微信号:【m_aigc2022】,备注不同方向邀请入群。
2025-04-15
stable diffusion开发公司
Stable Diffusion 是由初创公司 StabilityAI、CompVis 与 Runway 合作开发的。其核心技术来源于 AI 视频剪辑技术创业公司 Runway 的 Patrick Esser 以及慕尼黑大学机器视觉学习组的 Robin Romabach。该项目的技术基础主要来自于他们之前在计算机视觉大会 CVPR22 上合作发表的潜扩散模型(Latent Diffusion Model)研究。 Stable Diffusion 是一种基于潜在扩散模型(Latent Diffusion Models)的文本到图像生成模型,能够根据任意文本输入生成高质量、高分辨率、高逼真的图像。其原理包括使用新颖的文本编码器(OpenCLIP)将文本输入转换为向量表示,利用扩散模型将随机噪声图像逐渐变换为目标图像,在扩散过程中以文本向量和噪声图像作为条件输入给出变换的概率分布,最后使用超分辨率放大器将生成的低分辨率图像放大到更高分辨率。 Stable Diffusion 总共有 1B 左右的参数量,可以用于文生图、图生图、图像 inpainting、ControlNet 控制生成、图像超分等丰富的任务。在文生图任务中,将一段文本输入到模型中,经过一定迭代次数输出符合文本描述的图片;图生图任务则在输入文本基础上再输入一张图片,模型根据文本提示对输入图片进行重绘。输入的文本信息通过 CLIP Text Encoder 模型编码生成与文本信息对应的 Text Embeddings 特征矩阵,用于控制图像生成。源代码库为 github.com/StabilityAI/stablediffusion ,当前版本为 2.1 稳定版(2022.12.7),其代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行。
2025-04-15
runway的开发公司
Runway 是由一家总部位于旧金山的 AI 创业公司开发的。其在 2023 年初推出的 Gen2 代表了当前 AI 视频领域最前沿的模型。目前 Runway 支持在网页(https://runwayml.com/ )、iOS 访问,网页端目前支持 125 积分的免费试用额度(可生成约 105s 视频),iOS 则有 200 多,两端额度貌似并不同步。
2025-04-15
stable diffusion开发公司
Stable Diffusion 是由初创公司 Stability AI、CompVis 与 Runway 合作开发的。其核心技术来源于 AI 视频剪辑技术创业公司 Runway 的 Patrick Esser 以及慕尼黑大学机器视觉学习组的 Robin Romabach。该项目的技术基础主要来自于他们之前在计算机视觉大会 CVPR22 上合作发表的潜扩散模型(Latent Diffusion Model)研究。 Stable Diffusion 是一种基于潜在扩散模型(Latent Diffusion Models)的文本到图像生成模型,能够根据任意文本输入生成高质量、高分辨率、高逼真的图像。其原理包括使用新颖的文本编码器(OpenCLIP)将文本输入转换为向量表示,利用扩散模型将随机噪声图像逐渐变换为目标图像,在扩散过程中以文本向量和噪声图像作为条件输入给出变换概率分布,最后使用超分辨率放大器将生成的低分辨率图像放大到更高分辨率。 Stable Diffusion 总共有 1B 左右的参数量,可以用于文生图、图生图、图像 inpainting、ControlNet 控制生成、图像超分等丰富的任务。其代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行,当前版本为 2.1 稳定版(2022.12.7),源代码库为 github.com/StabilityAI/stablediffusion 。
2025-04-15
对于用cursor来开发,有没有好好用prompt来使cursor变得更加好用
以下是关于如何用 prompt 使 Cursor 变得更好用的相关内容: 在 prompt 方面,Devin 有一个特别有帮助的文档(https://docs.devin.ai/learnaboutdevin/prompting),它会教您什么样的 prompt 在与 Devin 沟通时最有效,比如明确定义成功的标准,如跑通某个测试或访问某个链接能对得上等。将同样的原则应用到 Cursor 中,会发现 Cursor 变得聪明很多,能自主验证任务完成情况并进行迭代。 Cursor 在生成单测方面表现出色。相对 GPT 等工具,Cursor 解决了上下文缺失和难以实现增量更新的问题。它可以向量化整个代码仓库,在生成单测代码时能同时提供目标模块及对应的上下游模块代码,生成结果更精确。例如,使用适当的 Prompt 能返回基于 Vitest 的结果,调整成本较小。 Cursor 支持使用.cursorrules 文件设定项目的系统提示词,针对不同语言可设定不同的 Prompt。@AIChain 花生做了一个 Cursor 插件解决提示语管理问题,可选择不同的.cursorrules 文件,还可从 https://cursor.directory/ 和 https://cursorlist.com/ 寻找提示词。此外,还有一个提示语小技巧,给已有的提示语追加上特定规则,可使模型在搜索资源和思考时默认使用英语,回复转换成中文,或更灵活地根据提问语言进行回复。
2025-04-14
我是一个前端开发人员,在工作中,我可以使用哪些ai工具提效
以下是一些适合前端开发人员在工作中提效的 AI 工具: 1. 辅助编程工具: GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能快速提供代码建议。 通义灵码:阿里巴巴团队推出,提供多种编程辅助能力。 CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,实时提供代码建议。 CodeGeeX:智谱 AI 推出的开源免费编程助手,基于 130 亿参数的预训练大模型。 Cody:Sourcegraph 推出的代码编写助手,借助强大的代码语义索引和分析能力。 CodeFuse:蚂蚁集团支付宝团队推出的免费 AI 代码助手。 Codeium:通过提供代码建议等帮助提高编程效率和准确性。 更多辅助编程 AI 产品,可查看:https://www.waytoagi.com/category/65 。每个工具功能和适用场景不同,可根据需求选择。 2. 测试用例生成:AI 在生成测试用例方面具有显著优势,能自动化和智能化生成高覆盖率的测试用例,减少人工编写时间和成本。通过合理应用 AI 工具,可提高测试效率、增强测试覆盖率和发现潜在问题,从而提升软件质量和用户体验。 3. 网页原型图生成工具: 即时设计:https://js.design/ ,可在线使用的「专业 UI 设计工具」,注重云端文件管理和团队协作。 V0.dev:https://v0.dev/ ,Vercel Labs 推出的 AI 生成式用户界面系统,能通过文本或图像生成代码化的用户界面。 Wix: ,用户友好,无需编码知识即可创建和自定义网站,提供广泛模板和设计选择,以及多种功能。 Dora:https://www.dora.run/ ,通过一个 prompt,借助 AI 3D 动画生成强大网站。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-14