「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
AI教育
以下是关于 AI 教育的相关内容: Sam Altman 在 X 上发表的《The Intelligence Age》一文中提到,我们的孩子将拥有虚拟导师,能够以任何语言和适合他们的节奏提供个性化的教学,类似概念还可应用于医疗保健改进、创建各种软件等领域。 人们对 AI 时代的教育怀有期待,是因为当前的应试教育体系存在诸多弊端,如题海战术、考试制度等。虽然教育资源比过去充裕,但学生的学习能力并未明显跃升,且在这套体系下培养出来的学生,创造性能力和创新性思维相对较差,还会让孩子对学习本身丧失兴趣。对于三四五六线城市的“小镇做题家”来说,选择有限,只能内卷。 此外,在“AI 摊主速成脑暴会”中,AI 教育与咨询方面包括 AI 应用培训、课程设计、商业化咨询、AI+行业应用咨询等,例如 AI 培训策划、商业化建议、产品思路分享、应用场景分析等。
2024-11-24
Cursor使用说明书
以下是 Cursor 的使用说明: 1. 下载与注册: 前往 https://www.cursor.com/ 下载 Cursor。 可用邮箱(如 google、github、163、qq 等)注册账号,直接接受二维码登录。 2. 安装中文包插件。 3. 配置相关设置: 在设置中进行 Rule for AI 配置。 可通过“Ctrl/Cmd + i”输入需求。 4. 检查使用情况: 可在页面检查使用情况,也可在 Cursor 应用程序中的 Cursor Settings > General > Account 下,专业用户按“Manage Subscription”,商业用户按“Manage”。 游标使用情况会根据订阅开始日期每月重置一次。 5. 用户界面与操作: 当 Cursor 仅添加其他文本时,补全显示为灰色文本;若建议修改现有代码,会在当前行右侧显示为 diff 弹出窗口。 可通过按 Tab 键接受建议,按 Esc 键拒绝建议;逐字部分接受建议按 Ctrl/⌘ →;拒绝建议可继续输入或使用 Escape 取消/隐藏建议。 每次击键或光标移动,Cursor 会尝试根据近期更改提出建议,但不总会显示。 Cursor 可更改当前行上方一行至下方两行的内容。 要打开或关闭相关功能,可将鼠标悬停在应用程序右下角状态栏上的“Cursor Tab”图标上。 若要做一个在网页中玩的贪吃蛇游戏,需求如下: 游戏界面:在矩形网格上进行,玩家控制蛇。 蛇的移动:持续移动,玩家通过按键控制方向(上、下、左、右)。 食物:界面随机出现,蛇吃到食物增长身体。 增长:每次吃到食物身体增加一节。 死亡条件:撞墙(头部撞到边界)、撞自己(头部撞到自身)。 得分:吃到食物获分数,与食物数量成正比。 难度递增:蛇速度加快或食物出现频率降低。 游戏结束:蛇死亡时结束,玩家可看到得分。清晰表达需求如:“帮我做一个贪吃蛇游戏,这个游戏的规则和逻辑如下……”
2024-11-24
目前各大主流模型的 max output token
以下是目前各大主流模型的 max output token 情况: Claude2100 k 模型的上下文上限是 100k Tokens,即 100000 个 token。 ChatGPT16 k 模型的上下文上限是 16k Tokens,即 16000 个 token。 ChatGPT432 k 模型的上下文上限是 32k Tokens,即 32000 个 token。 需要注意的是,token 限制同时对一次性输入和一次对话的总体上下文长度生效。不是达到上限就停止对话,而是会遗忘最前面的对话。 如果想直观查看 GPT 如何切分 token,可以打开: 。此外,GPT3 和 GPT3.5/4 的 token 计算方式不同,英文的 Token 占用相对于中文较少,这也是很多中文长 Prompt 会被建议翻译成英文设定然后要求中文输出的原因。
2024-11-24
AI设计
以下是关于 AI 设计的相关内容: AI 室外设计的最佳实践: 1. 充分利用 AI 的创意生成能力:使用 AI 图像生成工具,输入关键词如“后院”“庭院”等,生成多种创意设计方案,获取新颖独特的设计灵感。 2. 结合 AI 的模拟和可视化功能:利用 AR/VR 等技术,将 AI 生成的设计方案在实际环境中进行模拟和可视化,以便更好地评估和验证设计方案。 3. 运用 AI 的分析和优化能力:使用 AI 工具对设计方案进行采光、动线、材料等方面的分析和优化,确保符合使用者的实际需求和体验。 4. 借助 AI 的自动化设计功能:利用 AI 自动生成符合设计规范的平面图、立面图等,提高设计效率,缩短设计周期。 5. 融合 AI 与人工设计的协作模式:人工设计师与 AI 工具形成互补,在创意、分析、优化等环节充分利用 AI 的能力,提升整体的设计效率和质量。 生成 Logo 的 AI 产品: 1. Looka:在线 Logo 设计平台,使用 AI 理解用户品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:Logo 制作器使用 AI 技术创建个性化设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的 Logo 设计工具,用户可拖放设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:根据用户输入的品牌名称和行业类别快速生成 Logo 设计方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助用户创建个性化 Logo。 Midjourney 商业实战案例 UI 设计篇: 1. 数据图标设计:蓝色渐变磨砂玻璃,磨砂玻璃建筑,白色透明科技感白色城市建筑场景,数据线链接,芯片,OCrenderer,大数据,工业机械,高细节灰色背景与简单的线性细节,工作室照明,3d,c4d,纯白背景,8k。 2. B 端图标设计:质感不错,可多尝试不同构图的图片,喂图玩法中参考图影响最大,建议多跑跑图。 3. 音乐软件 UI 设计:关键词为“music app ui design,ux design,white,light,bright,data,modern,smooth,behance,dribbble,–upbeta –q 2 –v 4”。目前 Midjourney 在 UI 设计这块只能作为风格参考,已有很多 AI 生成的 UI 设计软件开始内测。
2024-11-24
文生视频工具
以下是一些文生视频工具: 1. Pika:出色的文本生成视频 AI 工具,擅长动画制作,支持视频编辑。 2. SVD:Stability AI 开源的 video model,可在图片基础上直接生成视频,适合熟悉 Stable Diffusion 的用户。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频功能,但收费。 4. Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 另外,根据视频脚本生成短视频的工具包括: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析并生成素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频。 3. Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容。 4. VEED.IO:提供 AI 图像生成器和 AI 脚本生成器,帮助从图像制作视频并规划内容。 5. Runway:能将文本转化为风格化的视频内容,适用于多种场景。 6. 艺映 AI:专注于人工智能视频领域,可根据文本脚本生成视频。 更多的文生视频网站可查看:https://www.waytoagi.com/category/38 。 同时,还有关于清影的文生视频示例,如“9、吗喽打工”“10、赛博吗喽黑客(体现指令跟随能力)”“11、老奶奶”等,具体视频可通过相应链接查看。
2024-11-24
Claude的注册方法
Claude 是由 Anthropic 公司开发的一款基于自然语言处理技术和人工智能算法的聊天机器人。以下是注册 Claude 的方法: 1. 访问 Claude 的官方网站。 2. 点击注册或登录界面中的“Sign Up”或“Continue with email”选项。 3. 填写您的邮箱地址并设置密码,然后提交表单。 4. 系统会向您的邮箱发送一封验证邮件,您需要打开邮件并使用其中的验证码来完成邮箱验证。 如果在注册过程中遇到需要海外手机号接收验证码的问题,有以下可能的解决方案: 1. 使用虚拟海外号服务,如 SMSActivate、SMSPool 等,购买一个海外虚拟手机号来接收 Claude 的验证码。 2. 借助第三方服务网站如 uiuihao.com 完成注册您的 Claude 账号。 3. 如果您有海外朋友,可以请他们帮忙接收验证码,并将验证码告诉您。 完成注册后,如果您希望升级到 Claude Pro 版本以获取更强大的功能和更高的 API 调用限额,您需要填写支付信息并选择一个合适的订阅计划。值得注意的是,订阅 Claude Pro 可能需要使用海外支付方式。 请注意,Claude.ai 目前处于公开测试阶段,未付费用户使用平台可能会受到一些限制。如果您在注册过程中遇到任何问题,可以参考其他用户分享的详细注册教程和解决策略。
2024-11-24
gpt是否可以识别图片中的人脸、人物
GPT 可以在一定程度上对图片中的人物进行识别和描述。例如,可以利用 GPT 的识图功能对人物照片的内容进行细致描述,包括人物的年龄、发型、肤色、五官、穿着、表情等方面,还能对人物所处的背景进行分析。但需要注意的是,其识别和描述的准确性可能会受到多种因素的影响,如图片的质量、清晰度、复杂程度等。同时,对于 GPT 是否能准确识别所有人脸和人物,还存在一定的不确定性和局限性。
2024-11-24
什么是Controlnet
ControlNet 是一种由斯坦福大学张吕敏发布的神经网络模型,常与预训练的图像扩散模型如 Stable Diffusion 结合使用,用于控制 AI 绘画的生成过程。 其工作原理是将 Stable Diffusion 模型的权重复制到 ControlNet 的可训练副本中,并利用外部条件向量训练副本。条件输入类型多样,如涂鸦、边缘图、姿势关键点、深度图、分割图、法线图等,以此指导生成图像的内容。 ControlNet 具有以下特点和优势: 1. 设计思想提供了训练过程中的鲁棒性,避免过度拟合,允许在小规模甚至个人设备上训练。 2. 架构具有强大的兼容性与迁移能力,可用于其他扩散模型,增强图像生成的多样性和可控性。 其应用不仅限于 AI 绘画,还可用于图像编辑、风格迁移、图像超分辨率等多种计算机视觉任务,展现出在 AIGC 领域的广泛应用潜力。 在使用方面,如在 Stable Diffusion 中,无论是文生图还是图生图,ControlNet 能实现更细化的控制,如构图、轮廓、形象姿态、色彩风格等。使用逻辑是通过预处理器将图片提取特征并转换为 AI 可识别的形式,再通过模型进行图像生成。预处理器如同“翻译软件”。例如绘制女孩模仿库里打篮球的图片,输入关键词和选择相应预处理器、模型等操作后即可生成。 在 Stable Diffusion 中使用 ControlNet 时,要注意一些设置,如确保 ControlNet 设置下的路径与本地 Stable Diffusion 的路径同步。基本流程包括点击 Enable 启用,选择预处理器,调整权重、控制生成步骤、反色模式等,还需根据情况选择合适的模型。
2024-11-24
文生视频
以下是关于文生视频的相关信息: “文生视频”是指使用人工智能技术将文本内容转换成视频的服务。一些国内外提供此类功能的产品有: 1. Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频,这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要注意是收费的。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。 Sora 的应用包括文生视频、图生视频、视频反推、视频编辑、视频融合等。其模型推理策略中,文生视频的做法是喂入 DiT 的为文本 embedding+全噪声 patch;视频编辑类似 SDEdit 的做法,在视频上加点噪声(不要搞成全是噪声),然后拿去逐步去噪;图生视频、视频反推、视频融合则是喂入 DiT 的为文本 embedding(可选)+特定帧用给定图片的 embedding+其他帧用全噪声 patch。 文生视频是 AI 生成视频中最直接的一种方式,通过输入提示词,让 PixVerse 生成视频。这种方式简单快速,但需要对提示词有较为深入的了解,能够准确描述画面内容,提示词的基本规则可以参考:。为方便创作,还提供了灵感分镜,风格选择等功能,帮助更快掌握文生视频。 内容由 AI 大模型生成,请仔细甄别。
2024-11-24
aigc最新发展动态
以下是 AIGC 的最新发展动态: AIGC 作为一种强大的技术,能够赋能诸多领域,但也存在多重潜在的合规风险。我国对 AIGC 的监管框架由多部法律和规定构成,形成共同监管的形势。 AIGC 主要分为语言文本生成、图像生成和音视频生成。语言文本生成利用多种模型生成文本,图像生成依赖于多种技术,音视频生成也有相应的技术,且在多个领域有广泛应用。 自 2023 年开年以来,生成式人工智能技术逐步涵盖艺术创作产业、医疗保健、虚拟现实、数据合成与数据增强等多个领域,为各行业带来了更多创新、效率与价值。 2024 年 7 月至 8 月,AIGC 领域有众多新动态,如 Anthropic 新增分享和后台功能、LLM 分布式训练框架 OpenDiLoCo、Odysseyml 重构 AI 视频生成技术、Open AI 发布 GPT4omini、Mistral 发布三个小模型、Meta 发布 Llama3.1 405B 模型、AI 音乐工具 Udio 的大规模更新、OpenAI 推出 SearchGPT 搜索功能、Google 发布 Gemma 2 2B 和 Gemini 1.5 Pro、FLUX 开源图像的新标杆、Meta 发布 SAM 2 分割模型等。
2024-11-24