Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

PATHON+AI 如何应用到实际工作中,你这边有没有实际案例教学

Answer

以下是一个关于 Python + AI 在实际工作中的应用案例:

在自动驾驶车辆领域,对于 AI 系统的可解释性需求程度高度取决于具体情境,包括应用的安全关键程度。例如,设计自动驾驶车辆的技术专家需要理解系统的决策能力以进行测试、评估和改进;普通用户可能仅需了解决策过程以安全使用车辆;若车辆发生故障并导致有害结果,监管机构可能需要有关系统如何运作的信息以分配责任。尽管 AI 可解释性仍是技术挑战和活跃的研究领域,但监管机构已在开展相关工作以解决此问题。如 2021 年,ICO 和艾伦图灵研究所共同发布了关于用 AI 解释决策的指导,为组织提供了实用建议,以帮助向受其影响的个人解释由 AI 交付或协助的流程、服务和决策。

Content generated by AI large model, please carefully verify (powered by aily)

References

【法律法规】《促进创新的人工智能监管方法》.pdf

1.4.How could current routes to contest or seek redress for AI-related harms be improved,if at all?2.5.Do you agree that,when implemented effectively,the revised cross-sectoral principles will cover the risks posed by AI technologies?3.6.What,if anything,is missing from the revised principles?33A pro-innovation approach to AI regulationCase Study 3.4:Explainable AI in practiceThe level of explainability needed from an AI system is highly specific to its context,including the extent to which an application is safety-critical.The level and type of explainability required will likely vary depending on whether the intended audience of the explanation is a regulator,technical expert,or lay person.For example,a technical expert designing self-driving vehicles would need to understand the system’s decision-making capabilities to test,assess and refine them.In the same context,a lay person may need to understand the decision-making process only in order to use the vehicle safely.If the vehicle malfunctioned and caused a harmful outcome,105 a regulator may need information about how the system operates in order to allocate responsibility–similar to the level of explainability currently needed to hold human drivers accountable.While AI explainability remains a technical challenge and an area of active research,regulators are already conducting work to address it.In 2021,the ICO and the Alan Turing Institute issued co-developed guidance on explaining decisions made with AI,106 giving organisations practical advice to help explain the processes,services and decisions delivered or assisted by AI to the individuals affected by them.

Others are asking
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
学AI上钉钉
以下是在钉钉上学 AI 的相关内容: 从 AI 助教到智慧学伴的应用探索: 登录钉钉客户端,在右上角依次选择钉钉魔法棒、AI 助理、创建 AI 助理。进入创建 AI 助理页面后,填写 AI 助理信息,设置完成即可创建成功。 AI 领导力向阳乔木:未提及具体的在钉钉上学 AI 的操作方法。 基于 COW 框架的 ChatBot 实现步骤: 创建应用: 进入,登录后点击创建应用,填写应用相关信息。 点击添加应用能力,选择“机器人”能力并添加。 配置机器人信息后点击发布,发布后点击“点击调试”,会自动创建测试群聊,可在客户端查看。点击版本管理与发布,创建新版本发布。 项目配置: 点击凭证与基础信息,获取 Client ID 和 Client Secret 两个参数。 参考项目,将相关配置加入项目根目录的 config.json 文件,并设置 channel_type:"dingtalk",注意运行前需安装依赖。 点击事件订阅,点击已完成接入,验证连接通道,会显示连接接入成功。 使用:与机器人私聊或将机器人拉入企业群中均可开启对话。
2025-04-19
AI术语解释
以下是一些常见的 AI 术语解释: Agents(智能体):一个设置了一些目标或任务,可以迭代运行的大型语言模型。与大型语言模型在像 ChatGPT 这样的工具中的通常使用方式不同,Agent 拥有复杂的工作流程,模型本质上可以自我对话,无需人类驱动每一部分的交互。属于技术范畴。 ASI(人工超级智能):尽管存在争议,但通常被定义为超越人类思维能力的人工智能。属于通识范畴。 Attention(注意力):在神经网络的上下文中,有助于模型在生成输出时专注于输入的相关部分。属于技术范畴。 Bias(偏差):AI 模型对数据所做的假设。“偏差方差权衡”是模型对数据的假设与给定不同训练数据的模型预测变化量之间必须实现的平衡。归纳偏差是机器学习算法对数据的基础分布所做的一组假设。属于技术范畴。 Chatbot(聊天机器人):一种计算机程序,旨在通过文本或语音交互模拟人类对话。通常利用自然语言处理技术来理解用户输入并提供相关响应。属于通识范畴。 CLIP(对比语言图像预训练):由 OpenAI 开发的 AI 模型,用于连接图像和文本,使其能够理解和生成图像的描述。属于技术范畴。 TPU(张量处理单元):谷歌开发的一种微处理器,专门用于加速机器学习工作负载。属于技术范畴。 Training Data(训练数据):用于训练机器学习模型的数据集。属于技术范畴。 Transfer Learning(迁移学习):机器学习中的一种方法,其中对新问题使用预先训练的模型。属于技术范畴。 Validation Data(验证集):机器学习中使用的数据集的子集,独立于训练数据集和测试数据集。用于调整模型的超参数(即架构,而不是权重)。属于技术范畴。 Knowledge Distillation(数据蒸馏):数据蒸馏旨在将给定的一个原始的大数据集浓缩并生成一个小型数据集,使得在这一小数据集上训练出的模型,和在原数据集上训练得到的模型表现相似。在深度学习领域中被广泛应用,特别是在模型压缩和模型部署方面。可以帮助将复杂的模型转化为更轻量级的模型,并能够促进模型的迁移学习和模型集成,提高模型的鲁棒性和泛化能力。属于技术范畴。 RAG(检索增强生成):检索增强生成。属于技术范畴。 Forward Propagation(前向传播):在神经网络中,输入数据被馈送到网络并通过每一层(从输入层到隐藏层,最后到输出层)以产生输出的过程。网络对输入应用权重和偏差,并使用激活函数生成最终输出。属于技术范畴。 Foundation Model(基础模型):在广泛数据上训练的大型 AI 模型,旨在适应特定任务。属于技术范畴。 GAN(通用对抗网络):一种机器学习模型,用于生成类似于某些现有数据的新数据。使两个神经网络相互对抗:一个“生成器”,创建新数据,另一个“鉴别器”试图将数据与真实数据区分开来。属于技术范畴。 Generative AI/Gen AI(生成式 AI):AI 的一个分支,专注于创建模型,这些模型可以根据现有数据的模式和示例生成新的原创内容,例如图像、音乐或文本。属于通识范畴。 GPU(图形处理单元):一种特殊类型的微处理器,主要用于快速渲染图像以输出到显示器。在执行训练和运行神经网络所需的计算方面也非常高效。属于产品范畴。
2025-04-18
低代码实际应用
低代码在实际应用中有多种场景和实现方式: 在构建本地小应用方面,可通过以下两种方法实现工作流: 直接使用 Coze 的 API 对接前端 UI 框架,将工作流逻辑集中在工程模板端,实现前后端分离。 直接调用大模型 API,并通过前端代码实现提示词处理和逻辑控制,将交互流程完全放入前端代码中。 实现文件上传可通过 Coze 的,用户可将本地文件上传至 Coze 的云存储。 关于 API 的使用及工作流执行流程可以参考。 若用户需要通过前端展示文件或流程结果,搭建 Demo 最简单的方式是首先绘制草图,然后借助多模态 AI 工具(如 GPT/Claude)生成初步的前端结构代码。 前端开发语言包括用于构建网页基础框架、定义整体页面结构的 HTML,负责网页布局样式美化、使页面视觉效果更优美的 CSS,以及实现交互逻辑,如信息处理、网络请求及动态交互功能的 JavaScript。 有人在手搓 Bot 的过程中体验到了低代码的快乐,写很少的代码就能快速把想法实现并做成产品发布。例如,用 Coze 这样的平台,降低了技术门槛,又提供了相当的可定制性,灵活度比 OpenAI 的 GPTs 要强,可制作出更复杂的应用。 在解决生活中的决策问题方面,如选工作,通过具体例子展示决策模型在实际生活中的应用,让理论产生价值。
2025-04-01
教育行业有那些基于aigc的业务实际落地的产品和案例?
以下是教育行业基于 AIGC 的一些业务实际落地的产品和案例: 教师的 AI 减负指南生成式人工智能在教学中的应用,包括教师使用 AI 的小技巧。涉及人员有张亚丽、富露露、张亚玲、张楚璇、吴箭枢等,学校有深圳大学附属中学、苏州工业园区娄葑学校、上海市静安区风华初级中学南校、江苏省苏州工业园区教师发展中心中学、苏州工业园区唯亭学校初中、中央民族大学附属中学等。 AIGC 人机协同国家课程项目化学科实践设计与实施,例如以科学《计量时间博物展》为例,以及基于思维可视化的项目式主题学习设计与实践,如以智驾未来课程为例。相关人员有祝琛、崔琴、张然、刘敏、王国庆、吴沁珂等,学校有深圳市南方科技大学教育集团实验二小、成都经济技术开发区实验小学校。 Al 创作家:用 AI 辅助设计桌游,解决学校实际问题,如北京市新英才学校的魏一然所做的工作。 生成式人工智能与教学变革:AI 领雁行动的探索与实践,相关人员有邹贤莲、向雪萍、陈治佑、余初冉、阊洪娇,学校有重庆两江新区行远小学校。 北京市新英才学校的跨学科项目老师带着学生用 AIGC 做学校地图桌游,英语老师在 AIGC 的帮助下备课和授课,生物和信息科技老师合作一起带着学生用训练 AI 模型,用以识别植物。 AIGC 常见名词解释,如 AIGC 意为人工智能生成内容,能进行 AIGC 的产品项目和媒介众多,包括语言文字类的 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等,语音声音类的 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等,图片美术类的 Midjourney、Stable Diffusion 等。
2025-03-13
通义灵码实际使用体验
通义灵码的实际使用体验如下: 在 Pytharm 中,通过“文件”“设置”“插件”红色框位置搜索“通义灵码”,安装通义灵码插件(目前免费)。 通义灵码是基于通义大模型的 AI 研发辅助工具,提供代码智能生成、研发智能问答、多文件代码修改、自主执行等能力,为开发者带来智能化研发体验,引领 AI 原生研发新范式。 通义灵码 AI 程序员具备多文件代码修改和工具使用的能力,可以与开发者协同完成编码任务,如需求实现、问题解决、单元测试用例生成、批量代码修改等。其核心能力包括:从片段级到多文件级的 AI 编码、协同完成复杂编码任务、多文件代码 Diff 生成和审查、面向任务的多轮对话迭代编程。 未来将与通义灵码合作推出 AI 编程课程。
2025-03-07
在室内软装设计领域,ai实际可以如何运用
在室内软装设计领域,AI 有以下实际运用方式: 1. 工具辅助: Maket.ai:主要面向住宅行业,在户型设计和室内软装设计方面有探索。设计师输入房间面积需求和土地约束,软件能自动生成户型图并提供详细设计结果。 2. 创意生成: 利用 AI 图像生成工具,输入相关关键词,生成多种室内软装创意设计方案,获取新颖独特的灵感。 3. 模拟可视化: 借助 AR/VR 等技术,将 AI 生成的设计方案在实际环境中模拟和可视化,更好地评估和验证设计。 4. 分析优化: 使用 AI 工具对室内软装设计方案进行采光、动线、材料等方面的分析和优化,以符合使用者需求和体验。 5. 自动化设计: 利用 AI 自动生成符合设计规范的室内软装平面图等,提高设计效率,缩短设计周期。 6. 协作模式: 人工设计师与 AI 工具形成互补,在创意、分析、优化等环节充分发挥各自优势。 同时,还有字节旗下的 Coze AI 的图像工作流可用于快速出家装设计效果图,并根据客户咨询信息收集用户联系方式形成销售线索,体验地址为:https://www.coze.cn/store/bot/7374039392832405554?panel=1&bid=6cq1cccs00017 。但需注意,每个工具都有其特定应用场景和功能,建议根据具体需求选择合适的工具。
2025-02-25
神经网络与大脑实际工作的原理区别
神经网络与大脑实际工作的原理存在以下区别: 1. 神经网络本质上是运行在多层面上的软件,由人工建立的一层层互相连接的神经元模型组成,模仿大脑处理复杂问题,如视觉和语言等。它可以自行学习与工作,不需要人为提示或参与控制。 2. 早期由于电脑处理能力不足,神经网络的发展受限。而大脑则具有强大的天然处理能力。 3. 神经网络的计算风格受神经元及其适应性连接启发,与传统的序列计算不同。 4. 对于循环网络,其连接图中存在定向循环,动态复杂,更具生物真实性。 5. ChatGPT 是通过获取大量人类创作的文本样本进行训练,生成类似的文本。其神经网络由简单元素组成,基本操作简单,从积累的“传统智慧统计数据”中提取“连贯的文本线索”,但不像大脑那样具有全面和复杂的功能。 总之,神经网络是对大脑的一种模拟,但与大脑真实的工作方式仍存在诸多差异。
2025-02-25
给出实际的操作案例,结合deepseek、kimi、豆包工具。
以下是结合 deepseek、kimi、豆包工具的实际操作案例: 在 2025 年 1 月的国内月活榜中: deepseek 作为聊天机器人,网址为 chat.deepseek.com,活跃用户达 7068 万人,环比变化为 24.3616%,所属公司为深度求索。 豆包作为聊天机器人,网址为 doubao.com,活跃用户为 779 万人,环比变化为 0.1911%,所属公司为字节跳动。 kimi 作为聊天机器人,网址为 kimi.moonshot.cn,活跃用户为 591 万人,环比变化为 0.1135%,所属公司为月之暗面。 在 2025 年 1 月的国内流量榜中: deepseek 作为聊天机器人,网址为 chat.deepseek.com,访问量达 22541 万,环比变化为 20.4093%,所属公司为深度求索。 豆包作为聊天机器人,网址为 doubao.com,访问量为 3457 万,环比变化为 0.1041%,所属公司为字节跳动。 kimi 作为聊天机器人,网址为 kimi.moonshot.cn,访问量为 3282 万,环比变化为 0.1283%,所属公司为月之暗面。 此外,在使用效果方面,DeepSeek 的思考与表达被认为碾压了包括豆包和 kimi 在内的其他模型,其思考过程细腻、自洽、深刻、全面,输出结果在语气、结构、逻辑上天衣无缝。
2025-02-20
请找到 AI 用于知识管理的案例
以下是一些 AI 用于知识管理的案例: 1. 在法学领域,当模型培训针对组织内特定的基于文本的知识体系进行微调时,生成式人工智能可以有效地管理组织的知识。例如摩根士丹利正在与 OpenAI 的 GPT3 合作,微调财富管理内容的培训,以便财务顾问既可以搜索公司内部的现有知识,又可以轻松地为客户创建量身定制的内容。 2. 在构建高效的知识管理体系方面,可以通过一系列创新的 AI 应用来实现。比如,AI 可以通过分析工作模式和内容类型,自动生成提示词,帮助将信息和知识分类到 PARA(项目、领域、资源、档案)的相应部分,还能帮设计笔记标签系统。此外,知识助手 Bot 可以根据学习进度和兴趣点,定期推送相关的文章、论文和资源,实现渐进式积累领域知识。 3. 在代码库相关的知识管理中,Cursor 有针对大代码库精准找到相关函数,并利用其信息帮助撰写代码的功能。对于非开发性质的问答,它是一个天然的 RAG 引擎。在问答窗口使用特定操作时,它会先在当前文件夹下搜索并显示相关文档和相关度,最后用这些信息构建提示词完成生成。而且,它能与私有文档自然结合进行问答,并将新生成的见解沉淀成新文档,形成知识闭环,提高知识检索和管理的效率。
2025-04-14
飞书+AI的应用案例
以下是飞书+AI的应用案例: 在企业运营方面,包括日常办公文档材料撰写整理、营销对话机器人、市场分析、销售策略咨询,以及法律文书起草、案例分析、法律条文梳理和人力资源简历筛选、预招聘、员工培训等。 在教育领域,协助评估学生学习情况,为职业规划提供建议,针对学生情况以及兴趣定制化学习内容,论文初稿搭建及论文审核,帮助低收入国家/家庭通过 GPT 获得平等的教育资源。 在游戏/媒体行业,有定制化游戏、动态生成 NPC 互动、自定义剧情、开放式结局,出海文案内容生成、语言翻译及辅助广告投放和运营,数字虚拟人直播,游戏平台代码重构,AI 自动生成副本。 在零售/电商领域,包括舆情、投诉、突发事件监测及分析,品牌营销内容撰写及投放,自动化库存管理,自动生成或完成 SKU 类别选择、数量和价格分配,以及客户购物趋势分析及洞察。 在金融/保险行业,有个人金融理财顾问、贷款信息摘要及初始批复、识别并检测欺诈活动风险、客服中心分析及内容洞。 线下活动方面: 活动宣传:用飞书文档制作活动宣传页面,用 AI 快速制作海报,用 GPTs 写人员分配和主持人台词,活动从策划到开始仅用 2 天时间。 活动报名:使用飞书的多维表格完成报名表及数据统计。 活动过程:大家在线协同,一起编辑文档,演示时共同展示一个文档。 活动记录:有相关的记录页面。 办活动的初衷是宣扬 AI 不只是降本增效的工具,还有很多乐趣等待挖掘,例如大理户外圆桌讨论、清迈的 AI 逛古城、杭州的 AI 玄学小组。
2025-04-13
有AI在各个行业的案例吗
以下是 AI 在各个行业的一些应用案例: 汽车行业: 1. 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定,如特斯拉、Waymo 和 Cruise 等公司在开发和测试自动驾驶汽车。 2. 车辆安全系统:AI 用于增强自动紧急制动、车道保持辅助和盲点检测等系统,通过分析数据预防事故。 3. 个性化用户体验:根据驾驶员偏好和习惯调整车辆设置,如座椅位置、音乐选择和导航系统。 4. 预测性维护:分析车辆实时数据预测潜在故障和维护需求,减少停机时间和维修成本。 5. 生产自动化:在汽车制造中用于自动化生产线,提高生产效率和质量控制。 6. 销售和市场分析:汽车公司用 AI 分析市场趋势、消费者行为和销售数据,制定营销策略和优化产品定价。 7. 电动化和能源管理:在电动汽车的电池管理和充电策略中发挥作用,提高能源效率和延长电池寿命。 8. 共享出行服务:如 Uber 和 Lyft 等,使用 AI 优化路线规划、调度车辆和定价策略,提高服务效率和用户满意度。 9. 语音助手和车载娱乐:AI 驱动的语音助手允许驾驶员通过语音控制车辆功能、获取信息和娱乐内容。 10. 车辆远程监控和诊断:AI 系统远程监控车辆状态,提供实时诊断和支持。 其他行业: 1. 企业运营:包括日常办公文档材料撰写整理、营销对话机器人、市场分析和销售策略咨询等。 2. 教育:协助评估学生学习情况,为职业规划提供建议,定制化学习内容,论文初稿搭建及审核,帮助低收入国家/家庭获得平等教育资源。 3. 游戏/媒体:定制化游戏、动态生成 NPC 互动、自定义剧情、开放式结局,出海文案生成、语言翻译及辅助广告投放和运营,数字虚拟人直播,游戏平台代码重构,AI 自动生成副本。 4. 零售/电商:舆情、投诉、突发事件监测及分析,品牌营销内容撰写及投放,自动化库存管理,自动生成或完成 SKU 类别选择、数量和价格分配,客户购物趋势分析及洞察。 5. 金融/保险:个人金融理财顾问,贷款信息摘要及初始批复,识别并检测欺诈活动风险,客服中心分析及内容洞察。
2025-04-12
用AIGC生成的单镜头循环视频案例
以下是一些用 AIGC 生成的单镜头循环视频的案例: OpenAI 的 Sora 视频生成模型:能够生成长达 1 分钟的视频,在时长、稳定性、一致性和运动幅度上表现出色。它可以根据提供的图像和提示生成视频,还能在时间上向前或向后扩展视频以产生无缝的无限循环。此外,能零镜头地改变输入视频的风格和环境,在两个输入视频之间逐渐进行插值创建无缝过渡,也能够生成图像。 Luma 视频生成工具 Dream machine 增加了尾帧生成视频的功能和循环视频生成功能。 智谱 AI 发布的 DiT 视频生成模型“智谱清影”,支持文生和图生视频,目前免费使用,加速生成需要付费。 此外,还有一些其他相关项目: Google 的 Genie 采用 STtransformer 架构,包括潜在动作模型、视频分词器与动力学模型,拥有 110 亿参数。 DeepMind 的 WaveNet 是一种生成模型,可以生成非常逼真的人类语音。 OpenAI 的 MuseNet 是一种生成音乐的 AI 模型,可以在多种风格和乐器之间进行组合。 ElevenLabs 的 Multilingual v2 是一种语音生成模型,支持 28 种语言的语音合成服务。 Stability 发布了 Stable Video 4D 模型,可以从视频中生成更多角度的新视频。 Pixverse 更新了 V2 版本 DiT 视频模型,支持 8 秒时长视频生成、细节和动作增强、支持最多 5 段内容一次性生成,无缝衔接。
2025-04-10
推荐知识库中用ai做学术的案例
以下是知识库中与用 AI 做学术相关的案例和信息: B 站 up 主的课程:每节 15 分钟,免费且内容好,涵盖 AI 艺术字等。 炼丹操作:16 号晚上中老师会带大家动手炼丹,炼丹需提前准备一些图,会让老师提前发布内容让大家准备。 高效 PB 及相关案例:高效 PB 投入力度大,有厉害的伙伴,案例在社区,有多种 battle 方式,会有菩萨老师专门介绍。 初学者入门推荐:推荐看 open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。 经典必读文章:如介绍 GPT 运作原理、Transformer 模型、扩散模型等的文章,还包括软件 2.0 时代相关内容。 历史脉络类资料:整理了 open AI 的发展时间线和万字长文回顾等。 6 月 29 日更新:翻译完 a16z 推荐的 AI 典藏文章其中两篇:。
2025-04-01
有AI+游戏的最新案例吗
以下是一些 AI+游戏的最新案例: 由 5 人独立游戏工作室 Proxima 开发的 AI 冒险独立游戏 Suck Up!上线三周油管播放超千万。这是一款沙盒社交冒险游戏,团队尝试加入了名为 Nemo 的 AI NPC,基于 LLM 驱动,Nemo 能在接收到用户命令或其他线索后,调动感知、记忆,并转化为可执行的游戏行动。去年上半年,该工作室因获得 160 万美元投资引起轰动,上线后也受到资本关注。玩家对其玩法和模式提出了很多创意想法,如设计成就系统、上线多人模式等。 开发者正在使用 AI 生成音乐来填充游戏过程与游戏 UI 中需要使用到的各类音效、不同游戏场景中用以渲染氛围的各种音乐。像 MusicLM 等模型已经支持生成多音轨的作品。 2023 年 Genfun.ai 和 Meshy 联合制作的游戏《Soul Chronicle》,是首款实时 3D+AIGC+UGC 的 MMO 手游,最大突破是制作出了与游戏完美融合的 3D AIGC 技术,可在游戏中实时生成角色皮肤。 2024 年 Bitmagic 释出的《Roleverse》平台,可在平台内使用提示在游戏内定制角色,对角色进行缩放、挤压和拉伸,也能轻松对游戏世界进行编辑。 AI 技术在游戏行业的应用由来已久,且不断发展。从最初的简单内容和随机元素生成,到辅助游戏设计,再到如今能够生成更复杂的游戏内容,如动态场景、智能 NPC 行为等。AI 对游戏创作的影响包括美术与风格、剧情与叙事、关卡与玩法、音效与音乐、测试与优化等方面。同时,AI 能基于玩家游戏行为评估玩家技能水平和游戏风格,动态调整游戏难度等,提升玩家体验。此外,游戏还能成为 AI 模型能力的最佳试验场。
2025-04-01