直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
BERT
BERT 是“来自 Transformer 的双向编码器表示”(“Bidirectional Encoder Representations from Transformers”)的缩写,由谷歌的研究人员于 2018 年引入。 BERT 不仅指模型体系结构,还指经过训练的模型本身,可在。谷歌的研究人员在一个庞大的文本语料库上对它进行了训练,它已成为一种用于自然语言处理的通用模型,能够扩展来解决一系列不同的任务,比如:文本摘要、问答、分类、命名实体识别、文本相似度、攻击性信息/脏话检测、理解用户的查询等。 BERT 证明,可以在未标记的数据上建立非常好的语言模型,比如从 Wikipedia 和 Reddit 中提取的文本,并且这些大型的“基础”模型可以与特定领域的数据相适应,适用于许多不同的用例。 BERT 为 Google 搜索提供支持,其有多个变体。BERT 接受了两种变体的训练,Bert Base 有 12 个 Transformers,大约有 1.1 亿个参数;Bert Large 有 24 层 Transformer,大约有 3.4 亿个参数。BERT 模型之所以强大,是因为它可以处理长输入上下文,在整个维基百科语料库和书籍语料库上进行了训练,训练了 100 万步。BERT 接受过不同任务的训练,具有多任务目标,适用于句子级别和标记级别。最初发布的两个不同版本的 BERT 分别是有 12 层的 Bert Base 和有 24 层的 Bert Large。
2024-12-16
ai入门
以下是为您提供的 AI 入门指南: 一、背景 在深入学习 AI 时,编程可能会让许多朋友感到困难,各类教程默认会打命令行也增加了入门难度。 二、关于 Python Python 就像哆拉 A 梦,拥有一个装满各种道具的百宝袋,即标准库。当标准库道具不够用时,还可以通过 pip 一类的工具从 GitHub 一类的分享代码平台订购新道具。Python 在 AI 领域被广泛使用。 三、关于 OpenAI API OpenAI 通过两种方式提供服务: 1. 通过 ChatGPT,提供开箱即用的服务,直接对话即可。 2. 通过 OpenAI API,提供更加灵活的服务,通过代码调用完成更多自动化任务。 四、学习方法 1. 了解 AI 基本概念 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支及联系。 浏览入门文章,了解 AI 的历史、应用和发展趋势。 2. 开始学习之旅 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习 AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习,一定要掌握提示词的技巧。 4. 实践和尝试 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 五、实践任务 在接下来的 20 分钟内,循序渐进地完成以下任务: 1. 完成一个简单程序。 2. 完成一个爬虫应用,抓取公众号文章。 3. 完成一个 AI 应用,为公众号文章生成概述。
2024-12-16
ai视频动漫
以下是关于 AI 视频动漫的相关信息: 一、现阶段应用场景 AI 视频产品目前面向的主要受众群体包括: 1. 专业创作者(艺术家、影视人等):AI 生成能够为作品赋予独特风格和想象力,为创作者提供灵感,配合高超的剪辑技巧和叙事能力,便可以制作出超乎想象的效果。低成本动捕更是能够大幅降低后期制作的门槛和成本,自动识别背景生成绿幕、视频主体跟随运动等能够辅助视频编辑,为后期制作增加更多空间。目前该应用主要集中在音乐 MV、短篇电影、动漫等方向。一些 AI 视频平台也积极寻求创意合作,为创作者提供免费支持。例如,@valleeduhamel 使用现有的素材、Gen1 和大量合成创作了新电影《After Light》的过程分享,Ammaar Reshi 的团队使用 Stable WarpFusion+Davinci Resolve 制作完整的动漫剧情,制作过程分享。 2. 自媒体、非专业创作者:这部分人群通常有着非常具体且明确的视频剪辑痛点。比如科技、财经、资讯类重脚本内容的视频在制作时需花费大量时间寻找视频素材、还需注意视频版权问题。一些产品(Invideo AI、Pictory)已经在发力脚本生成分镜、视频,帮助创作者降低视频素材制作门槛。Gamma AI 已经实现了文章高效转 PPT 的能力,若能结合 Synthesia、HeyGen AI、DID 等产品的 Avatar、语音生成能力也可快速转化为视频内容。不同平台适合不同内容形式,创作者想要将同一个素材在不同平台分发就意味着制作成本的升高。而 OpusClip 提供的长视频转短视频致力于解决这一痛点。 3. 企业客户:对于没有足够视频制作资金的小企业、非盈利机构来说,AI 视频生成可以为其大幅缩减成本。 二、热门产品介绍 现阶段 AI 视频产品在真实系视频生成上的效果有了飞速进步,但在偏平面的漫画风格上还缺乏训练数据,画面中的可运动元素也比较难被判断,因此使用 img2vid 比较难产出合适的动画,动画幅度较大时很难保证前后一致性。尝试做了一个黑白漫画画风动画,使用了 Luma AI 作为主力,Runway、Pixverse、SVD 等工具作为辅助产出。事实证明 Luma 在清晰度和运动幅度上都是目前可用的 AI 视频工具中最好的。 三、AI 摆摊项目中的应用 在 AI 摆摊项目中,视频处理方面包括视频动漫化等。例如,换脸(60 积分)、视频动漫化、AI 生成的视频脚本(20 积分)、AI 高清处理(10 积分)。
2024-12-16
分镜图片生成工具
以下是关于分镜图片生成的相关信息: 制作 2 分钟短片的步骤包括剧本创作、分镜脚本创作、角色设计、分镜图片制作、动画制作、配音和配乐。 在分镜图片生成阶段,由于 AI 视频生成目前处于抽盲盒阶段,无法精准判断生成的图片能否生成完美的动作视频,所以决定生成一张合适的图片就直接开始对应动画镜头的生成,若视频无法达到预期效果,及时修改图片、补充镜头。 给出了一些分镜图片生成的提示词示例,如“Heavy rain hits the grass,closeup of the grass,dark environment,in the style of Hayao Miyazakiar 16:9v 6.0s 250”“A tornado rolls in,dark,Hayao Miyazaki stylear 16:9v 6.0s 250”“Dark sky,dark clouds,lightning and thunder,sky closeup,in the style of Hayao Miyazakiar 16:9v 6.0s 250”“直接使用文生视频,后期需要叠加到镜 2 的画面上”“dark,bad environment,After a dark and dilapidated environment after a big storm,a white cat's paw walks on the wet dirt,side shot,closeup of the cat's paw,dim environment,in the style of Hayao Miyazakiar 16:9niji 6s 250”
2024-12-16
什么是多模态?什么是跨模态?
多模态指多数据类型交互,能够提供更接近人类感知的场景。大模型对应的模态包括文本、图像、音频、视频等。例如,Gemini 模型本身就是多模态的,它展示了无缝结合跨模态能力,如从表格、图表或图形中提取信息和空间布局,以及语言模型的强大推理能力,在识别输入中的细微细节、在空间和时间上聚合上下文,以及在一系列视频帧和/或音频输入上应用这些能力方面表现出强大的性能。 跨模态通常指不同模态之间的交互和融合。例如在 GPT4 的相关研究中,探索了视觉和音频等可能出乎意料的模态。智能的一个关键衡量标准是能够从不同的领域或模式中综合信息,并能够跨不同的情境或学科应用知识和技能。
2024-12-16
0基础如何系统学习AI,目标:针对特定场景开发出AI产品
对于 0 基础想要系统学习 AI 并针对特定场景开发出 AI 产品的您,以下是一些建议: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,对于 AI 产品经理,个人做了以下划分,仅供娱乐和参考: 1. 入门级: 能通过 WaytoAGI 等开源网站或一些课程了解 AI 的概念,使用 AI 产品并尝试动手实践应用搭建。 2. 研究级: 有两个路径,一个是技术研究路径,一个是商业化研究路径。这个阶段对应的画像可能是对某一领域有认知,可以根据需求场景选择解决方案,或利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用: 这一阶段的画像就是有一些成功落地应用的案例,如产生商业化价值。 在 AI 游戏场景方面,为您提供以下案例: 1. 从游戏截图升级到 KV 品质,AI 居然可以这样用! 作者:yanceyzhang 简介:AI 生成图像具有较大的随机性,如果想用在特定项目上的话,用游戏内资源拼合作为图生图的底图可以很好的帮助 ai 发挥,复现游戏原有的画风、世界观和人物设定,下面将实际操作中的一些思路和小技巧分享出来。 查看链接: 入库时间:2023/11/21 2. 《LORA 模型训练超入门级教程》人人都可以当炼金术士 作者:包子 SAMA丶 简介:初步接触训练模型,主要是以美术视角出发来进行讲解,目的就是可以让不理解训练概念和代码指令的小伙伴更容易上手 Lora 模型训练。 查看链接: 入库时间:2023/11/21 3. 人人可以做原画,如何运用 Midjourney+Stable Diffusion 进行角色原画设计 作者:Harayuan 简介:本文旨在详细探讨运用 MJ+SD 进行角色设计的方法、技巧,以及它的优势、不足之处和未来发展方向。 查看链接: 入库时间:2023/11/21
2024-12-16
如何理解GPT
GPT 是“生成式预训练变换器”(Generative Pretrained Transformer)的缩写,是一种大型语言模型(LLM),也是生成式人工智能的重要框架。首个 GPT 由 OpenAI 于 2018 年推出。GPT 模型是基于 Transformer 模型的人工神经网络,在大型未标记文本数据集上进行预训练,并能够生成类似于人类自然语言的文本。 生成式预训练是机器学习领域由来已久的概念。2017 年 Google 推出 Transformer 模型后,出现了如 BERT 和 XLNet 这样的大型语言模型。2018 年,OpenAI 发表了名为《通过生成式预训练提高语言理解能力》的文章,首次介绍了基于转换器的生成式预训练模型(GPT)系统,即“GPT1”。 生成式指的是大模型根据已有的输入为基础,不断计算生成下一个字词(token),从而逐字完成回答的过程。例如,一开始给大模型一些提示词,如“How”,大模型会结合自身知识计算推理,输出“are”接在“How”后面,然后在已知“How are”的情况下,再次推理计算输出“You”,如此重复,直到计算出下一个词是“”的概率最大,结束输出。 截至 2023 年,大多数 LLM 都具备这些特征,并广泛被称为 GPT。大模型通常拥有庞大的参数数量,通过处理和理解海量数据,能够胜任一系列复杂的任务。其强大的原因在于庞大的参数数量和大量的数据训练。
2024-12-16
Sora是什么
Sora 是 OpenAI 发布的一个文本到视频的生成模型。 它具有以下特点和能力: 1. 能够根据描述性的文本提示生成高质量的视频内容。 2. 其生成的视频不仅逼真且充满想象力,能创造出各种场景。 3. 可以生成长达 1 分钟的超长视频,且是一镜到底的,视频中的人物和背景等具有惊人的一致性和稳定性。 4. 虽然在技术界引起广泛关注和讨论,但目前 OpenAI 未公开发布,仅向少数研究人员和创意人士提供有限访问权限以获取使用反馈并评估技术安全性。 在图像生成能力方面,Sora 能生成图像,虽不及 Midjourney,但优于 Dalle 3。此外,Sora 在视频游戏模拟中也具有一定的能力。
2024-12-16
有没有一个ai,可以把一篇文档变成像Quizlet这样的填空或选择题
目前可能没有专门将文档直接转换为像 Quizlet 那样的填空或选择题形式的单一 AI 工具。但您可以利用一些自然语言处理和文本编辑的工具,结合一定的人工处理来实现类似的效果。例如,使用一些在线的文本编辑软件,先对文档进行分析和标记,然后手动创建填空或选择题。
2024-12-16
免费学习ai
以下是为您提供的免费学习 AI 的相关信息: 周鸿祎免费课 AI 系列第一讲:周鸿祎认为在人工智能的技能和知识面前人人平等,学会人工智能是未来职业发展必备的基本能力。其免费课的关键词是免费、分享、科普、交流。课程中会邀请行业专家讲课,还会分享学习方法,如先从宏观上把握新领域的整体框架,再结合微观层面展开。 野菩萨的 AI 课:课程内容丰富,包括预习周课程、基础操作课、核心范式课程、SD WebUi 体系课程、ChatGPT 体系课程、ComfyUI 与 AI 动画课程、应对 SORA 的视听语言课程等。如果想要免费获得这门课程,可以参与 video battle,获胜者有机会获得课程,不同名次有不同奖励。 您可以根据自己的需求选择适合的课程进行学习。
2024-12-16