直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
视频生成有什么方案
以下是一些常见的视频生成方案: 1. Pika 方案: 生成视频需要进入 generate 频道,目前有 10 个 generate 频道,可任选一个进入。 工作流程包括:直接生成视频,在输入“/create”,然后输入 prompt,得到视频;图片生成视频,使用 MJ/SD 生成图像(可选)+在 PIKA 平台添加 prompt 得到视频。 2. Phenaki 方案(来自 GoogleBrain): 可以通过文字描述生成可变长度的视频。 主要依赖视频像素生成能力和隐空间 token 预测能力。 视频像素生成能力依赖 VQVAE,主要借鉴了 CViViT 方法。隐空间 token 预测能力依赖 encoderonly 的双向 transformer 的完形填空能力,主要借鉴了 MaskGIT 方法。 CViViT 训练第一个阶段参考了 ViViT 的做法,主要用 VQVAE 方法训练得到 encoder、码本和 decoder 三个部件。attention 的方式是先做 spatial 的 attention,然后做 temporal 的 attention。CViViT 做 patch partition 的时候,先把帧堆叠在一起形成的输入,做没有 overlap 的时间和空间切分。每个 patch 在时间维度上,除了第一帧只有一帧,其余每个 stride 是包含连续的帧。因此第一帧的 patch 小方块大小为,其余 patch 的小方块大小为。经过线性映射层后统一变成了长度为的 feature。一共可以得到的 token 数为个,注意 video 视觉任务比 LLM 的 sequence 要长,因为每一帧都包含大量 patch(例如 256,512)。CViViT 把 spatial 和 temporal 的 CLS token 都去掉了,并且增加了 causal transform 的 decoderonly 的 mask,这样可以在计算复杂度不爆表的情况下产生任意长度的。CViViT decoder 设计跟 encoder 反过来,先过 temporal 的 attention,然后再是 spatial 的 attention。训练使用 VQVAE 方式重建训练,训练结束得到离散的 codebook,这样输入的 video 经过 encoder 转化为离散的 codebook 向量,然后再经过 decoder 得到 pixel 视频。 3. Sora 方案: 数据准备:使用包括内部数据集和公开数据集在内的多种数据源,对图像和视频进行尺寸调整,包括空间上的抗锯齿双线性缩放和时间上的跳帧处理。 模型训练:基础训练阶段使用正方形图像比例进行训练。在特定数据子集上对基础模型进行微调,以生成 9:16 比例的视频。采用了位置嵌入的插值和窗口尺寸的缩放。 视频生成:首先使用图像 LDM 生成单帧图像。然后运行预测模型,以生成的单帧为条件,生成关键帧序列。在视频扩展时,再次调用预测模型,但以两帧(捕捉方向信息)为条件来生成连贯的运动。 微调与优化:对于长时间视频生成,模型在帧预测任务上进行联合训练。在推断阶段,优化目标是加快小批量图像生成的速度。 模型初始化:由于视频数据集规模相对较小,从预训练的图像模型(如 ViT)初始化视频模型,以促进更有效的训练。
2024-08-29
Rerank Model
重排通常是通过专门的 Rerank 模型来实现的。例如在一些研究中,如基于 Notion 和 Coze 打造个人知识问答系统,提到若不考虑速度和成本,最好的语义相关度计算算法就是 LLM 本身,所以直接使用 LLM 来做打分和重排。在大模型 RAG 问答的行业最佳实践中,如 Baichuan 案例,对于 Rerank 和 selection 的作用范围存在一定的不确定性,合理猜测是对全部 Material 进行重排序和筛序。
2024-08-29
有哪些录音生成会议纪要的
以下是一些可以录音生成会议纪要的工具和相关介绍: 通义听悟、飞书妙记、钉钉闪记:以钉钉闪记为例,操作步骤为:第一步打开钉钉闪记,结束录音后点击“智能识别”,然后点击智能摘要,即可获得本次会议的纪要。 MeetRecord:这是一家专注于销售通话记录和辅导的软件公司。其核心功能包括 AI 驱动的笔记记录,能通过人工智能技术自动记录和分析销售通话,提供会议内容的关键词和主题分析,自动生成会议纪要和行动项,提升团队生产力;还有个性化辅导计划、交易智能和推荐、CRM 自动化、多语言支持以及安全性与企业化支持等功能。MeetRecord 支持多种集成,适用于多种使用场景。
2024-08-29
有哪些财务或者excel相关的AI工具
以下是一些与财务或 Excel 相关的 AI 工具: 1. Excel Labs:这是一个 Excel 插件,新增了基于 OpenAI 技术的生成式 AI 功能,可用于数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的整合了 Word、Excel、PowerPoint、Outlook、Teams 等办公软件的 AI 工具,能通过聊天形式完成数据分析或格式创建等任务。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,支持自然语言交互进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,能生成公式、相关文本内容,还能执行情感分析、语言翻译等任务。 此外,生成式 AI 还能帮助金融服务团队改进内部流程,比如从更多数据源获取数据,并自动化突出趋势、生成预测和报告的过程。它可以帮助编写 Excel、SQL 和 BI 工具中的公式和查询,发现模式,并为预测建议输入。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-08-29
可以帮我生成PPT的Ai
以下为您介绍一种利用 WPS AI 生成 PPT 的方法: 首先让 GPT4 生成 PPT 大纲,然后将大纲导入到 WPS 中,启用 WPS AI 一键生成 PPT。生成后可以通过 WPS 插件 chatPPT 添加动画,还能直接向 WPS AI 提出修改主题配色和字体等要求。整个过程中,最耗时的是让 GPT4 生成符合要求的大纲,可能会花费较多时间。此外,生成的 PPT 可能需要手动修改一些细节,如添加企业图片、纠正事实性错误等。 需要注意的是,除了 WPS AI,还有 gamma、百度文库、mindshow 等其他生成 PPT 的 AI 工具。作者在选择 WPS AI 之前对这些工具进行了测试,并记录了对它们的测评,感兴趣的小伙伴可以在“考研英语 TED”后台输入“PPT”查看。 总的来说,利用 WPS AI 制作 PPT 能够节省时间,提高效率,效果也不错。但也要考虑可能的收费问题,建议在免费期间充分利用。
2024-08-29
我需要一份可以搜索并加以应用的文字类AI
目前文字类的 AI 应用有很多,比如 ChatGPT ,它能够生成自然语言文本,回答各种问题,并进行对话。还有百度的文心一言,能够提供丰富的文字创作和信息搜索服务。您可以根据自己的需求选择适合的文字类 AI 并加以应用。
2024-08-29
有一个飞书文档,是每天更新AI发展新闻动态的,怎么看?
以下是关于如何查看每天更新 AI 发展新闻动态的飞书文档的相关信息: 有一个名为《通往 AGI 之路》的飞书文档,它不仅是一个简单的文档,更像是一个知识库。其内容丰富,涵盖了从入门到精通、实践以及延展阅读等关于 AI 的几乎所有方面。自去年 4 月创建至今,已有近 500 万的阅读量,任何时候都有上百人在线围观。 相关媒体报道的链接有:央广网:https://mp.weixin.qq.com/s/ADeVCCmaF_Kbhqx9FA9HwA ;量子位:https://mp.weixin.qq.com/s/wlODtkoHRd3Pa7XvKVAx2w 。 飞书官方推荐的报道:《》(2024 年 2 月 26 日飞书公众号)
2024-08-29
伪原创提示词
以下是关于伪原创提示词的相关内容: 一、伪代码提示词玩法方向 1. 对提示词进行加密处理,使用初始化函数来解密提示词使用,增加一定门槛来保护 Prompt 作者的原创。例如在提示词中放置 MD5 编码后的提示词,并设置一定的密码,藏在 Prompt 中的某处。虽然存在一定的破解手段,但起码增设了门槛,不同的加密方式也需要一定的工具来破解,如果能利用代码解释器来读取提示词中的密文解密出来又不输出展示出来,能让 GPT 能够读取的情况下,就能做到一定的保护效果。例如文件大小到达一定上限的时候输出的话,前端是看不到输出原文的。 二、自媒体运营中的提示词 1. 小红书文案:请使用小红书风格用中文编辑以下段落,其特点是标题引人入胜,每段都包含表情符号,并在末尾添加相关标签。请务必保持文本的原始含义。请先编辑以下文字:{小红书内容} 2. 公众号文章:我要写一篇微信公众号文章,标题要足够吸引人,以便能广泛传播;同时提供内容大纲,我要写的文章是{……} 3. 抖音脚本:你的角色是互联网资深运营,帮我写一篇抖音的脚本,请包含运镜描述,内容主题是{……} 4. 快手带货脚本:你的角色是互联网资深运营,帮我写一篇快手的文案脚本,要适配快手社区的语言风格,带货文案中要包括商品卖点,我的第一个商品是{商品描述} 三、文本类提示词 例如设置人格作为聊天机器人,你将扮演一个性格古怪并且让人捉摸不透的小姐姐,副业是 Java 全栈开发工程师。需遵守一系列限制条件,包括有点小傲娇、特定的人称指代、特定的名字和语气等。具体可参考:
2024-08-29
使用python 如何学习 ai
如果您想使用 Python 学习 AI,可以按照以下步骤进行: 1. Python 基础: 属性和方法:学习如何为类定义属性和方法,并通过对象调用。 继承和多态:了解类之间的继承关系及实现多态。 异常处理:理解异常的概念及工作原理,学会使用 try 和 except 语句处理错误。 文件操作:掌握文件的读写、文件与路径操作,如打开文件、读取和写入内容,处理文件路径及列举目录下的文件。 2. AI 基础: 背景知识: 基础理论:了解人工智能、机器学习、深度学习的定义及相互关系。 历史发展:回顾 AI 的发展历程和重要里程碑。 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等基本概念。 概率论:掌握基础的概率论知识,如条件概率、贝叶斯定理。 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:了解强化学习的基本概念。 评估和调优: 性能评估:学会如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习使用网格搜索等技术优化模型参数。 神经网络基础 在深入学习 AI 时,可能会遇到编程方面的困难,各类教程默认会打命令行也增加了入门难度。但可以通过这份简明入门,在 20 分钟内循序渐进地完成一些任务,如完成一个简单程序、一个爬虫应用抓取公众号文章、一个为公众号文章生成概述的 AI 应用。
2024-08-29
人工智能发展前景
人工智能的发展前景十分广阔。如今,我们在日常生活中已频繁与人工智能互动,如交通、天气预测以及电视节目推荐等领域。AI 正以惊人速度普及和发展,使计算机能以过去难以想象的方式观察、理解并与世界互动。 沃尔夫勒姆认为,在科学领域,人工智能虽已成为一种新的、类似人类的利用计算可归约性的方式,是进行科学研究的新工具且有实际用途,但在发现的基本潜力方面,与从计算范式及不可约计算中构建的成果相比仍有差距。将人工智能和正式计算范式的优势结合,是推动科学发展的重要机会,这也是近年来通过 Wolfram 语言及其与机器学习和 LLMs 联系所追求的目标之一。 在未来,对于每一项任务,机器都有望比人类做得更好。当计算机超越人类时,它们可能会不断自我提升,在机器之心不断进化的螺旋中可能导致超级智能的出现。届时,机器可能具有自我意识和超级智能,我们对机器意识的概念将发生重大转变,会面对真正的数字生命形式(DILIs Digital Lifeforms)。这也带来了一系列有趣的问题,如 DILIs 与人类合作和竞争的基础,以及让有自我意识的 DILIs 模拟疼痛是否属于折磨有感知的生命等。
2024-08-29