直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
知识蒸馏是什么
知识蒸馏是一种模型压缩方法。在训练过程中,大模型作为教师模型,轻量级模型作为学生模型,学生模型不仅学习任务的真实标签,还学习教师模型生成的软标签,从而能够“站在巨人的肩膀上”学习,提高自身性能。例如,NVIDIA 技术博客介绍了通过剪枝和知识蒸馏将 Llama3.1 8B 模型缩减为 Llama3.1Minitron 4B 模型的方法。剪枝通过移除模型中的一些参数来减少计算需求和内存占用,而知识蒸馏让小模型学习大模型的输出。此外,在一些情况下,可能存在无意导致的信息蒸馏现象。
2025-02-07
什么是AI
AI(Artificial Intelligence,人工智能)是一门令人兴奋的科学,它研究如何使计算机表现出智能行为,例如做一些人类所擅长的事情。 对于AI的理解,对于不具备理工科背景的文科生来说可能较困难,可将其当成一个黑箱,只需要知道它是某种能模仿人类思维、理解自然语言并输出自然语言的东西即可。其生态位是一种似人而非人的存在,技术再发展,这一生态位也不会改变。 从技术层面看,最初计算机由查尔斯·巴贝奇发明,用于按照明确的程序进行数字运算,现代计算机虽更先进,但仍遵循相同的受控计算理念。然而,对于像根据照片判断一个人的年龄这类任务,我们无法明确其解法,也无法编写明确程序让计算机完成,这类任务正是AI所感兴趣的。 在应用方面,生成式AI(GenAI)是一种基于深度学习技术,利用机器学习算法从已有数据中学习并生成新数据或内容的AI应用。典型的GenAI包括OpenAI推出的语言模型ChatGPT、GPT4、图像模型DALLE以及百度推出的文心一言、阿里云推出的通义千问等。AIGC则指利用GenAI创建的内容,包括图像、视频、音频、文本和三维模型等。国内主要在相关法律框架下对AIGC行业进行监管。
2025-02-07
数据集构建
以下是关于数据集构建的相关信息: Panda70M 数据集: 构建过程:从 HDVILA100M 数据集中筛选高质量视频片段,使用多个跨模态教师模型生成描述,通过微调检索模型选择最佳描述作为注释。 模型结构:设计语义感知的视频分割算法,将长视频分割成语义一致的片段,使用包括图像描述模型和视频视觉问答(VQA)模型在内的教师模型生成候选描述,微调细粒度的视频到文本检索模型选择最佳描述。 实验结果:在视频描述任务中,使用 Panda70M 预训练的模型在 MSRVTT 和 MSVD 数据集上的性能显著优于官方权重;在视频和文本检索任务中,预训练的 Unmasked Teacher 模型在 MSRVTT、DiDeMo 和 MSVD 数据集上的零样本和微调检索性能也优于官方权重。 总结归纳:Panda70M 是创新的大规模视频数据集,结合多模态输入和先进模型训练技术,提高视频描述质量和准确性,为视频理解和生成任务提供资源并推动研究进展。 相关工作:提到了与 Panda70M 相关的如 HDVILA100M、HowTo100M 等工作,为视频数据集构建和注释提供基础。 RAG 提示工程中的数据集构建: 动手做一个 RAG 提示词:将主要提示词放到 System 中控制模型行为与设定,User 提示词预置提问的话,重点在于{Query}这种特殊变量形式写法。 准备数据集:可以上传自己的测试数据集,也可以使用 PromptLayer 提供的测试数据集,目前支持 Json 和 CSV 两种格式,注意上传中文数据集可能出现乱码。 开始测试:点击创建的数据集进行测试前配置,免费账户可一次性测试 4 个 Q&A 对,付费账户可进行大批量测试。 中文数据集: 文本匹配相关的中文数据集包括: :包括 88 万文本蕴含中文文本蕴含数据集的翻译与构建,基于深度学习的文本蕴含判定模型构建。 :给定问题答案,以及该答案是否是该问题的答案之一的标记。 :给定文本形式的技术需求和技术成果,以及需求与成果的关联度标签。 :中文自然语言推理数据集,通过翻译加部分人工修正的方法从英文原数据集生成。
2025-02-07
音乐制作AI
以下是一些人工智能音频初创公司,专注于音乐创作与制作: :前身为“Definite Technologies”,开发使用 AI 处理/生成声音的 VST/AU/AUv3 插件。 :自适应 AI 音乐平台,通过高质量音频样本进行实时细胞组成。 :基于 AI 的音乐助手,包括歌词写作助手。 :实时音乐、音频和视频创作平台。 :为创意媒体应用提供合成歌声。 :数字宇宙的音乐解决方案,Soundtracks、AI Studio、Music Maker JAM 的制作者。 :AI 音乐创作和制作。 :自由定制高质量免版权费音乐。 :一个云平台,让音乐人和粉丝在全球范围内创作音乐、协作和互动。 :使用嵌入式软件、信号处理和 AI 帮助艺术家录制、混音和母带处理他们的现场表演。 :开源音乐生成工具。 :旨在通过 AI 赋能真实艺术家的伦理音频 AI 插件、工具和社区,而非取代他们。 :使用 AI 创作音乐和语音。 :与 DAW 集成的生成音乐工具,100%免版权费。 :为创意媒体提供的伦理音乐 AI。 :AI 音乐创作平台和探索声音宇宙的个人音乐制作人。 :通过音乐赋予你新的创作和表达方式。 :使用 AI 改变你的歌唱声音。 :为你的创造力和生产力提供 AI 音乐。 :使用 AI 生成声音、音效、音乐、样本、氛围等。 :带有 AI 助手并支持本地 VST 插件的网页 DAW。 :Audacity®音频编辑器的网页版。 (被 Apple 收购):我们的音乐帮助品牌与受众建立更深层次的连接。 :下一代音乐制作人。 :由 AI 驱动的软件引擎,可以生成音乐。它可以对手势、动作、代码或其他声音作出反应。 :全球最大的音乐教育平台。 :用于创作歌曲和音频录制的应用程序。 :提供无缝录音室体验的一体化在线协作平台。 :专业音频、语音、声音和音乐的扩展服务。 :视频编辑的音频解决方案。 :由 AI 驱动的音乐工作室。 :通过直观的软件/硬件生态系统为音乐演奏者提供世界级声音的民主化访问。 :AI 音频插件和社区,弥合 AI 研究与创意之间的差距。 :为音乐人、制作人和内容创作者提供 AI 驱动的混音服务。 :为创作者提供的在线音乐软件:音乐母带处理、数字音乐发行、分期付款插件、免费样本包和协作工具。
2025-02-07
有哪些好用的做ppt的ai工具
以下是一些好用的做 PPT 的 AI 工具: 1. Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 5. 爱设计 6. 闪击 7. Process ON 8. WPS AI
2025-02-07
普通人如何在AI迅猛发展的浪潮中避免被淘汰
在 AI 迅猛发展的浪潮中,普通人避免被淘汰可以从以下几个方面努力: 1. 积极学习和掌握 AI 相关技能,如 AI 编程。编程门槛因 AI 而降低,未来编程技能可能会像 Office 软件一样普及,成为职场基本素养。能够驾驭 AI 编程工具并用于解决实际问题、创造价值的人更易脱颖而出。 2. 注重培养运用 AI 工具解决问题的能力,而非仅仅依赖工具生成的结果。真正的价值在于借助工具实现创新、提升效率。 3. 关注 AGI 对社会和个人的影响,思考在 AGI 世界中个体如何生存、创造价值,并探索新的分配方式。 4. 以发展的眼光看待 AI 的进步,不能因当前 AI 的不足而忽视其快速发展的趋势。AI 的“效用函数”和计算力在不断提升,可能在 5 年内就使行业发生巨大变化,十几年内可能对人类产生全面替代,因此要积极应对,不能逃避或沾沾自喜。
2025-02-07
文本整理
以下是关于文本整理的相关内容: 总结类应用: 大型语言模型在概括文本方面的应用令人兴奋,可在 Chat GPT 网络界面中完成,也可通过代码实现。包括对产品评论的摘要任务,还介绍了文字总结的不同类型,如 4.1 文字总结、4.2 针对某种信息总结、4.3 尝试“提取”而不是“总结”、4.4 针对多项信息总结。 创建并使用知识库: 创建知识库并上传文本内容的上传方式及操作步骤: Notion:在文本格式页签下选择 Notion,依次进行授权、登录选择页面、选择数据、设置内容分段方式(自动分段与清洗或自定义)等操作,最后完成内容上传和分片。 自定义:在文本格式页签下选择自定义,输入单元名称,创建分段并输入内容,设置分段规则,最后保存。 本地文档:在文本格式页签下选择本地文档,拖拽或选择要上传的文档(支持.txt、.pdf、.docx 格式,每个文件不大于 20M,一次最多上传 10 个文件),选择内容分段方式(自动分段与清洗或自定义),完成上传和分片。
2025-02-07
请给我推荐一个能够阅读网页链接内部信息的AI模型
以下为您推荐能够阅读网页链接内部信息的 AI 模型相关内容: 有一款 AI 浏览器插件,在产品化开发阶段,需要考虑如何稳定获取网页内容、如何选择适合的 AI 大模型 API 服务以及如何构建生产级提示词等问题。 在获取网页内容方面,由于大模型对话产品的外链解析方式容易遭到平台反爬机制制裁,通过用户浏览器以浏览器插件形式本地提取网页内容是一种稳定、经济的解决方案。比如 AI Share Card 插件,可以获取网页元素清单。开发时,您可以拿着初版提示词,询问 AI 来设计获取相关元素的 js 代码。 对于大模型 API,需要利用插件预先获取的网页内容变量、提示词和 API 请求参数,拼搭出完整的 API 提示请求,精确引导 API 返回想要的生成结果。根据 BigModel 官网给出的请求示例,需要传递 Model 类型、系统提示词、用户提示词、top_p、temperature 等关键参数。如果缺少参数设定经验,可以先询问 AI 相关设定的合适值,再逐步调试效果。 同时需要注意,使用 AI 写东西时,它可能会“产生幻觉”生成错误内容,需要检查所有内容。而且 AI 不会真正解释自己,可能给出编造的答案,使用时要对其输出负责。
2025-02-07
有没有能够阅读网页链接内部信息的AI模型?
目前存在能够阅读网页链接内部信息的相关技术和工具。例如,有一些 AI 浏览器插件可以实现这一功能。 在实现过程中,需要考虑以下几个关键方面: 1. 稳定获取网页内容:在初版提示词实验中,获取网页内容依赖大模型对话产品的外链解析能力,但易受平台反爬机制制裁。转换思路,通过用户浏览器以插件形式本地提取网页内容是一种稳定且经济的解决方案。开发时需确定需要插件获取的网页元素,可拿着初版提示词询问 AI 来设计获取相关元素的 js 代码。 2. 选择适合的 AI 大模型 API 服务:需要综合考虑多种因素来选择合适的服务。 3. 构建生产级提示词:对于大模型 API,要利用插件预先获取的网页内容变量、提示词和 API 请求参数,拼搭出完整的 API 提示请求,精确引导 API 返回想要的生成结果。同时,要根据不同模型的特点和要求设置相关参数,也可先询问 AI 相关参数的设定经验再进行调试。 此外,在初版提示词的开发中,将设计要求拆分为“设计规范”和“内容结构”,再细分为独立模块,并结合“内容结构”进行要求提示,这种提示词组织方式具有模型通用性、提示简易性和生成稳定性等显著优势。
2025-02-07
新手入门该看这个知识库里的哪些文章/视频,给我列一个学习 路径
以下是为新手入门提供的学习路径: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,进行实践巩固知识,尝试使用各种产品做出作品。 在知识库查看大家实践后的作品、文章分享,并分享自己实践后的成果。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,对于 WayToAGI 知识库的使用: 1. 如果觉得视频太多很晕,可以从 Agent 板块开始,比如链接: ,从下往上看,一个一个点进去,都有视频。共学都有视频,都是手把手从注册开始的教学,不会就多看几遍,基本保障一个工具能调通、一个 Agent 能搭好。如果觉得内容多,可以先挑听过的工具开始。 2. 看了一些视频之后,如果想看理论或应用,可以找到导航,想看哪里点哪里。比如链接: 。 3. 还可以从常见工具开始体验,比如: 工具入门篇(AI Tools):数据工具多维表格小白之旅,文章链接: ,适用人群为 Excel 重度使用者、手动数据处理使用者、文件工作者,可满足 80%数据处理需求。 工具入门篇(AI Code):编程工具Cursor 的小白试用反馈,文章链接: ,适用人群为 0 编程经验、觉得编程离我们很遥远的小白,可降低技术壁垒。 工具入门篇(AI Music):音乐工具Suno 的小白探索笔记,文章链接: ,适用人群为 0 乐理知识、觉得作词作曲和我们毫不相关成本巨大的小白,可参与音乐制作。
2025-02-07