直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
我该从哪里开始
学习 AI 是一个长期的过程,需要耐心和持续的努力。对于新手来说,可以参考以下建议: 1. 完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。 2. 如果您想从零开始,可以参考 GPT1 到 Deepseek R1 所有公开论文 The 2025 AI Engineer Reading List 。其中我们挑选了 50 篇论文/模型/博客,涉及人工智能工程的 10 个领域:LLMs、基准、提示、RAG、代理、CodeGen、视觉、语音、扩散、微调。 3. 对于微调(Finetuning)方面,假设您已经按照上述说明准备了训练数据。使用 OpenAI CLI 开始微调工作,从 BASE_MODEL 开始选择基本模型的名称(ada、babbage、curie 或 davinci),您可以使用后缀参数自定义微调模型的名称。每个微调工作都从一个默认为 curie 的基本模型开始,模型的选择会影响模型的性能和运行微调模型的成本。开始微调作业后,可能需要一些时间才能完成,具体取决于模型和数据集的大小。
2025-02-15
嵌入式WEB翻译插件
以下是关于嵌入式 WEB 翻译插件的相关信息: SD 提示词自动翻译插件 promptallinone: 作者:白马少年 发布时间:20230529 20:00 原文网址:https://mp.weixin.qq.com/s/qIshiSRZiTiKGqDFGjD0g 在 Stable Diffusion 中输入提示词只能识别英文,秋叶整合包包含提示词联想插件。 常用翻译软件如 DeepL(网址:https://www.deepl.com/translator,可下载客户端)、网易有道翻译(可 ctrl+alt+d 快速截图翻译),但复制粘贴来回切换麻烦。 自动翻译插件 promptallinone 安装方式:在扩展面板中搜索 promptallinone 直接安装,或把下载好的插件放在“……\\sdwebuiakiv4\\extensions”路径文件夹下,安装完成后重启 webUI。 插件特点: 一排小图标,第一个可设置插件语言为简体中文。 第二个图标是设置,点开后点击第一个云朵图标可设置翻译接口,点击第一行下拉菜单可选择翻译软件。 AIGC 落地应用 Open AI Translator(强烈推荐): 推荐指数:????? 是接入了 GPT 能力的文本翻译、总结、分析类产品,翻译功能适合浏览网页时查询个别单词、句子。 最大优势是可在脱离只提供产品内 AI 能力的场景使用,如任何 web 场景,配合 Arc Browser 而非 Chrome 使用效果更佳。 调用方式:选中页面中的文本后会悬浮该插件,点击即可翻译,速度极快,摆脱“复制打开翻译软件粘贴翻译”的流程。 可用于文本分析、分析代码,搭配 Chat GPT 使用效果好。 开发者模式下也可辅助使用。 注:安装后需获取 Open AI 的 API Key,首次打开插件设置好 Open AI Key 地址,找地方保存好 API Key 方便使用。 下载地址:
2025-02-15
本地视频播放实时翻译
以下是关于本地视频播放实时翻译的相关内容: Adobe Firefly 视频翻译功能 1. 访问 Adobe Firefly 网站:打开浏览器,访问,可在下方示例视频处选择不同语种查看示例效果。 2. 上传视频文件:点击“浏览文件(Browse files)”上传视频文件,支持.mp4 或.mov 格式,分辨率最高可达 4K,视频时长 5 秒到 10 分钟,且文件需包含至少 5 秒连续音频,注意为获得最佳效果,视频或音频录音应包含清晰语音、可听见的语音和最小的混响或背景噪音,目前仅支持单个说话者,录音中应只有一种语言。 3. 选择源语言和目标语言:上传成功后,系统自动检测源语言,可更改,然后从“翻译成(Translate into)”下拉菜单选择目标语言,可多选。 4. 生成翻译视频:点击“生成(Generate)”按钮,系统开始翻译和唇形同步过程,进度条显示处理状态。关闭页面稍后返回,可从“你的媒体(Your media)”部分下载最终处理后的文件,七天内可供下载,七天后文件将被永久删除。若原始视频分辨率低于 1080p,输出视频分辨率将与原始视频匹配,否则将缩小到 1080p。 Meta AI 发布实时人工智能语言翻译模型:Seamless 1. 应用场景:实现人们之间的无障碍交流,包括文字和语音交流,适用于教学、旅行、娱乐等场景,使教育学习不再延时,方便国内外院校合作教育分享。 2. 技术类型:语音。 3. 简介:统一了之前的三个 Seamless 系列模型,可以实时翻译 100 多种语言,延迟不到 2 秒钟,说话者仍在讲话时就开始翻译。 4. 主要特点: 保持原声情感:SeamlessExpressive 模型专注于在语音到语音翻译中保持原始语音的表达性,包括语调、情感和风格,保留说话人的语气和情感。 实时翻译:实时翻译功能,大约只有两秒的延迟。与传统的翻译系统相比,它在说话者仍在讲话时就开始。
2025-02-14
我想用ai自动化把我的文档内容生成漂亮的ppt
以下是一些可以将文档内容生成漂亮 PPT 的方法和工具: 1. 歌者 PPT(gezhe.com): 功能: 话题生成:一键生成 PPT 内容。 资料转换:支持多种文件格式转 PPT。 多语言支持:生成多语言 PPT。 模板和案例:海量模板和案例库。 在线编辑和分享:生成结果可自由编辑并在线分享。 增值服务:自定义模板、字体、动效等。 简介:是一款永久免费的智能 PPT 生成工具,能将任何主题或资料转化为 PPT,并提供便捷操作和智能化体验。 产品优势: 免费使用:所有功能永久免费。 智能易用:通过 AI 技术简化制作流程,易于上手。 海量案例:大量精美模板和优秀案例可供选择和下载。 资料转 PPT 很专业:支持多种文件格式,转换过程中尊重原文内容。 AI 翻译:保持 PPT 原始排版不变,多语言在线即时翻译。 推荐理由: 完全免费,对学生和职场人士是福音。 智能化程度高,通过 AI 技术快速将资料转换成精美 PPT,高效准确。 模板和案例库丰富,适合各种场景。 对多语言支持实用,可一键生成目标语言的 PPT 或翻译。 几乎无需学习成本就能上手使用。 2. Process ON: 网址:https://www.processon.com/ 输入大纲和要点: 导入大纲和要点: 手动复制,相对比较耗时间。 导入方式: 复制最终大纲的内容到本地的 txt 文件后,将后缀改为.md。如果看不见后缀,可以自行搜索开启后缀。 打开 Xmind 软件,将 md 文件导入 Xmind 文件中。 Process ON 导入 Xmind 文件。 输入主题自动生成大纲和要求: 新增思维导图。 输入主题,点击 AI 帮我创作。 选择模版并生成 PPT: 点击下载,选择导入格式为 PPT 文件。 选择模版,再点击下载。 3. 增强版 Bot: 场景: 图片理解与生成:在对话框输入诉求,可生成相应图片,也可根据图片提取关键知识内容。 PPT 一键生成:根据上下文在对话框输入诉求,可生成幻灯片内容及相关模板选择。 PDF 智能制作:根据上下文在对话框输入诉求,可生成相应的可选模板。 系统架构论文一键创作。
2025-02-14
如何让老照片动起来
以下是一些让老照片动起来的方法和相关信息: 1. 参加“时光印记”AI 公益挑战赛:该挑战赛采集了杨浦 20 位老一辈建设者老照片与故事,期望用 AIGC 技术创作影视频、AIMV、动图。作品要求任选百年主题,创作视频短片、音乐 AIMV 或动态老照片,AI 制作内容不低于 70%,视频短片时长 60 秒以上,音乐 AIMV 至少 30 秒,图片组让老照片动起来 5 10s。报名及创作时间为即日起至 2024 年 11 月 20 日。参赛方式为填写报名问卷和进群获取素材。 2. 使用 Dreamina 即梦工具:不需要?,每天有免费额度。注册可用抖音号或手机号,上传照片即可尝试让老照片动起来。 3. 使用 Sora 工具:优点是发布的成果好,集成在 openai 一套里可用,但需要?,需要 gmail 注册,需要订阅后才能使用。
2025-02-14
如何输入一个话题自动化生成小红书配文
以下是关于输入一个话题自动化生成小红书配文的方法: 首先,有一个名为“小红书文案专家”的工具。 它的功能价值在于:见过多个爆款文案,只需输入一个网页链接或视频链接,就能生成对应的小红书文案,可辅助创作者生成能一键复制发布的初稿,提供创意和内容,能节约 10 倍文字内容创作时间。其应用链接为:https://www.coze.cn/s/ij5C6LWd/ 。 设计思路方面: 痛点是个人时间有限,希望有人帮忙写初稿再进行二创,最好还能生成配图。 实现思路是给自己和团队小伙伴设计工作流,让 AI 按照运营日常工作思路和流程工作。 一期产品功能包括: 可以提取任何链接中的标题和内容。 按照小红书平台文案风格重新整理内容。 加入 emoji 表情包,使文案更有活力。 为文案配图片。 二期计划功能持续优化升级中,包括增加全网搜索热点功能,提炼热点新闻或事件关键信息,结合用户想要生成的内容方向输出文案和配图。
2025-02-14
ai视频
以下是关于 AI 视频的相关信息: 将小说制作成 AI 视频的一般流程:包括文本分析、角色与场景生成、视频编辑与合成等。可用工具及网址如下: Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI Midjourney(MJ):适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com Adobe Firefly:Adobe 的 AI 创意工具,可生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ OpenAI 发布的首款文生视频模型 Sora:能够根据文字指令创造出逼真且充满想象力的场景,生成长达 1 分钟的超长一镜到底视频,视频中的女主角、背景人物等都有惊人的一致性和稳定性。 Adobe Firefly 的 AI 视频功能:一共发布了三大功能,包括文生视频、图生视频、视频翻译。支持 9:16、16:9 两种尺寸,支持简单的相机运镜,支持首尾帧,生成视频 5s、每秒帧数 24 FPS、1080p,文生视频里可以出现文字(英文),免费用户赠送生成 2 个视频。详细解析教程可访问。
2025-02-14
比较好用的音乐生成软件
以下是一些比较好用的音乐生成软件: 1. Udio:由前 Google DeepMind 工程师开发,通过文本提示可快速生成符合用户音乐风格喜好的高质量音乐作品。网址:https://www.udio.com/ 2. Suno AI:是一款革命性的人工智能音乐生成工具,通过先进的深度学习技术,能将用户输入转化为富有情感且高质量的音乐作品。网址:https://suno.com/ 3. Studio One:由 PreSonus 公司开发的一款专业 DAW 软件,功能全面,适合编曲、录音、混音和母带处理等音乐制作流程。 4. Waves XNoise:由 Waves 公司出品的一款降噪 VST 插件,用于降低音频中的噪声,操作简单,易于使用。 5. iZotope RX 11:专业的音频修复和降噪软件,具备多种音频修复和编辑工具。 6. iZotope Ozone 11:一款专业的母带处理软件,提供全面的母带处理工具,帮助提升音频的整体质量。 7. Ripx Daw Pro:由 Hit'n'Mix 公司出品的独特 DAW 软件,能够对混合音频进行分轨并进行钢琴卷帘形式的修改操作,同时可以导出独立的乐器和人声轨道,进行精细编辑。 8. Adobe Audition:由 Adobe 出品的数字音频编辑软件,操作直观,具备剪辑、降噪等音频处理功能,支持加载 VST 插件。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-14
腾讯agent开发
AppAgent 是由腾讯开发的一种基于大型语言模型(LLM)的多模态 Agent 框架。 其主要特点和功能包括: 多模态代理:能够处理和理解多种类型的信息(如文本、图像、触控操作等)。 直观交互:通过模仿人类的直观动作(如点击和滑动屏幕)来与手机应用程序交互,能够在手机上执行各种任务,例如在社交媒体上发帖、帮用户撰写和发送邮件、使用地图、在线购物,甚至进行复杂的图像编辑等。 对于之后模仿数据的反利用也有不错的应用场景,例如互联网或 AI 或涉及到原型+UE 的工作都可以在基于模仿数据的基础上进行反推,进而让设计出的产品原型和 UE 交互更优解。 AppAgent 在 50 个任务上进行了广泛测试,涵盖了 10 种不同的应用程序。该项目由腾讯和德州大学达拉斯分校的研究团开发。 相关链接: 官方网站:https://appagentofficial.github.io 相关报道:https://x.com/xiaohuggg/status/1738083914193965528?s=20
2025-02-14
coze
以下是关于 Coze 的相关信息: 重磅更新:Coze 可以接入抖音评论区,帮您自动回复用户评论。若想快速上手,可参考视频。若不了解 Coze 是什么,可参考文章。 安装 Coze Scraper: 通过应用商店安装: 1. 打开 Chrome 浏览器。 2. 点击在 Chrome 应用商店中打开 Coze Scrapper 扩展程序。 3. 单击添加至 Chrome。 4. 在弹出的页面,单击添加扩展程序。 本地安装: 1. 单击下载安装包,然后解压下载的文件。 2. 打开 Chrome 浏览器。 3. 在浏览器中输入 chrome://extensions 打开扩展程序页面,确认开发者模式处于打开状态。点击加载已解压的扩展程序,选择已解压的文件夹。 Coze 记账管家: 什么是 COZE:COZE 是字节跳动旗下子公司推出的 AI Agent 构建工具,允许用户在无编程知识的基础上,使用自然语言和拖拽等方式构建 Agent;目前 coze 可以白嫖海量的大模型免费使用,有丰富的插件生态。 什么是记账管家:记账管家是基于 COZE 平台的能力搭建的一个记账应用;您可以直接和 coze 说您今天的收入或者支出情况,coze 会自动帮您记账,同时帮您计算出账户余额。每一笔记账记录都不会丢失,下次来记账管家还记得您的历史记账记录。点击以下卡片体验记账管家。
2025-02-14