与知识库对话 - WayToAGI

直达「通往AGI之路」飞书知识库 →

首页/全部问答

大模型下的数据生产和应用

大模型下的数据生产和应用主要包括以下方面：整体架构：基础层：为大模型提供硬件支撑和数据支持，例如 A100、数据服务器等。数据层：包括企业根据自身特性维护的静态知识库和动态的三方数据集。模型层：如 LLm（大语言模型），一般使用 Transformer 算法实现，还有多模态模型，如文生图、图生图等，其训练数据与 LLm 不同，为图文或声音等多模态数据集。平台层：如大模型的评测体系或 langchain 平台等，是模型与应用间的组成部分。表现层：即应用层，是用户实际看到的地方。模型特点：预训练数据量大，往往来自互联网上的论文、代码、公开网页等，通常以 TB 级别计。参数众多，如 Open 在 2020 年发布的 GPT3 已达 170B 的参数。架构方面，目前常见的大模型多为右侧只使用 Decoder 的 Decoderonly 架构，如 ChatGPT 等。工作流程：训练过程类似于上学参加工作，包括找学校（需要大量 GPU 等硬件支持）、确定教材（需要大量数据）、找老师（选择合适算法）、就业指导（微调）、搬砖（推导）。在 LLM 中，Token 被视为模型处理和生成的文本单位，输入文本会被分割并数字化形成词汇表。

Azure 是微软提供的一系列云计算服务和平台。它涵盖了多个方面，包括但不限于以下内容：认知服务：用于创建实用的人工智能应用，如视觉、自然语言处理等。特定的机器学习云框架，如 Azure Machine Learning、Microsoft Fabric、Azure Databricks 等，可用于构建和运行机器学习解决方案。在人工智能的商业应用方面也有相关课程和资源。

有没有好用的 tts 的 api 推荐啊

以下为您推荐一些好用的 TTS API： 1. 出门问问 Mobvoi： API 官网：https://openapi.mobvoi.com/ 语音合成（TTS）API 地址：https://openapi.mobvoi.com/pages/soundlibrary 语音合成（TTS）操作文档：https://openapi.mobvoi.com/document?name=%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90%EF%BC%88TTS%EF%BC%89 接口请求域名：https://open.mobvoi.com/api/tts/v1 接口请求频率限制：5 次/秒提供多种方言和风格，满足不同场景需求，实时合成支持 SSML。 2. Eleven Labs：https://elevenlabs.io/ ElevenLabs Prime Voice AI 是一款功能强大且多功能的 AI 语音软件，使创作者和出版商能够生成逼真、高品质的音频。人工智能模型能够高保真地呈现人类语调和语调变化，并能够根据上下文调整表达方式。 3. Speechify：https://speechify.com/ Speechify 是一款人工智能驱动的文本转语音工具，使用户能够将文本转换为音频文件。它可作为 Chrome 扩展、Mac 应用程序、iOS 和 Android 应用程序使用，可用于收听网页、文档、PDF 和有声读物。 4. Azure AI Speech Studio：https://speech.microsoft.com/portal Microsoft Azure Speech Studio 是一套服务，它赋予应用程序能力，让它们能够“听懂、理解并与客户进行对话”。该服务提供了支持 100 多种语言和方言的语音转文本和文本转语音功能。此外，它还提供了自定义的语音模型，这些模型能够适应特定领域的术语、背景噪声以及不同的口音。 5. Voicemaker：https://voicemaker.in/ AI 工具可将文本转换为各种区域语言的语音，并允许您创建自定义语音模型。Voicemaker 易于使用，非常适合为视频制作画外音或帮助视障人士。请注意，以上内容由 AI 大模型生成，请仔细甄别。

在办公场景中的AI工具清单

以下是在办公场景中常见的 AI 工具清单： PPT 制作工具： Gamma：在线 PPT 制作网站，可通过输入文本和想法提示快速生成幻灯片，支持嵌入多媒体格式。链接：https://gamma.app/ 美图 AI PPT：通过输入简单文本描述生成专业 PPT 设计，有丰富模板库和设计元素。链接：https://www.xdesign.com/ppt/ Mindshow：AI 驱动的 PPT 辅助工具，提供智能设计功能，如自动布局、图像选择和文本优化等。链接：https://www.mindshow.fun/ 讯飞智文：由科大讯飞推出的 AI 辅助文档编辑工具，利用语音识别和自然语言处理技术，提供智能文本生成、语音输入、文档格式化等功能。链接：https://zhiwen.xfyun.cn/ 商业顾问工具： Sameday：可以接电话并预约。链接：https://www.gosameday.com/ Truelark：可以处理短信、电子邮件和聊天。链接：https://truelark.com/ Osome：可以管理后台办公室。链接：https://osome.com/sg/ Durable：可以创建一个完整的专业网站。链接：https://durable.co/ Harvey 和 Spellbook：帮助法律团队自动化任务，如接待、研究和文件起草。 Interior AI：使代理商能够虚拟布置房产。链接：https://interiorai.com/ Zuma：帮助物业经理将潜在客户转化为预定的参观。链接：https://www.getzuma.com/ 通用内容创建工具：Jasper（https://www.jasper.ai/）、Copy（http://copy.ai/）、Writer（http://writer.ai/）其他类型工具：辅助创作与学习：AI 智能写作助手、AI 语言学习助手、诗歌创作助手、书法字体生成器、漫画生成器等。推荐与规划：AI 图像识别商品推荐、美食推荐平台、旅游行程规划器、时尚穿搭建议平台、智能投资顾问等。监控与预警：AI 宠物健康监测设备、家居安全监控系统、天气预报预警系统、医疗诊断辅助系统等。优化与管理：办公自动化工具、物流路径优化工具、家居清洁机器人调度系统、金融风险评估工具等。销售与交易：AI 艺术作品生成器、书法作品销售平台、摄影作品销售平台、汽车销售平台、房地产交易平台等。

数字资产管理系统

数字资产管理系统是一种用于管理数字资产的系统。以下是一些相关信息：法规方面：有规定指出，市场因数据集中而产生的不平衡会受到限制。该法规旨在促进数据处理服务之间的切换，涵盖客户终止数据处理服务合同、与不同提供商签订新合同、转移包括数据在内的所有数字资产，并在新环境中继续使用且保持功能等效等方面。数字资产指客户有权使用的数字格式元素，包括数据、应用、虚拟机等。产品推荐：特赞发布的 DAM.GPT：帮助企业利用 AI 管理数字资产，可通过拖拽图片入库，AI 识别图片内容，建立关联和标注属性，通过关键词搜索获取资产，进行人肉筛选，对资产进行中心化合规管理和分发，以及二次加工生产。 SnackPrompt：提示词共享社区，筛选和新建功能良好，支持复制到 ChatGPT 中，创建提示词时可设置动态字段，还能选择语言、风格和语气。 HeroPage：提示词分享社区，创建提示词时可设置动态内容，支持直接回填到 ChatGPT 使用。 Builder.io：Figma 插件支持用自然语言生成设计稿并修改，能将生成的设计稿转成前端代码复制。 X Studio3：小冰公司的音乐 AI 工具，上传歌词和音乐可指定 AI 语音唱歌，能对音频自定义。 Playlistable：AI 生成播放列表，链接 Spotify 播放列表并输入心情，自动生成符合心情的播放列表。

大模型的数字资产管理系统

大模型的数字资产管理系统涉及以下方面：大模型的整体架构： 1. 基础层：为大模型提供硬件支撑和数据支持，例如 A100、数据服务器等。 2. 数据层：包括静态的知识库和动态的三方数据集，是企业根据自身特性维护的垂域数据。 3. 模型层：包含 LLm（大语言模型，如 GPT，一般使用 transformer 算法实现）或多模态模型（如文生图、图生图等模型，训练数据与 llm 不同，用的是图文或声音等多模态的数据集）。 4. 平台层：如大模型的评测体系或 langchain 平台等，是模型与应用间的组成部分。 5. 表现层：即应用层，是用户实际看到的地方。大模型的通俗理解：大模型是输入大量语料，让计算机获得类似人类的“思考”能力，能够进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练、使用过程： 1. 找学校：训练 LLM 需要大量计算，GPU 更合适，只有购买得起大量 GPU 的才有资本训练大模型。 2. 确定教材：大模型需要大量数据，几千亿序列（Token）的输入基本是标配。 3. 找老师：用合适算法让大模型更好理解 Token 之间的关系。 4. 就业指导：为让大模型更好胜任某一行业，需要进行微调（fine tuning）指导。 5. 搬砖：就业指导完成后，进行如翻译、问答等工作，在大模型里称之为推导（infer）。企业大模型的误区： 1. 总想搞一个宏大的产业大模型：目前大模型能力不足以支持，更适合在场景里解决专业问题。 2. 总想用一个万能大模型解决所有企业问题：企业不同场景可能需要不同的大模型。 3. 认为有了大模型，原来的 IT 系统就淘汰了：大模型需要与原业务系统连接协同工作，原数字化搞得越好，大模型效果越好。 4. 认为大模型不用做数字化，直接一步到位弯道超车：企业没有基本的 IT 系统、数字化系统，没有数据积累和知识沉淀，无法做大模型。

以下是关于 AI 写作修饰的相关内容：防止 AI 取代人类思考：在写作中，可能先以人类驱动为主，利用 AI 来修改完善，比如从手动撰写博客文章，再使用自动填充和语法反馈改进，甚至借助 AI 定义概念，但整体仍由人类主导，AI 辅助。有时也会先从 AI 生成的写作内容开始，再进行修改以符合个人风格。 AI 工作流赋能写作：先拆解流程，引入 AI 工具，如登录 Claude3.5 并打开 Artifacts 功能。可让 Claude3.5 润色词句，输出效果可能会有不符合需求的部分，可自行决定是否采用。用同样方法让 AI 打磨优化文章，注意在同一聊天窗口操作，且可按自身需求修改提示词。借助 AI 创作小说：让 AI 一段一段进行细节描写，先写故事概要和角色背景介绍并做修改。以表格形式输出细节描述，有打破叙事习惯、便于局部调整、确保内容具体等好处。把生成的表格依次粘贴让 AI 写文章，可能需要人工协助。但在修改时可能会遇到问题，如 GPT4 记性不好，Claude 改掉关键情节。

怎么用ai生成图片

以下是关于如何用 AI 生成图片的相关内容： 1. 关键词的运用：图片内容通常分为二维插画和三维立体两种表现形式。主题描述方面，可以描述场景、故事、元素、物体或人物的细节及搭配。对于场景中的人物，应独立描述，避免长串文字，以免 AI 识别不到。设计风格方面，可找风格类关键词参考或垫图/喂图，让 AI 结合主题描述生成相应风格的图片。某些材质的关键词运用有较多门道，需针对特定风格进行“咒语测试”。 2. 提示技巧：尽可能具体和细节，提供足够背景信息，详细说明需求细节。引导模型思考答案，细化思考步骤。不断迭代并试验。 3. 图像生成原理：扩散模型完成 AI 图片生成，先将图片增加噪声至完全是噪声，再从噪声不断向前推导，过程中不断增加文字影响图片生成。 4. 文生图工具： DALL·E：由 OpenAI 推出，可根据文本描述生成逼真图片。 StableDiffusion：开源工具，能生成高质量图片，支持多种模型和算法。 MidJourney：因高质量图像生成效果和友好界面在创意设计人群中受欢迎。您可以在 WaytoAGI 网站（https://www.waytoagi.com/category/104）查看更多文生图工具。

文字生图网站有哪些

以下是一些文字生图的网站： 1. DALL·E：由 OpenAI 推出，能根据输入的文本描述生成逼真的图片。 2. StableDiffusion：开源的文生图工具，可生成高质量图片，支持多种模型和算法。 3. MidJourney：因高质量的图像生成效果和用户友好的界面设计受到广泛欢迎，在创意设计人群中尤其流行。您还可以在以下网站查看更多相关工具： 1. https://www.waytoagi.com/category/104 2. https://www.waytoagi.com/category/38 另外，对于文字生成视频的网站，有以下推荐： 1. Pika：出色的文本生成视频 AI 工具，擅长动画制作，并支持视频编辑。 2. SVD：如果熟悉 Stable Diffusion ，可安装这款最新插件，在图片基础上直接生成视频，由 Stability AI 开源的 video model 。 3. Runway：老牌 AI 视频生成工具，提供实时涂抹修改视频的功能，但需注意是收费的。 4. Kaiber：视频转视频 AI ，能够将原视频转换成各种风格的视频。 5. Sora：由 OpenAI 开发，可以生成长达 1 分钟以上的视频。内容由 AI 大模型生成，请仔细甄别。

在WaytoAGI如何从0开始学习AI

对于在 WaytoAGI 中从 0 开始学习 AI，以下是一些建议： 1. 学习 AI 是一个长期的过程，需要耐心和持续的努力，不要害怕犯错，每个挑战都是成长的机会。随着时间的推移，您将逐渐建立起自己的 AI 知识体系，并能够在这一领域取得成就。 2. 完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法，设计自己的学习路径。 3. 为您推荐【野菩萨的 AIGC 资深课】，这门课程由工信部下属单位【人民邮电出版社】开设，是市面上为数不多的值得推荐的 AI 课程之一，也是全网技术更新最快的课程。课程内容涵盖 AI 绘画、视听语言和 ChatGPT 等多个体系的知识，无论您是 AI 初学者还是进阶者，都能满足您的学习需求。您可以扫码添加菩萨老师助理，了解更多信息。需要注意的是，开源社区资源丰富，适合自律的自主学习者，而知识付费课程能提供系统结构、专业指导、针对性计划和互动反馈，是一种高效的学习途径，您可以根据自身情况选择适合自己的学习方式。