直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
大模型下的数据生产和应用
大模型下的数据生产和应用主要包括以下方面: 整体架构: 基础层:为大模型提供硬件支撑和数据支持,例如 A100、数据服务器等。 数据层:包括企业根据自身特性维护的静态知识库和动态的三方数据集。 模型层:如 LLm(大语言模型),一般使用 Transformer 算法实现,还有多模态模型,如文生图、图生图等,其训练数据与 LLm 不同,为图文或声音等多模态数据集。 平台层:如大模型的评测体系或 langchain 平台等,是模型与应用间的组成部分。 表现层:即应用层,是用户实际看到的地方。 模型特点: 预训练数据量大,往往来自互联网上的论文、代码、公开网页等,通常以 TB 级别计。 参数众多,如 Open 在 2020 年发布的 GPT3 已达 170B 的参数。 架构方面,目前常见的大模型多为右侧只使用 Decoder 的 Decoderonly 架构,如 ChatGPT 等。 工作流程: 训练过程类似于上学参加工作,包括找学校(需要大量 GPU 等硬件支持)、确定教材(需要大量数据)、找老师(选择合适算法)、就业指导(微调)、搬砖(推导)。 在 LLM 中,Token 被视为模型处理和生成的文本单位,输入文本会被分割并数字化形成词汇表。
2024-10-30
Azure是什么
Azure 是微软提供的一系列云计算服务和平台。它涵盖了多个方面,包括但不限于以下内容: 认知服务:用于创建实用的人工智能应用,如视觉、自然语言处理等。 特定的机器学习云框架,如 Azure Machine Learning、Microsoft Fabric、Azure Databricks 等,可用于构建和运行机器学习解决方案。 在人工智能的商业应用方面也有相关课程和资源。
2024-10-30
有没有好用的 tts 的 api 推荐啊
以下为您推荐一些好用的 TTS API: 1. 出门问问 Mobvoi: API 官网:https://openapi.mobvoi.com/ 语音合成(TTS)API 地址:https://openapi.mobvoi.com/pages/soundlibrary 语音合成(TTS)操作文档:https://openapi.mobvoi.com/document?name=%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90%EF%BC%88TTS%EF%BC%89 接口请求域名:https://open.mobvoi.com/api/tts/v1 接口请求频率限制:5 次/秒 提供多种方言和风格,满足不同场景需求,实时合成支持 SSML。 2. Eleven Labs:https://elevenlabs.io/ ElevenLabs Prime Voice AI 是一款功能强大且多功能的 AI 语音软件,使创作者和出版商能够生成逼真、高品质的音频。人工智能模型能够高保真地呈现人类语调和语调变化,并能够根据上下文调整表达方式。 3. Speechify:https://speechify.com/ Speechify 是一款人工智能驱动的文本转语音工具,使用户能够将文本转换为音频文件。它可作为 Chrome 扩展、Mac 应用程序、iOS 和 Android 应用程序使用,可用于收听网页、文档、PDF 和有声读物。 4. Azure AI Speech Studio:https://speech.microsoft.com/portal Microsoft Azure Speech Studio 是一套服务,它赋予应用程序能力,让它们能够“听懂、理解并与客户进行对话”。该服务提供了支持 100 多种语言和方言的语音转文本和文本转语音功能。此外,它还提供了自定义的语音模型,这些模型能够适应特定领域的术语、背景噪声以及不同的口音。 5. Voicemaker:https://voicemaker.in/ AI 工具可将文本转换为各种区域语言的语音,并允许您创建自定义语音模型。Voicemaker 易于使用,非常适合为视频制作画外音或帮助视障人士。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-30
在办公场景中的AI工具清单
以下是在办公场景中常见的 AI 工具清单: PPT 制作工具: Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。链接:https://gamma.app/ 美图 AI PPT:通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。链接:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等。链接:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能。链接:https://zhiwen.xfyun.cn/ 商业顾问工具: Sameday:可以接电话并预约。链接:https://www.gosameday.com/ Truelark:可以处理短信、电子邮件和聊天。链接:https://truelark.com/ Osome:可以管理后台办公室。链接:https://osome.com/sg/ Durable:可以创建一个完整的专业网站。链接:https://durable.co/ Harvey 和 Spellbook:帮助法律团队自动化任务,如接待、研究和文件起草。 Interior AI:使代理商能够虚拟布置房产。链接:https://interiorai.com/ Zuma:帮助物业经理将潜在客户转化为预定的参观。链接:https://www.getzuma.com/ 通用内容创建工具:Jasper(https://www.jasper.ai/)、Copy(http://copy.ai/)、Writer(http://writer.ai/) 其他类型工具: 辅助创作与学习:AI 智能写作助手、AI 语言学习助手、诗歌创作助手、书法字体生成器、漫画生成器等。 推荐与规划:AI 图像识别商品推荐、美食推荐平台、旅游行程规划器、时尚穿搭建议平台、智能投资顾问等。 监控与预警:AI 宠物健康监测设备、家居安全监控系统、天气预报预警系统、医疗诊断辅助系统等。 优化与管理:办公自动化工具、物流路径优化工具、家居清洁机器人调度系统、金融风险评估工具等。 销售与交易:AI 艺术作品生成器、书法作品销售平台、摄影作品销售平台、汽车销售平台、房地产交易平台等。
2024-10-30
数字资产管理系统
数字资产管理系统是一种用于管理数字资产的系统。以下是一些相关信息: 法规方面:有规定指出,市场因数据集中而产生的不平衡会受到限制。该法规旨在促进数据处理服务之间的切换,涵盖客户终止数据处理服务合同、与不同提供商签订新合同、转移包括数据在内的所有数字资产,并在新环境中继续使用且保持功能等效等方面。数字资产指客户有权使用的数字格式元素,包括数据、应用、虚拟机等。 产品推荐: 特赞发布的 DAM.GPT:帮助企业利用 AI 管理数字资产,可通过拖拽图片入库,AI 识别图片内容,建立关联和标注属性,通过关键词搜索获取资产,进行人肉筛选,对资产进行中心化合规管理和分发,以及二次加工生产。 SnackPrompt:提示词共享社区,筛选和新建功能良好,支持复制到 ChatGPT 中,创建提示词时可设置动态字段,还能选择语言、风格和语气。 HeroPage:提示词分享社区,创建提示词时可设置动态内容,支持直接回填到 ChatGPT 使用。 Builder.io:Figma 插件支持用自然语言生成设计稿并修改,能将生成的设计稿转成前端代码复制。 X Studio3:小冰公司的音乐 AI 工具,上传歌词和音乐可指定 AI 语音唱歌,能对音频自定义。 Playlistable:AI 生成播放列表,链接 Spotify 播放列表并输入心情,自动生成符合心情的播放列表。
2024-10-30
大模型的数字资产管理系统
大模型的数字资产管理系统涉及以下方面: 大模型的整体架构: 1. 基础层:为大模型提供硬件支撑和数据支持,例如 A100、数据服务器等。 2. 数据层:包括静态的知识库和动态的三方数据集,是企业根据自身特性维护的垂域数据。 3. 模型层:包含 LLm(大语言模型,如 GPT,一般使用 transformer 算法实现)或多模态模型(如文生图、图生图等模型,训练数据与 llm 不同,用的是图文或声音等多模态的数据集)。 4. 平台层:如大模型的评测体系或 langchain 平台等,是模型与应用间的组成部分。 5. 表现层:即应用层,是用户实际看到的地方。 大模型的通俗理解: 大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练、使用过程: 1. 找学校:训练 LLM 需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练大模型。 2. 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。 3. 找老师:用合适算法让大模型更好理解 Token 之间的关系。 4. 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称之为推导(infer)。 企业大模型的误区: 1. 总想搞一个宏大的产业大模型:目前大模型能力不足以支持,更适合在场景里解决专业问题。 2. 总想用一个万能大模型解决所有企业问题:企业不同场景可能需要不同的大模型。 3. 认为有了大模型,原来的 IT 系统就淘汰了:大模型需要与原业务系统连接协同工作,原数字化搞得越好,大模型效果越好。 4. 认为大模型不用做数字化,直接一步到位弯道超车:企业没有基本的 IT 系统、数字化系统,没有数据积累和知识沉淀,无法做大模型。
2024-10-30
AI写作修饰
以下是关于 AI 写作修饰的相关内容: 防止 AI 取代人类思考:在写作中,可能先以人类驱动为主,利用 AI 来修改完善,比如从手动撰写博客文章,再使用自动填充和语法反馈改进,甚至借助 AI 定义概念,但整体仍由人类主导,AI 辅助。有时也会先从 AI 生成的写作内容开始,再进行修改以符合个人风格。 AI 工作流赋能写作: 先拆解流程,引入 AI 工具,如登录 Claude3.5 并打开 Artifacts 功能。 可让 Claude3.5 润色词句,输出效果可能会有不符合需求的部分,可自行决定是否采用。 用同样方法让 AI 打磨优化文章,注意在同一聊天窗口操作,且可按自身需求修改提示词。 借助 AI 创作小说: 让 AI 一段一段进行细节描写,先写故事概要和角色背景介绍并做修改。 以表格形式输出细节描述,有打破叙事习惯、便于局部调整、确保内容具体等好处。 把生成的表格依次粘贴让 AI 写文章,可能需要人工协助。但在修改时可能会遇到问题,如 GPT4 记性不好,Claude 改掉关键情节。
2024-10-30
怎么用ai生成图片
以下是关于如何用 AI 生成图片的相关内容: 1. 关键词的运用: 图片内容通常分为二维插画和三维立体两种表现形式。 主题描述方面,可以描述场景、故事、元素、物体或人物的细节及搭配。对于场景中的人物,应独立描述,避免长串文字,以免 AI 识别不到。 设计风格方面,可找风格类关键词参考或垫图/喂图,让 AI 结合主题描述生成相应风格的图片。某些材质的关键词运用有较多门道,需针对特定风格进行“咒语测试”。 2. 提示技巧: 尽可能具体和细节,提供足够背景信息,详细说明需求细节。 引导模型思考答案,细化思考步骤。 不断迭代并试验。 3. 图像生成原理:扩散模型完成 AI 图片生成,先将图片增加噪声至完全是噪声,再从噪声不断向前推导,过程中不断增加文字影响图片生成。 4. 文生图工具: DALL·E:由 OpenAI 推出,可根据文本描述生成逼真图片。 StableDiffusion:开源工具,能生成高质量图片,支持多种模型和算法。 MidJourney:因高质量图像生成效果和友好界面在创意设计人群中受欢迎。 您可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。
2024-10-30
文字生图网站有哪些
以下是一些文字生图的网站: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量的图像生成效果和用户友好的界面设计受到广泛欢迎,在创意设计人群中尤其流行。 您还可以在以下网站查看更多相关工具: 1. https://www.waytoagi.com/category/104 2. https://www.waytoagi.com/category/38 另外,对于文字生成视频的网站,有以下推荐: 1. Pika:出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion ,可安装这款最新插件,在图片基础上直接生成视频,由 Stability AI 开源的 video model 。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需注意是收费的。 4. Kaiber:视频转视频 AI ,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 内容由 AI 大模型生成,请仔细甄别。
2024-10-30
在WaytoAGI如何从0开始学习AI
对于在 WaytoAGI 中从 0 开始学习 AI,以下是一些建议: 1. 学习 AI 是一个长期的过程,需要耐心和持续的努力,不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。 2. 完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。 3. 为您推荐【野菩萨的 AIGC 资深课】,这门课程由工信部下属单位【人民邮电出版社】开设,是市面上为数不多的值得推荐的 AI 课程之一,也是全网技术更新最快的课程。课程内容涵盖 AI 绘画、视听语言和 ChatGPT 等多个体系的知识,无论您是 AI 初学者还是进阶者,都能满足您的学习需求。您可以扫码添加菩萨老师助理,了解更多信息。 需要注意的是,开源社区资源丰富,适合自律的自主学习者,而知识付费课程能提供系统结构、专业指导、针对性计划和互动反馈,是一种高效的学习途径,您可以根据自身情况选择适合自己的学习方式。
2024-10-30