Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

传统企业如何使用大模型,有哪些方法和路径?

Answer

传统企业使用大模型可以参考以下方法和路径:

  1. 训练准备:
    • 找学校:由于训练大模型需要大量计算,GPU 更为合适,只有具备购买大量 GPU 能力的企业才有资本训练自己的大模型。
    • 确定教材:大模型需要大量的数据量,几千亿序列(Token)的输入基本是标配。
    • 找老师:选择合适的算法来讲述数据内容,让大模型更好地理解 Token 之间的关系。
  2. 应用优化:
    • 就业指导:为了让大模型更好地胜任所在行业,需要进行微调(fine tuning)指导。
    • 实际应用:完成就业指导后,将大模型应用于实际工作,如进行翻译、问答等,在大模型中称之为推导(infer)。

此外,国家搞大模型应多条路并进,发改委已号召国企做产业大模型、行业大模型。真正让大模型成为生产力工具、赋能产业,重点在企业侧和产业侧。

Content generated by AI large model, please carefully verify (powered by aily)

References

大模型入门指南

通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习,那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程:1.找学校::训练LLM需要大量的计算,因此GPU更合适,因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大,需要的数据量特别多,几千亿序列(Token)的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容,让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导5.搬砖::就业指导完成后,下面就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)

周鸿祎免费课AI系列第一讲

我觉得国家搞大模型应该多条路并进,而不是只走OpenAI GPT4一条道路。最近发改委发了一个文件,号召国企都要做产业大模型、行业大模型。我也跟一些国企领导聊了一下,他们不做通用大模型,大家明白说,真正大模型要成为生产力工具,要真正赋能产业,真正的点是在企业侧、产业侧,这个是我下次课要讲的企业方法论,就是企业如何用大模型来改造自己的业务,来提升自己的生产力。

周鸿祎免费课AI系列第一讲

我觉得国家搞大模型应该多条路并进,而不是只走OpenAI GPT4一条道路。最近发改委发了一个文件,号召国企都要做产业大模型、行业大模型。我也跟一些国企领导聊了一下,他们不做通用大模型,大家明白说,真正大模型要成为生产力工具,要真正赋能产业,真正的点是在企业侧、产业侧,这个是我下次课要讲的企业方法论,就是企业如何用大模型来改造自己的业务,来提升自己的生产力。

Others are asking
学习WaytoAGI的最佳路径是什么
学习 WaytoAGI 的最佳路径包括以下几个方面: 1. 了解最新的 AI 技术:WaytoAGI 像免费的“技术期刊”,能让您了解最新动态,还能教授实用技能,且开源免费。 2. 线上共学:通过线上共学方式,手把手教您应用 AI 技术,无论您是小白还是有一定基础,都能找到适合自己的学习路径。 3. 找到志同道合的队友:如果您想创业、做副业,或者只是想找对 AI 感兴趣的伙伴一起做事,WaytoAGI 是很好的平台。 使用 WaytoAGI 的方法: 1. 点开链接就能看:无需注册和花钱,直接点击链接:点击。 2. 想看啥就看啥:比如想学 AI 绘画,就去看“AI 绘画”部分;想找 AI 工具,就去“工具推荐”部分,内容分类清晰。 3. 有问题还能问:看了还有不懂的,或者想跟别人交流,可以加入社群讨论。 此外,WaytoAGI 还有整活区,这里不是系统性学习的地方,而是一起做有趣事情的游乐场。在这里,您不用证明想法“有什么用”,可以尽情发挥对 AI 最天马行空的想象,鼓励把 AI 玩出新花样。
2025-04-10
学习路径文档
以下是为您提供的新手学习 AI 的路径文档: 首先,了解 AI 基本概念。建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 然后,开始 AI 学习之旅。在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有可能获得证书。 接着,选择感兴趣的模块深入学习。AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。特别建议您掌握提示词的技巧,它上手容易且很有用。 之后,进行实践和尝试。理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后也进行分享。 最后,体验 AI 产品。与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 此外,雪梅 May 的 AI 学习经验也值得参考。May 发现自己的学习路径是:迈出第一步→大量的学习输入→疯狂的模仿→开始自己创造→学的越来越宽越来越杂→积累的量变产生质变→开始分享。特别是学习 coze 的路径:输入→模仿→自发创造,这是她真实实践下来之后发现的学习规律。May 还提到,虽然费曼学习法告诉我们,学习最好的方式是教会别人,但在一开始学习 AI 时,自学和输入为主也是可行的。回想起来,如果能量更足、更有勇气,可以更早地开始输出倒逼输入。不过不要为难自己,只要迈开脚步,就是进步。
2025-04-09
基于规则的测试生成: 测试用例生成工具: Randoop:基于代码路径和规则生成测试用例,适用于 Java 应用程序。这个应该怎样使用呢
很抱歉,目前没有关于 Randoop 工具使用方法的相关内容。您可以通过以下途径获取更详细的信息: 1. 官方文档:访问 Randoop 的官方网站,查找其提供的详细使用说明和教程。 2. 技术论坛:在相关的技术论坛上搜索关于 Randoop 使用的讨论和经验分享。 3. 开源社区:参与开源社区中关于 Randoop 的交流,向其他开发者请教。
2025-04-08
提供一个全面的AI学习路径
以下是为您提供的全面的 AI 学习路径: 首先,了解 AI 的基础概念是至关重要的。这包括对机器学习、深度学习、自然语言处理等核心领域的基本认识。 在掌握基础概念后,深入学习数学知识,如线性代数、概率论、微积分等,这些是理解 AI 算法的基石。 接着,学习编程语言,如 Python,它在 AI 开发中被广泛应用。 然后,学习常见的机器学习算法,如决策树、聚类算法等,并通过实践项目加深理解。 对于深度学习,要掌握神经网络的原理和常见模型,如卷积神经网络、循环神经网络等。 同时,关注最新的 AI 行业资讯,了解前沿技术和应用案例。 参与相关的实践活动,如模型创作大赛等,将理论知识应用到实际中。 此外,利用丰富的学习资源,如文章、教程、工具推荐等,不断提升自己的能力。 “通往 AGI 之路”是一个致力于人工智能学习的中文知识库和社区平台,由开发者、学者和 AI 爱好者共同参与建设。它提供了系统全面的学习路径,涵盖从基础概念到实际应用的各个方面,包括丰富的学习资源、定期组织的活动等。您可以通过以下渠道获取更多信息: 网站: 知识库介绍说明:https://waytoagi.feishu.cn/wiki/BE57wlWV2iDkOvkbYIockX11nTC 社区业务:https://waytoagi.feishu.cn/wiki/PhZwwGR7jinzLVkqohOc7oofnzf 公众号:通往 AGI 之路 Bilibili:https://space.bilibili.com/259768893 小红书:https://www.xiaohongshu.com/user/profile/6457d2e4000000001f030dbe Twitter:https://twitter.com/WaytoAGI
2025-04-01
我是一名0基础的AI使用者,如果我需要熟练的搭建自己coze来完成一些业务工作,我的学习路径是什么样的?可以为我推荐一个学习计划,包括学习的资料获取途径和资料推荐吗?
以下是为您推荐的从 0 基础学习搭建自己的 Coze 来完成业务工作的学习路径和学习计划: 学习路径: 1. 了解 Coze AI 应用的背景和现状,包括其发展历程、适用场景和当前的局限性。 2. 熟悉创建 AI 应用的操作界面,包括学习业务逻辑和用户界面的搭建。 3. 掌握前端和后端的基础知识,了解其在 Coze 应用中的作用。 4. 学习容器的操作和页面布局技巧。 学习计划: 1. 资料获取途径:可以通过飞书知识库获取相关学习资料。 2. 资料推荐: “90 分钟从 0 开始打造你的第一个 Coze 应用:证件照 2025 年 1 月 18 日副本”,其中包含智能纪要和智能章节,详细介绍了 Coze 应用的创建过程、界面讲解、前端与后端基础及界面组件布局、容器操作与页面布局等内容。 (筹划中)「Agent 共学」之“两天学会用 AI 建站”,其中的共学日程表可能会提供相关的学习安排和指导。 在学习过程中,建议您重点熟悉桌面网页版的用户界面,按照资料中的步骤逐步实践,遇到问题及时查阅资料或寻求帮助。祝您学习顺利!
2025-03-31
学习路径
以下是关于学习 AI 的不同方面的学习路径: LLM 开发: 1. 掌握深度学习和自然语言处理基础,包括机器学习、深度学习、神经网络等基础理论,以及自然语言处理中的词向量、序列模型、注意力机制等。相关课程有吴恩达的深度学习课程、斯坦福 cs224n 等。 2. 理解 Transformer 和 BERT 等模型原理,包括 Transformer 模型架构及自注意力机制原理,以及 BERT 的预训练和微调方法。掌握相关论文,如 Attention is All You Need、BERT 论文等。 3. 学习 LLM 模型训练和微调,包括大规模文本语料预处理,使用 LLM 预训练框架如 PyTorch、TensorFlow 等,以及微调 LLM 模型进行特定任务迁移。相关资源有 HuggingFace 课程、论文及开源仓库等。 4. LLM 模型优化和部署,包括模型压缩、蒸馏、并行等优化技术,模型评估和可解释性,以及模型服务化、在线推理、多语言支持等。相关资源有 ONNX、TVM、BentoML 等开源工具。 5. LLM 工程实践和案例学习,结合行业场景进行个性化的 LLM 训练,分析和优化具体 LLM 工程案例,研究 LLM 新模型、新方法的最新进展。 6. 持续跟踪前沿发展动态,关注顶会最新论文、技术博客等资源。 AI 技术研究方向: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 AI 应用方向: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 AI 基础入门: 1. 根据电脑的硬件情况和自身财力选择合适的开始方式,如本地部署(电脑是 M 芯片的 Mac 电脑或 2060Ti 及以上显卡的 Windows 电脑)、在线平台(分为在线出图和云电脑)或配台电脑(不建议一开始就配主机)。 2. 必学、必看内容是基础课,主要解决环境问题和软件安装不上的问题;建炉是针对不同炼丹方式提供不同的炼丹工具的安装教程;正式的内容部分分为数据集预处理、模型训练以及模型调试及优化三个部分。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。
2025-03-31
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
我们是搜索团队的产品经理,团队定位倾向于“对于插件的建设与调用”定位,现在要做AI相关的产品规划,请以通俗易懂的方式对以下问题做出回答 1、请通过流程图的方式,介绍【插件/工具】能力在大模型生态架构中的环节、定位、实现流程是什么 2、调研下对于我们搜索团队而言,插件应该做什么,可以做什么 3、思考对于大模型来说,有哪些(通用或垂类)的模块/功能/插件是无法绕开的,或高频使用的,作为我们团队后续争取的发力点(如搜索推荐对于传统综合搜索结果页)
以下是为您提供的关于 AI 相关产品规划的回答: 一、插件/工具能力在大模型生态架构中的环节、定位、实现流程 从 2023 年 3 月份 OpenAI 宣布插件计划开始,到 5 月份上线,其中包括联网、代码、画图三个插件。其实现流程大致为: 1. 经过对模型的微调,检测何时需要调用函数(取决于用户的输入)。 2. 使用符合函数签名的 JSON 进行响应。 3. 在接口层面声明可调用的工具。 4. 使用函数和用户输入调用模型。 5. 使用模型响应调用 API。 6. 将响应发送回模型进行汇总。 二、对于搜索团队,插件可以做和应该做的事 目前没有直接针对搜索团队插件具体可做和应做事项的明确内容,但可以参考 OpenAI 的插件计划,例如开发与搜索相关的特定功能插件,或者探索如何将现有的搜索推荐功能与大模型更好地结合。 三、对于大模型无法绕开或高频使用的模块/功能/插件 目前没有直接指出对于大模型无法绕开或高频使用的具体模块、功能或插件。但从相关信息中可以推测,例如与数据获取和处理相关的插件(如联网)、与技术开发相关的插件(如代码)以及与内容生成相关的插件(如画图)可能是较为重要和高频使用的。对于搜索团队来说,可以考虑在这些方向上寻找发力点,结合搜索推荐等传统功能,开发出更具竞争力的插件。
2025-04-08
传统产品经理如何转AI产品经理?
传统产品经理若要转型为 AI 产品经理,需要注意以下方面: 1. 掌握算法知识: 理解产品核心技术,有助于做出更合理的产品决策。 与技术团队有效沟通,减少信息不对称带来的误解。 评估技术可行性,在产品规划阶段做出更准确的判断。 把握产品发展方向,更好地应对 AI 技术的迅速发展。 提升产品竞争力,发现产品的独特优势并提出创新特性。 增强数据分析能力,处理和分析 AI 算法涉及的数据。 2. 了解相关技术原理和框架: 如思维链,谷歌在 2022 年的论文提到其能显著提升大语言模型在复杂推理的能力,可在问题后加“请你分步骤思考”。 RAG(检索增强生成),将外部知识库切分转成向量存于向量数据库,用户提问时段落信息会和问题一起传给 AI,可搭建企业和个人知识库。 PAL(程序辅助语言模型),2022 年论文提出,对于计算问题不让 AI 直接生成结果,而是借助 Python 解释器等工具。 ReAct 框架,2022 年论文提出,将 reason 与 action 结合,让模型动态推理并与外界环境互动,可借助 LangChain 等框架简化构建流程。 3. 关注技术论文和前沿动态:虽然小白直接看技术论文有难度,但仍需完成一定知识储备,也可借助 AI 辅助阅读。同时,多参考相关的科普入门视频和访谈,如林粒粒呀的视频和安克创新 CEO 阳萌的访谈等。
2025-04-08
作为储能行业的软件平台产品经理,如何将AI融入产品中;当今世界(2025年3月27日),AI会对传统行业的平台软件产品产生哪些影响
在当今世界(2025 年 3 月 27 日),AI 对传统行业的平台软件产品产生了多方面的影响。例如,在储能行业,大模型训练与推理对电力需求剧增,尤其需要稳定、低成本的大规模供电,这使得调度与储能变得关键。同时,AI 时代对能源低成本与稳定性的需求极其旺盛,核能(尤其小堆)及储能、电动车电池都将持续发展。 对于储能行业的软件平台产品经理,将 AI 融入产品可以从以下几个方面考虑: 1. 利用 AI 进行电力需求预测和优化调度,以提高供电的稳定性和效率。 2. 借助 AI 技术对储能系统进行智能管理和优化,降低电池成本。 3. 通过 AI 分析用户行为和需求,为用户提供个性化的能源管理方案。 4. 利用 AI 监测和诊断储能设备的运行状态,提前预警故障,提高系统的可靠性。
2025-03-27
我是搞室内装修设计的,我想通过AI工具来替代传统设计流程中的创意流程,我想基于毛坯房图纸通过提问AI来完成令人惊叹的创作,请问我该从哪里开始学起
如果您是搞室内装修设计,想通过 AI 工具替代传统设计流程中的创意流程,基于毛坯房图纸通过提问 AI 来完成令人惊叹的创作,可以从以下几个方面学起: 1. 了解 AI 绘画创作平台:例如 MewXAI,它是一款强大专业且新手友好、操作简单的平台。其中的室内设计功能,上传空间图后,能通过分析图片的线条结构和几何形状,一键完成多种不同风格的室内/建筑设计,为您提供灵感并节约时间。访问地址:https://www.mewxai.cn/ 2. 掌握多工具协作与创作流程: 图像优化与问题解决:对于构图基本满意但局部需要调整的图像,可使用 MJ 的局部重绘功能。对满意的图像,会使用 ComfyUI 进行高清放大和细节增强。当 AI 无法生成满意效果时,也可使用传统工具如 Photoshop 补位。 视频生成与后期制作:获得满意的图像后,可使用可灵的图生视频功能将静态图像转化为动态画面,也可尝试 Pika 最新上线的 2.2 版本、Pixverse 等平台。最后,把生成的视频素材丢进剪映进行剪辑、添加音效、字幕和转场特效,完成最终成片。 3. 学习 AI 室外设计的最佳实践并应用于室内设计: 充分利用 AI 的创意生成能力,输入关键词生成多种创意设计方案,获取新颖独特的灵感。 结合 AI 的模拟和可视化功能,利用 AR/VR 等技术模拟实际环境,评估和验证设计方案。 运用 AI 的分析和优化能力,对采光、动线、材料等方面进行优化,确保符合实际需求和体验。 借助 AI 的自动化设计功能,生成符合设计规范的平面图、立面图等,提高效率。 融合 AI 与人工设计的协作模式,形成良性互补,发挥各自优势。 需要注意的是,工具只是画笔,创意才是颜料,两者结合才能描绘出独一无二的设计画卷。同时,内容由 AI 大模型生成,请仔细甄别。
2025-03-18
不能用APP思维、传统数字平台思维去做大模型创业和人工智能创业,二者在底层逻辑和商业模式等方面完全不同
大模型创业和人工智能创业与 APP 思维、传统数字平台思维在底层逻辑和商业模式等方面存在显著差异。大模型和人工智能创业更注重数据的深度处理、算法的优化创新以及对复杂问题的解决能力。相比之下,APP 思维通常侧重于用户界面和功能的设计,以满足特定的用户需求;传统数字平台思维则更多关注平台的搭建和用户流量的获取与运营。在大模型和人工智能领域,技术的突破和创新是关键,需要投入大量资源进行研发,并且要面对更高的技术门槛和不确定性。而 APP 和传统数字平台的创业相对更侧重于市场推广和用户体验的优化。总之,不能简单地用 APP 思维和传统数字平台思维来指导大模型和人工智能创业。
2025-03-07
我是一个传统的B端产品经理,如何入门AI产品呢?
作为传统的 B 端产品经理,入门 AI 产品可以参考以下步骤: 1. 入门级:通过 WaytoAGI 等开源网站或一些课程来了解 AI 的概念,使用 AI 产品并尝试动手实践应用搭建。对应的画像可能是喜欢听小宇宙 APP 的播客或浏览 AI 相关的文章。 2. 研究级:有两个路径,一个是技术研究路径,一个是商业化研究路径。这个阶段对应的画像可能是对某一领域有认知,可以根据需求场景选择解决方案,或利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用:这一阶段的画像就是有一些成功落地应用的案例,如产生商业化价值。 总结来说,对 AI 产品经理的要求是懂得技术框架,不一定要了解技术细节,而是对技术边界有认知,最好能知道一些优化手段和新技术的发展。AI 也是工具和手段,产品经理要关注的还是场景、痛点、价值。 此外,还可以了解一些相关的技术原理和框架,比如: 1. 思维链:谷歌在 2022 年一篇论文提到思维链可以显著提升大语言模型在复杂推理的能力(即有推理步骤),即使不用小样本提示,也可以在问题后面加一句【请你分步骤思考】。 2. RAG(检索增强生成):外部知识库切分成段落后转成向量,存在向量数据库。用户提问并查找到向量数据库后,段落信息会和原本的问题一块传给 AI;可搭建企业知识库和个人知识库。 3. PAL(程序辅助语言模型):2022 年一篇论文中提出;比如对于语言模型的计算问题,核心在于不让 AI 直接生成计算结果,而是借助其他工具比如 Python 解释器作为计算工具。 4. ReAct:2022 年一篇《React:在语言模型中协同推理与行动》的论文提出了 ReAct 框架,即 reason 与 action 结合,核心在于让模型动态推理并采取行动与外界环境互动。比如用搜索引擎对关键字进行搜索,观察行动得到的结果。可借助 LangChain 等框架简化构建流程。 个人总结:看很多大佬的发言,都说要关注或直接阅读技术论文,比如产品经理转型 AI 产品经理,也需要懂技术脉络。而小白直接看技术论文还是有难度,虽然现在可以让 AI 辅助阅读,不过还是要完成一定的知识储备。而林粒粒呀的这期视频是一个很好的科普入门。
2025-03-04
AI 制作短视频的方法
以下是关于 AI 制作短视频的方法: 1. 确定视频风格和主题:使用 Fanbook 中的 niji6 模型及sref 指令,加上每张图片的提示词来确定视频风格的一致性。比如根据丝绸之路的古风主题确定风格和时长,然后设定故事主线和镜头。 2. 创作故事剧本和分镜头:参考分镜头的基本格式要求,按照场景、地点、镜号、画面描述、台词、音效等维度进行填充。尽可能精简人物对话,提炼重点。当缺乏画面灵感时,可以借助语言大模型,如 Kimi 来获取帮助。 3. 生成角色和场景:根据剧本中的人物性格特征和时代背景,描绘人物的提示词、上传角色参考图cref,并将角色背景扣除以便于进行角色加背景的融合生成时进行垫图操作。场景提示词从剧本中的画面描述进行提取,采用文生图模式,画面风格选择提前准备好的风格图进行垫图,上传角色图、场景背景进行参考生成,提高人物和场景的融合度。 4. 让图片动起来:使用即梦进行图生视频,上传图片至视频生成模块,用简单提示词描绘画面中的动态内容,可生成时长为 3 秒钟的画面。运镜类型可根据剧本中的镜头描绘设置,主要设置以随机运镜为主,生成速度根据视频节奏选择。 此外,根据视频脚本生成短视频的 AI 工具有多种,适用于不同的应用场景和需求,包括: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户提供文本描述来生成相应的视频内容。 4. VEED.IO:提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. Runway:能够将文本转化为风格化的视频内容,适用于多种应用场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-13
推荐几个AI工具及其使用方法,我要用于病案质控
以下为您推荐几个可用于病案质控的 AI 工具及其使用方法: 1. Scite.ai:这是一个为研究人员、学者和行业专业人员打造的创新平台,旨在增强他们对科学文献的洞察。它提供了一系列工具,如引用声明搜索、自定义仪表板和参考检查,这些都能简化您的学术工作。您可以通过访问使用。 2. Scholarcy:这是一款科研神器,主要为做科研、学术、写论文的人准备。它可以从文档中提取结构化数据,并通过知识归纳引擎生成文章概要,精炼地呈现文章的总结信息,分析中包含关键概念、摘要、学术亮点、学术总结、比较分析、局限等板块的内容。您可以通过使用。 3. ChatGPT:这是一个强大的自然语言处理模型,可以提供有关病案质控的修改意见。您可以向它提供您的文章,并提出您的问题和需求,它将尽力为您提供帮助。您可以通过使用。 这些工具可以帮助您从不同的角度审视和改进您的病案质控工作,您可以根据自己的具体需求选择合适的工具进行尝试。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-04-13
模型训练的基本名词和方法
以下是关于模型训练的基本名词和方法的介绍: 基本名词: 1. 过拟合&欠拟合:过拟合和欠拟合都是不好的现象,需要加以控制以让模型达到理想效果。解决方法包括调整训练集、正则化和训练参数等,过拟合可减少训练集素材量,欠拟合则增加训练集素材量。 2. 泛化性:泛化性不好的模型难以适应其他风格和多样的创作。可通过跑 lora 模型生图测试判断泛化性,解决办法与过拟合和欠拟合类似,从训练集、正则化、训练参数等方面调整。 3. 正则化:是解决过拟合和欠拟合情况、提高泛化性的手段,给模型加规则和约束,限制优化参数,有效防止过拟合,提高模型适应不同情况的表现和泛化性。 方法: 1. 全面充分采集训练素材:例如在角色训练素材中,应包含各种角度、表情、光线等情况的素材,确保模型具有较好泛化性。 2. 图像预处理:对训练素材进行分辨率调整、裁切操作,并对训练集进行打标签处理。 3. 参数调优:尽量将训练时长控制在半小时左右,过长易导致过拟合,通过调整参数控制时长。 4. 观察学习曲线:通过观察学习曲线来调整训练素材和参数。 5. 过拟合&欠拟合处理:测试训练好的模型,观察过拟合和欠拟合问题,进一步通过调整训练素材和正则化等手段优化。 此外,在模型训练中还需注意: 1. 数据集获取渠道:可通过网上收集、购买、使用无版权问题的如古画等,原则是根据生成图的需求找对应数据集,要清晰、主体元素干净、风格统一。 2. 数据集处理:包括基础处理如裁剪保证清晰和分辨率,更重要的是写标注。 3. 设置模型触发词:可自定义,完整形式可以是一句话,建议以王 flags 模型为主。 4. 统一标注风格与应用场景:例如未来高科技 3D 天然风格,用于互联网首页图像等,并概括主题内容、描述物体特征等。 5. 利用 GPT 辅助描述并人工审核:让 GPT 按要求描述,人工审核修改。 6. 模型训练的准备与流程:完成数据集描述后进入训练流程,选择模型训练分类和数据集,创建并上传数据集压缩包,注意数据名与图片命名一致。选择训练模式和参数,新手选用普通基础模式,训练集质量重要,训练参数中总步数与训练集图片数量相关,触发词设定要避免概念混乱。
2025-04-09
chatgpt4.5的使用方法
以下是关于 ChatGPT 4.5 的使用方法: 1. 目前 ChatGPT 官网有 GPT3.5、GPT4 和 ChatGPT 4.5 三个版本。ChatGPT 4.5 发布后引起关注,其可以免费体验,但免费体验次数有限。 2. GPT3.5 为免费版本,拥有账号即可使用,但智能程度不如 ChatGPT 4.5,且无法使用 DALL.E3 等功能和插件。 3. ChatGPT 4.5 的知识更新到 2023 年 10 月,而 ChatGPT 4 更新到 2023 年 12 月。 4. 若想使用更多功能更智能的 ChatGPT 4.5,需要升级到 PLUS 套餐,收费标准为 20 美金一个月。GPT4 还有团队版企业版,但费用更贵,一般推荐使用 PLUS 套餐。 5. 关于注册、安装和订阅的详细步骤,您可以参考相关文章,如作者为 JessieZTalk 的亲测文章(原文链接:https://mp.weixin.qq.com/s/tzCVGrwgeG6Bss83Xmep0g )。
2025-03-28
数据挖掘评论分析生成可视化的免费方法
目前暂时没有关于数据挖掘评论分析生成可视化免费方法的相关内容。但您可以通过以下途径寻找免费的解决方案: 1. 利用开源的数据挖掘和可视化工具,如 R 语言中的 ggplot2 库、Python 中的 matplotlib 和 seaborn 库等。 2. 搜索在线的免费数据可视化平台,部分平台可能提供一定程度的数据挖掘和评论分析的可视化功能。 3. 参考相关的技术论坛和社区,获取其他用户分享的免费方法和经验。
2025-03-26
请详细讲述一下这个网站《通往AGI之路》的学习方法?
《通往 AGI 之路》的学习方法如下: 1. 系统学习:观看李弘毅老师的生成式 AI 导论、吴达的生成式 AI 入门视频等高质量学习内容,并整理成学习笔记,在整理过程中与大家交流互动。 2. 社区共创学习:对于觉得系统学习枯燥的同学,可以等待社区共创内容,通过共创做小项目来反向推动学习。 3. 了解相关原理:学习 A16Z 推荐的包括 GPT 相关知识、Transformer 模型运作原理、大语言模型词语接龙原理等基础知识。 4. 探索应用:例如了解 Stable Diffusion 运作原理与 GPT 训练现状。 5. 针对特定软件:对于 AE 软件,可在 B 站找丰富的入门课程自学,也可从包图网下载工程文件学习。通过拆解视频、留意路边广告特效、按层级逻辑思考画面运动来学习,还可参考模板。 6. 名词解释:理解包括 AGI、AIGC、agent、prompt 等 AI 相关名词,可通过与 AI 对话或李继刚老师的课程来理解。 7. 信息获取:关注赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等,订阅获取最新信息并投稿。 8. 参与活动:参加如 AIPO、CONFIUI 生态大会等社区活动,每月还有切磋大会。 9. 阅读经典:阅读介绍 GPT 运作原理、Transformer 模型、扩散模型等的经典必读文章,以及软件 2.0 时代相关内容。 10. 初学者推荐:对于初学者,推荐看 Open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。同时,整理 open AI 的发展时间线和万字长文回顾等历史脉络类资料。
2025-03-23