Chat with Wiki - 传统企业如何使用大模型，有哪些方法和路径？

Answer

传统企业使用大模型可以参考以下方法和路径：

训练准备：
- 找学校：由于训练大模型需要大量计算，GPU 更为合适，只有具备购买大量 GPU 能力的企业才有资本训练自己的大模型。
- 确定教材：大模型需要大量的数据量，几千亿序列（Token）的输入基本是标配。
- 找老师：选择合适的算法来讲述数据内容，让大模型更好地理解 Token 之间的关系。
应用优化：
- 就业指导：为了让大模型更好地胜任所在行业，需要进行微调（fine tuning）指导。
- 实际应用：完成就业指导后，将大模型应用于实际工作，如进行翻译、问答等，在大模型中称之为推导（infer）。

此外，国家搞大模型应多条路并进，发改委已号召国企做产业大模型、行业大模型。真正让大模型成为生产力工具、赋能产业，重点在企业侧和产业侧。

Content generated by AI large model, please carefully verify (powered by aily)

References

通俗来讲，大模型就是输入大量语料，来让计算机获得类似人类的“思考”能力，使之能够理解自然语言，能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习，那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程：1.找学校::训练LLM需要大量的计算，因此GPU更合适，因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大，需要的数据量特别多，几千亿序列（Token）的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容，让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后，为了让大模型能够更好胜任某一行业，需要进行微调（fine tuning）指导5.搬砖::就业指导完成后，下面就要正式干活了，比如进行一次翻译、问答等，在大模型里称之为推导（infer）

周鸿祎免费课AI系列第一讲

我觉得国家搞大模型应该多条路并进，而不是只走OpenAI GPT4一条道路。最近发改委发了一个文件，号召国企都要做产业大模型、行业大模型。我也跟一些国企领导聊了一下，他们不做通用大模型，大家明白说，真正大模型要成为生产力工具，要真正赋能产业，真正的点是在企业侧、产业侧，这个是我下次课要讲的企业方法论，就是企业如何用大模型来改造自己的业务，来提升自己的生产力。

周鸿祎免费课AI系列第一讲