传统企业使用大模型可以参考以下方法和路径:
此外,国家搞大模型应多条路并进,发改委已号召国企做产业大模型、行业大模型。真正让大模型成为生产力工具、赋能产业,重点在企业侧和产业侧。
通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习,那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程:1.找学校::训练LLM需要大量的计算,因此GPU更合适,因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大,需要的数据量特别多,几千亿序列(Token)的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容,让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导5.搬砖::就业指导完成后,下面就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)
我觉得国家搞大模型应该多条路并进,而不是只走OpenAI GPT4一条道路。最近发改委发了一个文件,号召国企都要做产业大模型、行业大模型。我也跟一些国企领导聊了一下,他们不做通用大模型,大家明白说,真正大模型要成为生产力工具,要真正赋能产业,真正的点是在企业侧、产业侧,这个是我下次课要讲的企业方法论,就是企业如何用大模型来改造自己的业务,来提升自己的生产力。
我觉得国家搞大模型应该多条路并进,而不是只走OpenAI GPT4一条道路。最近发改委发了一个文件,号召国企都要做产业大模型、行业大模型。我也跟一些国企领导聊了一下,他们不做通用大模型,大家明白说,真正大模型要成为生产力工具,要真正赋能产业,真正的点是在企业侧、产业侧,这个是我下次课要讲的企业方法论,就是企业如何用大模型来改造自己的业务,来提升自己的生产力。