以下是关于大模型的相关活动及信息:
2023 年度中文大模型关键进展:OpenAI 发布 GPT4、复旦开源 MOSS、元语开源 ChatYuan、清华开源 ChatGLM 、360 发布 360 智脑 1.0、科大讯飞发布星火 1.0 、阿里云发布通义千问 1.0、Meta 开源 Llama2、百川智能开源 Baichuan7B 、OpenAI 发布多模态 GPT4V 、GPT4 Turbo 发布、百度升级文心一言 4.0、商汤科技发布商量 1.0、阿里云开源 Qwen7B、华为发布盘古 3.0 、字节跳动公测大模型产品豆包、百川智能开源 Baichuan2、vivo 发布 BlueLM、清华开源 ChatGLM3 、清华&智谱 AI 开源 ChatGLM2、小米发布大模型 MiLM、西湖心辰发布西湖大模型、零一万物开源 Yi34B 、文心一言升级 V3.5、科大讯飞升级星火 3.0、元象科技开源 XVERSE13B、昆仑万维发布天工 1.0、云从科技发布从容大模型、出门问问发布序列猴子、上海人工智能实验室开源 InternLM20B 、OPPO 发布 AndesGPT。
2024 年 1 月 27 日,LangGPT 社区北京第一期交流沙龙活动举行,主题是关于“大模型落地应用”。
大模型入门指南:通俗来讲,大模型输入大量语料,让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”类比大模型的训练、使用过程:找有大量 GPU 的“贵族学校”训练;确定大量数据的“教材”;选择合适算法的“老师”;为胜任某一行业进行微调“就业指导”;完成指导后进行推导“搬砖”,如翻译、问答等。
2024-08-18