Chat with Wiki - Claude大模型背后是什么公司

Answer

Claude 大模型背后的公司是 Anthropic。Claude 系列在前段时间推出了 Claude-3.5-Sonnet 等模型，并且在代码生成等方面表现出色。同时，Anthropic 公司的 Claude 还具有较大的上下文窗口等特点。

Content generated by AI large model, please carefully verify (powered by aily)

References

从 Artifacts 到 Cursor 的连续爆火，唤起了大模型的又一春

如果你经常刷X或者关于AI的信息，那么你对Cursor这个词肯定不陌生。随便刷刷我的时间线，就能看到XXX说Cursor太牛逼了啊，我XXX小时就能利用它写一个应用出来。是的，他们说的都是真的。我只用了27*3秒，就写了一个简单的FLUX WebUI，还加了Magic Prompt+历史纪录功能。而且，这还是用的一个我以前一看就头疼的代码语言。所以，不得不感叹大模型技术发展之快，很多还在做大模型应用或者模型的公司，也要好好想想，互联网的那套方法，在当下还能不能奏效，现在的这种节奏，可能比敏捷开发还要敏捷。“不然OpenAI的GPT-5出来，就吊打大家”。上面的这句话，其实是山姆大叔在去年11月的OpenAI开发者大会上说的，结果他的对手，Claude的母公司Anthropic帮他做到了。因为Claude在前段时间推出了Claude-3.5-Sonnet：一个在前端代码生成能力上断崖式领先的模型，以及Artifacts：一个直接把前端代码渲染成网页的工具加上在Claude加持下的Cursor持续爆火，似乎让很多人在周边不断唱衰的论调中，似乎又看到了大模型应用落地的另一种新思路--代码生成。

如何使用 AI 来做事：一份带有观点的指南

前四个（包括Bing）都是OpenAI系统。今天有两大主要的OpenAI AI：3.5和4。3.5模型在11月启动了当前的AI热潮，4.0模型在春季首次发布，功能更强大。一个新的变种使用插件连接到互联网和其他应用程序。有很多插件，其中大部分不是很有用，但你应该随需要自由探索它们。Code Interpreter是一个非常强大的ChatGPT版本，可以运行Python程序。如果您从未为OpenAI付费，那么您只能使用3.5。除了插件变种和一个暂时停用的带有浏览功能的GPT-4版本之外，这些模型都没有连接到互联网。微软的Bing使用4和3.5的混合，通常是GPT-4家族中首个推出新功能的模型。例如，它既可以创建也可以查看图像，而且它可以在网页浏览器中阅读文档。它连接到互联网。[Bing使用有点奇怪，但功能强大。](https://oneusefulthing.substack.com/p/power-and-weirdness-how-to-use-bing)谷歌一直在测试自己的人工智能供消费者使用，他们称之为Bard，但是由各种基础模型驱动，最近是一个名叫PaLM 2的模型。对于开发出LLM技术的公司来说，他们非常令人失望，尽管昨天宣布的改进表明他们仍在研究基础技术，所以有希望。它已经获得了运行有限代码和解释图像的能力，但我目前通常会避免它。最后一家公司Anthropic发布了Claude 2。Claude最值得注意的是有一个非常大的上下文窗口-本质上是LLM的记忆。Claude几乎可以保存一整本书或许多PDF。与其他大型语言模型相比，它不太可能恶意行事，这意味着，在实际上，它倾向于对你做一些事情进行责骂。现在，来看看一些用途：

文章：Andrej Karpathy 亲授：大语言模型入门

我想提的另一件事是，我之前天真地描述了人类完成所有这些体力工作的过程。但这并不完全正确，而且它越来越不正确。这是因为这些语言模型同时变得更好。你基本上可以使用人机协作来创建这些标签，随着效率和正确性的提高。例如，你可以使用这些语言模型来获取示例答案。然后人们会挑选部分答案来创建一种单一的最佳答案。或者你可以要求这些模型尝试检查你的工作。或者你可以尝试让他们进行比较。然后你就像是一个监督角色。所以这是一种你可以确定的滑块。而且这些模型越来越好。我们正在将滑块向右移动。比较、标记文档、RLHF、合成数据、排行榜好的，最后，我想向你展示当前领先的大型语言模型的排行榜。例如，这就是聊天机器人竞技场。它由伯克利的一个团队管理。他们在这里所做的是根据ELO评级对不同的语言模型进行排名。计算ELO的方式与国际象棋中的计算方式非常相似。所以不同的棋手互相对弈。根据彼此的胜率，你可以计算他们的ELO分数。你可以使用语言模型做完全相同的事情。所以你可以访问这个网站，输入一些问题，你会得到两个模型的响应，你不知道它们是由什么模型生成的，然后你选择获胜者。然后根据谁赢谁输，你就可以计算出ELO分数。所以越高越好。所以你在这里看到的是，拥挤在顶部的是专有模型。这些是封闭模型，你无法访问权重，它们通常位于网络界面后面。这是OpenAI的GPT系列，以及Anthropic的Claude系列。还有其他公司的一些其他系列。所以这些是目前表现最好的模型。然后就在其下方，你将开始看到一些开放权重的模型。因此，这些权重是可用的，人们对它们有更多了解，通常有相关论文可用。例如，Meta的Llama2系列就是这种情况。或者在底部，你可以看到Zephyr 7b Beta，它基于法国另一家初创公司的Mistral系列。