DeepSeek 是一家成立于 2023 年,总部位于中国杭州,专注于人工智能基础技术研究的科技公司。其致力于探索 AGI(通用人工智能)的实现路径,定位为聚焦大模型研发与应用,提供高效、安全、可控的 AI 技术解决方案。
将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,认为其秘方是多快好省也不全面。早在 2024 年 5 月 DeepSeekV2 发布时,它就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,V2 的论文引发了 AI 研究界的广泛分享和讨论。当时在国内舆论场,DeepSeek 被描摹成“大模型价格战的发起者”。
如果 V3 是 DeepSeek 的 GPT3 时刻,接下来会怎样没人知道,但有意思的事还在后头。DeepSeek 应会为全人类的人工智能事业做出更大贡献,且已是中国最全球化的 AI 公司之一,其赢得尊重的秘方是硅谷味儿的。
使用地址:https://chat.deepseek.com/(有手机客户端)
模型下载地址:https://github.com/deepseekai/DeepSeekLLM?tab=readmeovfile
API 文档地址:https://apidocs.deepseek.com/zhcn/
DeepSeek 的提示词使用方法比较长,单独列了一篇
2025-02-06