搭建自己的 DeepSeek 环境

2025.02.13 13:31

DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。使用 DeepSeek 的方式有几种:直接访问官网 https://chat.deepseek.com/、下载 App 或者通过本地的客户端来使用。

使用本地的客户端能更方便的留存和管理聊天记录,同时因为使用 API 的方式还能灵活的接入不同提供方的模型,进行比较和能力综合。不要听到 API 就犯怵,其实大部分客户端都预置好了选项,只需要简单的填写从厂商哪里申请到的 API Key 就可以简单的配置好。

Chatbox (https://chatboxai.app)是一个支持多种流行LLM模型的桌面客户端,可在 Windows、Mac 和 Linux 上使用。Mac 用户推荐 https://chatwise.app/。

如果已经申请了 DeepSeek 或者 OpenAI 的 API key,直接在设置中选择模型提供方然后填写 API key 即可。如下图所示:

由于 DeepSeek 的热度持续上升,DeepSeek 暂停了 API 充值,而且官网和 APP 也因为涌入的流量过大经常停摆,因为 DeepSeek 是开源的大模型,所以很多第三方也同样部署了 DeepSeek 服务,例如 阿里云、硅基流动(SiliconFlow)等,将 API 换成这些公司的就能另辟蹊径享受快速的使用体验。

例如:有阿里云账户的同学可以激活开通阿里云百炼平台。使用阿里云百炼部署的 DeepSeek 671B 满血版模型,然后按照下面图示的方式配置即可使用。硅基流动的配置类似,区别只是 API 域名不同。

Chatbox 设置中 API 模式选择“添加自定义提供方”,添加阿里云版的 DeepSeek-V3

添加阿里云版的 DeepSeek-R1,其他都一样模型名称修改一下。

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能较高,能力较强。
DeepSeek-V3 为 MoE 模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练,在长文本、代码、数学、百科、中文 能力上表现优秀。

  • 100万 token 的免费额度
  • V3,每千Token 0.001元(输入)、0.004元(输出)
  • R1,每千Token 0.002元(输入)、0.008元(输出)

配置参数

  • base_url:https://dashscope.aliyuncs.com/compatible-mode/v1
  • api key:(通过阿里云百炼平台申请的 API)
  • 模型名称
    deepseek-r1
    deepseek-v3

  • 请不要将 API Key 泄露其他人使用

最好的 AI 是将它应用到自己的工作和生活中。写程序,测试,市场文案,智能客服,甚至招投标等工作,都可以尝试如何利用AI大模型,行动起来 ;)

Comments
Write a Comment