DeepSeek 是由深度求索(DeepSeek)推出的一系列开源大语言模型,支持本地部署和多种应用场景。本文将详细介绍如何在 Windows 和 macOS 系统的电脑上下载并安装 DeepSeek 模型。
一、准备工作
- 确保您的电脑具备足够的硬件资源(建议至少 16GB 内存,GPU 可选但推荐)。
- 安装 Python 3.8 或更高版本。
- 安装 Git 工具,用于克隆官方代码仓库。
二、下载 DeepSeek 模型
DeepSeek 的开源模型托管在 Hugging Face 和 GitHub 上。您可以通过以下方式获取:
- 访问官方 GitHub 仓库:https://github.com/deepseek-ai
- 选择对应的模型(如 DeepSeek-Coder、DeepSeek-Math 等)。
- 按照 README 中的说明,使用 git clone 命令下载源码。
- 通过 Hugging Face Transformers 加载模型权重(需登录并同意使用协议)。
三、本地运行示例
以 DeepSeek-Coder 为例,运行以下命令即可加载模型进行推理:
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/deepseek-coder-1.3b-instruct", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/deepseek-coder-1.3b-instruct", trust_remote_code=True)
inputs = tokenizer.encode("写一个Python冒泡排序函数", return_tensors="pt")
outputs = model.generate(inputs, max_length=200)
print(tokenizer.decode(outputs[0]))
四、常见问题
- Q:是否需要联网? 首次下载模型需要联网,之后可离线使用。
- Q:是否免费? DeepSeek 的部分模型是开源且免费的,具体请参考其许可证。
- Q:对显卡有要求吗? 若无 GPU,可在 CPU 上运行小模型,但速度较慢。