DeepSeek(深度求索)是由深度求索(DeepSeek)公司推出的一系列开源大语言模型(LLM),广泛应用于代码生成、多模态理解、通用对话等多个领域。以下是目前公开的主要 DeepSeek 模型版本:
1. DeepSeek-VL
多模态大模型,支持图文理解与生成,适用于视觉问答、图像描述等任务。
2. DeepSeek-Coder
专为代码理解和生成优化的大模型,支持多种编程语言,在 HumanEval 等代码评测中表现优异。
3. DeepSeek-MoE
基于混合专家(Mixture of Experts, MoE)架构的高效大模型,在保持高性能的同时显著降低推理成本。
4. DeepSeek-Base / Chat
基础通用语言模型及对话优化版本,适用于日常问答、内容创作、知识检索等场景。
5. DeepSeek-Math
专注于数学推理与解题能力的大模型,在数学竞赛题和复杂逻辑推理任务中具有领先表现。
所有 DeepSeek 模型均在 Hugging Face 和 GitHub 上开源,支持本地部署与商业应用(需遵守相应许可证)。