DeepSeek 是由深度求索(DeepSeek)推出的一系列开源大语言模型,针对不同应用场景提供了三种主要模式,分别适用于代码生成、高效推理和多模态理解。
专为代码理解和生成设计的模型,支持多种主流编程语言(如 Python、Java、C++、JavaScript 等),在 HumanEval、MBPP 等代码评测基准上表现优异。
基于混合专家(Mixture of Experts, MoE)架构的高效推理模型,在保持高性能的同时显著降低计算资源消耗。
多模态大模型,能够同时处理文本和图像输入,实现图文理解、视觉问答、图像描述生成等功能。
用户可根据实际需求选择合适的 DeepSeek 模式,充分发挥其在特定领域的优势。