DeepSeek是由深度求索(DeepSeek)团队推出的一系列开源大语言模型。其最初版本(通常称为 DeepSeek-V1 或 DeepSeek-LLM)于2023年发布,标志着该团队在通用大模型领域的首次公开成果。
该版本基于大量中文和英文语料训练,支持多种任务场景,包括问答、代码生成、文本创作等。模型采用标准的Transformer架构,并在训练策略、数据清洗和推理优化方面进行了多项创新。
DeepSeek最初版本以Apache 2.0协议开源,允许学术研究与商业应用,迅速在开发者社区中获得广泛关注,成为中文大模型生态中的重要一员。
如今,DeepSeek已迭代出多个增强版本(如 DeepSeek-Coder、DeepSeek-MoE 等),但最初版本仍因其简洁性、高效性和良好的基础性能,被广泛用于教学、研究和轻量级部署场景。