1. DeepSeek 是什么
DeepSeek,是一家在2023年于杭州成立的AI公司「深度求索」开发的大模型名称。DeepSeek 发展情况如下:
-
2024年1月,发布「DeepSeek LLM」,这是他们正式发布的第一版DeepSeek 大模型。 -
2024年5月,发布「DeepSeek-V2」,正式打响中国大模型价格战,当时新发布的 DeepSeek-V2 的API价格只有 GPT-4o 的 2.7%,随后一周时间,国产厂商全部跟进,字节、阿里、百度、腾讯全部降价。 -
2024年12月,发布「DeepSeek-V3」且开源,训练成本仅为557.6万美元,剔除掉Meta、OpenAI等大厂的前期探索成本,大概是别人的三分之一,并且整体模型评测能力媲美闭源模型,震惊海外,自此,东方的神秘力量彻底坐实。 -
2025年1月,发布全新的推理模型DeepSeek-R1 且开源,效果媲美业界标杆OpenAI o1,同时API价格仅为OpenAI o1的3.7%,再一次震惊海外,让Meta连夜成立四个研究小组,让全球算力暴跌,英伟达的神话都岌岌可危。
接下来,我们就看看火遍全球的DeepSeek-R1 大模型到底应该怎么用。
2. DeepSeek-R1核心使用技巧
2.1 总体原则(建议优先阅读)
- 自然对话优先
无需刻意设计思维链,直接表达需求 - 目标导向沟通
说明应用场景比提供指令更重要 - 动态难度调节
通过”说人话”等指令控制输出复杂度 - 专业深度可选
保留但不依赖传统提示词工程技巧
下文将具体展开每个原则的实践方法。
2.2 核心技巧一:摒弃结构化模板
原理说明
作为专精推理的大模型,DeepSeek-R1内置完整的思考链条。传统提示词工程中的分步指令(如”请按以下步骤分析…”)反而会限制其推理能力的发挥。
对比案例
-
传统方式:
作为新能源行业分析师,请按以下结构撰写报告:
市场规模(800字) 竞争格局(800字) 技术路线(800字)
要求:引用2024年最新数据…
-
优化方式:
下周要与比亚迪电池供应商谈判,需要:
用外行能听懂的语言解释他们的技术优势 预测可能的报价区间 提供3个专业谈判术语及使用场景
效果差异:前者产出标准化报告,后者生成包含价格锚定策略的实战指南。
2.3 核心技巧二:目标场景描述法
操作公式
[身份背景] + [使用场景] + [核心目标] + [特别关注点]
应用示例
-
基础版:”我要给高中生讲解量子力学,需要三个生活化比喻” -
进阶版:”作为医疗器械销售,需要准备与三甲医院主任的会谈资料,重点突出我们的耗材在手术室场景下的感染防控优势”
2.4 核心技巧三:动态难度调节
当遇到晦涩难懂的回复时,可通过以下方式优化:
- 即时修正
在回答后追加“请用更通俗的方式解释” - 预设条件
“假设听众是初中文化水平,请重新说明” - 渐进升级
“现在补充技术细节(适合工程师级别)”
3. 不同用户的使用建议
- 新手用户
直接以日常对话方式提问 - 进阶用户
尝试目标场景描述公式 - 专业用户
结合传统prompt技巧进行深度定制
4. 结语:让技术回归服务本质
DeepSeek-R1的技术突破,本质上是对AI服务本质的回归——当大模型足够理解人类意图时,我们不再需要学习”与机器对话的特殊语言”。这种转变正如智能手机取代命令行:技术进化的终极目标,是让复杂消失于无形。


