第五部分 本地部署準(zhǔn)備工作:各個(gè)版本、推理框架、硬件資源
DeepSeek-R1的多個(gè)版本:加上2個(gè)原裝671B的,總計(jì)8個(gè)參數(shù)版本
主流的大模型推理框架:分為PC端和Android端
不同參數(shù)的模型所要求的硬件
蒸餾版和滿(mǎn)血版的兩類(lèi)部署
第六部分 通過(guò)Ollama、vLLM本地部署DeepSeek-R1蒸餾版:支持聯(lián)網(wǎng)搜索及知識(shí)庫(kù)問(wèn)答
1、基于Ollama和各類(lèi)插件構(gòu)建智能對(duì)話:終端、open-webui(支持聯(lián)網(wǎng))、Chatbox
1) Ollama下的終端命令行交互
2) Ollama下的open-webui交互:基于docker安裝,且支持聯(lián)網(wǎng)搜索
3) 基于Ollama + ChatBox部署deepseek-r1:7b
2、基于Ollama和Page Assist/AnythingLLM構(gòu)建本地知識(shí)庫(kù)問(wèn)答系統(tǒng)
1) 基于Ollama + Page Assist搭建本地知識(shí)庫(kù)問(wèn)答系統(tǒng):且支持聯(lián)網(wǎng)搜索
2) 基于Ollama + AnythingLLM搭建本地知識(shí)庫(kù)問(wèn)答
3、通過(guò)vLLM推理deepseek-r1
1) 基于vLLM的命令行交互——R1-Distill-Llama-8B
2) 基于vllm + open WebUi 部署r1 7b
4、本地手機(jī)端部署DeepSeek-R1蒸餾Llama/Qwen后的版本
第七部分 無(wú)蒸餾前提下本地部署R1 or R1-Zero 671B滿(mǎn)血版
1、折中路徑:無(wú)蒸餾但量化部署Deepseek-R1 671B滿(mǎn)血版
1) 本地CPU上運(yùn)行 Deepseek-R1 的完整的硬件 + 軟件設(shè)置
2) GPU上跑無(wú)蒸餾但量化的Deepseek-R1 671B滿(mǎn)血版
2、企業(yè)級(jí)部署:無(wú)蒸餾不量化部署Deepseek-R1 671B滿(mǎn)血版