一、为什么大模型依赖 GPU¶

大模型(如GPT、DeepSeek等)依赖GPU进行训练和推理

CPU和GPU的区别：

	CPU	GPU
组成单元	运算单元、控制单元、缓存单元	运算单元、控制单元、缓存单元
组成占比	25%的ALU(运算单元) 25%的Control(控制单元) 50%的Cache(缓存单元)	90%的ALU(运算单元) 5%的Control(控制单元) 5%的Cache(缓存单元)
适用场景	武器装备、信息化等需要复杂逻辑控的场合	密码学、挖矿、图形学等需要并行计算,无依赖性、互相独立的场合
对于奥数题的求解能力	单线程计算(比如机器人运动控制),单个芯片性能强劲,计算能力强,能计算出来	单个芯片性能弱,计算能力弱,可能算不出来,或速度很慢
对于1000道算术题的求解速度	先算第1题,再算第2题,时间为1000×N;速度较慢	可同时计算1000道算术题,时间为M，速度很快
形象比喻	相当于1名老教授,奥数题和小学算数题都会	相当于1000名小学生,只会小学算数题

大模型需要的能力：

大模型为什么离不开 GPU