排序
大模型为什么离不开 GPU
一、为什么大模型依赖 GPU 大模型(如GPT、DeepSeek等)依赖GPU进行训练和推理 CPU和GPU的区别: | | CPU | GPU | | -------------------------- | --------------------------------------------...
Transformer 为什么成为大模型核心架构
一、Transformer 解决了什么问题 传统模型(RNN/LSTM) * 痛点:无法并行处理、长距离依赖失效、上下文理解局限 * 举例:传话游戏,只能一传一,不能互相通信,第1个人接收到的信息跟第10个人比肯定会...
大模型微调数据集入门:常见分类与数据格式
一、什么是大模型微调数据集 简单说,微调数据集就是一批专门为某个目标准备的数据,用来让一个已经很强的通用模型,进一步学会特定任务、特定风格或特定领域知识。 二、常见数据集分类 2.1 指...
Go 基础语法:变量、常量、函数与流程控制
一、变量和常量 1.1 变量 1.1 什么是Go语言变量 在Go语言中,变量用于存储和操作数据。Go 语言变量名由字母、数字、下划线组成,其中首个字符不能为数字。 1.1 什么是变量声明 声明变量的一般形...
大模型推理优化总览:硬件、系统架构与服务部署
一、大模型优化的核心目标 优化通常围绕四个目标展开: * 降低延迟: * 尤其是首个 Token 时间和生成速度。 * 提高吞吐: * 在固定资源下服务更多请求。 * 降低成本: * 提升资源利用率,降低单...
Go 接口实战:interface、空接口、类型断言与接口嵌套
一、前言 本文主要以下几方面介绍Go语言中接口: * 初识接口 * 接口使用 * 空接口 * 类型断言 * 接口嵌套 二、初识接口 2.1 理解接口 对于Go语言中的接口,我们可以从现实生活出发,可以更好的理...
大模型压测入门:核心指标与常见压测工具
一、大模型压测为什么特别重要 相比传统 API,大模型服务的性能不只是“请求快不快”,还涉及: * 首个 Token 出来的速度; * 后续 Token 生成的节奏; * 并发下吞吐是否塌陷; * GPU 利用率是...
大模型参数入门:从规模到主流模型量级
一、什么是大模型参数 * 参数单位:B,billion(十亿) * 参数是什么? 大模型参数是通过海量数据训练得到的内部数值,用于存储知识关联并决定模型处理信息的方式。 * 举例1:参数就好比图书馆书架上的...
Go 函数进阶:具名返回值、不定参数与递归实践
一、前言 主要以下几方面介绍Go语言中的函数: * 函数初体验 * 具名返回值 * 接收任意长度参数 * 递归函数 二、函数初体验 2.1 什么是函数 函数是一段封装了特定功能的代码块,它可以接收输入(...
Kubernetes GPU资源调度落地
一、K8s集群部署 1.1 Runtime安装 1、卸载已经安装的 docker 2、配置源 3、安装 Containerd 4、配置 Containerd 的内核 5、创建 Containerd 的配置文件 6、启动Containerd 1.2 Kubernetes 部署 ...









