排序
Unsloth 微调 Qwen3-4B 实战:训练、推理与 vLLM 部署
一、先配置训练器 示例里使用的是 `SFTTrainer`: - 二、几个关键超参数怎么理解 * `gradient_accumulation_steps`: * 用梯度累积模拟更大的 batch。 * `warmup_steps`: * 训练初期逐步升高学...
Go 基础语法:变量、常量、函数与流程控制
一、变量和常量 1.1 变量 1.1 什么是Go语言变量 在Go语言中,变量用于存储和操作数据。Go 语言变量名由字母、数字、下划线组成,其中首个字符不能为数字。 1.1 什么是变量声明 声明变量的一般形...
Go 开发环境搭建:VSCode 与基础工具链配置
一、安装VSCode 1.点击[VSCode官网](https://code.visualstudio.com/download),选择对应的版本进行下载,这里我是windows 2.双击安装包,点击【下一步】 3.选择安装目录,点击【下一步】 4.点...
大模型如何训练:参数、数据与调用流程
一、知识是如何进入参数的 观点:大模型本身没有知识库/数据库,它“大脑”里的知识来源于它的参数。这些知识是通过训练数据学习到的统计规律,编码在神经网络参数中。大模型不像传统数据库通过结...
大模型选型指南:性能、参数与安全性
一、性能与场景适配度 1.1 通用能力 评估模型在数学推理、代码生成、多语言支持等通用任务上的表现。例如,通义千问在多项评测中表现突出,DeepSeek-R1 在复杂推理任务中也有明显优势。 1.2 行...
大模型知识蒸馏入门:原理、方法与百度千帆实战
一、什么是知识蒸馏 知识蒸馏(Knowledge Distillation)是一种模型压缩技术,核心思想是: * 用一个更大的教师模型指导一个更小的学生模型; * 让学生模型在更低资源占用下,尽量接近教师模型...






