一、Milvus 是什么¶

Milvus 是一个面向 AI 时代海量向量数据的高性能、可扩展、云原生开源向量数据库。

它的核心价值是：

专为向量检索设计；
支持大规模向量存储和相似搜索；
适合推荐系统、语义检索、多模态检索、RAG 等场景。

官网：

https://milvus.io/

GitHub：

https://github.com/milvus-io/milvus

二、实验环境说明¶

笔记里的演示环境基于 Ubuntu 22.04，实验环境配置大致为：

2C2G 用于测试；
生产环境按实际数据量和并发需求扩容。

三、安装 Docker 和 Docker Compose¶

apt update
apt install docker.io docker-compose -y

如果拉镜像慢，可以继续配置 Docker 加速器：

sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<-'EOF'
{
  "registry-mirrors": [
    "https://docker.m.daocloud.io",
    "https://dockerhub.timeweb.cloud"
  ]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker

可以先用 busybox 测试 Docker 是否正常：

docker pull busybox

四、下载 Milvus 单机版配置¶

可以直接下载官方提供的单机版 Docker Compose 文件：

wget https://github.com/milvus-io/milvus/releases/download/v2.6.0-rc1/milvus-standalone-docker-compose.yml -O docker-compose.yml

如果你本地已经有现成的 Compose 文件，也可以直接用现有文件。

五、启动 Milvus¶

docker-compose up -d
docker-compose ps

启动后通常会看到几个核心容器：

milvus-etcd
milvus-minio
milvus-standalone

其中：

milvus-standalone 通常监听 19530；
MinIO 会暴露对象存储相关端口；
etcd 主要用于内部元数据管理。

六、访问 WebUI¶

如果你在云主机上部署，需要先开放对应安全组端口，然后再访问：

http://<your-server-ip>:9091/webui/

公开文章里请始终使用占位写法，不要写真实公网 IP。

七、为什么 Milvus 很适合做 RAG 底座¶

因为它在“海量向量存储 + 高效相似检索”这两件事上做得足够专业。对于 RAG 来说，检索是第一步，Milvus 这种数据库的存在，就是为了把这一步做得更快、更稳。

八、部署层面的一个实用建议¶

如果你只是做实验，单机版就够了；如果要进入生产环境，再去考虑：

数据规模；
索引类型；
集群部署；
备份与监控。

先跑通最小可用版本，再逐步升级，是更稳妥的路线。

Milvus 快速入门：Linux 单机部署、Docker 安装与 WebUI