一、Milvus 是什么¶
Milvus 是一个面向 AI 时代海量向量数据的高性能、可扩展、云原生开源向量数据库。
它的核心价值是:
- 专为向量检索设计;
- 支持大规模向量存储和相似搜索;
- 适合推荐系统、语义检索、多模态检索、RAG 等场景。
官网:
https://milvus.io/
GitHub:
https://github.com/milvus-io/milvus
二、实验环境说明¶
笔记里的演示环境基于 Ubuntu 22.04,实验环境配置大致为:
- 2C2G 用于测试;
- 生产环境按实际数据量和并发需求扩容。
三、安装 Docker 和 Docker Compose¶
apt update
apt install docker.io docker-compose -y
如果拉镜像慢,可以继续配置 Docker 加速器:
sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<-'EOF'
{
"registry-mirrors": [
"https://docker.m.daocloud.io",
"https://dockerhub.timeweb.cloud"
]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker
可以先用 busybox 测试 Docker 是否正常:
docker pull busybox
四、下载 Milvus 单机版配置¶
可以直接下载官方提供的单机版 Docker Compose 文件:
wget https://github.com/milvus-io/milvus/releases/download/v2.6.0-rc1/milvus-standalone-docker-compose.yml -O docker-compose.yml
如果你本地已经有现成的 Compose 文件,也可以直接用现有文件。
五、启动 Milvus¶
docker-compose up -d
docker-compose ps
启动后通常会看到几个核心容器:
milvus-etcdmilvus-miniomilvus-standalone
其中:
milvus-standalone通常监听19530;- MinIO 会暴露对象存储相关端口;
- etcd 主要用于内部元数据管理。
六、访问 WebUI¶
如果你在云主机上部署,需要先开放对应安全组端口,然后再访问:
http://<your-server-ip>:9091/webui/
公开文章里请始终使用占位写法,不要写真实公网 IP。
七、为什么 Milvus 很适合做 RAG 底座¶
因为它在“海量向量存储 + 高效相似检索”这两件事上做得足够专业。对于 RAG 来说,检索是第一步,Milvus 这种数据库的存在,就是为了把这一步做得更快、更稳。
八、部署层面的一个实用建议¶
如果你只是做实验,单机版就够了;如果要进入生产环境,再去考虑:
- 数据规模;
- 索引类型;
- 集群部署;
- 备份与监控。
先跑通最小可用版本,再逐步升级,是更稳妥的路线。