一、向量检索
1、向量的定义
- 计算机只认识数字,它只能通过数字来量化这个世界,用一组数字来表示一个事物,这样的一组数字就是一个向量(Vector)
- 如果一个向量由N个数字组成,它就是一个N维向量。拿目前广泛使用的人脸识别技术来说,计算机从照片或视频中提取出人脸的图像,然后将人脸图像转换为128维或者更高维度的向量。
- 首先我们了解下什么是向量,所谓向量就是由N个数字(二值向量由N个比特组成)组成的数组,我们称之为N维向量。
- 而向量检索就是在一个给定向量数据集中,按照某种度量方式,检索出与查询向量相近的K个向量(K-Nearest Neighbor,KNN),但由于KNN计算量过大,我们通常只关注近似近邻(Approximate Nearest Neighbor,ANN)问题。