分析师认为,可能很少有人接受Pinecone新的无服务器向量数据库(称为Pinecone Serverless)。
Constellation Research首席分析师Doug Henschen说:“如果您可以从已经使用且已经在管理数据的数据库中获得相同的功能,为什么要建立和管理一个单独的数据库——即使是具有无服务器可扩展性优势的数据库?”
除了主流向量数据库,如Milvus、Weaviate和Chroma,向量嵌入和搜索功能已经添加或即将添加到数据库服务提供商,包括MongoDB、Couchbase、Snowflake和Google BigQuery等。
Henschen说:“向量嵌入和搜索的加入使刚刚起步的、仅限向量的数据库更难开发一个大市场。”
根据专家的说法,向量数据库和向量搜索是开发人员用于将非结构化信息转换为向量的两种技术,现在通常称为嵌入。
这些嵌入反过来又使存储、搜索和比较信息更容易、更快,并且对大型数据集的可扩展性大大提高。
向量搜索的可扩展性优势也有助于它赢得基于生成人工智能构建应用程序的开发人员的青睐,因为您可以向大型语言模型(LLM)提供更多数据,在需要时,模型可以生成更准确的响应,进而使顶层应用程序更高效。
然而,首席分析师表示,他不相信具有更多钟声和口哨声的开发人员和从事人工智能的数据科学家的向量数据库,将迫使企业支付额外的数据库服务,该服务仅用于开发基于人工智能的应用程序。
扁平的IT预算可能会增加Pinecone的担忧
此外,Pinecone Serverless的推出正是在企业的IT预算继续持平之际。
dbInsight首席分析师Tony Baer说:“虽然人们对生成人工智能很感兴趣,但预算尚未相应飙升。”
Baer补充说:“固定预算可以归因于该领域的不成熟;从工具到基础模型再到运行时服务,一切的选择都还处于起步阶段,除了副驾驶和自然语言查询外,企业仍然处于识别获胜用例的学习曲线上。”
除了满足生成性人工智能的需求外,Pinecone预计新的无服务器数据库将帮助企业降低成本和管理基础设施的需求。
该公司表示,通过将读取、写入和存储分开来降低成本,并补充说,该数据库旨在通过采用一种架构来减少延迟,在这种架构下,向量聚类位于blob存储之上。
据该公司称,该数据库配备了新的索引和检索算法,可以在不牺牲检索质量的情况下,从blob存储中实现快速且内存高效的向量搜索。
根据Baer的说法,新的向量索引使Pinecone比其他向量和操作数据库具有优势。这位分析师表示,松果支持近十几种指数类型。
Baer说,数据库的无服务器属性也是一小时的需要。
“检索增强生成(RAG)工作负载的性质是,它们将具有任何查询驱动工作负载(考虑分析)的特征,这些工作负载本质上是尖峰的。Baer解释说,如果没有无服务器,客户必须提供“以防万一”的容量,这种容量可能会经常保持沉默。
Pinecone采用无服务器路由的第二个原因是帮助缓解开发人员的复杂性,因为它消除了配置服务器的需要。