又是一年技术卓越奖揭幕时,2023年生成式AI、大模型的火热引爆了新一轮的数智技术革命,为数据库的发展带来新的挑战和机遇。让我们具体来看看2023年数据库领域有哪些新发展趋势吧。
向量数据库随生成式AI(AIGC)爆发而火爆
ChatGPT所引发的AIGC浪潮,推着向量数据库从籍籍无名,突然跳到了聚光灯下。AI教父黄仁勋为其背书,称“向量数据库对于建立专有大模型的组织至关重要”,资本为之疯狂,各厂商不甘落后争相布局。比如4月,多个向量数据库初创厂商获得融资,包括,Chroma获得1800万美元种子轮融资。Qdrant获得750万美元种子轮融资。Weaviate获得5000万没有B轮融资,估值2亿美元,是上次估值的4倍,有分析称本次融资为其后面的融资预留了空间。Pinecone获得了1亿美元B轮融资,投后估值7.5亿美元,达到A轮的4倍多,去年A轮投后估值为1.68亿美元。
国内外厂商争相布局向量数据库或者增加向量检索支持,如星环科技、腾讯云、南大通用等发布专门的向量数据库,Elastic、MongoDB、PG、Oracle、Amazon、阿里云、Neo4j、天云数据等在其原有数据库基础上增加向量检索插件或向量检索支持。
专家指出,向量数据库随着AIGC的发展水涨船高,尤其在消除大模型幻觉、充当大模型海马体方面扮演了重要的角色。但是向量数据库的落地也受AI、大模型应用的影响,希望大家在向量数据库方面可以更加理性投资。
多云、Serverless、智能化、一体化等不断深入发展
随着云端转型不断深入,在数据库领域,为了发挥不同云的特性,以及避免云锁定问题,多云管理的需求不断提升。此外,亚马逊云科技、阿里云、腾讯云、华为云等,在云原生数据库、Serverless方面不断探索创新,助力企业降本增效。
此外,AI4DB以及DB4AI等数据库智能化的发展也引发广泛关注。目前AIGC在数据交互层面有较好的应用,比如NPL2SQL的能力,降低了数据交互门槛。而在智能运维方面,大模型也可以结合知识图谱发挥更重要的作用,进行故障告警,缩小故障根因范围等,专家认为运维的最后一公里还需要交给DBA。而AI在优化器、执行器方面的应用还有待于更进一步探索。
随着数字化转型深入,场景越来越多元复杂。为了满足复杂场景的多元化需求,数据库融合、一体化的趋势越来越明显,通过技术的融合,一种数据库解决更多场景的问题,一些厂商提出了超融合的理念。另一方面,也有厂商坚持专库专用,坚持一款数据库只解决一种场景问题。
信创国产化走入深水区,但“平替”不易
今年,国产数据库在核心系统投产的消息越来越多,数据库信创国产化已经走入深水区。我们也能看到,一些数据库厂商推出了数据库一体机来更好地满足关键核心系统的高性能、高可用等方面的需求。
从年初,业内一直在讨论是“平替”还是“改造升级”。专家认为,虽然国产数据库已经有长足的进步,但是还是需要正视与成熟商业数据库之间的差距,一些关键系统的数据库替代并不容易做到“平替”,是“平替”还是“改造”需要结合企业自身情况而定。为了保证平稳替换,国产化替换需要循序渐进,替换前多做测试验证。在做国产化替换的过程中,一方面,数据库厂商尽可能做差异的对齐,尽可能做到“平替”,另外应用厂商也需要做一些调整,双方结合起来,才能让整体替换更加平滑稳定。而一些核心系统平替后,需要很好的可观测性,实时观察数据库的运行状态是否平稳。
在2023年即将结束之际,IT168再次启动“技术卓越奖”评选,由行业CIO/CTO大咖、技术专家及IT媒体三方联合评选,评判标准代表了用户和媒体声音。经过多方评审,评选出极具优势的数据库相关企业、产品、解决方案和数字化领军人物,接下面就让我们一起来看一下,今年都有谁入榜。