数据库圈这周吵翻了天,一个叫“Curt”的独立分析师抛出观点,让原本沉闷的技术圈瞬间分成两派:有人说是“旧瓶装新酒”,毫无新意;也有人觉得这才是数据库该有的样子。这场争论背后,其实是产品技术与DBA(数据库管理员)价值谁更重要的老问题,被重新摆上了台面。
到底什么是这个引发争论的技术
这个被热议的对象,本质上是一个查询预编译与持久化存储的中间件技术。它不像传统数据库那样每次查询都重新解析SQL语句,而是把常用的查询模式保存成预编译对象,下次遇到相同模式的查询直接调用结果。
Curt在他的分析文章中指出,这项技术最早起源于云计算厂商的内部需求,为了解决多租户环境下资源争抢的问题。目前已经有几家初创公司在做商业化落地,其中一家位于硅谷的公司已经获得了2500万美元的A轮融资。
性能提升背后的技术逻辑
在性能测试中,这项技术确实表现出色。根据Curt引用的第三方测试数据,在TPC-H基准测试中,针对复杂查询的响应时间平均降低了73%,CPU使用率下降了45%左右。这对于需要处理大量并发查询的企业来说,意味着可以直接降低硬件成本。
其实将查询进行预编译很难说是一个创新,也不是业内的独一份。此前包括Oracle的共享池、PostgreSQL的预处理语句以及MySQL 8.0的查询缓存都做过类似的尝试。而这次引发关注的技术,其特色在于将预编译结果持久化到磁盘,而不是仅仅放在内存里。
公司背景与商业布局
开发这项技术的是一家成立仅三年的初创公司,总部位于奥斯汀,核心团队来自AWS Redshift和Google BigQuery。他们目前主要瞄准的是云端SaaS服务商,这类客户通常有大量重复的查询模式,能最大化发挥技术优势。
Curt在文章中透露,这家公司已经和三家财富500强企业签订了试点合同,其中包括一家排名前三的美国零售商。他们正在用黑盒测试的方式,将这套技术嵌入到后者的电商数据库系统中,预计今年年底会有正式上线案例。
存储机制的争议点
关于持久性的设计,Curt也提出了自己的疑问。这项技术使用预写入日志到一个磁盘(传统或固态硬盘),同时发送快照到其他磁盘的方式来实现数据持久化。在正常负载下,这种设计是连续的,性能损耗很小。
但是在full-query场景中是否还能保持同样水准就不清楚了。当并发查询量突然暴增时,预写入日志的写入速度会不会成为瓶颈?Curt认为这是潜在的风险点,但厂商没有提供压力测试的具体数据,只是口头表示“内部测试没问题”。
技术细节中的亮点与槽点
其他一些值得注意的技术细节包括:每个查询模式只占几KB的空间,在早期的客户中,他们最多存储不会超过几千个查询模式。因此对于编译这些查询会造成的内存影响,厂商还是表示非常乐观的,他们使用LRU算法来释放空间的方式也比较成熟。
不过有技术博主在翻看文档后发现,这套算法其实和20年前Sybase ASE使用的方法高度相似。这也成了“旧瓶装新酒”派的主要论据——技术本身没问题,但非要包装成颠覆性创新就有点过了。
DBA的价值会被取代吗
这场争论的核心,最终还是落到了人身上。如果查询预编译和自动优化做得足够好,企业还需要高薪聘请DBA吗?Curt的观点是恰恰相反,他认为当技术把重复劳动自动化之后,DBA反而能腾出手来做更有价值的架构设计和性能规划。
他举了个例子:一家游戏公司去年裁掉了两名DBA,结果今年新游戏上线时数据库频繁死锁,没人能快速定位问题,最后不得不花三倍价钱请回一个老顾问。工具再先进,关键时候还是得靠人。
你觉得数据库技术越来越智能,是会让DBA失业,还是让这个岗位变得更有价值?欢迎在评论区分享你的看法,点个赞让更多同行加入讨论。
