柏睿数据国内首创MPP内存数据仓库完成千万级融资
- 发布时间:2015-01-09 14:05:51 来源:新华网 责任编辑:罗伯特
柏睿数据国内首创的海量并行MPP内存数据仓库RapidsDB近日已经完成了数千万级的Pre-A融资,领投机构为蓝驰创投,这也是国内顶级基金蓝驰创投在大数据核心技术方向上插下的一个重要旗帜。
众所周知,传统企业级内存数据库尤其是MPP内存数据仓库由于技术壁垒非常高,市场一直由Oracle、SAP HANA、Teradata这三家数据库巨头牢牢把控。国内数据仓库领域,迄今为止还没有一家国产厂商在纯关系型MPP内存数据仓库方向上形成技术突围,此次柏睿数据在技术上的成功突围可谓是中国数据仓库领域的“诺曼底反攻”。
传统基于SMP关系型数据库发展时间久,理论成熟,但是面对移动互联网时代的大数据读写、高并发访问以及频繁的横向扩展需求,基于SMP关系型数据仓库由于扩展性差、升级昂贵等原因已经频显乏力。而前几年虽然新兴的NoSQL等非关系型数据库以更灵活的数据组织形式和分布式存储等特点有所表现,但由于舍弃了数据间的关系特性,则根本无法满足基于大数据的海量分析需求。
柏睿数据的RapidsDB 是一个新型的基于分布式内存的数据仓库,和亚马逊新近收购的ParAccel一样,属于全内存的分析型数据库。与 ParAccel不同的是,柏睿数据的RapidsDB完全针对的是企业级用户,因此更完整支持TPC-H及TPC-DS的SQL语法,同时还加入了其他顶级数据仓库公司少有的流数据操作功能,这使得企业级用户能轻易的驾驭以键值存取的移动互联网流数据及物联网机器数据。
“数据仓库这个领域本身门槛就很高,鲜少有人能真正在产品功能上实现,尤其是MPP架构的数据仓库由于技术分支基本就来源于贝尔实验室及UC Berkeley,所以产品开发的关键还是在于开发人员的素质,虽然我们的起步比国外晚些。”柏睿数据的创始人刘睿民先生向记者介绍道,“但我们的后发优势非常明显,尤其是大数据对MPP数据仓库的需求跟以前的要求有了根本的区别,现在的数据量在以万倍数的增长率增长,这是我们在研发过程中一直关注并致力于解决的核心问题,我们的这个产品能快速推出符合当今大数据快速处理需求的功能和特性,我们产品数据处理速度是现有技术的50倍,这就意味着我们在处理海量数据时,现有技术10几个小时才能处理完的数据,用我们的产品在10分钟左右的时间,甚至秒级即可处理并得出结论,这对于以数据分析为核心竞争力的企业用户来说,反应时间就是市场、就是金钱。你比别人反应快,你占领市场的速度就比别人快,你必然比竞争对手更具明显竞争优势”。
公司创始人刘睿民创办公司前,曾任多家世界级跨国IT公司的大中国区及亚太高管,并曾在国内上市公司华胜天成担任CTO,归国前在硅谷Tandem公司师从图灵奖大神级得主Jim Gray,共同参与过Tandem NonStop SQL/MP的内核编写。据业界权威人士介绍,Tandem公司的MPP分布式数据库迄今为止依然在欧美的高端市场傲视群雄。
“MPP内存数据仓库与基于SMP的关系型数据仓库依然会有一段时间长期共存,但是随着移动互联网及物联网进入成熟期,数据量暴增会使得海量数据的实时分析压力越来越大。而随着固态硬盘及内存价格的持续下跌,基于海量并行的MPP内存数据仓库必将成为首选。”刘睿民表示,“柏睿数据目前的客户都是企业级用户,他们现有的数据增量已经非常可观,每天增量TB级的客户已经越来越多了”,比如在传统企业里就有包括中国联通、诺基亚西门子、万达信息等公司;而互联网行业里面也有像多米音乐这类企业,他们现在都已经成为柏睿数据的客户。而且像中国联通这样的每天流淌着海量数据的巨无霸公司也开始与柏睿数据合作,现已经有多个系统在线运行,其中包括实时客户画像等对数据反映速度要求最苛刻的系统也在使用柏睿数据的RapidsDB。
未来柏睿数据计划在丰富自己产品线的同时,更多的与生态圈里的其他国产数据库友商进行合作,因为作为数据分析及存储的数据库是IT基础架构中至关重要的基石,只有形成良性互动才能建立国产数据库产业的良好氛围。
在采访的最后,刘睿民告先生诉记者,柏睿数据将在国家级的标准方面做更多的工作。他认为数据仓库的标准是整个行业的标杆,只有设立正确的标杆才能更好的促进国产数据库的健康发展,企业级产品性能及服务才是根本。柏睿数据,这家坐落在北京的公司,目前拥有一个 20 多人的团队,研发队伍主要来自硅谷和本土培养,他们的专业与对市场的精准把握,必然会对海量数据基础平台带来划时代的革命。