ITPub博客

首页 > 数据库 > NewSQL > 话题探讨:GitHub不用分布式,能说明什么?

话题探讨:GitHub不用分布式,能说明什么?

原创 NewSQL 作者:老鱼 时间:2021-11-19 17:58:52 0 删除 编辑

题图:来自unsplash(Volodymyr Hryshchenko)


最近,老鱼看到一篇文章,标题是《值75亿美金的GitHub都不用分布式,你的数据库也不需要》,有点意思,有意思的不在极致的分库分表,而是可以延伸出几个特别值得探讨的话题。


一、市值是否等同于数据库复杂度?

二、GitHub不用分布式,能说明什么?

三、分布式与集中式只能非此即彼?

四、分布式是中国特色还是全球趋势?


老鱼对GitHub业务不了解,不敢妄下评论,所以,找来几个数据库老炮,大家一起来探讨下。


市值是否等同于数据库复杂度?


市值75亿美金,等同于数据库复杂度高?小公司,数据库就很简单?其实,并不一定。


一个企业的数据库复杂度与业务复杂度是有关联度的,但跟市值却不完全对应,可能有公司市值小,但数据库超级复杂,有的公司很大却很简单。

---杨传辉(花名:日照)OceanBase CTO


要做个对比的话,GitHub的业务肯定没有金融复杂,过去几年,GitHub发生了好几次宕机时间超过一天的事故,并且这几次事故大多是因为数据库问题,前几次的事故是数据同步,一致性问题,同样的事故,如果平移到金融机构,肯定不能忍受。所以,脱离业务复杂度,脱离业务本身的社会属性去讨论技术,本身是有问题的。


据我观察,小公司不一定就只有小数据,也可能有大数据,也可能有高并发的业务量。但是小公司对于基础架构的投入或者说对于基础架构的重视程度,可能有所不同。


---黄东旭 PingCAP联合创始人兼CTO


GitHub不用分布式能说明什么?


GitHub不用分布式,不带代表这部分工作不存在,不用分布式,只是一个技术偏好选项的问题,并不能说明其它问题。


复杂度是守恒的,GitHub没用分布式,不代表这部分工作就不做了,这部分工作可能是在应用层、中间层做了。从数据库的角度看,分布式数据库把复杂留给数据库,把简单留给应用,应用不需要关注底层数据库容量、事务、伸缩扩容、一致性备份等等很多问题。


国外用户规模可能没有中国市场这么凸显,因为中国有人口红利。另外,是用分布式产品去解决,还是用分布式解决方案去解决?这又是另外一个思路,单机数据库一样可以做这个事情。


---王伟民 阿里云数据库事业部产品与解决方案部总经理


一个公司用什么样的数据库跟其开发人员有关系,开发人员比较强,用NoSQL系统也可以把所有业务做得好。如果把业务复杂度推给客户,让客户做改造,也能玩得转。尤其是越偏互联网业务改造越多,越偏传统企业业务改造反而越少。

---杨传辉(花名:日照)OceanBase CTO


其实,我确实认识一个GitHub做数据库的团队,他们就非常喜欢分库分表,这是一个技术偏好选项的问题,不同的公司情况各不相同。


比如说你可以说不需要新一代的分布式数据库,还是可以依赖单机数据库去维护1000个MySQL分片,那是可以的,但前提是,你能找到像GitHub一样维护1000个甚至几千个MySQL分片,非常厉害的分库分表工程师。我觉得这个门槛对于大多数公司来说还是太高了。


所以,我们在做的事,是把这个技术门槛拉低了,就像苹果一样,你当然可以说现在还可以用诺基亚,但为什么大家不用诺基亚呢?


---黄东旭 PingCAP联合创始人兼CTO


分布式与集中式只能非此即彼?


分布式虽然近年非常火,但并不是新东西,分布式数据库在数据库历史的早期就有了,其研究始于20世纪70年代,世界上第一个分布式数据库系统SDD-1是由美国计算机公司(CCA)于1979年在DEC计算机上实现。


从时间上看,有关分布式架构与集中式架构孰优孰劣的讨论已经持续了30多年时间,到现在也没见谁消失。


因此,分布式与集中式是数据库技术发展背后的两股重要力量,二者并不是取代关系,而是两者都在发展和进步,但步调并不一致。有时会制约对方,有时又促进对方,纠缠不清,相爱相杀,但总体来说都是在推动着数据库 向前发展。


分布式和单机,其发展是螺旋交互上升的。早年Neo4j(市占率最高的图数据库)坚定走优化单机的技术路线,甚至去与IBM大型机合作,但最近也开始重点发展分布式能力。因为分布式不仅能突破单机数据存储的瓶颈,也在高可用、高并发等场景下有不可比拟的优势。


分布式或者单机的发展,与数据增长以及支持其存储计算的底层软硬件设施的发展是戚戚相关的。分布式技术可以通过大量便宜的通用硬件,完成昂贵的大型机能完成的大数据处理任务。比如,谷歌的数据量那么大,都放在昂贵的大型机上,估计早就破产了。


集中式(单机)有没有可能在以后某一天,突然又红火起来?我认为是可能的,比如哪一天量子计算机出来,单机算力提升很多,使得一台机器上能做现在一千台机器做的事情,那单机极致优化可能又再次成为主流。


更远的未来的哪天可能又有新的市场环境以及需求场景,又从单机到多机循环,从更长的技术历史长河来看,两者交互螺旋上升。


---张晨 浙江创邻科技有限公司创始人、CEO


分布式与集中式系统会持续发展,但集中式系统仅会活跃于特定领域和业务。


过去20年数据库技术发展路线大致可分为从性能受限的集中式系统,到取舍CAP的NoSQL系统,再到保证ACID事务特性的NewSQL系统。


随着理论发展和新硬件的不断涌现,分布式系统逐渐实现了集中式系统的特色功能,并维持高可用、可扩展等技术优势,也将不断蚕食集中式系统的应用空间。


--- 吕程  星环科技联合创始人、研发副总裁


分布式是中国特色还是全球趋势?


毫无疑问,分布式是全球趋势而非中国特色。


国内的分布式更广泛,本质还是因为中国庞大的人口基数与人口密度、以及高度发展的经济产生了大量的用户、行为、运营数据,让大量企业具备了单机无法处理的数据体量。这是一个不可逆的趋势。


国外虽然没有相同的市场环境,但分布式技术在国外的起步很早,随着各大科技巨头不断的技术输出,分布式技术在各个领域都被广泛的使用,主流厂商的主流技术产品都在发展分布式的能力。


总的来说,分布式趋势我认为是世界范围的,并不仅限于中国。


---张晨 浙江创邻科技有限公司创始人、CEO


系统分布式化是全球趋势,当下全球市场广受追捧的数字货币、隐私计算、物联网等应用,其背后数据所呈现的复杂性、异构性、庞大性,是集中式系统有限算力和存储容量无法满足的。


国内主流大厂和新兴数据库厂商,在分布式技术储备上已可媲美国外同行。新应用产业在国内拥有巨大发展潜力,将推动国内分布式技术的发展和落地。


--- 吕程 星环科技联合创始人、研发副总裁


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/11310314/viewspace-2843203/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论
私人笔记,记录老鱼日常所见所闻所感!

注册时间:2007-12-05

  • 博文量
    189
  • 访问量
    518582