下面我将从以下几个方面阐述mysql和postgresql的异同和优劣:
开源性:
postgresql: the world’s most advanced open source database。
- 开源协议:postgresql基于自由的bsd/mit许可,组织可以使用、复制、修改和重新分发代码,只需要提供一个ag真人试玩娱乐的版权声明即可。
- pg的开源协议特别灵活,任何公司的和个人都可以把pg作为一个产品销售,而不需要像mysql那样必须修改大部分代码才可以作为公司的产品。
mysql:world’s most popular open source database。
- 开源协议:核心代码基于gpl或commercial license。
- mysql的开源协议是基于gpl协议,任何公司都可以免费使用,不允许修改后和衍生的代码做为闭源的商业软件发布和销售,mysql的ag真人试玩娱乐的版权在甲骨文手中,甲骨文可以推了其商业闭源版本。
事务支持:
- postgresql支持事务的强一致性,事务保证性好,完全支持acid特性。
- mysql只有innodb引擎支持事务,事务一致性保证上可根据实际需求调整,为了最大限度的保护数据,mysql可配置双一模式,对acid的支持上比pg稍弱弱。
sql标准支持:
- postgresql几乎支持所有的sql标准,支持类型相当丰富。
- mysql只支持部分sql标准,相比于pg支持类型稍弱。
数据复制:
mysql的复制是基于binlog的逻辑异步复制,无法实现同步复制。
复制模式:
-
一主一备
-
一主多备
-
级联复制
-
循环复制
-
主主复制
数据流转优势:通过canal增量数据的订阅和消费,可以同步数据到kafka,通过kafka做数据流转。
mysql所有的高可用方案都是基于binlog做的同步,以及基于mysql的分布式数据也是基于mysql的binlog实现,binlog是mysql生态圈最基本技术实现。
postgresql可以做到同步,异步,半同步复制,以及基于日志逻辑复制,可以实现表级别的订阅和发布。
复制模式:
-
一主一备。
-
一主多备。
-
级联复制。
-
热备库/流复制。
-
逻辑复制。
数据流转优势:通过逻辑复制实现消息的订阅和消费,可以同步数据到kafka,通过kafka实现数据流转。
并发控制:
postgresql通过其mvcc实现有效地解决了并发问题,从而实现了非常高的并发性。
pg新老数据一起存放的基于xid的mvcc机制,新老数据一起存放,需要定时触发vacuum,会带来多余的io和数据库对象加锁开销,引起数据库整体的并发能力下降。而且vacuum清理不及时,还可能会引发数据膨胀。
当然postgresql还有一点影响比较,为了保证事务的强一致性,未决事务会影响所有表vacuum清理,导致表膨胀。
mysql仅在innodb中支持mvcc(并发版本控制)。
innodb的基于回滚段实现的mvcc机制,但是mysql的间隙锁影响较大,锁定数据较多。
性能方面:
postgresql:
- postgresql广泛用于读写速度高和数据一致性高的大型系统。此外,它还支持各种性能优化,当然这些优化仅在商业ag真人游戏的解决方案中可用,例如地理空间数据支持,没有读锁定的并发性等等。
- postgresql性能最适用于需要执行复杂查询的系统。
- postgresql在oltp/ olap系统中表现良好,读写速度以及大数据分析方面表现良好,基于pg的gp数据库,在数据仓库领域表现良好。
- postgresql也适用于商业智能应用程序,但更适合需要快速读/写速度的数据仓库和数据分析应用程序。
mysql:
- mysql是广泛选择的基于web的项目,需要数据库只是为了简单的数据事务。但是,当遇到重负载或尝试完成复杂查询时,mysql通常会表现不佳。
- mysql的读取速度,在oltp系统中表现良好。
- mysql innodb为oltp场景提供了非常好的读/写速度。总体而言,mysql在高并发场景下表现良好。
- mysql是可靠的,并且与商业智能应用程序配合良好,因为商业智能应用程序通常读取很多。
高可用方面:
postgresql
- 基于流复制的异步、同步主从。
- 基于流复制的–keepalive。
- 基于流复制的 –repmgr。
- 基于流复制的 –patroni etcd。
- 共享存储ha(corosync pacemaker)。
- postgres-xc。
- postgres-xl。
- 中间件实现:pgpool、pgcluster、slony、plploxy。
mysql
- 主从复制。
- 主主复。
- mha。
- lvs keepalive。
- mgr分布式数据库,多点写入[不建议],基于paxos协议。
- pxc分布式数据库,多点写入[不建议],基于令牌环协议。
- innodb cluster[8.0新技术,基于mgr实现,上层封装命令],基于paxos协议。
- 中间件实现:mycat。
外部数据源:
postgresql fdw –[foreign-data wrapper的一个简称,可以叫外部封装。
postgresql不支持多数据引擎。但支持extension组件扩充,以及通过名为fdw的技术将oracle、hadoop、mongodb、sqlserver、excel、csv文件等作为外部表进行读写操作,因此,可以为大数据与关系型数据库提供良好对接。
mysql:无。
数据存储和数据类型:
- pg主表采用堆表存放,存放的数据量较大,数据访问方式类似于oracle的堆表。
- mysql采用索引组织表,mysql必须有主键索引,所有的数据访问都是通过主键实现,二级索引访问时,需要扫描两遍索引(主键和二级索引)。
postgresql与mysql优劣对比
postgresql相对于mysql的优势:
- 在sql的标准实现上要比mysql完善,而且功能实现比较严谨。
- 存储过程的功能支持要比mysql好,具备本地缓存执行计划的能力。
- 对表连接支持较完整,优化器的功能较完整,支持的索引类型很多,复杂查询能力较强。
- pg主表采用堆表存放,mysql采用索引组织表,能够支持比mysql更大的数据量。
- pg的主备复制属于物理复制,相对于mysql基于binlog的逻辑复制,数据的一致性更加可靠,复制性能更高,对主机性能的影响也更小。
- mysql的存储引擎插件化机制,存在锁机制复杂影响并发的问题,而pg不存在。
- pg对可以实现外部数据源查询,数据源的支持类型丰富。
- pg原生的逻辑复制可以实现表级别的订阅发布,可以实现数据通过kafka流转,而不需要其他的组件。
- pg支持三种表连接方式,嵌套循环,哈希连接,排序合并,而mysql只支持嵌套循环。
- postgresql源代码写的很清晰,易读性比mysql强太多了。
- postgresql通过postgis扩展支持地理空间数据。地理空间数据有专用的类型和功能,可直接在数据库级别使用,使开发人员更容易进行分析和编码。
- 可扩展型系统,有丰富可扩展组件,作为contribute发布。
- postgresql支持json和其他nosql功能,如本机xml支持和使用hstore的键值对。它还支持索引json数据以加快访问速度,特别是10版本jsonb更是强大。
- postgresql完全免费,而且是bsd协议,如果你把postgresql改一改,然后再拿去卖钱,也没有人管你,这一点很重要,这表明了postgresql数据库不会被其它公司控制。相反,mysql现在主要是被oracle公司控制。
mysql相对于pg的优势:
- innodb的基于回滚段实现的mvcc机制,相对pg新老数据一起存放的基于xid的mvcc机制,是占优的。新老数据一起存放,需要定时触 发vacuum,会带来多余的io和数据库对象加锁开销,引起数据库整体的并发能力下降。而且vacuum清理不及时,还可能会引发数据膨胀。
- mysql采用索引组织表,这种存储方式非常适合基于主键匹配的查询、删改操作,但是对表结构设计存在约束。
- mysql的优化器较简单,系统表、运算符、数据类型的实现都很精简,非常适合简单的查询操作。
- mysql相对于pg在国内的流行度更高,pg在国内显得就有些落寞了。
- mysql的存储引擎插件化机制,使得它的应用场景更加广泛,比如除了innodb适合事务处理场景外,myisam适合静态数据的查询场景。
总结:
总体上来说,开源数据库都不是很完善,商业数据库oracle在架构和功能方面都还是完善很多的。从应用场景来说,pg更加适合严格的企业应用场景(比如金融、电信、erp、crm),但不仅仅限制于此,postgresql的json,jsonb,hstore等数据格式,特别适用于一些大数据格式的分析;而mysql更加适合业务逻辑相对简单、数据可靠性要求较低的互联网场景(比如google、facebook、alibaba),当然现在mysql的在innodb引擎的大力发展,功能表现良好。
mysql和postgresql复杂的开源关系型数据库,本文只是作者根据自己经验写的对pg和mysql的理解,难免有不当之处,不当之处还请大家多多指正。
mysql在国内的发展已然很成熟,但是如果你转向postgresql,会发现不一样的天地,学院派的风格,丰富的功能,肯定会给你带来不一样的惊喜。