数据库拆分(分库分布的几件小事(一)数据库如何拆分)
这篇文章给大家聊聊关于数据库拆分,以及分库分布的几件小事(一)数据库如何拆分对应的知识点,希望对各位有所帮助,不要忘了收藏本站哦。
关于ACCESS数据库,字段拆分
两种办法:
一种是在模块里把数据集整理出来,用VB语句来完成更新,这种办法消耗系统内存,但是可以操作复杂的字段,比如一个字段里有两个/的也有多个/的,都可以把他们分解开整理起来。
还有一种节约内存,那就是直接用内置函数解决,SQL语句这么写就好了:
Select Left(Condition,InStr(Condition,'/')-1) as汽车类型, Left(Right(Condition,Len(Condition)-InStr(Condition,'/')),InStr(Right(Condition,Len(Condition)-InStr(Condition,'/')),'/')-1) as系列, Right(Right(Condition,Len(Condition)-InStr(Condition,'/')),Len(Right(Condition,Len(Condition)-InStr(Condition,'/')))-InStr(Right(Condition,Len(Condition)-InStr(Condition,'/')),'/'))) as车名 From表;
如此复杂的SQL查询语句罕见吧,但是运行起来比第一种快,如果是SQL Server就直接写函数过程了,但ACCESS做不到,在ACCESS里用SQL语句你要先判断“/”在第几位:
Instr(Condtion,'/')
这意思是在字段中第一个“/”出现的位数,当你知道第一个“/”位数那就取他左边开始位数-1位字符就是“汽车类型字段”,后面的“/”是根本判断不了的,你要先把后面的字符拆分开再做同样的事情。所以后面的表达式就会那么长,其实不烦琐,这就是你所说的字段拆分
Right(Condition,Len(Condition)-InStr(Condition,'/'))就是第一个“/”后面的字符表达式。不知道你看懂没有。其实如果你不理解就用查询设计器,类似一个PetShop的界面,第一个字段输入:
车类型: Left(Condition,InStr(Condition,'/')-1)
第二个字段输入:
系列车名: Right(Condition,Len(Condition)-InStr(Condition,'/'))
保存为查询1,查询1里就是车类型和系列车名两个字段了。
查询1里继续做同样的事情,再把系列车名给拆分掉。这种没刚才直接写SQL语句快,因为他在查询两个查询,要计算存储过程。
数据库怎么拆分表
数据库拆分表可分为水平拆分和垂直拆分,水平拆分是按照表中逻辑关系和相关条件把表拆分成多个分表;垂直拆分是按照不同表切分到不同数据库中去。
随着数据的不断扩大,有的数据表的规模会以几何级增长,当数据达到一定规模时,数据的查询,读取性能就会变得缓慢,这时就需要拆分数据表,接下来在文章中将为大家详细介绍在数据库中怎么拆分表,希望对大家有所帮助。
【推荐课程:MySQL教程】
为什么需要拆分表
当一个表的数据量很大时就比较耗时,这就需要对表进行拆分,把大表拆分成多个子表,那么在更新或者查询数据的时候,压力会分散到不同的表上。由于分表之后每个表的数据较小,不管是查询还是更新都极大的提高了速度,即使出现最坏的“锁表”的情况,那其他表还是可以并行使用。
数据表的拆分
数据表拆分可以分为两种形式,分别是水平切分和垂直切分
水平切分:根据表中数据的逻辑关系,将同一个表中的数据按照某种条件拆分到多台数据库(主机)上面,这种切分称之为数据的水平(横向)切分。
垂直切分:按照不同的表来切分到不同的数据库(主机)之上,这种切可以称之为数据的垂直(纵向)切分
水平拆分的方法
一般情况下使用“取模”的形式来将数据进行表存储,如果用4张表就是id%4结果会是0,1,2,3四种,user_0,user_1,user_2,user_3就够了。需要注意的是在这个过程中需要新建一张临时表,目的在于提供数据插入的自增id,得到自增id后再通过取模进行分表插入
垂直拆分的方法
把常用的字段放一个表,不常用的放一个表
把字段比较大的比如text的字段拆出来放一个表里面
使用的话是根据具体业务来拆,查询时使用多表联查,可以再配合redis存储
分库分布的几件小事(一)数据库如何拆分
1.为什么要分库分表
①分库分表说白了,就是因为数据量太大了,如果你的单表数据量都到了千万级别,那么你的数据库就无法承受高并发的要求,数据库操作性能就会出现极大的下降。
②数据库并发量太大了,一般而言,一个数据库最多支撑并发到2000,这时候一定要进行扩容,不然性能会出现严重下降。而且一个健康的单库并发值你最好保持在每秒1000左右,不要太大。那么你可以将一个库的数据拆分到多个库中,访问的时候就访问一个库好了。
2.有哪些分库分布中间件
比较常见的中间件有cobar、TDDL、atlas、sharding-jdbc、mycat。
①cobar:阿里b2b团队开发和开源的,属于proxy层方案。已经好几年没有进行更新了,基本没啥人用。而且不支持读写分离、存储过程、跨库join和分页等操作。
②TDDL:淘宝团队开发的,属于client层方案,不支持join,但是支持读写分离。目前使用的也不多,因为还依赖淘宝的diamond配置管理系统。
③atlas:360开源的,属于proxy层方案,以前有一些公司在用,但是已经好几年没有更新了,所以现在用的也不多。
④sharding-jdbc:当当开源的,属于client层方案。SQL语法支持多,没有太多的限制,从2.0版本开始支持分库分表、读写分离、分布式id生成、柔性事务(最大努力送达型事务、TCC事务)。而且现在使用较多。
⑤myCat:基于cobar改造,属于proxy层方案,支持的功能完善,而且目前应该是非常火的而且不断流行的数据库中间件,社区很活跃,也有一些公司开始在用了。
3.分布式中间件类型
①proxy类型
proxy类型的中间件就是一个客户端,需要直接部署一个中间件,去进行分库分表。服务端将sql发送到中间件客户端去进行不同表库的操作。如果中间件客户端不可用将直接导致无法进行分库分表,而且要走网络耗时。
②client
client不需要单独部署中间件客户端,运维成本低,中间件就是一个jar包,直接在项目中导入、配置就可以完成分库分表,而且不需要代理层的二次转发,性能高点,但是遇到升级等操作需要重新发布版本,各个系统都需要耦合sharding-jbdc的依赖。
4.垂直拆分与水平拆分
①垂直拆分
垂直拆分的意思,就是把一个有很多字段的表给拆分成多个表,或者是多个库上去。每个库表的结构都不一样,每个库表都包含部分字段。一般来说,会将较少的访问频率很高的字段放到一个表里去,然后将较多的访问频率很低的字段放到另外一个表里去。因为数据库是有缓存的,你访问频率高的行字段越少,就可以在缓存里缓存更多的行,性能就越好。这个一般在表层面做的较多一些。
这个其实挺常见的,不一定我说,大家很多同学可能自己都做过,把一个大表拆开,订单表、订单支付表、订单商品表。
②水平拆分
水平拆分的意思,就是把一个表的数据给弄到多个库的多个表里去,但是每个库的表结构都一样,只不过每个库表放的数据是不同的,所有库表的数据加起来就是全部数据。水平拆分的意义,就是将数据均匀放更多的库里,然后用多个库来抗更高的并发,还有就是用多个库的存储容量来进行扩容。
③表的拆分
还有表层面的拆分,就是分表,将一个表变成N个表,就是让每个表的数据量控制在一定范围内,保证SQL的性能。否则单表数据量越大,SQL性能就越差。一般是200万行左右,不要太多,但是也得看具体你怎么操作,也可能是500万,或者是100万。你的SQL越复杂,就最好让单表行数越少。
一般来说,垂直拆分,你可以在表层面来做,对一些字段特别多的表做一下拆分;水平拆分,是并发承载不了,或者是数据量太大,容量承载不了,你给拆了,按什么字段来拆,你自己想好;分表,你考虑一下,你如果哪怕是拆到每个库里去,并发和容量都ok了,但是每个库的表还是太大了,那么你就分表,将这个表分开,保证每个表的数据量并不是很大。
5.两种分库分表方式
①range方式
就是每个库一段连续的数据,这个一般是按比如时间范围来的,但是这种一般较少用,因为很容易产生热点问题,大量的流量都打在最新的数据上了。
range来分,好处在于说,后面扩容的时候,就很容易,因为你只要预备好,给每个月都准备一个库就可以了,到了一个新的月份的时候,自然而然,就会写新的库了;缺点,但是大部分的请求,都是访问最新的数据。实际生产用range,要看场景,你的用户不是仅仅访问最新的数据,而是均匀的访问现在的数据以及历史的数据
②hash方式
按照某个字段hash一下均匀分散,这个较为常用。
hash分法,好处在于说,可以平均分配没给库的数据量和请求压力;坏处在于说扩容起来比较麻烦,会有一个数据迁移的这么一个过程
分库分布的几件小事(一)数据库如何拆分
标签:常用缓存分布式客户频率代理服务端支持表结构
文章分享结束,数据库拆分和分库分布的几件小事(一)数据库如何拆分的答案你都知道了吗?欢迎再次光临本站哦!