分布式、服务化的ERP系统架构设计

分布式、服务化的ERP系统架构设计
曾几何时我混迹于电商、珠宝行业4年多为这两个行业开发过两套大型业务系统ERP。作为一个ERP系统系统主要功能模块无非是订单管理、商品管理、生产采购、仓库管理、物流管理、财务管理等等。作为一个管理系统大家的一般开发习惯就是使用.Net或Java技术建立一个单块单进程架构的应用只有一个SQLServer或MySql数据库。然后在项目文件中分一下各个模块三层结构方式组织代码编写开发。最后测试交付上线。起初因为数据量不大系统性能还不错各种列表查询报表查询Excel数据导出功能等用的都很流畅。但是随着公司业务发展订单量日积月累后期各种业务部门的报表查询、数据导出需求不断增多我们渐渐就感觉系统运行越来越慢。于是我们可能最先想到的解决方案就是优化系统瓶颈数据库这个大头。我们可能的一种尝试就是将数据库单独放置到一个服务器实现数据库和应用程序分离或者是建立各种数据库表索引优化程序代码等方法。经过这样一番研究优化系统某些功能可能性能的确大大提高但是我们还是发现某些功能列表的数据查询导出依然很慢或者随着数据量继续积累原来较快的列表导出功能也愈来愈变得缓慢了。我们用尽各种办法最后也达不到理想的系统性能速度。为了提高系统性能我们也许会主动学习一些互联网公司的技术经验什么高并发、高性能、大数据、读写分离等方案发现自己根本无从下手。我们会觉得因为系统业务特点不一样。ERP系统并发量不高主要是业务复杂各种业务耦合度远高于那些互联网应用不好做拆分数据查询逻辑要远比互联网系统复杂一个列表页查询出来的数据往往需要关联4、5张表才能得到结果。有些报表类的甚至更多。加上各种业务操作事务性、数据一致性要求很高很多时候导致我们措不及手无法进一步优化系统。曾几何时我也被这样或那样的理由所挫败认为ERP系统非常特殊无药可救可是后来。。。我现在已经不这么认为了似乎有了新的解决方案O(∩_∩)O哈哈~曙光乍现在叙述具体方案前先说下自己的想法。我首先觉得我们做ERP系统前就得有当今互联网思维。我们不要再去做一个大一统的系统了。我们要分拆一个大系统做成一个个小系统。然后通过系统接口让这些小系统相互通信。这样来组成一个大系统具体来说就是“分布式”、“服务化”的互联网思维。让系统在架构设计上就是一个先天支持高度可扩展的系统。怎么做呢具体来说就是要将订单管理、商品管理、生产采购、仓库管理、物流管理、财务管理拆分成一个个子系统。这些子系统可以单独设计开发对外暴露出各种其他子系统需求的数据接口即可。每个子系统都有单独的数据库。甚至这些子系统可以交由不同的团队去开发和维护使用不同的技术体系使用不同的数据库。而不是再像以前那样都集成在同一个大而全的系统中一个大而全的数据库。对于新架构的系统他有什么优点呢首先也是最重要的就是解决系统的性能问题。以往数据库实例只有一个没法扩展出多个实例以便在性能受限的情况下依靠增加数据库实例来达到负载均衡。也许有人会说可以使用读写分离方案但是因为ERP系统的特点这个方案很多时候不现实。比如说操作库存的时候你不能从读库里读库存然后在写库里写入库存。因为主从复制会有时效性写入的库存并不能马上写入从库。这样的场景在ERP中也有多处。何况写库不能扩展只能有一个。而新设计方案是写库是分离的每个子系统有自己的数据库。其次就是更新非常方便各个子系统以后台微服务的方式存在。前台一个单独的web项目这个web项目调用后台这些子系统的服务接口。这样的设计在某个业务子系统需要更新的时候可以单独更新。不用像以前那种单进程架构时一个小更新需要整个系统重启导致用户会话也丢失用户需要新登录。而现在的这种设计就不会有这个问题。系统整体设计系统物理部署视图详细设计拆分应用层拆分应用层是践行“微服务”架构的理念。将原来大而全的单进程架构按照业务模块拆分成可独立部署的应用程序以此来达到平滑系统更新、升级、方便负载扩展的目的。具体来说技术上可以使用restfull风格的接口也可以使用像java中dubbo框架方式来简化开发复杂度。ERPWeb端或其他移动端也是一个单独的应用充当表现层。非常薄只是简单的接受参数调取后台其他各种微服务程序的接口获取所需展示的数据。微服务充当业务逻辑层每个微服务都是可独立部署上线的程序对外提供数据访问接口。微服务可以使用流行的各种RPC框架比如dubbo可以支持多种调用协议Http、TCP等这些框架使得编码比较容易框架封装底层数据通信细节使得客户端执行远程方法如同执行本地方法一样简单。dubbo微服务架构还支持服务治理负载均衡等功能。这样不仅可以提高系统的可用性还能动态提升系统应用层的性能。比如仓库管理中入库业务非常繁忙占用非常多的CPU和内存资源我们可以另外加一台机器单独再部署一个仓库管理服务上去。这样使得整个系统有两个仓库管理服务在同时工作平衡负载。而这一切都是在服务注册中心比如Zookeeper下自动完成的。微服务结构天生很好的支持系统更新升级操作。比如财务模块有个新需求需要上线我们只需要替换财务模块的服务重启即可。这对已经登录系统的用户来说没有多少影响不用重新登陆系统其他模块服务使用也不受影响。拆分数据层数据库瓶颈是ERP系统的永久之伤。大量复杂的数据查询表连接逻辑充斥着整个系统。数据库垂直拆分成功的关键就是如何重新设计系统数据层各个模块相互耦合的问题。能解决这个问题永久之伤便可以解决了。我们先来看一个典型数据层模块耦合问题。需求是展示物料库存列表字段物料编号、物料名称、品类、仓库、数量物料表物料ID名称品类IDZ0001Iphone6红色手机壳ZZ0002iPhone6黑色手机壳Z库存表物料ID仓库ID数量Z0001W110Z0002W120品类和仓库表省略。。。很显然传统一个数据库中我们只需要简单的join操作即可关联这两张表外加关联品类和仓库表即可查询出我们所要的数据。但是现在我们的架构中物料表和商品表不在同一个数据库实例中我们不能使用join操作了那我们该怎么实现需求呢新的架构只允许我们通过对方的服务接口来获取数据不能直接关联对方服务的私有数据库。至少从架构上服务化角度来说不能直接访问对方服务的数据库。这种情况下假设web模块子系统调用仓库子系统来获取数据则我们需要在仓库模块中创建一个service方法来装配这些数据。然后返回给web子系统。如下图所示仓库管理方法首先获取本地库存表的物料编码、和仓库表的仓库名称字段信息并且分页完后最终准备返回20条数据到Web模块前将这20条数据中的物料ID作为参数请求商品模块子系统商品子系统返回这20个物料ID相关的商品信息给到仓库管理模块然后仓库管理模块重新组装上列表所需的物料名称和品类两个字段数据实现最终要返回给Web子系统的数据。也许你会说这太麻烦了这种方法的性能肯定没有直接join来的高解决不了性能问题。咋看起来好像是这么回事但是仔细考虑看看在系统并发量低、数据量小、业务不算繁忙的环境下的确性能还不如传统一个数据中join方式来的快速。但我们想想以后吧我们现在的架构设计是将一个数据库拆成多个数据库每个数据库可以运行在单独的服务器上去这样以后就能负载数据库的压力了。整体来说这样才能不会让数据库成为未来业务繁忙时候的性能瓶颈了。想想都觉得让人兴奋不已是不是这时候有人又会问那以后系统数据量、业务更大了连你这个拆分成几个数据库还不够用怎么办呢我的方法是可以基于拆分的数据库单独每个库可以做读写分离、使用缓存等。甚至可以继续拆分下去将子系统再次拆分成多个孙子系统。视业务模块繁忙程度而定。报表系统有人又会问有些列表查询逻辑非常复杂关联十多张表如果按上述方法拆分数据那简直是灾难啊是的你说的没有错。这种情况下我的方案是将这种更加复杂的报表级别的数据查询展示需求可以单独做个报表系统。报表数据库设计采用数据仓库方式。为了更高的读取性能我们可以将数据库表设计成很多冗余字段方式也就是反范式设计以及建立非常多的组合索引。这种系统成功的关键就是数据和主ERP系统业务库的同步问题了。一般可以写一个定时同步程序将ERP主业务系统的数据经过帅选、转化等方式直接生成报表视图所需的最终或中间数据简化关联查询。报表系统也可以采用微服务架构设计。如下图所示如果报表所需的数据要求实时的我们可以让ERP系统业务操作时触发同步数据的请求实时同步至报表库。分布式事务也许有人又又问了ERP系统很多操作都要求事务性你拆分系统后怎么实现事务性保障数据一致性呢这个问题很好也是我决定写这篇文章前思考的最后一个问题。在微服务架构中实现夸服务的事务并不容易至少不像本地应用使用本地数据库事务那样方便性能高效数据一致性好。也许你听过分布式事务这个概念。有两种情景一种是一个应用中使用多个数据库为保障数据一致性需要使用分布式事务。还有一种情况就是针对我们这个架构而言的。微服务环境下的分布式事务具体来说打个比方。采购入库这个操作设计在仓库管理服务中。入库后需要更新采购子系统中的采购单中的入库数量。这个过程要求数据一致性也就是采购单入库成功后写入了库存表中的数量同时要更新采购单表中的入库数量。我们不能直接在仓库服务中去访问采购服务中的数据库必须通过采购服务提供的服务接口才行。如果这样我们怎么能保证数据一致性呢因为很有可能库存表写入成功但调取采购服务写入采购单数据时失败了。可能是网络问题原因导致的这样数据就不一致了。在分布式事务技术中有实现最终一致性这么一说意思就是只要我能保证两边数据最终实现了一致性就行不一定要使用事务。这样说来就有方案了。如仓库子系统在处理采购入库时需要增加入库单数据和更新库存数据等多个表。这多个表都在仓库子系统中我们可以使用一个本地事务来保证仓库子系统中的表数据一致性。然后调用采购子系统更新采购单里的入库数量。为了防止这个过程突然中断导致调用失败我们考虑增加一个消息队列中间件如ActiveMQ。如果接口返回失败我们就往MQ里写入这个处理请求等到采购子系统恢复正常后MQ通知采购子系统处理这个更新操作。由于消息消费掉以后不会再有通知了采购子系统处理过程中发生异常导致更新失败需要将问题写入本地的日志库以便通知管理员做后续补偿处理。就这样通过各种办法来达到数据的最终一致性即可。虽然听上去有点坑但这就是解决方案。没有其他更好的了。或者更新失败后重新调用仓库子系统回滚入库单和库存数据达到最终一致性如图所示非常有幸能和大家一起分享知识和经验正是由于大家的无私分享才让我们得以成长和进步我最近几年来都很少分享东西有时候是因为工作很忙没有时间写点东西有时候也是因为自己懒或是没有什么新东西可以分享给大家的。最后也希望大家对我的分享不足之处给予批评指正一起进步