润普挂卷失败之老卷宗对接NP无法获取案件信息问题排查
润普挂卷失败之老卷宗对接NP无法获取案件信息问题排查
写在最前面
根因:NP的dzjzzzfw与老卷宗dzjz服务用的zookeeper不是同一个,且老卷宗指向的zookeeper没有任何一个匹配的dzjzzzfw。仅有消费者,没有任何生产者,导致老卷宗通过dubbo获取案件信息失败。
非以下情况本文基本不具有参考价值,可不继续观看
- 润普通过老卷宗挂卷,且堆栈错误明确指向获取案件信息空指针
- 老卷宗刷新卷宗失败,且堆栈错误明确指向获取案件信息空指针
- 非卷宗服务,但使用了zookeeper、dubbo组件,且堆栈错误明确指向获取服务提供者空指针
问题现象
现场反馈润普所有案件均挂卷失败,从润普提供的信息来看,润普调用多个案件多个接口,老卷宗均返回了:{“code”:201,“compressData”:false,“message”:“接口调用不成功,action【fileXXXAndDirectoryInfoSharedStorage】”,反复重试很多次结果都一样,已经持续几天了,客户着急了,卷宗的研发还在忙别的,正好我在现场,之前也有卷宗问题处理经验,我就先自己上手排查一下吧。
初步排查
根据之前的经验,按照润普提供的接口路径,在老卷宗代码里面找到了对应的接口,但接口中没有润普提供的错误信息,后来在接口的父类com.t.s.c.httpapi.AbstractHttpApi#execute中找到了对应代码
@Overridepublic ApiResult execute(String action, Map<String, String> headers,Map<String, Object> params) {if (action.indexOf('.') > 0) {action = action.substring(action.indexOf('.') + 1);}try {Method method = this.getClass().getDeclaredMethod(action,Map.class, Map.class);method.setAccessible(true);return (ApiResult) method.invoke(this, headers, params);} catch (Exception e) {logger.error(e.getMessage(), e);}return new ApiResult(ApiResultCodeConsts.API_NOT_FOUND这里是201,"接口调用不成功,action【" + action + "】");}
不过这里是通用的报错,并不能直接定位具体问题。还好这里有输出堆栈信息,根据代码路径,去logback.xml中找到对应logger,确认日志输出到了 KaTeX parse error: Expected group after '_' at position 29: …lassifiBusiness_̲{ip}_${port}.log 文件中。
<!-- 忽略不相关内容 --><appender name="rpClassifiBusiness" class="ch.qos.logback.core.rolling.RollingFileAppender"><File>${baseHome}/${appname}_rpClassifiBusiness_${ip}_${port}.log</File><encoder><pattern>%d{yyyy-MM-dd HH:mm:ss:SSS , GMT+8} [%-5level] [%-5thread] [%logger{20}:%line] - %msg%n</pattern><charset>UTF-8</charset></encoder><filter class="ch.qos.logback.classic.filter.ThresholdFilter"><level>info</level></filter><append>true</append><rollingPolicy class="ch.qos.logback.core.rolling.TimeBasedRollingPolicy"><fileNamePattern>${baseHome}/${appname}_rpClassifiBusiness_${ip}_${port}.%d{yyyy-MM-dd}.log.zip</fileNamePattern></rollingPolicy></appender><!-- 忽略不相关内容 --><logger name="com.thunisoft.fy.dzjz.httpapi.ZnfzbaxtHttpApi" level="info" additivity="false"><appender-ref ref="rpClassifiBusiness" /></logger>
跟现场要来了对应日志,并使用调用参数搜索,定位到获取案件信息空指针
2023-02-08 08:39:52:340 [INFO ] [qtp970538683-19221] [c.t.f.d.h.ZnfzbaxtHttpApi:2312] - 从np获取案件信息
2023-02-08 08:39:52:341 [ERROR] [qtp970538683-19221] [c.t.f.d.h.ZnfzbaxtHttpApi:53] - null
java.lang.reflect.InvocationTargetException: nullat sun.reflect.GeneratedMethodAccessor888.invoke(Unknown Source)at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)at java.lang.reflect.Method.invoke(Method.java:606)at com.thunisoft.summer.component.httpapi.AbstractHttpApi.execute(AbstractHttpApi.java:51)at com.thunisoft.fy.dzjz.httpapi.DzjzHttpApiServlet.doPost(DzjzHttpApiServlet.java:83)at javax.servlet.http.HttpServlet.service(HttpServlet.java:713)at javax.servlet.http.HttpServlet.service(HttpServlet.java:806)at org.eclipse.jetty.servlet.ServletHolder.handle(ServletHolder.java:652)... 去掉不相关内容at org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:608)at org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java:543)at java.lang.Thread.run(Thread.java:745)
Caused by: java.lang.NullPointerException: nullat com.thunisoft.fy.dzjz.httpapi.ZnfzbaxtHttpApi.getAjxx(ZnfzbaxtHttpApi.java:1637)at com.thunisoft.fy.dzjz.httpapi.ZnfzbaxtHttpApi.getSpAjxx(ZnfzbaxtHttpApi.java:2313)at com.thunisoft.fy.dzjz.httpapi.ZnfzbaxtHttpApi.fileClassificationInfoAndDirectoryInfoSharedStorage(ZnfzbaxtHttpApi.java:1879)... 58 common frames omitted
而对应业务代码长下面这样
private CaseInfoBean getAjxx(Long NAjlbs, Integer NFyDm, Integer NAjlb) {BaseInfoBean req = new BaseInfoBean();req.setNAjbs(NAjlbs);req.setNAjlb(NAjlb);req.setNFyid(NFyDm);if (ajxxDubboService == null) {ajxxDubboService = (IAjxxDubboService) ArteryUtil.getBean("ajxxDubboService");}CaseInfoBean ajxx = ajxxDubboService.getAjxx(req); // 这一行报错了。ajxxDubboService类型为com.thunisoft.dzjz.dubbo.ywxtProvider.IAjxxDubboServiceif (ajxx == null) {return null;}return ajxx;}
从上面代码来看,NPE的话,只可能是 ajxxDubboService 这个对象未实例化,而这个对象是使用一个dubbo组件注册到spring里面的,这个逻辑已经用了好多年了,结合以上情况分析,是老卷宗服务和审判系统之间的通道哪儿出问题了。
到这里根据经验,让现场检查dzjzzzfw是否正常,现场说NP研发已经检查过了,服务正常的。然后又想起来,之前好像谁说过老卷宗是有启动顺序要求的,没按照顺序启动可能会导致无法正常调用dzjzzzfw,但我TSTC、ADC、既往卷宗相关文档扒了一圈都没找到哪儿有这个说明,现场也不知道。还好来回换了好几个关键字,一页页扒,最终在TSTC中找到了徐海明明哥的一篇帖子电子卷宗启动方法及FAQ2.2版,里面描述了老卷宗的启动步骤,让现场按照帖子顺序验证,说好像好了,但润普下班了,需要明天验证。
- zookeeper
- …有些跟本文无关的省略了
- dzjzzzfw
- dzjz(老卷宗服务)
第二天一验证,凉凉,问题依旧,报错相同,这???船到桥头自然沉呀,不科学…
再次定位
第二天现场反馈问题依旧,客户又催了,得抓紧搞定了。
既然还不行,那就跟启动顺序没关系了,下一步干啥呢?网上看了下zookeeper、dubbo的一些使用教程,了解到zookeeper是一个服务注册中心,生产者和消费者都是跟注册中心交互,dubbo是一个分布式服务框架,卷宗使用dubbo框架的组件去跟注册中心交互,实现RPC调用。既然消费者初始化失败了,那么我们去注册中心里面看看生产者是否正常吧(在本文中dzjzzzfw就是生产者,dzjz就是消费者)。
记得之前搜过有个zkcli工具可以查看zookeeper服务情况,所以下载这个工具,解压到磁盘,结合网上的教程,连上注册中心,并使用zkcli的ls命令,观察服务情况
# 连接注册中心
E:\xxx\apache-zookeeper-3.8.1-bin\bin\zkCli.cmd -server 131.16.xx.xx:2181
# 查看根路径都有哪些节点
[zk:131.16.xx.xx:2181<CONNECTED> x]ls /
# 输出 [dubbo, zookeeper]
# zookeeper中基本没什么东西,着重看dubbo
[zk:131.16.xx.xx:2181<CONNECTED> x]ls /dubbo
# 这里输出一堆节点,[com.thunisoft.clfx.ajxx.provider.IAjDataDubboService, com.thunisoft.clfx.ajxx.provider.IAjSaveDubboService ... com.thunisoft.summer.component.approve.service.IProcessService]
# 然后查看报错代码类型定义的那个接口是否存在
[zk:131.16.xx.xx:2181<CONNECTED> x]ls /dubbo/com.thunisoft.dzjz.dubbo.ywxtProvider.IAjxxDubboService
# 输出 [configurators, consumers, providers, routers]
# 继续查看消费者
[zk:131.16.xx.xx:2181<CONNECTED> x]ls /dubbo/com.thunisoft.dzjz.dubbo.ywxtProvider.IAjxxDubboService/consumers
# 输出 [consumer%3A%2F%2F131.16.xx.xx%2F...] 代表已经有消费者注册进来了
# 查看生产者
[zk:131.16.xx.xx:2181<CONNECTED> x]ls /dubbo/com.thunisoft.dzjz.dubbo.ywxtProvider.IAjxxDubboService/providers
# 输出 [] 空,从这里分析,应该是生产者没成功注册到zookeeper中
用另一家正常的单位重新走了一遍以上zkCli命令,确认正常的单位中providers列表也是有数据的,所以更加明确,当前问题就是生产者没注册成功,那就看看两边zookeeper配置有没有不同。
要来dzjzzzfw和dzjz两个服务的远程,查看两个服务的配置,发现dzjz(/bin/StartTAS.sh的export ZOOKEEPER_URL参数)及dzjzzzfw(/webapp/WEB-INF/classes/props/config.properties的zookeeper.dzjz.address参数)的zookeeper用的不是同一个。
再次用zkCli连上dzjzzzfw指向的zookeeper,使用 ls /dubbo/com.thunisoft.dzjz.dubbo.ywxtProvider.IAjxxDubboService/providers命令确认列表不为空,让现场调整后重启验证,确认相关功能正常,功能恢复。
现场为啥这么配置,什么时候改的,不好追溯,不过好在问题最终解决了。整理到这里,后续有类似问题直接来复制代码检查,加快问题处理效率。不过还是希望以后不会遇到这个问题,不然搞了一半天,就是这么一个简单配置问题,还是有点儿浪费资源的。
参考资料
zkCli 下载:
https://dlcdn.apache.org/zookeeper/zookeeper-3.8.1/apache-zookeeper-3.8.1-bin.tar.gz
Zookeeper之zkCli.sh客户端的使用:https://blog.51cto.com/u_12564104/2896709
相关文章:
润普挂卷失败之老卷宗对接NP无法获取案件信息问题排查
润普挂卷失败之老卷宗对接NP无法获取案件信息问题排查 写在最前面 根因:NP的dzjzzzfw与老卷宗dzjz服务用的zookeeper不是同一个,且老卷宗指向的zookeeper没有任何一个匹配的dzjzzzfw。仅有消费者,没有任何生产者,导致老卷宗通过…...
产品经理面试题思考及回答思路(一)
求职产品助理/经理岗位,转行产品岗面试真题 关于产品经理岗位能力的思考: 什么是产品经理?为什么要当/选择做产品经理?怎么理解产品经理?如何理解产品经理的价值?产品日常工作有哪些?工作流程…...
Routability-Driven Macro Placement with Embedded CNN-Based Prediction Model
Routability-Driven Macro Placement with Embedded CNN-Based Prediction Model 2019 Design, Automation & Test in Europe Conference & Exhibition (DATE) DOI: 10.23919/DATE.2019.8715126 目录Abstract一、Introduction二、PROBLEM FORMULATION AND PRELIMINARIE…...
论一个上班族如何一次性通过PMP考试
PMP是我工作后考取的一个证书。从准备到通过,花了大约三个月的时间。我之前在某家互联网公司从事程序员的工作,工作一段时间后,天天敲着代码,改着bug,感觉比较迷茫,不知道未来的发展在哪里,都说…...
Web前端:使用Angular CLI时的最佳实践和专业技巧
在web开发业务中,构建高性能的应用程序是首要因素。此外,用开发人员最流行的语言开发一个健壮的网站将始终为构建高功能的网站提供适当的基础网站。相比之下,不可否认,Angular CLI是建立得最好且正在成长的框架之一。Angular CLI简…...
从0到1一步一步玩转openEuler--15 openEuler使用DNF管理软件包
文章目录15.1 搜索软件包15.2 列出软件包清单15.3 显示RPM包信息15.4 安装RPM包15.5 下载软件包15.6 删除软件包DNF是一款Linux软件包管理工具,用于管理RPM软件包。DNF可以查询软件包信息,从指定软件库获取软件包,自动处理依赖关系以安装或卸…...
【java】Spring Boot --spring boot项目整合xxl-job
文章目录1、源码下载地址2.文档地址3.源码结构4.初始化数据库脚本5.配置调度中心xxl-job-admin5.1 修改调度中心配置文件:/xxl-job/xxl-job-admin/src/main/resources/application.properties5.2 启动调度中心5.3 访问调度中心管理界面6.创建执行器项目6.3 载入配置…...
视图、索引、存储过程、触发器
视图、索引、存储过程、触发器 group by补充: 规范来说,分组查询中,select后的字段只能是group by的字段或者是聚合函数。mysql在这有一个小优化,分组后如果某个字段的所有记录相同,同样可以select。 视图 视图是虚拟…...
ImportError: cannot import name ‘FlattenObservation‘ from ‘gym.wrappers‘ 解决方案
问题描述 今天在运行openai给出的ppo2的baseline的时候遇到了以下bug: File "/root/code/baselines_openai/baselines/common/cmd_util.py", line 12, in <module> from gym.wrappers import FlattenObservation, FilterObservation ImportErr…...
大件传输的9种方法
不知道你有没有试过用电子邮件进行大文件传输,由于文件大小的限制,往往会发送失败。同时,一些文件共享服务对传输的文件有大小限制,使得你无法与朋友分享电影片段或向客户展示你的工作样本。还有一些要求你注册一个账户࿰…...
将vue2的项目《后台管理模式》转变为vue3版本 (一)
本篇主要讲了将v2项目转变为v3版本,以本人经验愿于各位分享 希望大家可以一起交流!!!! 文章目录一、app 出口位置二 、 index.js 路由配置三、package.json 文件四、 main.js 既然安装插件那就需要引入五、 跨域问题总…...
苹果手机怎么下载手机铃声?图文教程,快速学会
很多小伙伴喜欢使用苹果手机,可是苹果手机里的铃声自己并不是很喜欢听,想要下载一些好听的歌曲更换自己的手机铃声。苹果手机怎么下载手机铃声?别着急,今天小编以图文的方式,教教大家如何使用苹果手机下载手机铃声。 苹…...
AJAX笔记(二)Fetch和axios
1、Fetch 1.1、XMLHttpRequest的缺陷 1.2、fetch的get写法 1.3、fetch的post写法 1.4、fetch的put写法 1.5、fetch的patch写法 1.6、fetch的delete写法 2、axios 2.1、axios的介绍 2.2、axios的get写法 2.3、axios的post写法(图一json写法和图二三form写法&#x…...
TOTOLINK NR1800X 系列 CVE 分析
漏洞简介 TOTOLINK NR1800X最近报了一些cve,现主要对其命令注入进行具体分析,以及对其登录绕过进行分析。 固件下载地址:https://www.totolink.net/home/menu/detail/menu_listtpl/download/id/225/ids/36.html 环境搭建 固件提取 binwa…...
IDEA如何将代码进行上下左右移动,改变位置
鼠标光标定位快捷键 1.ctrl Home:定位到一页代码的行头 2.ctrl end :定位到一页代码的行末 3.home:定位到一行的行头 4.end:定位到一行的行末 有的小键盘可能没有home和end键,就需要自行修改IDEA中的快捷键或者使用键盘映射的方法修改。 将…...
【Java 面试合集】HashMap中为什么引入红黑树,而不是AVL树呢
HashMap中为什么引入红黑树,而不是AVL树呢1. 概述 开始学习这个知识点之前我们需要知道,在JDK1.8 以及之前,针对HashMap有什么不同。 JDK 1.7的时候,HashMap的底层实现是数组 链表JDK1.8的时候,HashMap的底层实现是数…...
深度学习Week15-common.py文件解读(YOLOv5)
目录 简介 一.基本组件 1.1autopad 1.2Conv 1.3 Focus 1.4Bottleneck 1.5BottleneckCSP 1.6 C3 1.7 SPP 1.8Concat 1.9Contract、Expand 二、重要类 2.1非极大值抑制(NMS) 2.2AutoShape 2.3 Detections 2.4 Classify 三、实验 …...
qemu的snapshot快照功能的详细使用介绍
快照功能还是蛮有趣的,就是资料比较少,这边万能菜道人特意整理了一下。参考内容:QEMU checkpoint(snapshot) 使用-pudn.comKVM&QEMU学习笔记(二)-蒲公英云 (dandelioncloud.cn)在线迁移存储 - 爱码网 (likecs.com)…...
谷歌关键词优化多少钱【2023年调研】
本文主要分享Google关键词排名优化的一些成本调研,方便大家参考。 本文由光算创作,有可能会被剽窃和修改,我们佛系对待这种行为吧。 今年2023年了,谷歌关键词优化到底要多少钱? 答案是:价格在2w~25w左右…...
凸包及其算法
概念 凸包:一个能够将所有给定点围住的最小周长封闭图形。 稳定凸包:在当前组成凸包的点集 V0V_0V0 中新增一个不在凸包上的点,形成新点集 V1V_1V1,若可以使 V1V_1V1 中所有点都在 V1V_1V1 的点的凸包上,则这…...
HY-MT1.5-1.8B优化技巧:如何提升翻译速度与内存效率
HY-MT1.5-1.8B优化技巧:如何提升翻译速度与内存效率 1. 引言 在移动设备和边缘计算场景下,机器翻译模型面临着内存受限和实时性要求的双重挑战。HY-MT1.5-1.8B作为一款专为轻量级部署设计的翻译模型,其18亿参数的紧凑架构已经展现出卓越的性…...
Context Rot:AI Agent 变蠢的真相,是上下文管理失控
很多团队在做 AI Agent 时都经历过类似的困惑:Agent 刚启动时表现还不错,跑了 20 步之后开始犯低级错误,到 50 步就像换了个模型——胡编乱造、忘记之前的决策、重复做已经做过的事。第一反应通常是:模型不够强,换个更…...
MiniCPM-V-2_6在Android应用开发中的实战:移动端AI集成指南
MiniCPM-V-2_6在Android应用开发中的实战:移动端AI集成指南 最近在捣鼓一个智能相册应用,想让它能自动识别照片里的内容,比如是猫是狗、是风景还是美食,然后智能分类。一开始想用云端的AI服务,但转念一想,…...
Qwen3-ASR-1.7B功能体验:实时录音识别与批量文件处理,实用功能全解析
Qwen3-ASR-1.7B功能体验:实时录音识别与批量文件处理,实用功能全解析 1. 引言:当语音识别真正变得“好用”时,会发生什么? 想象一下这个场景:你刚结束一场重要的客户会议,手机里录下了整整45分…...
浅谈项目运行时,jvm是如何工作的
最近研究了一下项目运行时,jvm是如何工作的,按照自己的理解画的图,一块复习一下有不对的地方,欢迎大家一块讨论...
OpenClaw+GLM-4.7-Flash自动化测试:3小时无人值守执行日志分析
OpenClawGLM-4.7-Flash自动化测试:3小时无人值守执行日志分析 1. 为什么选择这个技术组合 上个月团队新上线了一个分布式服务,每天产生近10GB的日志文件。最初我们尝试用传统脚本分析,但发现两个痛点:一是日志格式不统一&#x…...
OpenClaw+GLM-4-7-Flash科研助手:自动整理文献与生成综述
OpenClawGLM-4-7-Flash科研助手:自动整理文献与生成综述 1. 为什么需要自动化科研助手 作为一名经常需要阅读大量文献的研究者,我发现自己花费在文献整理上的时间越来越多。每次打开文件夹看到几十篇PDF文献时,那种"从哪里开始"的…...
效率翻倍:用快马平台将你的效率工具idea一键生成
最近工作总是被各种琐事打断,效率直线下降。作为一个经常需要同时处理多个项目的开发者,我特别需要一个能结合待办事项和番茄工作法的工具。传统的待办清单缺少时间管理,而单独的番茄钟应用又没法直观关联具体任务。于是决定自己动手开发一个…...
python-数字中药材资源共享平台vue
目录需求分析与架构设计前端实现(Vue 3 TypeScript)后端实现(Python)数据库设计开发与测试流程部署方案关键代码示例(FastAPI Vue)注意事项项目技术支持源码获取详细视频演示 :文章底部获取博…...
AI率过高必看!4大核心方法+5款实用工具,SpeedAI真滴强!
现在各大AI检测机制越来越严格,不管是高校学生写毕业论文、职场人做方案汇报,还是自媒体输出原创内容,“AI检测率超标”都成了最头疼的问题——轻的要反复返工修改,严重的甚至会影响学分认定、项目评审结果。今天给大家整理了一套…...
