当前位置：首页 > news >正文

因果推断（五）基于谷歌框架Causal Impact的因果推断

news 2026/2/10 22:04:02

因果推断（五）基于谷歌框架Causal Impact的因果推断

除了传统的因果推断外，还有一些机器学习框架可以使用，本文介绍来自谷歌框架的Causal Impact。该方法基于合成控制法的原理，利用多个对照组数据来构建贝叶斯结构时间序列模型，并调整对照组和实验组之间的大小差异后构建综合时间序列基线，最终预测反事实结果。

CausalImpact适用于时间序列在干预后的效果评估，例如某功能上线后是否提升了用户活跃。本文参考自CausalImpact 贝叶斯结构时间序列模型、tfcausalimpact官网示例。

准备数据

# pip install tfcausalimpact

import tensorflow as tf
from causalimpact import CausalImpact
import pandas as pdtf.compat.v1.logging.set_verbosity(tf.compat.v1.logging.ERROR) # 忽略tf警告信息

以下数据如果有需要的同学可关注公众号HsuHeinrich，回复【因果推断05】自动获取～

# 读取数据
data = pd.read_csv('arma_data.csv')
data.iloc[70:, 0] += 5 # 手动增加y值。构造提升效果
data.head()

数据格式：

第一列为因变量，后面为协变量，例如本立中的y和X。
数据需要标准化处理，可参考官方示例

# causalimpact.misc.standardize标准化
import numpy as np
import pandas as pd
import pytest
import tensorflow as tf
import tensorflow_probability as tfp
from numpy.testing import assert_array_equal
from pandas.util.testing import assert_frame_equalfrom causalimpact import CausalImpact
from causalimpact.misc import standardizedata = pd.read_csv('tests/fixtures/btc.csv', parse_dates=True, index_col='Date')
training_start = "2020-12-01"
training_end = "2021-02-05"
treatment_start = "2021-02-08"
treatment_end = "2021-02-09"
pre_period = [training_start, training_end]
post_period = [treatment_start, treatment_end]pre_data = rand_data.loc[pre_int_period[0]: pre_int_period[1], :]
# 标准化
normed_pre_data, (mu, sig) = standardize(pre_data)

# 自定义标准化 x-mu/sigma
normed_my_data = (pre_data - mu) / sig # 伪代码
# 定义model_args参数
model_args == {'fit_method': 'hmc', 'niter': 1000, 'prior_level_sd': 0.01,  'season_duration': 1, 'nseasons': 1, 'standardize': True}

	y	X
0	118.188694	99.795292
1	120.233276	100.663180
2	118.627775	98.883699
3	119.609722	100.448941
4	121.391508	101.561734

模型拟合

# 分析报告
pre_period = [0, 69] # 干预前时期
post_period = [70, 99] # 干预后时期ci = CausalImpact(data, pre_period, post_period)
print(ci.summary())
ci.plot()

Posterior Inference {Causal Impact}Average            Cumulative
Actual                    125.23             3756.86
Prediction (s.d.)         120.23 (0.33)      3606.76 (9.97)
95% CI                    [119.58, 120.89]   [3587.5, 3626.57]Absolute effect (s.d.)    5.0 (0.33)         150.11 (9.97)
95% CI                    [4.34, 5.65]       [130.3, 169.36]Relative effect (s.d.)    4.16% (0.28%)      4.16% (0.28%)
95% CI                    [3.61%, 4.7%]      [3.61%, 4.7%]Posterior tail-area probability p: 0.0
Posterior prob. of a causal effect: 100.0%For more details run the command: print(impact.summary('report'))

output_54_1

Causal Impact报告
实验最终的平均预测值（prediction）为120.34，平均实际值（actual）为125.23；而累计预测值3610.16，累计实际值3756.86；这里的平均数据范围就是上述虚线之后（干预后）的时间段
经过MCMC估计指标绝对效应（absolute effect）平均增长4.89，累计增长146.71；相对比率（relative effect）平均增长4.06%，累计增长4.06%

Causal Impact图
第一张图（original）黑色实线为干预前后的实际结果，橙色虚线为模拟的策略未上线时的结果。阴影为置信区间
第二张图（pointwise）橙色虚线为策略前后y的差值，可以看到策略上线后，y差值是显著为正的。
第三张图（cumulative）橙色虚线为策略上线后的累加值，是持续增大的，可见策略有明显的正向作用。

# 打印详细报告
print(ci.summary(output='report'))

也可以用时间序列+多元变量
数据格式：
- 第一列为因变量，后面为协变量，例如本立中的CHANGED和[NOT_CHANGED_1、NOT_CHANGED_2、NOT_CHANGED_3]
- 数据需要标准化处理，同上

# 读取数据
data = pd.read_csv('comparison_data.csv', index_col=['DATE'])
data.head()

	CHANGED	NOT_CHANGED_1	NOT_CHANGED_2	NOT_CHANGED_3
DATE
2019-04-16	83836.5	85642.5	86137.5	81241.5
2019-04-17	83887.5	86326.5	85036.5	80877.0
2019-04-18	82662.0	87456.0	84409.5	80910.0
2019-04-19	83271.0	89551.5	87568.5	82150.5
2019-04-20	84210.0	90256.5	86602.5	83083.5

pre_period = ['2019-04-16', '2019-07-14']
post_period = ['2019-7-15', '2019-08-01']ci = CausalImpact(data, pre_period, post_period, model_args={'fit_method': 'hmc'}) # model_args参数提高精度，牺牲效率
print(ci.summary())
ci.plot()

# 打印详细报告
print(ci.summary(output='report'))

总结

这里的分享较为浅显，就当是一种冷门数据分析方法的科普吧，如果想深入了解的同学可自行查找资源进行充电～

共勉～

因果推断（五）基于谷歌框架Causal Impact的因果推断

因果推断（五）基于谷歌框架Causal Impact的因果推断除了传统的因果推断外，还有一些机器学习框架可以使用，本文介绍来自谷歌框架的Causal Impact。该方法基于合成控制法的原理，利用多个对照组数据来构建贝叶斯结构时间…...

编程日记 2023/8/22 11:44:41

VR全景加盟项目如何开展？如何共赢VR时代红利？

VR全景作为一个新兴蓝海项目，相信有着很多人刚接触VR行业的时候都会有这样的疑问：VR全景加盟后项目如何开展？今天，我们就从项目运营的三个阶段为大家讲解。一、了解项目时目前VR全景已经被应用到各行各业中去，学校、…...

编程日记 2023/8/22 11:43:38

Win10+anaconda+CUDA+pytorch+vscode配置

Win10anacondaCUDApytorchvscode配置 1.安装anaconda2.安装CUDA确认CUDA版本确认CUDA和pytorch版本安装CUDA 3.安装cudnn4.安装Pytorch5.vscode配置安装VScodevscode配置pytorch环境 1.安装anaconda 官网https://www.anaconda.com 下载安装，路径全英文然后记得有一…...

编程日记 2023/8/22 11:42:37

vue-router在vue2/3区别

构建选项区别 vue2-router const router-new VueRouter({mode:history,base:_name,})vue-next-router import { createRouter,createWebHistory} from vue-next-router const routercreateRouter({history:createHistory(/) })在上述代码中我们发现,vue2中的构建选项mode和ba…...

编程日记 2023/8/22 11:41:36

Apache Doris 入门教程33：统计信息

统计信息统计信息简介 Doris 查询优化器使用统计信息来确定查询最有效的执行计划。Doris 维护的统计信息包括表级别的统计信息和列级别的统计信息。表统计信息： 信息描述row_count表的行数data_size表的⼤⼩（单位 byte）update_rows收…...

编程日记 2023/8/22 11:40:35

有效需求的特征

如何区分优秀的软件需求和软件需求规格说明书（SRS）与可能导致问题的需求和规格说明书？在这篇文章中，我们将首先讨论单个需求应该具有的几种不同特性。然后，我们将讨论成功的SRS整体应具有的理想特征。 1.有效需求的特…...

编程日记 2023/8/22 11:39:33

基于51单片机无线温度报警控制器 NRF24L01 多路温度报警系统设计

一、系统方案 1、本设计默认采用STC89C52单片机，如需更换单片机请联系客服。 2、接收板LCD1602液晶实时显示当前检测的2点温度值以及对应的上下限报警值。发射板由DS18B20采集温度值，通过无线模块NRF24L01传给接收板。 3、按键可以设置温度上下限值&…...

编程日记 2023/8/22 11:38:32

Spring Data JPA的@Entity注解

一、示例说明 rules\CouponTypeConverter.java Converter public class CouponTypeConverterimplements AttributeConverter<CouponType, String> {Overridepublic String convertToDatabaseColumn(CouponType couponCategory) {return couponCategory.getCode();}Overr…...

编程日记 2023/8/22 11:37:30

CANoe panel中，Path Dialog如何保存选择的文件路径

这里写目录标题 Path Dialog控件的设置系统变量和环境变量 Path Dialog控件的设置过滤加载的文件类型填写格式为：Hex file |.hex 其中Hex file为自定义name，.hex为你想识别的文件类型系统变量和环境变量系统变量：在canoe的Environmen…...

编程日记 2023/8/22 11:36:29

关于es中索引，倒排索引的理解

下面是我查询进行理解的东西也就是说我们ES中的索引就相当于我们mysql中的数据库表，索引库就相当于我们的数据库，我们按照mapping规则会根据相应的字段（index为true默认）来创建倒排索引，这个倒排索引就相当于我们索引…...

编程日记 2023/8/22 11:35:26

k8s service (二)

K8s service (二) Endpoint Endpoint是kubernetes中的一个资源对象，存储在etcd中，用来记录一个service对应的所有pod访问地址，它是根据service匹配文件中selector描述产生的。一个Service由一组Pod组成，这些Pod通过Endpoints…...

编程日记 2023/8/22 11:34:25

桌面软件开发框架 Electron、Qt、WPF 和 WinForms 怎么选？

一、Electron Electron 是一个基于 Web 技术的跨平台桌面应用程序开发框架。它使用 HTML、CSS 和 JavaScript 来构建应用程序界面，并借助 Chromium 渲染引擎提供强大的页面渲染能力。Electron 的主要特点包括：跨平台：Electron 可以在 Windows、macOS 和 Linux 等多个主流操…...

编程日记 2023/8/22 11:33:24

SSM框架的学习与应用(Spring + Spring MVC + MyBatis)-Java EE企业级应用开发学习记录（第二天）Mybatis的深入学习

SSM框架的学习与应用(Spring Spring MVC MyBatis)-Java EE企业级应用开发学习记录（第二天）Mybatis的深入学习（增删改查的操作） 上一篇我们的项目搭建好了，也写了简答的Junit测试类进行测试，可以正确映射…...

编程日记 2023/8/22 11:32:23

学习笔记：Opencv实现限制对比度得自适应直方图均衡CLAHE

2023.8.19 为了完成深度学习的进阶，得学习学习传统算法拓展知识面，记录自己的学习心得 CLAHE百科： 一种限制对比度自适应直方图均衡化方法，采用了限制直方图分布的方法和加速的插值方法 clahe（限制对比度自适应直方图…...

编程日记 2023/8/22 11:31:22

R语言处理缺失数据（1）-mice

#清空 rm(listls()) gc()###生成模拟数据### #生成100个随机数 library(magrittr) set.seed(1) asd<-rnorm(100, mean 60, sd 10) %>% round #平均60，标准差10 #将10个数随机替换为NA NA_positions <- sample(1:100, 10) asd[NA_positions] <- NA #转…...

编程日记 2023/8/22 11:30:20

SpringBoot自动配置原理

Spring Boot 的自动配置可以根据添加的jar依赖，自动配置 Spring Boot 应用程序。例如，我们想要使用Redis，直接在POM文件中增加spring-boot-starter-data-redis依赖，然后我们配置下连接信息就可以使用了。那么Spring Boot 是如何…...

编程日记 2023/8/22 11:29:19

HarmonyOS学习路之方舟开发框架—学习ArkTS语言（状态管理五）

管理应用拥有的状态概述 LocalStorage：页面级UI状态存储 LocalStorage是页面级的UI状态存储，通过Entry装饰器接收的参数可以在页面内共享同一个LocalStorage实例。LocalStorage也可以在UIAbility内，页面间共享状态。本文仅介绍LocalStora…...

编程日记 2023/8/22 11:28:17

Java基础篇——反射枚举

反射&枚举课程目标 1. 【理解】类加载器 2. 【理解】什么是反射 3. 【掌握】获取Class对象的三种方式 4. 【掌握】反射获取构造方法并创建对象 5. 【掌握】反射获取成员变量并使用 6. 【掌握】反射获取成员方法并使用 7. 【掌握】反射综合案例 8. 【理解】枚举B友：http…...

编程日记 2023/8/22 11:27:16

每日一学——案例难点Windows配置

在Windows上配置DNS服务器有几个步骤： 步骤1：打开网络连接设置在任务栏上右键单击网络图标，并选择“打开网络和Internet设置”。在新窗口中，选择“更改适配器选项”。在打开的窗口中，找到正在使用的网络适配器&a…...

编程日记 2023/8/22 11:26:15

2023.8 - java - 运算符

Java 运算符算术运算符关系运算符位运算符逻辑运算符赋值运算符其他运算符算术运算符算术运算符用在数学表达式中，它们的作用和在数学中的作用一样。下表列出了所有的算术运算符。表格中的实例假设整数变量A的值为10，变量B的值为20： …...

编程日记 2023/8/22 11:25:13

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...

编程新知 2026/2/7 23:18:39

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞！！！ 抽象现代智能交通系统 （ITS） 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 （…...

编程新知 2026/2/8 5:22:04

设计模式和设计原则回顾

设计模式和设计原则回顾 23种设计模式是设计原则的完美体现，设计原则设计原则是设计模式的理论基石，设计模式在经典的设计模式分类中（如《设计模式：可复用面向对象软件的基础》一书中），总共有23种设计模式，分为三大类：一、创建型模式（5种） 1. 单例模式（Sing…...

编程新知 2025/12/14 20:57:41

C++_核心编程_多态案例二-制作饮品

#include <iostream> #include <string> using namespace std;/*制作饮品的大致流程为：煮水 - 冲泡 - 倒入杯中 - 加入辅料利用多态技术实现本案例，提供抽象制作饮品基类，提供子类制作咖啡和茶叶*//*基类*/ class AbstractDr…...

编程新知 2026/2/8 20:42:55

中南大学无人机智能体的全面评估！BEDI：用于评估无人机上具身智能体的综合性基准测试

作者：Mingning Guo, Mengwei Wu, Jiarun He, Shaoxian Li, Haifeng Li, Chao Tao单位：中南大学地球科学与信息物理学院论文标题：BEDI: A Comprehensive Benchmark for Evaluating Embodied Agents on UAVs论文链接：https://arxiv.…...

编程新知 2026/1/22 15:36:10

Linux相关概念和易错知识点（42）（TCP的连接管理、可靠性、面临复杂网络的处理）

目录 1.TCP的连接管理机制（1）三次握手①握手过程②对握手过程的理解 （2）四次挥手（3）握手和挥手的触发（4）状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...

编程新知 2026/1/30 0:09:51

python爬虫：Newspaper3k 的详细使用（好用的新闻网站文章抓取和解析的Python库）

更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录一、Newspaper3k 概述1.1 Newspaper3k 介绍1.2 主要功能1.3 典型应用场景1.4 安装二、基本用法2.2 提取单篇文章的内容2.2 处理多篇文档三、高级选项3.1 自定义配置3.2 分析文章情感四、实战案例4.1 构建新闻摘要聚合器…...

编程新知 2025/10/25 7:51:48

用docker来安装部署freeswitch记录

今天刚才测试一个callcenter的项目，所以尝试安装freeswitch 1、使用轩辕镜像 - 中国开发者首选的专业 Docker 镜像加速服务平台编辑下面/etc/docker/daemon.json文件为 {"registry-mirrors": ["https://docker.xuanyuan.me"] }同时可以进入轩…...

编程新知 2026/2/1 3:20:44

全志A40i android7.1 调试信息打印串口由uart0改为uart3

一，概述 1. 目的将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本：2014.07； Kernel版本：Linux-3.10； 二，Uboot 1. sys_config.fex改动使能uart3(TX:PH00 RX:PH01)，并让boo…...

编程新知 2026/2/5 6:28:09

蓝桥杯3498 01串的熵

问题描述对于一个长度为 23333333的 01 串, 如果其信息熵为 11625907.5798， 且 0 出现次数比 1 少, 那么这个 01 串中 0 出现了多少次? #include<iostream> #include<cmath> using namespace std;int n 23333333;int main() {//枚举 0 出现的次数//因…...

编程新知 2026/2/6 2:05:50

因果推断（五）基于谷歌框架Causal Impact的因果推断

准备数据

模型拟合

总结

相关文章：