当前位置：首页 > news >正文

R语言生存分析（机器学习）（1）——GBM（梯度提升机）

news 2025/11/15 8:45:52

GBM是一种集成学习算法，它结合了多个弱学习器（通常是决策树）来构建一个强大的预测模型。GBM使用“Boosting”的技术来训练弱学习器，这种技术是一个迭代的过程，每一轮都会关注之前轮次中预测效果较差的样本，以便更专注地对它们进行建模。这有助于逐步减少整体预测误差。

#1 清空
rm(list = ls())
gc()
#2 导入包
library("survival")
library("gbm")
help(package="gbm")
#3 拆分训练集和测试集
data<-lung
set.seed(123)
train <- sample(1:nrow(data), round(nrow(data) * 0.70))
train <- data[train, ]
test <- data[-train, ]
#4 建立模型
set.seed(123)
gbm_model <- gbm(Surv(time, status) ~ .,#建模distribution = "coxph",#分布data = train,#数据n.trees = 5000,#树数量shrinkage = 0.1,#学习率或步长减少interaction.depth = 5,#每棵树的最大深度n.minobsinnode = 10,#最小观测次数在树的终末节点cv.folds = 10#交叉验证次数
)
plot(gbm_model)#通过“积分”其他变量，绘制所选变量的边际效应。
summary(gbm_model)#绘图，从高到低显示因素的相对重要性

#5 预测
best.iter <- gbm.perf(gbm_model, plot.it = TRUE, method = "cv")
pred_train <- predict(gbm_model, train, n.trees = best.iter)
pred_test <- predict(gbm_model, test, n.trees = best.iter)
#6 模型评价
#计算ROC
library(survivalROC)
roc_area <- survivalROC(Stime=train$time,status=train$status,marker =pred_train,predict.time=100,method="KM")
# 计算C-index
Hmisc::rcorr.cens(-pred_train, Surv(train$time, train$status))
Hmisc::rcorr.cens(-pred_test, Surv(test$time, test$status))
#7 计算生存概率
# 计算累积
CH<- basehaz.gbm(train$time, train$status, pred_train, t.eval = 300, cumulative = TRUE)
exp(-exp(pred_test)*CH)

R语言生存分析（机器学习）（1）——GBM（梯度提升机）

GBM是一种集成学习算法，它结合了多个弱学习器（通常是决策树）来构建一个强大的预测模型。GBM使用“Boosting”的技术来训练弱学习器，这种技术是一个迭代的过程，每一轮都会关注之前轮次中预测效果较差的样本，…...

编程日记 2023/8/15 7:05:18

k8s和docker简单介绍

当涉及到容器技术和容器编排时，Docker和Kubernetes是两个重要的概念。我将更详细地介绍它们以及它们之间的关系。 Docker： Docker是一种容器化技术，它允许你将应用程序及其依赖项打包到一个称为"容器"的封闭环境中。每个容器都包…...

编程日记 2023/8/15 7:04:17

Lua学习记录

Lua基础了解 Lua的注释通过 (-- 单行注释，--[[ ]] 多行注释)可以不加； 多个变量赋值，按顺序赋值，没有则为nil； function的简单用法，多个返回值配合多重赋值，以end为结束标志 Lua下标从1开始&…...

编程日记 2023/8/15 7:03:15

三分钟完美解决你的C盘内存过大爆红

一、清理回收站二、清理桌面建议一不要在桌面放太多图标或者文件会占用过多的内存,可以放到其他盘建议二、将位置移动到别的盘三、手动删除下载文件与缓存文件日常使用中会通过Windows下载各种文件资料到电脑中，它默认也是直接下载在C盘中的。如果我们在以…...

编程日记 2023/8/15 7:02:14

C++ - equal(比较两个vector元素)

C标准库的std::equal函数。这个函数用于比较两个范围的元素是否相等。在使用std::equal函数时，您需要提供两个范围的迭代器，以及一个可选的谓词函数（predicate）。函数会比较第一个范围内的元素和第二个范围内的元素是否相等。如果…...

编程日记 2023/8/15 7:01:13

多线程：线程池

线程池提前创建多个线程放入线程池中，使用时直接获取，使用完直接放入池中；可以避免频繁创建销毁，实现重复利用，类似生活中的公共交通工具。好处：提高相应速度；降低资源消耗；便于线…...

编程日记 2023/8/15 7:00:12

9.3.2.2网络原理(传输层TCP)

TCP全部细节参考RFC标准文档一.TCP特点: 有连接,可靠传输,面向字节流,全双工. 二.TCP数据报: 1.端口号是传输层的重要概念. 2.TCP的报头是变长的(UDP是固定的8字节),大小存在4位首部长度中,用4个bit位(0~15)表示长度单位是4字节.(TCP报头最大长度是60字节,前面20字节是固定…...

编程日记 2023/8/15 6:59:10

ssm+mybatis无法给带有下划线属性赋值问题

原因：mybaitis根据配置，将有下划线的字段名改为了驼峰格式。具体见：ssmmybatis无法给带有下划线属性赋值问题，无法获取数据库带下划线的字段值 - 开发者博客解决方式： 直接将实体类中的下划线去掉返回值使用resul…...

编程日记 2023/8/15 6:58:09

SpringBoot Actuator 1 引入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-actuator</artifactId> </dependency>2 开启配置 # 暴露所有的监控点【含Prometheus】 management.endpoin…...

编程日记 2023/8/15 6:57:07

使用css实现时间线布局（TimeLine）

前言在使用uni-app开发微信小程序过程中，遇到了时间轴布局，由于每项的内容高度不一致，使用uniapp自带的扩展组件uni-steps，样式布局无法对齐竖线，于是自己造轮子，完成特殊的布局。显示效果如下&#xff1…...

编程日记 2023/8/15 6:56:06

深入浅出栈和队列（附加循环队列、双端队列）

栈和队列一、栈概念与特性二、Stack 集合类及模拟实现1、Java集合中的 Stack2、Stack 模拟实现三、栈、虚拟机栈、栈帧有什么区别？四、队列概念与特性五、Queue集合类及模拟实现1、Queue的底层结构（1）顺序结构（2）链…...

编程日记 2023/8/15 6:55:05

前端基础（二）

前言：前端开发框架——Vue框架学习。准备工作：添加Vue devtools扩展工具具体可查看下面的这篇博客添加vue devtools扩展工具添加后F12不显示Vue图标_MRJJ_9的博客-CSDN博客 Vue官方学习文档 Vue.js - 渐进式 JavaScript 框架 | Vue.js MVVM M…...

编程日记 2023/8/15 6:54:04

ORB-SLAM2学习笔记7之System主类和多线程

文章目录 0 引言1 整体框架1.1 整体流程 2 System主类2.1 成员函数2.2 成员变量 3 多线程3.1 ORB-SLAM2中的多线程3.2 加锁 0 引言 ORB-SLAM2是一种基于特征的视觉SLAM（Simultaneous Localization and Mapping）系统，它能够从单个、双目或RBG…...

编程日记 2023/8/15 6:53:03

gin的占位符:和通配符*

1、用法在 Gin 路由中，可以使用一个通配符（*）或一个占位符（:）来捕获 URL 的一部分。 r.GET("/royal/:id", func(c *gin.Context) {id : c.Param("id")//fmt.Println("into :id")c.Str…...

编程日记 2023/8/15 6:52:01

【量化课程】08_2.深度学习量化策略基础实战

文章目录 1. 深度学习简介2. 常用深度学习模型架构2.1 LSTM 介绍2.2 LSTM在股票预测中的应用 3. 模块分类3.1 卷积层3.2 池化层3.3 全连接层3.4 Dropout层 4. 深度学习模型构建5. 策略实现 1. 深度学习简介深度学习是模拟人脑进行分析学习的神经网络。 2. 常用深度学习模型架…...

编程日记 2023/8/15 6:51:00

12-数据结构-数组、矩阵、广义表

数组、矩阵、广义表目录数组、矩阵、广义表一、数组二.矩阵三、广义表一、数组这一章节理解基本概念即可。数组要看清其实下标是多少，并且二维数组，存取数据，要先看清楚是按照行存还是按列存，按行则是正常一行一行的去读…...

编程日记 2023/8/15 6:49:58

Idea 反编译jar包

实际项目中，有时候会需要更改jar包源码来达到业务需求，本文章将介绍一下如何通过Idea来进行jar反编译 1、Idea安装decompiler插件 2、找到decompiler插件文件夹 decompiler插件文件夹路径为：idea安装路径/plugins/java-decompiler/lib 3、…...

编程日记 2023/8/15 6:48:56

【Git】安装以及基本操作

目录一、初识Git二、在Linux底下安装Git一）centOS二）Ubuntu 三、 Git基本操作一） 创建本地仓库二）配置本地仓库三）认识工作区、暂存区、版本库四）添加文件五）查看.git文件六）修改文…...

编程日记 2023/8/15 6:47:55

Spring创建Bean的过程（2）

上一节介绍了Spring创建过程中的两个重要的接口，那么它们在创建Bean的过程中起到了什么作用呢？接下来请看： Spring有三种方式寻找 xml 配置文件，根据 xml 文件内容来构建 ApplicationContext，分别为ClassPathXmlAppli…...

编程日记 2023/8/15 6:46:54

Linux 终端操作命令（2）内部命令

Linux 终端操作命令也称Shell命令，是用户与操作系统内核进行交互的命令解释器，它接收用户输入的命令并将其传递给操作系统进行执行，可分为内部命令和外部命令。内部命令是Shell程序的一部分，而外部命令是独立于Shell的可执行程序…...

编程日记 2023/8/15 6:45:53

Ubuntu系统下交叉编译openssl

一、参考资料 OpenSSL&&libcurl库的交叉编译 - hesetone - 博客园二、准备工作 1. 编译环境宿主机：Ubuntu 20.04.6 LTSHost：ARM32位交叉编译器：arm-linux-gnueabihf-gcc-11.1.0 2. 设置交叉编译工具链在交叉编译之前&#x…...

编程新知 2025/11/10 15:33:04

CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型

CVPR 2025 | MIMO：支持视觉指代和像素对齐的医学视觉语言模型论文信息标题：MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者：Yanyuan Chen, Dexuan Xu, Yu Hu…...

编程新知 2025/10/6 14:17:21

工业安全零事故的智能守护者：一体化AI智能安防平台

前言： 通过AI视觉技术，为船厂提供全面的安全监控解决方案，涵盖交通违规检测、起重机轨道安全、非法入侵检测、盗窃防范、安全规范执行监控等多个方面，能够实现对应负责人反馈机制，并最终实现数据的统计报表。提升船厂…...

编程新知 2025/11/11 16:32:39

.Net框架，除了EF还有很多很多......

文章目录 1. 引言2. Dapper2.1 概述与设计原理2.2 核心功能与代码示例基本查询多映射查询存储过程调用 2.3 性能优化原理2.4 适用场景 3. NHibernate3.1 概述与架构设计3.2 映射配置示例Fluent映射XML映射 3.3 查询示例HQL查询Criteria APILINQ提供程序 3.4 高级特性3.5 适用场…...

编程新知 2025/11/9 4:20:50

【Java学习笔记】Arrays类

Arrays 类 1. 导入包：import java.util.Arrays 2. 常用方法一览表方法描述Arrays.toString()返回数组的字符串形式Arrays.sort()排序（自然排序和定制排序）Arrays.binarySearch()通过二分搜索法进行查找（前提：数组是…...

编程新知 2025/10/25 11:57:30

抖音增长新引擎：品融电商，一站式全案代运营领跑者

抖音增长新引擎：品融电商，一站式全案代运营领跑者在抖音这个日活超7亿的流量汪洋中，品牌如何破浪前行？自建团队成本高、效果难控；碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

编程新知 2025/11/11 21:44:02

UR 协作机器人「三剑客」：精密轻量担当（UR7e）、全能协作主力（UR12e）、重型任务专家（UR15）

UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中，UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化&#xf…...

编程新知 2025/11/8 10:30:24

Java面试专项一-准备篇

一、企业简历筛选规则一般企业的简历筛选流程：首先由HR先筛选一部分简历后，在将简历给到对应的项目负责人后再进行下一步的操作。 HR如何筛选简历例如：Boss直聘（招聘方平台） 直接按照条件进行筛选例如&#xff1a…...

编程新知 2025/11/12 5:19:38

【C++进阶篇】智能指针

C内存管理终极指南：智能指针从入门到源码剖析一. 智能指针1.1 auto_ptr1.2 unique_ptr1.3 shared_ptr1.4 make_shared 二. 原理三. shared_ptr循环引用问题三. 线程安全问题四. 内存泄漏4.1 什么是内存泄漏4.2 危害4.3 避免内存泄漏五. 最后一. 智能指针智能指…...

编程新知 2025/11/12 18:52:42

实战设计模式之模板方法模式

概述模板方法模式定义了一个操作中的算法骨架，并将某些步骤延迟到子类中实现。模板方法使得子类可以在不改变算法结构的前提下，重新定义算法中的某些步骤。简单来说，就是在一个方法中定义了要执行的步骤顺序或算法框架，但允许子类…...

编程新知 2025/11/14 9:16:32

R语言生存分析（机器学习）（1）——GBM（梯度提升机）

相关文章：

R语言生存分析（机器学习）（1）——GBM（梯度提升机）

k8s和docker简单介绍

Lua学习记录

三分钟完美解决你的C盘内存过大爆红

C++ - equal(比较两个vector元素)

多线程：线程池

9.3.2.2网络原理(传输层TCP)

ssm+mybatis无法给带有下划线属性赋值问题

学习笔记-JVM监控平台搭建

使用css实现时间线布局（TimeLine）

深入浅出栈和队列（附加循环队列、双端队列）

前端基础（二）

ORB-SLAM2学习笔记7之System主类和多线程

gin的占位符:和通配符*

【量化课程】08_2.深度学习量化策略基础实战

12-数据结构-数组、矩阵、广义表

Idea 反编译jar包

【Git】安装以及基本操作

Spring创建Bean的过程（2）

Linux 终端操作命令（2）内部命令

Ubuntu系统下交叉编译openssl

CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型

工业安全零事故的智能守护者：一体化AI智能安防平台

.Net框架，除了EF还有很多很多......

【Java学习笔记】Arrays类

抖音增长新引擎：品融电商，一站式全案代运营领跑者

UR 协作机器人「三剑客」：精密轻量担当（UR7e）、全能协作主力（UR12e）、重型任务专家（UR15）

Java面试专项一-准备篇

【C++进阶篇】智能指针

实战设计模式之模板方法模式