医学数据分析实训 项目一 医学数据采集
项目一 医学数据采集
一、实践目的
- 了解医学数据的特点;
- 熟悉常见的医学公共数据库的使用方法;
- 掌握获取医学数据的方法;
二、实践平台
- 操作系统:Windows10 及以上
- Python 版本:3.8.x 及以上
- PyCharm 或 Anoconda 集成环境
三、实践内容
医学数据采集实验的数据来源广泛,主要包括以下几个方面:
- 患者数据:通过电子病历系统、患者自主记录等方式收集患者的临床症状、体征、病史、用药情况等信息;
- 医疗设备数据:利用各种医疗设备(如心电图机、超声仪、CT 扫描仪等)实时监测患者的生理参数和健康状况,生成大量医学图像和数据;
- 实验室数据:通过实验室检测获取患者的生化指标、遗传学信息、微生物学结果等数据;
- 外部数据源:包括公共卫生数据库、医学研究数据库等,这些数据库包含了大量的医学研究成果和临床数据,为医学数据采集实验提供了丰富的资源。
1. 熟悉常见医学公共数据库的使用方法
(1)熟悉 Kaplan-Meier Plotter 平台 https://kmplot.com/analysis/ 的使用
- 操作过程:
-
访问 Kaplan-Meier Plotter 平台首页(图 1)。

-
输入对应参数(图 2),如基因 STAT2 和乳腺癌生存率的相关性。
-

-
生成生存率关系图(图 3),并通过文字对结果进行解释。
-


-
解释含义:(fitten code生成)
1 高表达STAT2基因的乳腺癌患者群体的生存率显著高于低表达
2 体这种差异在统计学上是显著的(Log-rank P值为9e-11)
3 STAT2基因的高表达可能与乳腺癌患者更好的生存率相关
(2)熟悉 SEER 数据库 https://seer.cancer.gov/data-software/ 的使用方法
- 操作过程:
-
在 SEER 数据库中查询癌症数据。
-


-
对查询结果(图 4)进行解释。
-

-
解释含义:(fitten code生成)
1 从2000年到2021年,男性和女性的癌症发病率总体上保持稳定,没有显著的变化
2 男性和女性的发病率在2000年至2017年间没有显著的年度百分比变化
3 这张图表明,在2000年至2021年期间,所有癌症部位的年龄调整发病率在男性和女性中都没有显著变化
2. 使用 GEO 数据库 https://www.ncbi.nlm.nih.gov/geo 下载数据集
-
操作步骤:
-
访问 GEO 页面(图 5)。
-

-
在 GEO 中检索肝癌(HCC)环状 RNA(circRNA)研究数据(图 6)。
-

-
选择并查看检索到的数据集(图 7)。
-

-
查看数据集的详细信息(图 8)。
-

-
下载数据集(图 9)。
-

-
-
查看下载的数据集文件(图 10),并对该数据集进行解释。
解释含义:(fitten code生成)
在GEO(Gene Expression Omnibus)数据库中,"ID_REF"通常表示基因或探针的标识符。在你提供的数据集中,"ID_REF"后面的数据是基因或探针的表达值,这些值对应于不同的样本(GSM编号)。
这是一个关于肝癌(HCC)环状RNA(circRNA)研究的表达矩阵。每一行代表一个特定的circRNA(由"ID_REF"标识),每一列代表一个样本(由GSM编号标识)。矩阵中的数值表示相应circRNA在相应样本中的表达水平。
例如,第一行数据:
“ASCRP000002” 9.042573151 9.238902276 8.997313248 9.4371723 8.962706649 9.415486133 9.017848355 9.524889458 9.671877122 9.479558558 9.227469787 9.409693079 8.97187312 8.96956744
CopyInsert
表示circRNA "ASCRP000002"在14个不同样本中的表达值。这些值可以用来分析circRNA在不同样本中的表达差异,从而研究其在肝癌发生发展中的作用。
3. 通过 UCI 机器学习库下载数据集
- 操作步骤:
-
访问 UCI 机器学习库官网(https://archive.ics.uci.edu/ )。
-

-
在数据集中搜索并下载任意两个与医药卫生相关的数据集。
-
一个是心脏病数据集,另一个是乳腺癌数据集。download the datasets.
-

-



-

- 通过文字对数据集进行解释。
解释含义:(fitten code生成)
- 这个打开数据集,自己看吧。这里举一个例子



-
相关文章:
医学数据分析实训 项目一 医学数据采集
项目一 医学数据采集 一、实践目的 了解医学数据的特点;熟悉常见的医学公共数据库的使用方法;掌握获取医学数据的方法; 二、实践平台 操作系统:Windows10 及以上Python 版本:3.8.x 及以上PyCharm 或 Anoconda 集成…...
《Oracle(一)- 基础》
文章目录 一、Oracle简介(一)什么是ORACLE(二)ORACLE 体系结构1.数据库2.实例3.数据文件(dbf)4.表空间5.用户 二、ORACLE 安装与配置(一)VMware 挂载 windows server 2003࿰…...
Unity Resource System 优化笔记
Unity Resources System 定义 Resources System允许开发者在项目中的Resources文件夹下存放一个或多个资源文件夹,并且可以在Unity运行时通过Unity提供的API对资源和对象进行加载和卸载。 如果Resources中的文件结构复杂,内容多,会给应用常…...
Flutter之SystemChrome全局设置
一、简介 SystemChrome作为一个全局属性,很像 Android 的 Application,功能很强大。 二、使用详解 2.1 setPreferredOrientations 设置屏幕方向 在我们日常应用中可能会需要设置横竖屏或锁定单方向屏幕等不同要求,通过 setPreferredOrien…...
Windows11 WSL2的ubuntu 22.04中拉取镜像报错
问题描述 在windows11 WSL2的ubuntu 22.04中拉取镜像报错。错误为: Error response from daemon: Get "https://registry-1.docker.io/v2/": net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting header…...
【Linux】多线程:线程同步、条件变量
目录 一、同步的概念 为什么需要同步呢? 二、条件变量 条件变量的相关概念 1、条件变量的初始化:静态初始化、动态初始化 2、条件变量的等待:pthread_cond_wait函数 工作原理及流程【重要!】 关键点总结 3、条件变量的激…...
【Android Studio】使用雷电模拟器调试
文章目录 进入开发者模式使雷电模拟器adb连接PC测试 进入开发者模式 多次点击版本号 -开区USB调试 使雷电模拟器adb连接PC 写cmd脚本 雷电模拟器端口为5555 ,脚本内容如下: adb.exe connect 127.0.0.1:5555双击bat脚本文件 测试...
你必须知道的C语言问题(9)
问:如下代码,两个结构体类型成员变量相同,只是成员顺序不同,为什么大小不同? #include <stdio.h> #include <stdint.h> #include <string.h> #include <stdlib.h>typedef struct _test1{uint…...
如何通过网络找到自己想要的LabVIEW知识?
学习LabVIEW或其他编程技术时,无法依赖某一篇文章解决所有问题。重要的是通过多种途径获取灵感,并学会归纳总结,从而逐渐形成系统性的理解。这种持续学习和总结的过程是技术提升的基础。通过网络找到所需的LabVIEW知识可以通过以下几个步骤进…...
SCRM电商管理后台Axure高保真原型 源文件
在电商行业蓬勃发展的今天,企业急需一个全面的客户关系管理(CRM)系统来优化他们的电商运营。我们的Scrm电商管理后台应运而生,它不仅是一个集中化的管理平台,更是企业提升客户互动和销售业绩的得力助手。 预览地址 ht…...
重载new,delete , RTTI,类成员指针
重载new,delete 执行过程 重载new,delete 和普通的运算符重载不同,并非重载new,delete 的行为,而是改变内存分配的方式,将对象放置在特定的内存空间中 new运算符操作: 调用STL标准模板库的…...
基于SSM+Vue+MySQL的在线医疗服务系统
系统展示 用户前台界面 管理员后台界面 系统背景 随着医疗信息化的快速发展和患者对便捷医疗服务需求的日益增长,开发一个高效、可靠的在线医疗服务系统显得尤为重要。基于SSM(SpringSpring MVCMyBatis)框架、前端采用Vue.js、后端连接MySQL数…...
Windows 11上pip报‘TLS/SSL connection has been closed (EOF) (_ssl.c:1135)‘的解决方法
这个只是简单记录一下,可能是我用了代理的缘故,即便是把源换成国内的,例如阿里云,也会报错,例如: pip install matplotlib Looking in indexes: https://mirrors.aliyun.com/pypi/simple/, https://pypi.or…...
53 - I. 在排序数组中查找数字 I
comments: true edit_url: https://github.com/doocs/leetcode/edit/main/lcof/%E9%9D%A2%E8%AF%95%E9%A2%9853%20-%20I.%20%E5%9C%A8%E6%8E%92%E5%BA%8F%E6%95%B0%E7%BB%84%E4%B8%AD%E6%9F%A5%E6%89%BE%E6%95%B0%E5%AD%97%20I/README.md 面试题 53 - I. 在排序数组中查找数字 …...
基于 TDMQ for Apache Pulsar 的跨地域复制实践
导语 自2024年9月6日起,TDMQ Pulsar 版专业集群支持消息、元数据两级跨地域复制功能,消息级复制解决用户全球地域的数据统一归档问题,元数据级复制提供解决用户核心业务跨地域容灾的场景。 用户在跨地域场景遇到的疑问和挑战 在跨地域相关…...
无线通信感知/雷达系统算法专业技术栈
无论是在工业界还是在学业界,无线通信感知一体化都是一个热门的方向,作为一个24届毕业生,刚好处于行业当中,就总结一下自己浅薄认知下,自己觉得已经掌握或者应该掌握的技术栈和专业能力,与大家共勉。 Rada…...
离谱碾压!奇安信中标:高出第二名近70分!
2024年08月09日,广东省政务服务和数据管理局,近日发布了网络安全第三方服务(2024年)项目之关基检查及重要政务应用安全检查服务招标公告! 预算金额:2,896,200.00元,其中安全检查服务包…...
HOT 100(七)栈、堆、贪心算法
一、栈 1、每日温度 使用单调递减栈来解决。主要思路是遍历temperatures数组,利用栈来存储还没有找到比当前温度高的天数的索引。当遇到比栈顶索引所对应温度更高的温度时,就可以确定当前这一天的温度比之前那一天高。索引的差值就是等待的天数。 求一…...
速盾:高防服务器租用需要注意什么事项
在当今互联网时代,网络安全问题日益严峻。各种网络攻击手段层出不穷,给企业和个人的网站带来了巨大的安全威胁。为了保障网站的安全稳定运行,高防服务器成为了许多人的选择。而在租用高防服务器时,需要注意以下几个事项。 一、选择…...
【数据库】MySQL内置函数
本篇分享一些在MySQL中常见的一些内置函数,如日期函数,字符串函数和数学函数,以方便于操作数据库中的数据。 1.日期函数 我们先整体观察一下这些函数再讲解案例 日期函数使用起来都非常就简单 获得年月日: select current_dat…...
基于拉丁超立方采样的电力系统概率潮流计算实现分析
采用拉丁超立方采样的电力系统概率潮流计算 (自适应核密度估计,自适应带宽核密度估计) 拉丁超立方采样属于分层采样,是一种有效的用采样值反映随机变量的整体分布的方法。 其目的是要保证所有的采样区域都能够被采样点覆盖。 该方…...
3个创新方案解决Kindle封面丢失问题:Fix-Kindle-Ebook-Cover的全方位修复指南
3个创新方案解决Kindle封面丢失问题:Fix-Kindle-Ebook-Cover的全方位修复指南 【免费下载链接】Fix-Kindle-Ebook-Cover A tool to fix damaged cover of Kindle ebook. 项目地址: https://gitcode.com/gh_mirrors/fi/Fix-Kindle-Ebook-Cover 当你打开Kindle…...
Z-Image-Turbo-辉夜巫女真实生成效果:支持中文提示词直输,无需英文翻译
Z-Image-Turbo-辉夜巫女真实生成效果:支持中文提示词直输,无需英文翻译 1. 模型简介 Z-Image-Turbo-辉夜巫女是基于Z-Image-Turbo模型的Lora版本,专门针对生成"辉夜巫女"风格图片进行了优化。这个模型最大的特点是支持直接输入中…...
个人开发者如何用隧道代理实现“代理自由”?
那个被反爬逼疯的周末去年有个周末,我窝在家里写一个比价脚本。想爬几个主流电商平台的价格数据,做个小工具自己用。代码写得挺顺,Requests库套上代理,循环跑起来。前50次请求一切正常,第51次——啪,403。换…...
GPCC数据不止看趋势:手把手教你用MATLAB做降水信号的谐波分析(附周年振幅相位代码)
GPCC数据不止看趋势:手把手教你用MATLAB做降水信号的谐波分析(附周年振幅相位代码) 长江流域的降水变化对农业生产、水资源管理和生态保护都具有重要意义。当我们拿到GPCC的月尺度降水数据时,除了绘制时间序列图观察趋势外&#x…...
Anthropic 新政策与功能更新:AI 市场竞争下的博弈与挑战
Claude 新收费政策:第三方代理使用需额外付费上周末,Anthropic 告知订阅用户,若大量使用 Claude AI 模型驱动 OpenClaw 等第三方代理,需额外付费。月度订阅用户虽仍可通过第三方代理使用 Claude 模型,但需通过 Anthrop…...
[技术突破] 解决营销行业3大痛点:基于control_v1p_sd15_qrcode_monster的创新方案
[技术突破] 解决营销行业3大痛点:基于control_v1p_sd15_qrcode_monster的创新方案 【免费下载链接】control_v1p_sd15_qrcode_monster 项目地址: https://ai.gitcode.com/hf_mirrors/monster-labs/control_v1p_sd15_qrcode_monster 一、痛点剖析:…...
跨场景事件:没人聊但人人踩的持久化问题
目录根本矛盾静态事件:幽灵订阅问题实例事件:随场景消亡DontDestroyOnLoad 创可贴Bootstrap 场景模式多场景编辑让情况更糟生命周期问题GES 如何解决这个问题ScriptableObject 事件存在于场景之外Behavior Window:自动生命周期管理Persistent…...
Windows系统终极清理指南:用Win11Debloat免费快速释放30%系统性能
Windows系统终极清理指南:用Win11Debloat免费快速释放30%系统性能 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declu…...
什么是网站结构优化_它在 SEO 中的作用是什么_网站速度优化有哪些方法_它在 SEO 中的作用是什么
什么是网站结构优化?它在 SEO 中的作用是什么 网站结构优化,简称“结构优化”,是指通过优化网站的层级结构、导航系统和内容组织方式,以提升用户体验和搜索引擎的抓取效率的一系列措施。网站结构的良好设计,不仅可以让用户更容易…...
