当前位置：首页 > news >正文

【深度学习】基于机器学习的无机钙钛矿材料形成能预测，预测形成能，神经网络，回归问题

news 2025/12/16 0:19:38

文章目录

任务分析
数据处理
- 处理离散数值
- 处理缺失值
- 处理不同范围的数据
- 其他注意事项
我们的数据处理
模型
训练
网页web
代码、指导

任务分析

简单来说，就是一行就是一个样本，要用绿色的9个数值，预测出红色的那1个数值。
在这里插入图片描述

数据处理

在进行深度数学数据处理时，数据预处理是一个至关重要的步骤。它涉及到处理离散数值、缺失值以及不同范围的数据等问题。下面，我们将探讨如何高效地处理这些常见问题，并确保数据集为后续的分析和建模做好准备。

处理离散数值

离散数值通常指的是分类数据，这些数据可以是有序的（例如教育水平）或无序的（例如国籍）。在深度学习中，离散数值通常需要转换为一种更适合模型处理的格式。

独热编码（One-Hot Encoding）: 对于无序的分类变量，独热编码是一种常见的处理方法。它为每个类别创建一个新的布尔列，表示某个样本是否属于该类别。

标签编码（Label Encoding）: 对于有序的分类变量，可以使用标签编码，它将每个类别映射到一个整数值。这种方法保留了类别间的顺序关系。

嵌入（Embeddings）: 对于类别数量非常多的情况，可以使用嵌入层来学习一个更为紧凑的表示。

处理缺失值

缺失值处理是数据预处理中的一个重要方面。不同的处理方法可能会对模型的性能产生重大影响。

删除: 如果数据丢失不是很严重，可以考虑删除含有缺失值的行或列。但这可能会导致信息损失。

填充: 可以用某些统计值（如均值、中位数或众数）填充缺失值。对于连续变量，通常用均值或中位数；对于分类变量，可以用众数。

预测模型: 使用其他完整的特征来预测缺失值。例如，可以使用随机森林或K最近邻算法来预测缺失的数据。

使用缺失值: 某些算法可以直接处理缺失值，例如XGBoost。此外，可以将缺失值作为模型的一个特征。

处理不同范围的数据

当数据集中的特征在不同的范围内变化时，可能会导致模型性能下降，尤其是在使用基于距离的算法时。

标准化（Standardization）: 通过减去均值并除以标准差来转换数据，使得特征的均值为0，标准差为1。

归一化（Normalization）: 将特征缩放到给定的最小值和最大值之间，通常是0和1。

Robust Scaling: 使用中位数和四分位数范围来缩放特征，这种方法对异常值有更好的鲁棒性。

其他注意事项

异常值处理: 异常值可能是由于错误或偏差造成的。可以使用Z分数、IQR分数等方法检测并处理异常值。

特征工程: 考虑创建新的特征或转换现有特征，以更好地表示数据的潜在结构。

数据集的平衡: 在分类问题中，确保每个类别的样本数量大致相等，或者使用加权损失函数来解决类别不平衡问题。

时间序列数据: 如果数据是时间序列，需要考虑时间依赖性和季节性因素。

数据一致性: 确保所有数据都以一致的格式和单位进行表示。

通过以上的数据预处理方法，我们可以确保数据集为机器学习模型的训练和测试做好准备。这些步骤有助于提高模型的准确性、减少过拟合的风险，并提高模型的泛化能力。

我们的数据处理

独热编码、填充平均值、删除缺失数据过多（>3）的样本、标准化输入。

分析数据平稳性质，基本平稳，无需额外剔除工作。

在这里插入图片描述

模型

引入自注意力机制的神经网络模型：


class SelfAttention(nn.Module):def __init__(self, in_dim):super(SelfAttention, self).__init__()self.query = nn.Linear(in_dim, in_dim)self.key = nn.Linear(in_dim, in_dim)self.value = nn.Linear(in_dim, in_dim)self.softmax = nn.Softmax(dim=-1)def forward(self, x):q = self.query(x)k = self.key(x)v = self.value(x)attention_weights = self.softmax(torch.matmul(q, k.transpose(-2, -1)) / (x.size(-1) ** 0.5))attention_output = torch.matmul(attention_weights, v)return attention_outputclass AttentionModel(nn.Module):def __init__(self, input_dim, output_dim):super(AttentionModel, self).__init__()self.fc0 = nn.Linear(input_dim, 1024)self.fc0_1 = nn.Linear(1024, 512)self.fc1 = nn.Linear(512, 256)self.fc2 = nn.Linear(256, 128)self.fc3 = nn.Linear(128, 64)self.fc4 = nn.Linear(64, output_dim)self.relu = nn.SELU()self.bn0 = nn.BatchNorm1d(1024)self.bn0_1 = nn.BatchNorm1d(512)self.bn1 = nn.BatchNorm1d(256)self.bn2 = nn.BatchNorm1d(128)self.bn3 = nn.BatchNorm1d(64)self.self_attention = SelfAttention(256)def forward(self, x):x = self.bn0(self.relu(self.fc0(x)))x = self.bn0_1(self.relu(self.fc0_1(x)))x = self.bn1(self.relu(self.fc1(x)))attention_output = self.self_attention(x)x = self.relu(attention_output + x)  # 残差连接后应用ReLUx = self.bn2(self.relu(self.fc2(x)))x = self.bn3(self.relu(self.fc3(x)))x = self.fc4(x)return x# 使用Xavier初始化或Kaiming初始化def _initialize_weights(self):for m in self.modules():if isinstance(m, nn.Linear):init.kaiming_uniform_(m.weight, mode='fan_in', nonlinearity='relu')if m.bias is not None:init.constant_(m.bias, 0)

训练

MSE最低降低到0.2左右。
在这里插入图片描述

网页web

在这里插入图片描述

代码、指导

需要帮助请：

https://docs.qq.com/sheet/DUEdqZ2lmbmR6UVdU?tab=BB08J2

【深度学习】基于机器学习的无机钙钛矿材料形成能预测，预测形成能，神经网络，回归问题

文章目录任务分析数据处理处理离散数值处理缺失值处理不同范围的数据其他注意事项我们的数据处理模型训练网页web代码、指导任务分析简单来说，就是一行就是一个样本，要用绿色的9个数值，预测出红色的那1个数值。数据处理在进行深度数…...

编程日记 2024/3/28 22:07:04

20240321-2-Adaboost 算法介绍

Adaboost 算法介绍 1. 集成学习集成学习（ensemble learning）通过构建并结合多个学习器（learner）来完成学习任务，通常可获得比单一学习器更良好的泛化性能（特别是在集成弱学习器（weak learner…...

编程日记 2024/3/28 22:04:01

python第三方库的安装，卸载和更新，以及在cmd下pip install安装的包在pycharm不可用问题的解决

目录第三方库pip安装，卸载更新 1.安装： 2.卸载 3.更新一、第三方库pip安装，卸载更新 1.安装 pip install 模块名加镜像下载：pip install -i 镜像网址模块名常用的是加清华镜像，如 pip install -i https://pyp…...

编程日记 2024/3/28 22:03:00

Python第三次作业

周六 1. 求一个十进制的数值的二进制的0、1的个数 def er(x):a bin(x)b str(a).count("1")c str(a).count("0") - 1print(f"{a},count 1:{b},count 0:{c}")x int(input("enter a number:")) er(x) 2. 实现一个用户管理系统&…...

编程日记 2024/3/28 22:01:59

ai写作软件选哪个？这5款风靡全球的工具不容错过！

从去年到现在，ai 人工智能的发展一直是许多人关注的重点，每隔一段时间新诞生的 ai 工具软件，总会成为人们茶余饭后谈论的焦点。不过在种类繁多的 ai 工具软件中，ai 写作软件是最常被使用的 ai 工具类别，它的使用门槛较…...

编程日记 2024/3/28 21:59:55

一、绘制信号分析频谱 1.代码 % 生成测试信号 Fs 3000; % 采样频率 t 0:1/Fs:1-1/Fs; % 时间向量 x1 1*sin(2*pi*50*t) 1*sin(2*pi*60*t); % 信号1 x2 1*sin(2*pi*150*t)1*sin(2*pi*270*t); % 信号2% 绘制信号图 subplot(2,2,1); plot(t,x1); title(信号x1 1*sin(…...

编程日记 2024/3/28 21:58:52

Android Databinding 使用教程

Android Databinding 使用教程一、介绍 Android Databinding 是 Android Jetpack 的一部分，它允许你直接在 XML 布局文件中绑定 UI 组件到数据源。通过这种方式，你可以更简洁、更直观地更新 UI，而无需编写大量的 findViewById 和 setText/…...

编程日记 2024/3/28 21:56:49

【每日跟读】常用英语500句（200~300）

【每日跟读】常用英语500句 Home sweet home. 到家了 show it to me. 给我看看 Come on sit. 过来坐 That should do nicely. 这样就很好了 Get dressed now. 现在就穿衣服 If I were you. 我要是你 Close your eyes. 闭上眼睛 I don’t remember. 我忘了 I’m not su…...

编程日记 2024/3/28 21:54:46

【Java开发过程中的流程图】

流程图由一系列的图形符号和箭头组成，每个符号代表一个特定的操作或决策。下面是一些常见的流程图符号及其含义： 开始/结束符号（圆形）：表示程序的开始和结束点。过程/操作符号（矩形）&#xff…...

编程日记 2024/3/28 21:49:40

蓝桥杯刷题-day5-动态规划

文章目录使用最小花费爬楼梯解码方法使用最小花费爬楼梯【题目描述】给你一个整数数组 cost ，其中 cost[i] 是从楼梯第 i 个台阶向上爬需要支付的费用。一旦你支付此费用，即可选择向上爬一个或者两个台阶。你可以选择从下标为 0 或下标为 1 的台阶…...

编程日记 2024/3/28 21:45:35

新概念英语1：Lesson7内容详解

新概念英语1：Lesson7内容详解如何询问人的个人信息本课里有两个关于个人信息的问句，一个是问国籍，一个是问工作，句型如下： what nationality are you?询问国籍回复一般就是我是哪国人，I’m Chinese…...

编程日记 2024/3/28 21:44:34

FASTAPI系列 14-使用JSONResponse 返回JSON内容

FASTAPI系列 14-使用JSONResponse 返回JSON内容文章目录 FASTAPI系列 14-使用JSONResponse 返回JSON内容前言一、默认返回的JSON格式二、JSONResponse 自定义返回三、自定义返回 headers 和 media_type总结前言当你创建一个 FastAPI 接口时，可以正常返回以下任意…...

编程日记 2024/3/28 21:42:31

【版本控制】git使用指南

Git 是一个免费、开源的分布式版本控制系统，最初由 Linus Torvalds 于2005年创建。它旨在管理项目的源代码，并提供了跟踪更改、协作开发、版本控制、分支管理等功能。一、版本控制概念版本控制系统（Version Control System，VC…...

编程日记 2024/3/28 21:37:22

Flask 与小程序的图片数据交互过程及探讨研究学习

今天不知道怎么的，之前拿编程浪子地作品抄过来粘上用好好的，昨天开始照片突的就不显示了。今天不妨再耐味地细细探究一下微信小程序wxml 和flask服务器端是怎么jpg图片数据交互的。 mina/pages/food/index.wxml  <!--1px …...

编程日记 2024/3/28 21:36:21

【JavaEE】初识线程，线程与进程的区别

文章目录 ✍线程是什么？✍线程和进程的区别✍线程的创建1.继承 Thread 类2.实现Runnable接口3.匿名内部类4.匿名内部类创建 Runnable ⼦类对象5.lambda 表达式创建 Runnable ⼦类对象 ✍线程是什么？ ⼀个线程就是⼀个 “执行流”. 每个线程之间都可以按…...

编程日记 2024/3/28 21:31:15

Kafka高级面试题-2024

Kafka中的Topic和Partition有什么关系？ 在Kafka中，Topic和Partition是两个密切相关的概念。 Topic是Kafka中消息的逻辑分类，可以看作是一个消息的存储类别。它是按照不同的主题对消息进行分类，并且可以用于区分和筛选数据。每个…...

编程日记 2024/3/28 21:30:14

Qt——Qt文本读写之QFile与QTextStream的使用总结（打开文本文件，修改内容后保存至该文件中）

【系列专栏】：博主结合工作实践输出的，解决实际问题的专栏，朋友们看过来！《项目案例分享》《极客DIY开源分享》《嵌入式通用开发实战》《C++语言开发基础总结》《从0到1学习嵌入式Linux开发》《QT开发实战》《Android开发实战》...

编程日记 2024/3/28 21:29:13

掌握Java中的super关键字

super 是 Java 中的一个关键字，它在继承的上下文中特别有用。super 引用了当前对象的直接父类，它可以用来访问父类中的属性、方法和构造函数。以下是 super 的几个主要用途： 1. 调用父类的构造函数在子类的构造函数中，你可以使…...

编程日记 2024/3/28 21:22:04

STM32之HAL开发——系统定时器（SysTick）

系统定时器（SysTick）介绍 SysTick—系统定时器是属于 CM3 内核中的一个外设，内嵌在 NVIC 中。系统定时器是一个 24bit的向下递减的计数器，计数器每计数一次的时间为 1/SYSCLK，一般我们设置系统时钟 SYSCLK等于 72M。当…...

编程日记 2024/3/28 21:20:02

Redis 不再“开源”：中国面临的挑战与策略应对

Redis 不再“开源”，使用双许可证 3 月 20 号，Redis 的 CEO Rowan Trollope 在官网上宣布了《Redis 采用双源许可证》的消息。他表示，今后 Redis 的所有新版本都将使用开源代码可用的许可证，不再使用 BSD 协议，而是采用…...

编程日记 2024/3/28 21:19:00

conda相比python好处

Conda 作为 Python 的环境和包管理工具，相比原生 Python 生态（如 pip 虚拟环境）有许多独特优势，尤其在多项目管理、依赖处理和跨平台兼容性等方面表现更优。以下是 Conda 的核心好处： 一、一站式环境管理&#xff1a…...

编程新知 2025/11/29 6:54:19

Xshell远程连接Kali（默认 | 私钥）Note版

前言:xshell远程连接，私钥连接和常规默认连接任务一开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务任务二修改配置文件 vi /etc/ssh/ssh_config //第一…...

编程新知 2025/12/12 3:26:16

MongoDB学习和应用(高效的非关系型数据库)

一丶 MongoDB简介对于社交类软件的功能，我们需要对它的功能特点进行分析： 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具： mysql：关系型数据库&am…...

编程新知 2025/12/12 3:11:50

如何在看板中体现优先级变化

在看板中有效体现优先级变化的关键措施包括：采用颜色或标签标识优先级、设置任务排序规则、使用独立的优先级列或泳道、结合自动化规则同步优先级变化、建立定期的优先级审查流程。其中，设置任务排序规则尤其重要，因为它让看板视觉上直观地体…...

编程新知 2025/12/15 21:24:01

连锁超市冷库节能解决方案：如何实现超市降本增效

在连锁超市冷库运营中，高能耗、设备损耗快、人工管理低效等问题长期困扰企业。御控冷库节能解决方案通过智能控制化霜、按需化霜、实时监控、故障诊断、自动预警、远程控制开关六大核心技术，实现年省电费15%-60%，且不改动原有装备、安装快捷、…...

编程新知 2025/11/30 16:55:29

【磁盘】每天掌握一个Linux命令 - iostat

目录【磁盘】每天掌握一个Linux命令 - iostat工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景注意事项【磁盘】每天掌握一个Linux命令 - iostat 工具概述 iostat（I/O Statistics）是Linux系统下用于监视系统输入输出设备和CPU使…...

编程新知 2025/9/30 16:39:11

第一篇：Agent2Agent (A2A) 协议——协作式人工智能的黎明

AI 领域的快速发展正在催生一个新时代，智能代理（agents）不再是孤立的个体，而是能够像一个数字团队一样协作。然而，当前 AI 生态系统的碎片化阻碍了这一愿景的实现，导致了“AI 巴别塔问题”——不同代理之间…...

编程新知 2025/12/14 4:36:59

Psychopy音频的使用

Psychopy音频的使用本文主要解决以下问题： 指定音频引擎与设备；播放音频文件本文所使用的环境： Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音频配置 Psychopy文档链接为Sound - for audio playback — Psy…...

编程新知 2025/12/9 4:34:34