当前位置: 首页 > news >正文

【Python】数据分析+数据挖掘——掌握Python和Pandas中的单元格替换操作

1. 前言

数据处理和清洗是数据分析和机器学习中至关重要的步骤。在数据处理过程中,我们经常需要对数据集进行清洗和转换,其中单元格替换是一个常用的技术。Python作为一种功能强大且灵活的编程语言,为数据处理提供了丰富的工具和库。Pandas库是Python中最流行的数据处理库之一,它提供了丰富的功能,包括强大的单元格替换操作。

在本博客中,我们将深入探讨Python和Pandas库中有关单元格替换的知识。我们将首先介绍Python中的基本替换方法,然后重点关注Pandas库中的df.replace()方法,以及如何使用它来进行单元格替换。我们还将学习如何使用df.replace()来实现单元格范围替换,以及如何进行哑变量替换,将分类数据转换为更易于处理的形式。


2. 单元格变量替换

当涉及到数据处理、清洗或转换时,Python原生库和Pandas库都提供了一些功能来进行单元格替换。让我们先介绍一下Python原生库中的替换方法,然后再探讨Pandas库的相关功能。


Python原生库中的单元格替换:

在Python中,主要使用内置的数据结构如列表(List)和字典(Dictionary)来处理数据。对于列表,你可以使用列表推导式或循环来实现单元格替换,而对于字典,可以通过键值对的方式进行替换。



  1. 例如使用列表推导式替换列表中的特定值:

In[0]:

derive_list = ['a','b','c','d','e'] # 用列表推导来替换的列表例子derive_list = [x if x != 'a' else 'A' for x in derive_list] # 使用列表推导式来替换列表中特定的值
print(derive_list)

注释:

  • derive_list: 这是一个列表变量,它包含了一些元素。假设derive_list是一个字符串列表,例如[‘a’, ‘b’, ‘c’, ‘d’, ‘e’]。

  • for x in derive_list: 这是列表推导式的循环部分。它遍历derive_list中的每个元素,并将当前元素赋值给变量x。

  • x if x != ‘a’ else ‘A’: 这是列表推导式的条件表达式。它表示如果当前元素x不等于’a’,则不做修改,否则替换为’A’。

最终结果: 列表推导式的结果是一个新的列表,其中满足条件的元素已经被替换。该结果会覆盖原始的derive_list,因此derive_list会被修改。


out[0]:

['A', 'b', 'c', 'd', 'e']


  1. 接下来使用循环替换列表中的特定值:

In[1]:

loop_list = ['h','e','l','l','o',',','p','y','t','h','o','n'] # 用循环来替换列表中特定的值for index,list_item in enumerate(loop_list): # 使用循环来替换列表中特定的值if list_item == 'p':loop_list[index] = 'P'for new_list_item in loop_list: # 使用循环来依次打印新列表里面的元素值print(new_list_item, end="") # end=""的作用是不换行

注释:

  • enumerate()函数可以用于遍历一个可迭代对象(如列表、元组、字符串等)并返回元素的索引和对应的值。

out[1]:

hello,Python


  1. 最后在学习一下使用字典替换列表中的特定值:

In[2]:

num_key_dict = {0:'a',1:'b',2:'c',3:'d'} # 键为number类型的dict
str_key_dict = {'0':'a','1':'b','2':'c','3':'d'} # 键为string类型的dictnum_key_dict[1] = 'B' # 替换dict中的特定值
str_key_dict['1'] = 'B' # 替换dict中的特定值print("num_key_dict is:",num_key_dict)
print("str_key_dict is:",str_key_dict)

注释:

  • 若将str_key_dict['1'] = 'B'改为str_key_dict[1] = 'B'那么str_key_dict中的’b‘值并不会被改变,而是字典中多了一个key为1,value为’B’的键值对

out[2]:

num_key_dict is: {0: 'a', 1: 'B', 2: 'c', 3: 'd'}
str_key_dict is: {'0': 'a', '1': 'B', '2': 'c', '3': 'd'}

案例数据表university_rank.csv

在这里插入图片描述

接下来我们将重点放在Pandas中的单元格替换操作,Pandas提供了多种方法来替换DataFrame或Series中的特定值。这些方法可以帮助你快速、灵活地对数据进行替换。下面将详细介绍几种常用的单元格替换方法。

常用的函数是df.inplace来进行某个单元格或者某个列的变量替换

语法:DataFrame.replace(to_replace=None, value=None, inplace=False, limit=None, regex=False, method=‘pad’)

df.replace(# 要替换的值。可以是单个值、一个列表、字典或正则表达式。to_replace# 用于替换的新值。可以是单个值或字典。value# 是否在原df上修改inplace = False# 指定每行替换的最大数量。默认为None,表示不限制。limit = None# 是否启用正则表达式替换。默认为False。regex = False # 当to_replace为字典时,指定如何进行替换。默认为'pad',表示用字典中的值向前填充method = 'pad'
)

In[3]:

import pandas as pddf = pd.read_csv("university_rank.csv") # 读取案例数据表
inplace_set = {'北美': "北美洲", '南美': '南美洲'} # 创建一个替换集合
df.地区.replace(inplace_set, inplace=True) # 将读取到的数据中所有'北美'、'南美'单元格均换成'北美洲'、'南美洲'
df # 展示新的DataFrame

**out[3]:**
        大学名称   排名   地区   学科领域    排名依据
0       哈佛大学    1  北美洲     工程    学术声誉
1       牛津大学    2   欧洲     医学    科研产出
2       北京大学    3   亚洲     商学   国际影响力
3       悉尼大学    4  大洋洲  计算机科学    教学质量
4      圣保罗大学    5  南美洲     艺术   学生满意度
..       ...  ...  ...    ...     ...
95   圣保罗国立大学   96  南美洲  计算机科学  研究生录取率
96   约翰内斯堡大学   97   非洲   环境科学    学术声誉
97     麦吉尔大学   98  北美洲     艺术   学生满意度
98  伦敦政治经济学院   99   欧洲     法律   国际影响力
99      东京大学  100   亚洲     教育  毕业生就业率[100 rows x 5 columns]

2.1 范围单元格替换

假如要对某个范围的单元格进行替换就需要搭配df.querydf.locdf.index来使用来达到目的

若我想要筛选出地区为北美洲和南美洲,同时10<排名<80的所有记录,将其排名依据均设置为空



In[4]:

df.loc[df.query("10<排名<80 and 地区 in ['北美洲','南美洲']").index, '排名依据'] = '' # 筛选出地区为北美洲和南美洲,同时10<排名<80的所有记录,将其排名依据均设置为空
df[10:79] # 查看进行范围单元格替换后的DataFrame

out[4]:

大学名称排名地区学科领域排名依据
10斯坦福大学11北美洲工程
11剑桥大学12欧洲医学教学质量
12清华大学13亚洲商学校友网络
13墨尔本大学14大洋洲计算机科学学术声誉
14圣保罗国立大学15南美洲艺术
..................
74墨尔本大学75大洋洲商学国际化程度
75圣保罗国立大学76南美洲计算机科学
76约翰内斯堡大学77非洲环境科学学术声誉
77麦吉尔大学78北美洲艺术
78伦敦政治经济学院79欧洲法律国际影响力

69 rows × 5 columns



同样的我们也可以使用replace方法,通过条件表达式选择满足条件的行,并将"排名依据"列的值置为空字符串

In[5]:

# 使用replace方法,通过条件表达式选择满足条件的行,并将"排名依据"列的值置为空字符串
condition = (df["排名"].between(11, 79)) & (df["地区"].isin(['北美洲', '南美洲']))
df['排名依据'].replace(to_replace=df.loc[condition, '排名依据'].values, value='', inplace=True)df[10:79] # 查看进行范围单元格替换后的DataFrame
.dataframe tbody tr th {vertical-align: top;
}.dataframe thead th {text-align: right;
}

out[5]:

大学名称排名地区学科领域排名依据
10斯坦福大学11北美洲工程
11剑桥大学12欧洲医学教学质量
12清华大学13亚洲商学校友网络
13墨尔本大学14大洋洲计算机科学学术声誉
14圣保罗国立大学15南美洲艺术
..................
74墨尔本大学75大洋洲商学国际化程度
75圣保罗国立大学76南美洲计算机科学
76约翰内斯堡大学77非洲环境科学学术声誉
77麦吉尔大学78北美洲艺术
78伦敦政治经济学院79欧洲法律国际影响力

69 rows × 5 columns


2.2 哑变量替换

在数据分析和统计学中,哑变量(Dummy Variable),也称为虚拟变量,是用来对分类变量进行编码的一种方法。在许多机器学习算法中,需要将分类数据转换为数值形式才能进行处理,而哑变量就是一种常用的编码方式。

哑变量编码的基本思想是将一个有n个取值的分类变量转换成n个二进制变量,每个二进制变量表示该分类是否出现。对于原始的分类变量,其中某个取值用1表示,而其他取值用0表示。这样做的目的是为了在数值形式上保持分类变量之间的独立性。

例如,假设有一个商品,它具有商品ID、价格、分类三个属性,变量“分类”,包含三个取值:“日常用品”、“蔬果"和"服装”。如下图所示

属性1
属性2
属性3
商品
商品ID
价格
分类

使用哑变量编码后,将生成三个二进制变量:"日常用品"变量、“蔬果"变量和"服装"变量。如果原始数据中的某一行"分类"是"日常用品”,则"日常用品"变量为1,而"蔬果"和"服装"变量为0。


下面这个表格是正常的商品表

商品名称商品ID价格分类
手帕纸10011$日常用品
T恤100210$服装
火龙果10035$蔬果

下面这个改动后的商品表则是使用分类这个哑变量

商品名称商品ID价格分类_日常用品分类_服装分类_蔬果
手帕纸10011$100
T恤100210$010
火龙果10035$001

哑变量替换(Dummy Variable Replacement)指的是将原始的分类变量使用哑变量编码替换成数值形式。这种替换方式常用于机器学习模型的训练和其他数据分析任务,因为大部分算法需要处理数值数据。



在Pandas中,使用pd.get_dummies函数可以方便地将包含分类数据的DataFrame或Series转换成哑变量形式。它会自动识别分类数据并生成相应的哑变量。其中某个分类的取值用1表示,其余分类的取值用0表示。

语法:pd.get_dummies(data, prefix=None, prefix_sep=‘_’, columns=None, drop_first=False, dtype=None)

pd.get_dummies(# 转换的变量列,若不指定则为全部列data# 哑变量名称前缀,str或列表,用于指定生成的哑变量列名的前缀。默认为None,即不添加前缀。prefix = None# 用于指定前缀与原始列名之间的分隔符prefix_sep = '_'# 设置空值的哑变量dummy_na = False# 转换的原始列名,若不指定则为全部列columns = None# 是否丢弃第一列,因为若后面的列全为0,反向说明省去的列为1,则第一列可舍去drop_frist = False# 数据类型,用于指定生成哑变量列的数据类型。默认为None,即自动推断数据类型。dtype = None
)

In[6]:

df = pd.read_csv("university_rank.csv") # 读取案例数据表
print(df) # 打印一下案例数据表
print(pd.get_dummies(data=df.学科领域)) # 只打印以学科领域为哑变量列的表 

out[6]:

        大学名称   排名   地区   学科领域    排名依据
0       哈佛大学    1   北美     工程    学术声誉
1       牛津大学    2   欧洲     医学    科研产出
2       北京大学    3   亚洲     商学   国际影响力
3       悉尼大学    4  大洋洲  计算机科学    教学质量
4      圣保罗大学    5   南美     艺术   学生满意度
..       ...  ...  ...    ...     ...
95   圣保罗国立大学   96   南美  计算机科学  研究生录取率
96   约翰内斯堡大学   97   非洲   环境科学    学术声誉
97     麦吉尔大学   98   北美     艺术   学生满意度
98  伦敦政治经济学院   99   欧洲     法律   国际影响力
99      东京大学  100   亚洲     教育  毕业生就业率[100 rows x 5 columns]
医学商学工程教育法律环境科学社会科学经济学艺术计算机科学
00010000000
11000000000
20100000000
30000000001
40000000010
.................................
950000000001
960000010000
970000000010
980000100000
990001000000

100 rows × 10 columns



In[7]:

df = pd.read_csv("university_rank.csv") # 读取案例数据表
print(df) # 打印案例表
print(pd.get_dummies(df, columns=["学科领域"])) # 打印包括学科领域哑变量列的所有数据

out[7]:

        大学名称   排名   地区   学科领域    排名依据
0       哈佛大学    1   北美     工程    学术声誉
1       牛津大学    2   欧洲     医学    科研产出
2       北京大学    3   亚洲     商学   国际影响力
3       悉尼大学    4  大洋洲  计算机科学    教学质量
4      圣保罗大学    5   南美     艺术   学生满意度
..       ...  ...  ...    ...     ...
95   圣保罗国立大学   96   南美  计算机科学  研究生录取率
96   约翰内斯堡大学   97   非洲   环境科学    学术声誉
97     麦吉尔大学   98   北美     艺术   学生满意度
98  伦敦政治经济学院   99   欧洲     法律   国际影响力
99      东京大学  100   亚洲     教育  毕业生就业率[100 rows x 5 columns]
大学名称排名地区排名依据学科领域_医学学科领域_商学学科领域_工程学科领域_教育学科领域_法律学科领域_环境科学学科领域_社会科学学科领域_经济学学科领域_艺术学科领域_计算机科学
0哈佛大学1北美学术声誉0010000000
1牛津大学2欧洲科研产出1000000000
2北京大学3亚洲国际影响力0100000000
3悉尼大学4大洋洲教学质量0000000001
4圣保罗大学5南美学生满意度0000000010
.............................................
95圣保罗国立大学96南美研究生录取率0000000001
96约翰内斯堡大学97非洲学术声誉0000010000
97麦吉尔大学98北美学生满意度0000000010
98伦敦政治经济学院99欧洲国际影响力0000100000
99东京大学100亚洲毕业生就业率0001000000

100 rows × 14 columns



In[8]:

print(pd.get_dummies(df, columns=["学科领域"], drop_first=True)) # 去掉第一列哑变量

out[8]:

大学名称排名地区排名依据学科领域_商学学科领域_工程学科领域_教育学科领域_法律学科领域_环境科学学科领域_社会科学学科领域_经济学学科领域_艺术学科领域_计算机科学
0哈佛大学1北美学术声誉010000000
1牛津大学2欧洲科研产出000000000
2北京大学3亚洲国际影响力100000000
3悉尼大学4大洋洲教学质量000000001
4圣保罗大学5南美学生满意度000000010
..........................................
95圣保罗国立大学96南美研究生录取率000000001
96约翰内斯堡大学97非洲学术声誉000010000
97麦吉尔大学98北美学生满意度000000010
98伦敦政治经济学院99欧洲国际影响力000100000
99东京大学100亚洲毕业生就业率001000000

100 rows × 13 columns

2.3 分段单元格替换

分段单元格替换(Binning)是一种在数据处理中常用的技术,它将连续的数值数据划分为若干个离散的区间,然后用相应的区间值来替换原始数据。这样可以将连续的数值数据转换为有序的分类数据,便于数据分析和可视化。

分段单元格替换通常用于数据的离散化,将数值数据按照一定规则划分成若干区间,然后将原始数据映射到相应的区间值。

在Pandas中,可以使用cut()函数来实现分段单元格替换。cut()函数接受一个Series对象和一个表示区间边界的列表,然后将Series中的数值映射到相应的区间。

假如现在我想要将原本1-100的排名替换成1-20,20-40,40-60,60-80,80-100五段来显示,那么我们能使用什么函数来达到这个目的呢?


语法:pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates=‘raise’)

pd.cut(# 分段的变量列名称x# 具体的分段设定,表示区间边界的列表,可以是整数表示区间的个数,也可以是自定义的边界值列表bin# 是否包括右边界 '[)'形式right = True# 给分段设置标签lables = None# 第一条记录是否包括左侧界值,当right不为True才有效果include_lowest = False# 是否返回划分后的区间边界值,默认为False。retbins = False # 表示区间边界的精度,默认为3precision = 3# 处理重复的边界值。默认为'raise',即如果有重复的边界值会抛出异常duplicates = 'raise'
)

In[9]:

df = pd.read_csv("university_rank.csv") # 读取案例数据表# 对df的排名列进行分段处理 
df['排名'] = pd.cut(x=df['排名'], bins=[1, 20, 40, 60, 80, 100],right=False, labels=["L1", "L2", "L3", "L4", "L5"])
print(df.head(40)) # 打印替换后的新DataFrame

out[9]:

大学名称排名地区学科领域排名依据
0哈佛大学L1北美工程学术声誉
1牛津大学L1欧洲医学科研产出
2北京大学L1亚洲商学国际影响力
3悉尼大学L1大洋洲计算机科学教学质量
4圣保罗大学L1南美艺术学生满意度
5约翰内斯堡大学L1非洲法律毕业生就业率
6麦吉尔大学L1北美教育校友网络
7伦敦政治经济学院L1欧洲经济学国际化程度
8东京大学L1亚洲社会科学研究生录取率
9澳大利亚国立大学L1大洋洲环境科学科研经费
10斯坦福大学L1北美工程研究成果
11剑桥大学L1欧洲医学教学质量
12清华大学L1亚洲商学校友网络
13墨尔本大学L1大洋洲计算机科学学术声誉
14圣保罗国立大学L1南美艺术学生满意度
15约翰内斯堡大学L1非洲法律国际影响力
16麦吉尔大学L1北美教育毕业生就业率
17伦敦政治经济学院L1欧洲经济学科研产出
18东京大学L1亚洲社会科学国际化程度
19澳大利亚国立大学L2大洋洲环境科学研究生录取率
20加州理工学院L2北美工程学术声誉
21巴黎高等师范学院L2欧洲医学科研产出
22香港大学L2亚洲商学国际影响力
23奥克兰大学L2大洋洲计算机科学教学质量
24里约热内卢大学L2南美艺术学生满意度
25约翰内斯堡大学L2非洲法律毕业生就业率
26约翰内斯堡大学L2非洲工程研究成果
27麦吉尔大学L2北美医学教学质量
28伦敦政治经济学院L2欧洲社会科学国际化程度
29东京大学L2亚洲艺术学生满意度
30澳大利亚国立大学L2大洋洲法律毕业生就业率
31斯坦福大学L2北美经济学校友网络
32剑桥大学L2欧洲工程科研产出
33清华大学L2亚洲医学学术声誉
34墨尔本大学L2大洋洲商学教学质量
35圣保罗国立大学L2南美计算机科学研究生录取率
36约翰内斯堡大学L2非洲环境科学学术声誉
37麦吉尔大学L2北美艺术学生满意度
38伦敦政治经济学院L2欧洲法律国际影响力
39东京大学L3亚洲教育毕业生就业率

3. 结束语

如果有疑问欢迎大家留言讨论,你如果觉得这篇文章对你有帮助可以给我一个免费的赞吗?我们之间的交流是我最大的动力!

相关文章:

【Python】数据分析+数据挖掘——掌握Python和Pandas中的单元格替换操作

1. 前言 数据处理和清洗是数据分析和机器学习中至关重要的步骤。在数据处理过程中&#xff0c;我们经常需要对数据集进行清洗和转换&#xff0c;其中单元格替换是一个常用的技术。Python作为一种功能强大且灵活的编程语言&#xff0c;为数据处理提供了丰富的工具和库。Pandas库…...

Godot 4 源码分析 - 增加格式化字符串功能

Godot 4的主要字符串类型为String&#xff0c;已经设计得比较完善了&#xff0c;但有一个问题&#xff0c;格式化这块没怎么考虑。 String中有一个format函数&#xff0c;但这个函数只有两个参数&#xff0c;这咋用&#xff1f; String String::format(const Variant &va…...

C#中XML文档与Treeview控件操作的数据同步

在前文《C#使用XML和Treeview结合实现复杂数据采集功能》中&#xff0c;使用Treeview展示了XML的数据&#xff0c;问题是如果在Treeview上进行了操作&#xff0c;怎样同步更改XML数据的内容呢&#xff1f; 这个问题看似简单&#xff0c;实现起来有一点小麻烦。 要实现的操作功能…...

【Java Web基础】mvn命令、Maven的安装与配置

本文极大程度上来自Maven安装(超详解)&#xff0c;但是担心安的过程中遇到什么不一样的问题&#xff0c;顺便加深印象&#xff0c;所以还是打算自己弄一篇。 目录 第一步&#xff1a;Download Maven第二步&#xff1a;解压与安装2.1 解压2.2 安装 第一步&#xff1a;Download …...

加强Web应用程序安全:防止SQL注入

数据库在Web应用程序中存储和组织数据时起着至关重要的作用&#xff0c;它是存储用户信息、内容和其他应用程序数据的中央存储库。而数据库实现了高效的数据检索、操作和管理&#xff0c;使Web应用程序能够向用户提供动态和个性化的内容。然而&#xff0c;数据库和网络应用程序…...

【云原生】k8s中Contrainer 生命周期回调/策略/指针学习

个人主页&#xff1a;征服bug-CSDN博客 kubernetes专栏&#xff1a;kubernetes_征服bug的博客-CSDN博客 目录 1 容器生命周期 2 容器生命周期回调/事件/钩子 3 容器重启策略 4 自定义容器启动命令 5 容器探针 1 容器生命周期 Kubernetes 会跟踪 Pod 中每个容器的状态&am…...

electron+vue3全家桶+vite项目搭建【25】使用electron-updater自动更新应用

文章目录 引入实现效果实现步骤引入依赖配置electron-buidler文件封装版本升级工具类主进程调用版本更新校验渲染进程封装方法调用 测试版本更新 引入 demo项目地址 electron-updater官网 我们不可能每次发布新的版本都让用户去手动下载安装最新的包&#xff0c;而是应用可以…...

SQL 表别名 和 列别名

列表名 列表名之后 order by 可以用别名 也可以用原名&#xff0c; where 中不能用别名的 SQL语句执行顺序&#xff1a; from–>where–>group by -->having — >select --> order 第一步&#xff1a;from语句&#xff0c;选择要操作的表。 第二步&#xff1…...

面试之快速学习c++11-函数模版的默认模版参数,可变模版,tuple

//学习地址&#xff1a; http://c.biancheng.net/view/3730.html 函数模版的默认模版参数 在 C98/03 标准中&#xff0c;类模板可以有默认的模板参数&#xff0c;如下&#xff1a; template <typename T, typename U int, U N 0> struct TestTemplateStruct {};但是…...

Visual Studio Code 常见的配置、常用好用插件以及【vsCode 开发相应项目推荐安装的插件】

一、VsCode 常见的配置 1、取消更新 把插件的更新也一起取消了 2、设置编码为utf-8&#xff1a;默认就是了&#xff0c;不用设置了 3、设置常用的开发字体&#xff1a;Consolas, 默认就是了&#xff0c;不用设置了 字体对开发也很重要&#xff0c;不同字体&#xff0c;字母形…...

源码编译安装gcc

摘要&#xff1a; 在编译开源的FunASR项目的C代码时&#xff0c;可能要求的gcc版本不符合&#xff0c;需要升级gcc版本&#xff0c;但是从网上搜索升级gcc方式&#xff0c;大部分都是通过简单的yum命令方式升级&#xff0c;我也尝试了这个方式&#xff0c;这种方式并不能升级到…...

pc文件上传

1.代码&#xff1a; <template><div><el-upload:multiple"true":auto-upload"true":headers"headers":action"uploadFileUrl":before-upload"handleBeforeUpload":on-error"handleUploadError":o…...

Vue3_对响应式对象解构赋值之后失去响应性

官网toRefs() :响应式 API&#xff1a;工具函数 | Vue.js toRefs 在调用时只会为源对象上可以枚举的属性创建 ref。如果要为可能还不存在的属性创建 ref&#xff0c;请改用 toRef。 setup(){const state reactive({name:"张三"age:14})const stateAsToRefs toRef…...

3d 地球与卫星绕地飞行

1 创建场景 2 创建相机 3 创建地球模型 4 创建卫星中心 5 创建卫星圆环及卫星 6 创建控制器 7 创建渲染器 <template><div class"home3dMap" id"home3dMap"></div> </template><script> import * as THREE from three impo…...

Opencv-C++笔记 (16) : 几何变换 (图像的翻转(镜像),平移,旋转,仿射,透视变换)

文章目录 一、图像平移二、图像旋转2.1 求旋转矩阵2.2 求旋转后图像的尺寸2.3手工实现图像旋转2.4 opencv函数实现图像旋转 三、图像翻转3.1左右翻转3.2、上下翻转3.3 上下颠倒&#xff0c;左右相反 4、错切变换4.1 实现错切变换 5、仿射变换5.1 求解仿射变换5.2 OpenCV实现仿射…...

第十次CCF计算机软件能力认证

第一题&#xff1a;分蛋糕 小明今天生日&#xff0c;他有 n 块蛋糕要分给朋友们吃&#xff0c;这 n 块蛋糕&#xff08;编号为 1 到 n&#xff09;的重量分别为 a1,a2,…,an。 小明想分给每个朋友至少重量为 k 的蛋糕。 小明的朋友们已经排好队准备领蛋糕&#xff0c;对于每个朋…...

【敏捷开发】测试驱动开发(TDD)

测试驱动开发&#xff08;Test-Driven Development&#xff0c;简称TDD&#xff09;是敏捷开发模式中的一项核心实践和技术&#xff0c;也是一种设计方法论。TDD有别于以往的“先编码&#xff0c;后测试”的开发模式&#xff0c;要求在设计与编码之前&#xff0c;先编写测试脚本…...

骑砍二 ATC MOD 使用教程与应用案例解析

骑砍二 ATC MOD 使用教程与应用案例解析 作者&#xff1a;blibli-财不外漏 / NEXUSMODS-PuepleKarmen 案例MOD依赖&#xff1a;ATC - Adonnay’s Troop Changer & AEW - Adonnay’s Exotic Weaponry & New Armor 文本编辑工具&#xff1a;VS Code&#xff08;推荐使用&…...

python和c语言哪个好上手,c语言和python语言哪个难

大家好&#xff0c;本文将围绕python和c语言哪个更值得学展开说明&#xff0c;python语言和c语言哪个简单是一个很多人都想弄明白的事情&#xff0c;想搞清楚c语言和python语言哪个难需要先了解以下几个事情。 前言 新手最容易拿来讨论的三个语言&#xff0c;具体哪个好&#x…...

智能优化算法 | Matlab实现鲸鱼优化算法(Whale Optimization Algorithm)(内含完整源码)

文章目录 效果一览文章概述研究内容源码设计参考资料效果一览 文章概述 智能优化算法 | Matlab实现鲸鱼优化算法(Whale Optimization Algorithm)(内含完整源码) 研究内容 步骤 1:设置鲸鱼数量 N 和算法的最大迭代次数 tmax,初始化位置信息; 步骤 2:计算每条鲸鱼的适应度,…...

eNSP-Cloud(实现本地电脑与eNSP内设备之间通信)

说明&#xff1a; 想象一下&#xff0c;你正在用eNSP搭建一个虚拟的网络世界&#xff0c;里面有虚拟的路由器、交换机、电脑&#xff08;PC&#xff09;等等。这些设备都在你的电脑里面“运行”&#xff0c;它们之间可以互相通信&#xff0c;就像一个封闭的小王国。 但是&#…...

理解 MCP 工作流:使用 Ollama 和 LangChain 构建本地 MCP 客户端

&#x1f31f; 什么是 MCP&#xff1f; 模型控制协议 (MCP) 是一种创新的协议&#xff0c;旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议&#xff0c;它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。 可以把它想象成你的 AI 模型 和想要使用它…...

深入理解JavaScript设计模式之单例模式

目录 什么是单例模式为什么需要单例模式常见应用场景包括 单例模式实现透明单例模式实现不透明单例模式用代理实现单例模式javaScript中的单例模式使用命名空间使用闭包封装私有变量 惰性单例通用的惰性单例 结语 什么是单例模式 单例模式&#xff08;Singleton Pattern&#…...

大语言模型如何处理长文本?常用文本分割技术详解

为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...

MVC 数据库

MVC 数据库 引言 在软件开发领域,Model-View-Controller(MVC)是一种流行的软件架构模式,它将应用程序分为三个核心组件:模型(Model)、视图(View)和控制器(Controller)。这种模式有助于提高代码的可维护性和可扩展性。本文将深入探讨MVC架构与数据库之间的关系,以…...

将对透视变换后的图像使用Otsu进行阈值化,来分离黑色和白色像素。这句话中的Otsu是什么意思?

Otsu 是一种自动阈值化方法&#xff0c;用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理&#xff0c;能够自动确定一个阈值&#xff0c;将图像中的像素分为黑色和白色两类。 Otsu 方法的原…...

Python爬虫(二):爬虫完整流程

爬虫完整流程详解&#xff08;7大核心步骤实战技巧&#xff09; 一、爬虫完整工作流程 以下是爬虫开发的完整流程&#xff0c;我将结合具体技术点和实战经验展开说明&#xff1a; 1. 目标分析与前期准备 网站技术分析&#xff1a; 使用浏览器开发者工具&#xff08;F12&…...

基于Java Swing的电子通讯录设计与实现:附系统托盘功能代码详解

JAVASQL电子通讯录带系统托盘 一、系统概述 本电子通讯录系统采用Java Swing开发桌面应用&#xff0c;结合SQLite数据库实现联系人管理功能&#xff0c;并集成系统托盘功能提升用户体验。系统支持联系人的增删改查、分组管理、搜索过滤等功能&#xff0c;同时可以最小化到系统…...

SiFli 52把Imagie图片,Font字体资源放在指定位置,编译成指定img.bin和font.bin的问题

分区配置 (ptab.json) img 属性介绍&#xff1a; img 属性指定分区存放的 image 名称&#xff0c;指定的 image 名称必须是当前工程生成的 binary 。 如果 binary 有多个文件&#xff0c;则以 proj_name:binary_name 格式指定文件名&#xff0c; proj_name 为工程 名&…...

【Go语言基础【12】】指针:声明、取地址、解引用

文章目录 零、概述&#xff1a;指针 vs. 引用&#xff08;类比其他语言&#xff09;一、指针基础概念二、指针声明与初始化三、指针操作符1. &&#xff1a;取地址&#xff08;拿到内存地址&#xff09;2. *&#xff1a;解引用&#xff08;拿到值&#xff09; 四、空指针&am…...