python程序设计员—练习笔记
目录
基础处理
- 字符串
- 列表
- 字典
- 运算符
- 正则表达式re库
- requests
- Beautiful Soup
- jieba库
- 分词模式
- 基于TF-IDF算法的关键词提取
- 基于TextRank算法的关键词提取
- pandas 打开有多个表的.xlsx文件
基础处理
字符串
- str_ = str_.lower()
- lower()函数:将字符中的大写字母转换成小写字母。
- str_ = str_.upper()
- upper()函数:将字符中的小写字母转换成大写字母。
- str_ = str_.replace("要被替换的字符","替换后的字符")
- 替换字符串
- str_ = str_.strip()
删除字符串前后的空格或字符
- str_ = str_.count()
- 统计某字符在字符串中的个数
- str_ = str_.split()
- 以指定字符分割
- str_.isalpha()
- 用于判断字符中是否只包含英文和中文字符,如果字符串至少有一个字符且所有字符都是字母,则返回 True,否则返回 False。
- 判断中文字符,用编码格式匹配。
- 判断字符中所有都是中文,有一个英文都返回False。
num = "python炒粉,为生活添砖java"if "\u4e00" <= num <= "\u9fff":print(True) else:print(False)提取字符中的非中文字符。
num = "python炒粉,为生活添砖java"jg = "" for i in num:if "\u4e00" <= i <= "\u9fff":#是中文就pass掉passelse:#不是中文就添加jg += i #返回:"python,java" print(jg)
列表
- list_.remove()
- .remove():函数可以删除列表中第一个指定的值。
- list_ = list_[::-1]
- 用索引反转列表
- list_.insert(要插入的位置的索引,要插入的内容)
- 向列表插入值
- list_ = list_.pop()
- 默认移除列表最后一个元素。
- 如果提供索引,则移除指定索引的元素。
字典
- 向字典插入值
如:dict_[ "键" ] = "插入的值"
- 提取字典的值
- dict_.get("要提取值的键")
- 字典的排序:sorted()函数
- 如下:
my_dict = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2} sorted_dict_by_values = dict(sorted(my_dict.items(), key=lambda item: item[1])) print(sorted_dict_by_values) # 输出: {'pear': 1, 'orange': 2, 'banana': 3, 'apple': 4}- 倒叙排序:reverse=True
运算符
" // ":两数相除,向下取整,取两数相除后的整数部分。
如:3 // 2 结果为:1
5 // 2 结果为:2
" % ":取模运算,两数相除后的余数。
如:7 % 2 结果为:1
3 % 2 结果为:1
- pow(x,y,z)
- 其中
x是底数,y是指数。这个函数返回x的y次幂- 其中
x是底数,y是指数,而z是模数。这个函数返回(x**y) % z的结果,即x的y次幂对z取模的结果。这种用法在计算大数的幂并对某个数取模时非常有用,因为它可以避免中间结果过大而导致的溢出问题。
正则表达式re库
- re.search()
- 在字符中找到第一次搜索出的正则表达式模式,若为找到则返回None。
- re.findall("正则表达式" , 要匹配的字符串)
- 在字符串中找到正则表达式所匹配的所有子串, 返回列表。
- re.sub()
- 正则表达式替换匹配的字符串
requests
发送请求
#传入url链接
url = "XXX"#向网站发送请求
#请求成功时状态为:200
resp = requests.get(url)#转换编码格式
#常用的编码格式:"utf-8","gbk"
resp.encoding = "utf-8"#将返回转换成文本
resp = resp.text
Beautiful Soup
将文本转换成Beautiful Soup的对象
soup = BeautifulSoup( 文本 ,"html.parser")
- soup.find("标签" , 属性="xxx")
- 匹配第一个符合条件的值。
- ##注意匹配class属性时,要将"class"属性写成 "class_" 因为"class"时python的关键词。
- soup.find_all("标签" , 属性="xxx")
- 匹配所有符合条件的值。
- 提取标签的属性
- soup[ " title " ]
jieba库
分词模式
1.精确模式
- 精确模式是将文本按照最大概率进行切分,效果较好。
- 使用方法:jieba.cut(sentence),返回一个可迭代的分词结果。
2.全模式
- 全模式将文本中所有可能的词语都切分出来,可能存在冗余。
- 使用方法:jieba.cut(sentence, cut_all=True),返回一个可迭代的分词结果。
3.搜索引擎模式
- 搜索引擎模式根据词语的位置进行切分,适合搜索引擎分词。
- 使用方法:jieba.cut_for_search(sentence),返回一个可迭代的分词结果。
- jieba.luct()
- 这个函数回返回一个分词后的列表。
基于TF-IDF算法的关键词提取
- jieba库提供了基于TF-IDF算法的关键词提取方法jieba.analyse.extract_tags
(sentence, topK=10),用于从文本中提取关键词。 topK:参数指定返回的关键词数量,默认为10。
基于TextRank算法的关键词提取
- jieba库还提供了基于TextRank算法的关键词提取方法:
jieba.analyse.textrank(sentence, topK=10,withWeight=False, allowPOS=("ns", "n", "vn", "v"))sentence:是要提取关键词的文本topK:参数指定返回的关键词数量,默认为10。withWeight:表示是否返回关键词的权重值(默认为False)allowPOS:表示仅包括指定词性的词(默认为名词、动词等)
pandas 打开有多个表的.xlsx文件
- df = pd.read_excel('path_to_excel_file.xlsx', sheet_name=None)
- 设置sheet_name参数为None
- 打开指定的表:df["表名"]
相关文章:
python程序设计员—练习笔记
目录 基础处理 字符串列表字典运算符正则表达式re库requestsBeautiful Soupjieba库分词模式基于TF-IDF算法的关键词提取 基于TextRank算法的关键词提取pandas 打开有多个表的.xlsx文件 基础处理 字符串 str_ str_.lower()lower()函数:将字符中的大写字母转换成小…...
1.DBeaver连接hive数据库
1.hive开启远程服务,linux中直接输入:hiveserver2 2.解压dbeaver和hive-jdbc-2.1.1.zip 3.双击打开 4.数据库,新建连接 5.搜索hive 6.配置参数 7.编辑驱动设置 8.添加jar包 9.测试连接 10.右击,新建sql编辑器 11.执行sql 12.调整字…...
CODESYS随机动态图案验证码制作详细案例(三)
#使用CODESYS软件模仿网页端动态图案验证码的制作详细案例# 前言: 通过上篇图案验证码的实际测试,我们已经完成了该案例的制作,但是在项目应用中,我们想对该功能直接调用,就需要将具有一定功能的程序代码或可视化进行封装成库文件。我们熟知,CODESYS有丰富的库文件,有…...
NodeJS 使用百度翻译API
在大数据处理中,经常需要大批量地翻译短小的文字,使用在线翻译平台的API 调用能够大幅度提高效率。 最近尝试了一下。 第一步在百度翻译开放平台注册 百度翻译开放平台 (baidu.com) 申请APPID 和SECRET加密码 源代码(mjs) …...
摩熵数科数据产品阵容BCPM
摩熵数科基本介绍 摩熵数科(成都)医药科技有限公司BCPMdata Pharma Technology (Chengdu)Co.,Ltd以“探索生命科学数据本源,构建全产业链数据应用生态”为愿景,致力于成为生命科学领域全球领先的数据系统与…...
ros2 .idl文件生成C、C++代码
一、包目录结构 rosidl_generator_c 依赖rosidl_cmake、rosidl_typesupport_interface、ament_index_python、rosidl_parser rosidl_generator_cpp 依赖 rosidl_parser、rosidl_runtime_cpp、rosidl_generator_c rosidl_parser :The parser for .idl ROS interfa…...
scrapy的xpath在控制台可以匹配,但是到了代码无法匹配(无法匹配tbody标签)
问题 使用xpath-helper可以匹配到,然后scrapy却无法 然后写入html来看看 发现根本就没有tbody,太可恶了 解决 方法1 不使用tbody就可以 方法2 使用或运算符 | big_list response.xpath("//div[classChannelClasssNavContent]/table/tbody/tr[1]/td/table/tbody/t…...
OpenCL内存模型
OpenCL将内存划分成主机内存和设备内存。主机内存可在主机上使用,其并不在OpenCL的定义范围内。使用对应的OpenCL API可以进行主机和设备的数据传输,或者通过共享虚拟内存接口进行内存共享。而设备内存,指定是能在执行内核中使用的内存空间。…...
Commvault Cloud如何改变网络弹性游戏规则?
近段时间有点被Commvault与AWS“刷屏”了:9月,Commvault宣布将收购AWS关键云数据保护领域技术领导者Clumio公司;10月,Commvault宣布将在AWS上推出Commvault Cloud网络弹性平台。 种种偶然背后往往隐藏着必然。作为混合云网络弹性和…...
echarts环形饼图自定义边框、标题及图例
目录 1、官网找示例 2、初步改造有个雏形 3、细节改造和优化 4、全部代码 5、原始效果和最终效果对比 看下效果图,和普通的饼图很明显的区别就是: 1有明显的白色边框线 2圆环中心自定义内容标题 3需要设置图例位置与内容 我通常的实现思路就是官网找例子再一步一步改…...
Android SELinux——上下文Context源码(十)
通过前面的文章我们知道,SELinux 中的上下文(contexts)包含很多类型,这里我们就来看看Androd 源码中 上下文 SELinux Contexts 的代码结构。 一、Contexts源码 源码位置:/system/sepolicy/private 1、file_contexts file_contexts 文件用于定义系统中各个文件和…...
责任链模式下,解决开闭原则问题实践
前言 在现代软件工程中,设计模式是解决常见问题的有效工具之一。它们吸收了前人的经验,不仅帮助开发者编写更清晰、更可维护的代码,还能促进团队之间的沟通和协作。责任链模式(Chain of Responsibility Pattern)作为一…...
对Android的Binder机制的了解
Android的Binder机制详解 Android的Binder机制是Android系统中用于进程间通信(IPC)的核心机制,它提供了一种高效、安全、稳定的进程间通信方式。以下将对Binder机制的基本概念、工作原理、应用场景、优势以及实现细节进行详细的阐述。 一、…...
收藏文章_VMware17Pro虚拟机安装教程(超详细)
收藏文章: VMware17Pro虚拟机安装教程(超详细) VMware虚拟机安装Linux教程(超详细)...
友思特分享 | 车载同步技术创新:多相机系统如何实现精准数据采集与实时处理?
导读 车载多相机采集系统是智能驾驶技术实际应用中的“眼睛”,友思特车载图像采集和回放系统切实提升了系统的实时同步采集与回放能力,为ADAS等应用的决策系统提供了可靠的核心数据。 视频流同步采集与智驾技术发展 在现代汽车行业中,智能驾…...
grafana failed to load dashboard from file= ... json error=EOF
问题描述 使用 prometheus-community/kube-prometheus-stack helm chart 部署 prometheus 监控后,查看 grafana pod 有如下报错 logger=provisioning.dashboard type=file name=default t=2024-10-17T06:30:47.937121541Z level=error msg...
【前端学习】AntV G6-09 复杂的自定义边、边动画
课程视频 AntV G6:复杂的自定义边、边动画(上)_哔哩哔哩_bilibili AntV G6:复杂的自定义边、边动画(下)_哔哩哔哩_bilibili 讲义截图 提及链接 https://codesandbox.io/p/sandbox/register-polyline-get…...
极狐GitLab 发布安全补丁版本 17.4.2, 17.3.5, 17.2.9
本分分享极狐GitLab 补丁版本 17.4.2, 17.3.5, 17.2.9 的详细内容。 极狐GitLab 正式推出面向 GitLab 老旧版本免费用户的专业升级服务,为 GitLab 老旧版本进行专业升级,详情可以查看官网 GitLab 专业升级服务指南 今天,极狐GitLab 专业技术…...
MATLAB智能算法 - Immunity Algorithm免疫算法
Immunity Algorithm免疫算法 智能算法是路线规划、深度学习等等一系列领域所使用的优化算法,是算法进阶之路的必备之路。 前言:本文主要围绕解决TSP旅行商问题展开,对于机器人的路线规划以及非线性方程求解的问题等解决方案 对于一些其他智能…...
学习eNSP对提升就业竞争力有多大帮助?
学习eNSP(Enterprise Network Simulation Platform)对提升就业竞争力有显著帮助,具体表现在以下几个方面: 1. **增强专业技能**:通过eNSP,你可以模拟华为的网络设备,进行网络设计、配置和故障排…...
谷歌浏览器插件
项目中有时候会用到插件 sync-cookie-extension1.0.0:开发环境同步测试 cookie 至 localhost,便于本地请求服务携带 cookie 参考地址:https://juejin.cn/post/7139354571712757767 里面有源码下载下来,加在到扩展即可使用FeHelp…...
Redis相关知识总结(缓存雪崩,缓存穿透,缓存击穿,Redis实现分布式锁,如何保持数据库和缓存一致)
文章目录 1.什么是Redis?2.为什么要使用redis作为mysql的缓存?3.什么是缓存雪崩、缓存穿透、缓存击穿?3.1缓存雪崩3.1.1 大量缓存同时过期3.1.2 Redis宕机 3.2 缓存击穿3.3 缓存穿透3.4 总结 4. 数据库和缓存如何保持一致性5. Redis实现分布式…...
【磁盘】每天掌握一个Linux命令 - iostat
目录 【磁盘】每天掌握一个Linux命令 - iostat工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景 注意事项 【磁盘】每天掌握一个Linux命令 - iostat 工具概述 iostat(I/O Statistics)是Linux系统下用于监视系统输入输出设备和CPU使…...
在 Nginx Stream 层“改写”MQTT ngx_stream_mqtt_filter_module
1、为什么要修改 CONNECT 报文? 多租户隔离:自动为接入设备追加租户前缀,后端按 ClientID 拆分队列。零代码鉴权:将入站用户名替换为 OAuth Access-Token,后端 Broker 统一校验。灰度发布:根据 IP/地理位写…...
CMake 从 GitHub 下载第三方库并使用
有时我们希望直接使用 GitHub 上的开源库,而不想手动下载、编译和安装。 可以利用 CMake 提供的 FetchContent 模块来实现自动下载、构建和链接第三方库。 FetchContent 命令官方文档✅ 示例代码 我们将以 fmt 这个流行的格式化库为例,演示如何: 使用 FetchContent 从 GitH…...
k8s业务程序联调工具-KtConnect
概述 原理 工具作用是建立了一个从本地到集群的单向VPN,根据VPN原理,打通两个内网必然需要借助一个公共中继节点,ktconnect工具巧妙的利用k8s原生的portforward能力,简化了建立连接的过程,apiserver间接起到了中继节…...
LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf
FTP 客服管理系统 实现kefu123登录,不允许匿名访问,kefu只能访问/data/kefu目录,不能查看其他目录 创建账号密码 useradd kefu echo 123|passwd -stdin kefu [rootcode caozx26420]# echo 123|passwd --stdin kefu 更改用户 kefu 的密码…...
Unity UGUI Button事件流程
场景结构 测试代码 public class TestBtn : MonoBehaviour {void Start(){var btn GetComponent<Button>();btn.onClick.AddListener(OnClick);}private void OnClick(){Debug.Log("666");}}当添加事件时 // 实例化一个ButtonClickedEvent的事件 [Formerl…...
Ubuntu系统复制(U盘-电脑硬盘)
所需环境 电脑自带硬盘:1块 (1T) U盘1:Ubuntu系统引导盘(用于“U盘2”复制到“电脑自带硬盘”) U盘2:Ubuntu系统盘(1T,用于被复制) !!!建议“电脑…...
认识CMake并使用CMake构建自己的第一个项目
1.CMake的作用和优势 跨平台支持:CMake支持多种操作系统和编译器,使用同一份构建配置可以在不同的环境中使用 简化配置:通过CMakeLists.txt文件,用户可以定义项目结构、依赖项、编译选项等,无需手动编写复杂的构建脚本…...
