Python从0到100(三十九):数据提取之正则(文末免费送书)
前言:
零基础学Python:Python从0到100最新最全教程。 想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、 计算机视觉、机器学习、神经网络以及人工智能相关知识,成为学习学习和学业的先行者!
欢迎大家订阅专栏:零基础学Python:Python从0到100最新最全教程!
1 什么是正则表达式
正则表达式是一种文本模式,包括普通字符(例如,字母和数字)以及特殊字符(称为“元字符”)。这些元字符没有文字意义,它们用来定义搜索模式,这个模式可以用来检查一个字符串是否符合我们定义的规则,或者从一个文本中提取出符合规则的子串。
2 正则表达式的常见语法
知识点
- 正则中的字符:普通字符和特殊字符。
- 正则中的预定义字符集:如
\d
匹配任何十进制数字,\w
匹配任何字母数字字符等。 - 正则中的数量词:如
*
(零次或多次),+
(一次或多次),?
(零次或一次)等。
语法示例
.
:匹配任意单个字符(除了换行符)。^
:匹配输入字符串的开始位置。$
:匹配输入字符串的结束位置。[]
:匹配方括号内的任意字符(例如,[abc]
匹配"a"、“b"或"c”)。|
:逻辑或操作符(例如,cat|dog
匹配"cat"或"dog")。()
:将多个表达式组合成一个子表达式,也可以用于捕获匹配的子字符串。
3 re模块的常见方法
方法列表
re.match
:从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功则返回None
。re.search
:扫描整个字符串,搜索第一个位置的匹配。re.findall
:找出字符串中所有匹配的子串,并把它们作为列表返回。re.sub
:替换字符串中的一些子串。re.compile
:编译正则表达式,提高效率。
代码示例
import re# 查找所有数字
result = re.findall(r'\d+', 'chuan 123 zhi 456')
print(result) # 输出: ['123', '456']# 替换数字为下划线
modified_string = re.sub(r'\d', '_', 'chuan 123 zhi 456')
print(modified_string) # 输出: 'chuan _ _ zhi _ _'# 编译正则表达式
pattern = re.compile(r'\d+', re.S)
found = pattern.findall('123 456 789')
print(found) # 输出: ['123', '456', '789']
4 Python中原始字符串r的用法
原始字符串定义
原始字符串(raw string)通过在字符串前加上r
或R
来定义,表示字符串中的反斜杠\
不应该作为转义字符。
代码示例
# 原始字符串与普通字符串的区别
print(r'\n') # 输出: \n
print('\n') # 输出: (换行)# 原始字符串的长度
print(len(r'\n')) # 输出: 2
print(len('\n')) # 输出: 1
5 匹配中文
代码示例
import re# 匹配中文字符
title = u'你好,hello,世界'
pattern = re.compile(ur'[\u4e00-\u9fa5]+')
result = pattern.findall(title)print(result) # 输出: ['你好', '世界']
6 正则表达式的应用场景
- 验证输入(如邮箱、电话号码等格式)
- 搜索和替换文本
- 从日志文件中提取信息
- HTML/XML解析等
正则表达式是文本处理的强大工具,掌握其语法和使用方式对于编程和数据处理非常重要。
好书推荐
ChatGPT+AI文案写作实战108招
《ChatGPT AI文案写作实战108招》通过10个专题内容、108个实用技巧、240多分钟教学视频,讲解了以ChatGPT平台为代表的AI生成文案的方法,具体内容按以下两条线展开。
一是技能线:前3章内容详细讲解了ChatGPT平台的运用、向ChatGP提问的方法和高效提问的使用技巧,让读者从宏观上把握ChatGPT生成文案的技巧。
二是案例线:后7章内容包括6个文案场景和1个综合案例的AI文案生成技巧,分别为办公类文案写作、艺术类文案写作、学术类文案写作、娱乐类文案写作、媒体类文案写作、营销类文案写作和AI写作全流程案例,让读者结合具体的文案场景掌握ChatGPT生成文案的技巧。
本书案例丰富,实战性强,适合对AI文案感兴趣的读者,特别是文案策划者、文案写作人员、电商商家、新媒体编辑、广告策划者、短视频编导、作家和艺术工作者等,也可作为文学、语言、计算机等相关专业的教材。
购买链接:https://product.dangdang.com/29723016.html
编辑推荐
个人简历、会议发言、商业计划书、演讲稿、工作总结……
诗歌、小说、剧本、故事、散文、歌词……
调研报告、调查问卷、读书笔记……
朋友圈文案、个人自传、贺词、祝福语……
新闻稿、公众号文章、豆瓣书评、节目脚本、人物台词……
产品推广文案、测评文案、品牌故事……
各类文案写作,信手拈来!
内容简介
《ChatGPT AI文案写作实战108招》通过10个专题内容、108个实用技巧、240多分钟教学视频,讲解了以ChatGPT平台为代表的AI生成文案的方法,具体内容按以下两条线展开。
一是技能线:前3章内容详细讲解了ChatGPT平台的运用、向ChatGP提问的方法和高效提问的使用技巧,让读者从宏观上把握ChatGPT生成文案的技巧。
二是案例线:后7章内容包括6个文案场景和1个综合案例的AI文案生成技巧,分别为办公类文案写作、艺术类文案写作、学术类文案写作、娱乐类文案写作、媒体类文案写作、营销类文案写作和AI写作全流程案例,让读者结合具体的文案场景掌握ChatGPT生成文案的技巧。
本书案例丰富,实战性强,适合对AI文案感兴趣的读者,特别是文案策划者、文案写作人员、电商商家、新媒体编辑、广告策划者、短视频编导、作家和艺术工作者等,也可作为文学、语言、计算机等相关专业的教材。
作者简介
苏海,资深互联网人士,ChatGPT、文心一言等数据大模型首批使用者;对ChatGPT提问经验丰富,超过10000 组人机互动提问词研究和实战应用;运用ChatGPT进行过各类文案的写作,如办公类文案、艺术类文案、学术类文案、营销类文案等;著有畅销书《活动策划实战宝典:品牌推广 人气打造 实战案例》。
目 录
第1 章 技能入门:熟悉ChatGPT 平台的运用 001
◎ 1.1 掌握ChatGPT 的基本用法002
001 让ChatGPT 生成文案002
002 让ChatGPT 停止生成文案003
003 让ChatGPT 重新生成文案003
004 移动鼠标选择复制文案004
005 单击相应按钮复制文案005
006 输入提示词时进行换行 006
007 改写发送的指令或提示词008
◎ 1.2 掌握ChatGPT 的进阶用法009
008 用ChatGPT 生成各种图表009
009 让ChatGPT 找到合适的图片011
◎ 1.3 管理ChatGPT 的聊天窗口012
010 新建一个聊天窗口 013
前 言
人工智能在响应各行各业需求的呼声中高速发展着,不仅能够解放人们的双手,代替人类进行大量琐碎、重复的体力劳动,而且在不断升级与进化中,也可以助力人们的脑力劳动,AI 生成文案就是一个很好的例子。
ChatGPT 作为生成式AI 的主要代表,在生成文案方面有它的优势,一是通过提示词生成文案,二是联系上下文内容生成文案,这两个优势使得ChatGPT 自发布到应用之际都广受欢迎。
秉承主动识变应变求变,主动防范化解风险的精神,我们致力于探索ChatGPT 生成文案的实际应用,结合不同场景中的文案需求,通过改变提示词, 让ChatGPT 进行文案创作。在探索中,我们发现提示词是ChatGPT 生成文案的关键,因此将提示词的编写方式,即提问技巧,也即ChatGPT 生成文案的技巧, 浓缩为108 招式,汇编成此书,便于读者直接学习并掌握实用技巧,进而抢占AI 文案的高地。
综合来看,本书有以下3 个亮点。
(1)实战干货。本书提供了108 个实用的技巧和实例,涵盖了宏观上的33 招AI 生成文案技巧和微观上的75 招实际场景中的AI 生成文案技巧,让读者实打实地把握ChatGPT 的应用和AI 文案的生成。
(2)优中择优。本书选取了办公类文案写作、艺术类文案写作、学术类文案写作、娱乐类文案写作、媒体类文案写作、营销类文案写作6 大场景文案来介绍AI 生成文案的方法,且每一个案例都提供提问思路和实操技巧,让读者有选择性地、有针对性地高效学习。
(3)物超所值。书中除了介绍AI 生成文案的方法,还随书赠送了108 集教学视频、提示词和效果文件等,让读者学而无忧、学有所得。
本书内容高度凝练,由浅入深,以实战为核心,无论是初学者还是有一定经验的读者,都能够从本书中获益。
特别提示:本书在编写时,是基于ChatGPT-3.5 的界面截取的实际操作图片。需要注意的是,即使是相同的关键词,ChatGPT 每次的回复也会有差别, 因此在扫码观看教学视频时,读者应把更多的精力放在ChatGPT 关键词的编写和实操步骤上。
特别提醒:尽管ChatGPT 具备强大的模拟人类对话的能力,但由于其是基于机器学习的模型,因此在生成的文案中仍然会存在一些语法错误,读者需根据自身需求对文案进行适当修改或再加工后方可使用。
本书由苏海编著,参与编写的人员还有朱霞芳,在此表示感谢。若有与本书相关的问题需要沟通和交流,读者可扫描封底“文泉云盘”二维码获取作者联系方式。
相关文章:

Python从0到100(三十九):数据提取之正则(文末免费送书)
前言: 零基础学Python:Python从0到100最新最全教程。 想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Pyth…...

redis redisson(仅供自己参考)
redis 通过setnx实现的分布式锁有问题 如图: 解决的新的工具为(闪亮登场):redisson redisson可重入锁的原理 实现语言lua: 加锁实现脚本语言: 释放锁的脚本语言: 加锁的lua -- 首先判断这个锁…...

【C语言初阶】探索编程基础:深入理解分支与循环语句的奥秘
📝个人主页🌹:Eternity._ ⏩收录专栏⏪:C语言 “ 登神长阶 ” 🤡往期回顾🤡:C语言入门 🌹🌹期待您的关注 🌹🌹 ❀分支与循环语句 📒1.…...

ERP基础知识
ERP 一、概述 ERP是Event-related Potentials的简称。外加一种特定的刺激,作用于感觉系统或脑 的某一部位,在给予刺激或撤销刺激时,或和当某种心理因素出现时在脑区所产生的电位变化,成为事件相关电位,是一种特殊…...
C++是否可以使用.获取union、struct中的成员变量的地址
C可以使用.获取union、struct中的成员变量的地址 示例代码如下所示 #include <stdio.h> #include <stdint.h>struct u128 { uint64_t v64; uint64_t v0; };int main() {union { unsigned __int128 ui; struct u128 s; } union_temp_m128;void* p1 &union_te…...

【前端】包管理器:npm、Yarn 和 pnpm 的全面比较
前端开发中的包管理器:npm、Yarn 和 pnpm 的全面比较 在现代前端开发中,包管理器是开发者必不可少的工具。它们不仅能帮我们管理项目的依赖,还能极大地提高开发效率。本文将详细介绍三种主流的前端包管理器:npm、Yarn 和 pnpm&am…...

C++ 类和对象 赋值运算符重载
前言: 在上文我们知道数据类型分为自定义类型和内置类型,当我想用内置类型比较大小是非常容易的但是在C中成员变量都是在类(自定义类型)里面的,那我想给类比较大小那该怎么办呢?这时候运算符重载就出现了 一 运算符重载概念&…...
【Python实战因果推断】35_双重差分6
目录 Strict Exogeneity No Time Varying Confounders No Feedback No Carryover and No Lagged Dependent Variable Strict Exogeneity 严格的外生性假设是一个相当技术性的假设,通常用固定效应模型的残差来表示: 严格的异质性说明: 这…...

【HarmonyOS】关于官方推荐的组件级路由Navigation的心得体会
前言 最近因为之前的630版本有点忙,导致断更了几天,现在再补上。换换脑子。 目前内测系统的华为应用市场,各种顶级APP陆续都放出来beta版本了,大体上都完成了主流程的开发。欣欣向荣的气息。 学习思路 关于学习HarmonyOS的问题…...
Spring中事件监听器
实现ApplicationListener接口 Configuration public class A48 {public static void main(String[] args) {AnnotationConfigApplicationContext context new AnnotationConfigApplicationContext(A48.class);context.getBean(MyService.class).doBusiness();context.close()…...

案例|LabVIEW连接S7-1200PLC
附带: 写了好的参考文章: 通讯测试工具和博图仿真机的连接教程【内含图文完整过程软件使用】 解决博图V15 V16 V17 V18等高版本和低版本在同款PLC上不兼容的问题 目录 前言一、准备条件二、步骤1. HslCommunicationDemo问题1:连接失败?问题…...

正点原子STM32(基于HAL库)6
目录 TFTLCD(MCU 屏)实验TFTLCD 简介TFTLCD 简介液晶显示控制器FSMC 简介FSMC 关联寄存器简介 硬件设计程序设计FSMC 和SRAM 的HAL 库驱动程序流程图程序解析 下载验证 LTDC LCD(RGB 屏)实验RGBLCD<DC 简介RGBLCD 简介LTDC 简介…...
flutter Android端权限
flutter 中权限请求path_provider Android 6.0 - 10.0 (API level 23 - 29)Android 11 (API level 30)具体实现示例注意事项 在 Flutter 中使用 path_provider 插件获取除本应用外所有的 PDF 文件,对于不同的 Android 版本(从 Android 6.0 到 Android 14…...

ant design form动态增减表单项Form.List如何进行动态校验规则
项目需求: 在使用ant design form动态增减表单项Form.List时,Form.List中有多组表单项,一组中的最后一个表单项的校验规则是动态的,该组为最后一组时,最后一个表单项是非必填项,其他时候为必填项。假设动态…...

7.16做题总结
今日也是让我看到了繁神的ACM历程,确实,我觉得繁神的历程里面确实有一句很好 不想打算法竞赛了。这是因为有别的事情要做,不是因为我打不动。 不想打比赛凌晨两点才睡了。因为我会困。 不想在群里和高水平选手水群了,因…...

unity使用 MQTT复现plant simulate仿真
unity使用 MQTT复现plant simulate仿真 一、plant simulate端配置 1、plant simulate MQTT组件配置,该组件在类库的信息流类目下,端口不变,填写ip即可; 2、设备配置界面,在控件入口和出口处各挂一个脚本,…...

MATLAB激光通信和-积消息传递算法(Python图形模型算法)模拟调制
🎯要点 🎯概率论和图论数学形式和图结构 | 🎯数学形式、图结构和代码验证贝叶斯分类器算法:🖊多类型:朴素贝叶斯,求和朴素贝叶斯、高斯朴素贝叶斯、树增强贝叶斯、贝叶斯网络增强贝叶斯和半朴素…...

初识HTML
一 HTML HTML(Hyper Text Markup Language),超⽂本标记语⾔.超文本:⽐⽂本要强⼤.通过链接和交互式⽅式来组织和呈现信息的⽂本形式.不仅仅有⽂本,还可能包含图⽚,⾳频,或者⾃已经审阅过它的学者所加的评注、补充或脚注等等.标记语言:由标签构成的语⾔。 1.HTML代码是由“标签…...

基于Rspack实现大仓应用构建提效实践|得物技术
一、实践背景 随着项目的逐步迭代,代码量和依赖的逐渐增长,应用的构建速度逐步进入缓慢期。以目前所在团队的业务应用来看(使用webpack构建),应用整体构建耗时已经普遍偏高,影响日常开发测试的使用效率&am…...

什么是MOW,以bitget钱包为例
元描述:MOW凭借其富有创意的故事情节和广阔的潜力在Solana上脱颖而出。本文深入探讨了其独特的概念和光明的未来。 Mouse in a Cats World (MOW)是一个基于Solana区块链的创新meme项目,它重新构想了一个异想天开且赋予权力的故事。在这个奇幻的宇宙中&am…...
后进先出(LIFO)详解
LIFO 是 Last In, First Out 的缩写,中文译为后进先出。这是一种数据结构的工作原则,类似于一摞盘子或一叠书本: 最后放进去的元素最先出来 -想象往筒状容器里放盘子: (1)你放进的最后一个盘子(…...

使用VSCode开发Django指南
使用VSCode开发Django指南 一、概述 Django 是一个高级 Python 框架,专为快速、安全和可扩展的 Web 开发而设计。Django 包含对 URL 路由、页面模板和数据处理的丰富支持。 本文将创建一个简单的 Django 应用,其中包含三个使用通用基本模板的页面。在此…...

Qt/C++开发监控GB28181系统/取流协议/同时支持udp/tcp被动/tcp主动
一、前言说明 在2011版本的gb28181协议中,拉取视频流只要求udp方式,从2016开始要求新增支持tcp被动和tcp主动两种方式,udp理论上会丢包的,所以实际使用过程可能会出现画面花屏的情况,而tcp肯定不丢包,起码…...

YSYX学习记录(八)
C语言,练习0: 先创建一个文件夹,我用的是物理机: 安装build-essential 练习1: 我注释掉了 #include <stdio.h> 出现下面错误 在你的文本编辑器中打开ex1文件,随机修改或删除一部分,之后…...

CentOS下的分布式内存计算Spark环境部署
一、Spark 核心架构与应用场景 1.1 分布式计算引擎的核心优势 Spark 是基于内存的分布式计算框架,相比 MapReduce 具有以下核心优势: 内存计算:数据可常驻内存,迭代计算性能提升 10-100 倍(文档段落:3-79…...

STM32标准库-DMA直接存储器存取
文章目录 一、DMA1.1简介1.2存储器映像1.3DMA框图1.4DMA基本结构1.5DMA请求1.6数据宽度与对齐1.7数据转运DMA1.8ADC扫描模式DMA 二、数据转运DMA2.1接线图2.2代码2.3相关API 一、DMA 1.1简介 DMA(Direct Memory Access)直接存储器存取 DMA可以提供外设…...
工程地质软件市场:发展现状、趋势与策略建议
一、引言 在工程建设领域,准确把握地质条件是确保项目顺利推进和安全运营的关键。工程地质软件作为处理、分析、模拟和展示工程地质数据的重要工具,正发挥着日益重要的作用。它凭借强大的数据处理能力、三维建模功能、空间分析工具和可视化展示手段&…...
macOS多出来了:Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用
文章目录 问题现象问题原因解决办法 问题现象 macOS启动台(Launchpad)多出来了:Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用。 问题原因 很明显,都是Google家的办公全家桶。这些应用并不是通过独立安装的…...
Element Plus 表单(el-form)中关于正整数输入的校验规则
目录 1 单个正整数输入1.1 模板1.2 校验规则 2 两个正整数输入(联动)2.1 模板2.2 校验规则2.3 CSS 1 单个正整数输入 1.1 模板 <el-formref"formRef":model"formData":rules"formRules"label-width"150px"…...

九天毕昇深度学习平台 | 如何安装库?
pip install 库名 -i https://pypi.tuna.tsinghua.edu.cn/simple --user 举个例子: 报错 ModuleNotFoundError: No module named torch 那么我需要安装 torch pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple --user pip install 库名&#x…...