基础库正则表达式
我们已经可以用requests 库来获取网页的源代码,得到 HTML 代码。但我们真正想要的数据是包含在 HTML代码之中的,要怎样才能从 HTML,代码中获取想要的信息呢?正则表达式就是其中一个有效的方法。
本篇博客我们将了解一下正则表达式的相关用法。正则表达式是用来处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。
当然,对于爬虫来说,有了它,从HTML里提取想要的信息就非常方便了。
实例引入
说了这么多,可能我们对正则表达式到底是什么还是比较模糊,下面就用几个实例来看一下它的用法。
打开开源中国提供的正则表达式测试工具,输人待匹配的文本,然后选择常用的正则表达式,就可以得出相应的匹配结果了。例如,这里输入如下待匹配的文本:
Hello, my phone number is 010-86432100 and email is cqc@cuigingcai.com, and my website is https://cuigingcai.com
这段字符串中包含一个电话号码、一个 E-mai 地址和一个 URL,接下来就尝试用正则表达式将这些内容提取出来。
在网页右侧选择“匹配 Email 地址”,就可以看到下方出现了文本中的 E-mail,如下图所示。
如果选择“匹配网址 URL”,可以看到下方出现了文本中的 URL,如下图所示:
是不是非常神奇?
其实,这里就是用了正则表达式匹配,也就是用一定的规则将特定文本提取出来。例如,E-mail地址的开头是一段字符串,然后是一个@符号,最后是某个域名,这是有特定的组成格式的。另外,对于 URL,开头是协议类型,然后是冒号加双斜线,最后是域名加路径。
对于 URL来说,可以用下面的正则表达式匹配。
[a-zA-z]+://[^\s]*
用这个正则表达式去匹配一个字符串,如果这个字符串中包含类似 URL的文本,那么这部分就会被提取出来。
正则表达式看上去虽然是乱糟糟的一团,但里面其实是有特定语法规则的。例如,a-z 代表匹配任意的小写字母,\代表匹配任意的空白字符,*代表匹配前面的任意多个字符,那一长串正则表达式就是这么多匹配规则的组合。
写好正则表达式后,就可以拿它去一个长字符串里匹配查找了。不论这个字符串里面有什么,只要符合我们写的规则,统统可以找出来。对于网页来说,如果想找出网页源代码里有多少 URL,只要用匹配 URL的正则表达式去匹配即可,
上面我们介绍了几个匹配规则,下表列出了常用的一些匹配规则。
看完这个表之后,可能有点晕晕的吧,不用担心,后面我们会详细讲解一些常见规则的用法。其实正则表达式并非 Python独有,它也可以用在其他编程语言中。但是 Python 的re 库提供了整个正则表达式的实现,利用这个库,可以在 Python 中方便地使用正则表达式。用 Python 编写正则表达式时几乎都会使用这个库,下面就来了解它的一些常用方法。
match
这里首先介绍第一个常用的匹配方法—match,向它传人要匹配的字符串以及正则表达式,就可以检测这个正则表达式是否和字符串相匹配。
match方法会尝试从字符串的起始位置开始匹配正则表达式,如果匹配,就返回匹配成功的结果;如果不匹配,就返回 None。实例如下:
import recontent = 'Hello 123 4567 World_This is a Regex Demo'
print(len(content))
result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}', content)
print(result)
print(result.group())
print(result.span())
运行结果如下:
41
<re.Match object; span=(0, 25), match='Hello 123 4567 World_This'>
Hello 123 4567 World_This
(0, 25)
这个实例首先声明了一个字符串,其中包含英文字母、空白字符、数字等。接着写了一个正则表达式:
^Hello\s\d\d\d\s\d{4}\s\w{10}
用它来匹配声明的那个长字符串。开头的^表示匹配字符串的开头,也就是以 He1lo 开头;然后\s 表示匹配空白字符,用来匹配目标字符串里 He1l0 后面的空格;\d 表示匹配数字,3 个 \d 用来匹配 123;紧接着的1个\s表示匹配空格:目标字符串的后面还有 4567,我们其实依然可以用4个\d来匹配,但是这么写比较烦琐,所以可以用\d后面跟{4}的形式代表匹配4次数字;后面又是1个空白字符,最后\w{10}则表示匹配 10个字母及下划线。我们注意到,这里其实并没有把目标字符串匹配完,不过这样依然可以进行匹配,只是匹配结果短一点而已。
在 match 方法中,第一个参数是传人了正则表达式,第二个参数是传人了要匹配的字符串。
将输出结果打印出来,可以看到结果是SRE Match 对象,证明匹配成功。该对象包含两个方法:group 方法可以输出匹配到的内容,结果是Hell01234567 World This,这恰好是正则表达式按照规则匹配的内容;span 方法可以输出匹配的范围,结果是(0,25),这是匹配到的结果字符串在原字符串中的位置范围。
通过上面的例子,我们基本了解了如何在 Python 中使用正则表达式来匹配一段文字。
- 匹配目标
用 match方法可以实现匹配,如果想从字符串中提取一部分内容,该怎么办呢?就像上一节的实例一样,从一段文本中提取出E-mail 地址或电话号码。
可以使用括号()将想提取的子字符串括起来。()实际上标记了一个子表达式的开始和结束位置,被标记的每个子表达式依次对应每个分组,调用group方法传人分组的索引即可获取提取结果。实例如下:
import recontent = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^Hello\s(\d+)\sWorld', content)
print(result)
print(result.group())
print(result.group(1))
print(result.span())
通过这个实例,我们把字符串中的 1234567提取出来了,可以看到其中数字部分的正则表达式被()括了起来。然后调用 group(1)获取了匹配结果。
运行结果如下:
<re.Match object; span=(0, 19), match='Hello 1234567 World'>
Hello 1234567 World
1234567
(0, 19)
可以看到,我们成功得到了 1234567。这里用的是 group(1),它与 group()有所不同,后者会输出完整的匹配结果,前者会输出第一个被()包围的匹配结果。假如正则表达式后面还有用()包围的内容,那么可以依次用 group(2)、group(3)等获取。
- 通用匹配
刚才我们写的正则表达式其实比较复杂,只要出现空白字符就需要写\s 匹配,出现数字就需要写 \d匹配,这样的工作量非常大。其实完全没必要这么做,因为还有一个万能匹配可以用,就是.*其中,可以匹配任意字符(除换行符),*代表匹配前面的字符无限次,所以它们组合在一起就可以匹配任意字符了。有了它,我们就不用挨个字符进行匹配了。
接着上面的例子,我们利用.*改写一下正则表达式:
import recontent = 'Hello 123 4567 World_This is a Regex Demo'
result = re.match('^Hello.*Demo$', content)
print(result)
print(result.group())
print(result.span())
这里我们直接省略中间部分,全部用.*来代替,并在最后加一个结尾字符串。运行结果如下:
<re.Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>
Hello 123 4567 World_This is a Regex Demo
(0, 41)
可以看到,group 方法输出了匹配的全部字符串,也就是说我们写的正则表达式匹配到了目标字符串的全部内容;span 方法输出(0,41),这是整个字符串的长度。
因此,使用.*能够简化正则表达式的书写。
- 贪婪与非贪婪
使用通用匹配.*匹配到的内容有时候并不是我们想要的结果。看下面的例子:
import recontent = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^He.*(\d+).*Demo$', content)
print(result)
print(result.group(1))
这里我们依然想获取目标字符串中间的数字,所以正则表达式中间写的依然是(\d+)。而数字两侧由于内容比较杂乱,所以想省略来写,于是都写成.。最后,组成 ^He.(\d+).*Demo$,看样子没什么问题。可我们看下运行结果:
<re.Match object; span=(0, 40), match='Hello 1234567 World_This is a Regex Demo'>
7
奇怪的事情发生了,只得到了7这个数字,这是怎么回事?
这里涉及贪婪匹配和非贪婪匹配的问题。在贪婪匹配下,.*会匹配尽可能多的字符。正则表达式中.*后面是 \d+,也就是至少一个数字,而且没有指定具体几个数字,因此,.*会匹配尽可能多的字符,这里就把 123456 都匹配了,只给\d+ 留下一个可满足条件的数字7,因此最后得到的内容就只有数字 7。
但这很明显会给我们带来很大的不便。有时候,匹配结果会莫名其妙少一部分内容。其实,这里只需要使用非贪婪匹配就好了。非贪婪匹配的写法是.*?,比通用匹配多了一个 ?,那么它可以起到怎样的效果?我们再用实例看一下:
import recontent = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^He.*?(\d+).*Demo$', content)
print(result)
print(result.group(1))
这里我们只是将第一个.改成了.?,贪婪匹配就转变为了非贪婪匹配。结果如下:
<re.Match object; span=(0, 40), match='Hello 1234567 World_This is a Regex Demo'>
1234567
此时便可以成功获取 1234567了。原因可想而知,贪婪匹配是匹配尽可能多的字符,非贪婪匹配就是匹配尽可能少的字符。当.?匹配到 Hel10后面的空白字符时,再往后的字符就是数字了,而\d+恰好可以匹配,于是这里.?就不再进行匹配了,而是交给 \d+ 去匹配。最后.*?匹配了尽可能少的字符,\d+的结果就是 1234567。
所以说,在做匹配的时候,字符串中间尽量使用非贪婪匹配,也就是用.?代替.,以免出现匹配结果缺失的情况。
但这里需要注意,如果匹配的结果在字符串结尾,.*?有可能匹配不到任何内容了,因为它会匹配尽可能少的字符。例如:
import recontent = 'http://weibo.com/comment/kEraCN'
result1 = re.match('http.*?comment/(.*?)', content)
result2 = re.match('http.*?comment/(.*)', content)
print('result1', result1.group(1))
print('result2', result2.group(1))
运行结果如下:
result1
result2 kEraCN
可以观察到,.*?没有匹配到任何结果,而.*则是尽量多匹配内容,成功得到了匹配结果。
- 修饰符
在正则表达式中,可以用一些可选标志修饰符来控制匹配的模式。修饰符被指定为一个可选的标志。我们用实例来看一下:
import recontent = ('''Hello 1234567 World_This is a Regex Demo''')
result = re.match('^He.*?(\d+).*?Demo$', content)
print(result)
print(result.group(1))
和上面的例子相仿,我们在字符串中加了换行符,正则表达式还是一样的,用来匹配其中的数字。看一下运行结果:
Traceback (most recent call last):File "D:\projects\scrapy-demo\test.py", line 7, in <module>print(result.group(1))
AttributeError: 'NoneType' object has no attribute 'group'
None
发现运行直接报错,也就是说正则表达式没有匹配到这个字符串,返回结果为None,而我们又调用了 group 方法,导致 AttributeError。
那么,为什么加了一个换行符,就匹配不到了呢?这是因为匹配的内容是除换行符之外的任意字符,当遇到换行符时,.*?就不能匹配了,所以导致匹配失败。这里只需加一个修饰符 re.s,即可修正这个错误:
import recontent = ('''Hello 1234567 World_This is a Regex Demo''')
result = re.match('^He.*?(\d+).*?Demo$', content, re.S)
print(result)
print(result.group(1))
这个修饰符的作用是使匹配内容包括换行符在内的所有字符。此时运行结果如下:
<re.Match object; span=(0, 52), match='Hello 1234567 World_This \n is a Regex >
1234567
这个 re.S 在网页匹配中经常用到。因为 HTML节点经常会有换行,加上它,就可以匹配节点与节点之间的换行了。
另外,还有一些修饰符,在必要的情况下也可以使用,如下表所示。
在网页匹配中,较为常用的有re.S 和re.I。
- 转义匹配
我们知道正则表达式定义了许多匹配模式,如.用于匹配除换行符以外的任意字符。但如果目标字符串里面就包含·这个字符,那该怎么办呢?
这时需要用到转义匹配,实例如下:
import recontent = '(百度)www.baidu.com'
result = re.match('\(百度\)www\.baidu\.com', content)
print(result)
当在目标字符串中遇到用作正则匹配模式的特殊字符时,在此字符前面加反斜线\转义一下即可。例如.就可以用来匹配.,运行结果如下:
<re.Match object; span=(0, 17), match='(百度)www.baidu.com'>
可以看到,这里成功匹配到了原字符串。
以上这些是写正则表达式时常用的几个知识点,熟练掌握它们对后面非常有帮助。
search
前文提到过,match 方法是从字符串的开头开始匹配的,意味着一旦开头不匹配,整个匹配就失败了。我们看下面的例子:
import recontent = 'Extra stings Hello 1234567 World This is a Regex Demo Extra stings'
result = re.match('Hello.*?(\d+).*?Demo', content)
print(result)
这里的字符串以 Extra 开头,正则表达式却以 Hell0 开头,其实整个正则表达式是字符串的一部但这样匹配是失败的。运行结果如下:
None
因为 match方法在使用时需要考虑目标字符串开头的内容,因此在做匹配时并不方便。它更适合检测某个字符串是否符合某个正则表达式的规则。
这里就有另外一个方法 search,它在匹配时会扫描整个字符串,然后返回第一个匹配成功的结果也就是说,正则表达式可以是字符串的一部分。在匹配时,search方法会依次以每个字符作为开头扫描字符串,直到找到第一个符合规则的字符串,然后返回匹配内容;如果扫描完还没有找到符合规则的字符串,就返回 None。
我们把上面代码中的 match方法修改成 search:
import recontent = 'Extra stings Hello 1234567 World This is a Regex Demo Extra stings'
result = re.search('Hello.*?(\d+).*?Demo', content)
print(result)
print(result.group(1))
再看下运行结果:
<re.Match object; span=(13, 53), match='Hello 1234567 World This is a Regex Demo'>
1234567
这时就得到了匹配结果。
因此,为了匹配方便,尽量使用search 方法。
下面再用几个实例来看看search方法的用法
首先,这里有一段待匹配的 HTML文本,接下来写几个正则表达式实例实现相应信息的提取:
html = '''<div id="songs-list">
<h2 class="title">经典老歌</h2>
<p class="introduction">
经典老歌列表
</p>
<ul id="list" class="list-group">
<li data-view="2">一路上有你</li>
<li data-view="7">
<a href="/2.mp3" singer="任贤齐">
沧海一声笑
</a>
</li>
<li data-view="4" class="active">
<a href="/3.mp3" singer="齐秦">往事随风</a>
</li>
<li data-view="6"> <a href="/4.mp3" singer="beyond">光辉岁月</a></li>
<li data-view="5"><a href="/5.mp3" singer="陈慧琳">记事本</a>
</li>
<li data-view="5"><a href="/6.mp3" singer="邓丽君">但愿人长久</a>
</li>
</ul>
</div>'''
可以观察到,u 节点里有许多 1i 节点,这些1i节点中有的包含a节点,有的不包含。a节点还有一些相应的属性–超链接和歌手名。
首先,我们尝试提取 class 为 active 的li节点内部的超链接包含的歌手名和歌名,也就是说需要提取第三个 li 节点下a节点的 singer 属性和文本。
此时正则表达式可以以 li 开头,然后寻找一个标志符 active,中间的部分可以用.?来匹配。接下来,因为要提取singer 这个属性值,所以还需要写人 singer="(.?)",这里把需要提取的部分用小括号括了起来,以便用 group 方法提取出来,小括号的两侧边界是双引号。然后还需要匹配a节点的文本,此文本的左边界是>,右边界是。然后目标内容依然用(.*?)来匹配,所以最后的正则表达式就变成了:
<li.*?active.*?singer="(.*?)">(.*?)</a>
再调用 search方法,它会搜索整个HTML文本,找到符合上述正则表达式的第一个内容并返回。
另外,由于代码中有换行,所以search方法的第三个参数需要传入re.s。于是整个匹配代码如下:
result = re.search('<li.*?active.*?singer="(.*?)">(.*?)</a>', html, re.S)
if result:print(result.group(1), result.group(2))
由于需要获取的歌手和歌名都已经用小括号包围,所以可以用 group 方法获取。运行结果如下:
齐秦 往事随风
可以看到,这正是class为active的 li节点内部的超链接包含的歌手名和歌名如果正则表达式不加 active(也就是匹配不带 class 为 active 的节点内容 ),会怎样呢?我们将正则表达式中的 active 去掉,代码改写如下:
result = re.search('<li.*?singer="(.*?)">(.*?)</a>', html, re.S)
if result:print(result.group(1), result.group(2))
由于 search 方法会返回第一个符合条件的匹配目标,于是这里结果就变了:
任贤齐
沧海一声笑
把 active 标签去掉后,从字符串开头开始搜索,此时符合条件的节点就变成了第二个 li 节点,后面的就不再匹配,所以运行结果就变成第二个li节点中的内容。
注意,在上面的两次匹配中,search方法的第三个参数都加了re.S,这使得.*?可以匹配换行所以含有换行的 li节点被匹配到了。如果我们将其去掉,结果会是什么?去掉re.S 的代码如下:
result = re.search('<li.*?singer="(.*?)">(.*?)</a>', html)
if result:print(result.group(1), result.group(2))
运行结果如下:
beyond 光辉岁月
可以看到,结果变成了第四个 li 节点的内容。这是因为第二个和第三个 li节点都包含换行符去掉 re.S之后,.*?已经不能匹配换行符,所以正则表达式不会匹配这两个li 节点,而第四个li节点中不包含换行符,可以成功匹配。
由于绝大部分 HTML文本包含换行符,所以需要尽量加上re.S修饰符,以免出现匹配不到的问题。
findall
介绍完了 search 方法的用法,它可以返回与正则表达式相匹配的第一个字符串。如果想要获取与正则表达式相匹配的所有字符串,该如何处理呢?这就要借助findall方法了。
还是用上面的 HTML文本,如果想获取其中所有a节点的超链接、歌手和歌名.可以将 search方法换成 findall 方法。其返回结果是列表类型,需要通过遍历来依次获取每组内容。
results = re.findall('<li.*?href="(.*?)".*?singer="(.*?)">(.*?)</a>', html, re.S)
print(results)
print(type(results))
for result in results:print(result)print(result[0], result[1], result[2])
运行结果如下:
[('/2.mp3', '任贤齐', '\n沧海一声笑\n'), ('/3.mp3', '齐秦', '往事随风'), ('/4.mp3', 'beyond', '光辉岁月'), ('/5.mp3', '陈慧琳', '记事本'), ('/6.mp3', '邓丽君', '但愿人长久')]
<class 'list'>
('/2.mp3', '任贤齐', '\n沧海一声笑\n')
/2.mp3 任贤齐
沧海一声笑('/3.mp3', '齐秦', '往事随风')
/3.mp3 齐秦 往事随风
('/4.mp3', 'beyond', '光辉岁月')
/4.mp3 beyond 光辉岁月
('/5.mp3', '陈慧琳', '记事本')
/5.mp3 陈慧琳 记事本
('/6.mp3', '邓丽君', '但愿人长久')
/6.mp3 邓丽君 但愿人长久
可以看到,返回的列表中的每个元素都是元组类型,我们用索引依次取出每个条目即可。
总结一下,如果只想获取匹配到的第一个字符串,可以用 search 方法;如果需要提取多个内容可以用 findall 方法。
sub
除了使用正则表达式提取信息,有时候还需要借助它来修改文本。例如,想要把一串文本中的所有数字都去掉,如果只用字符串的replace方法,未免太烦琐了,这时可以借助sub方法。
import recontent = '54aK54yr5oiR54ix5L2g'
content = re.sub('\d+', '', content)
print(content)
运行结果如下:
aKyroiRixLg
这里往 sub 方法的第一个参数中传入 \d+ 以匹配所有的数字,往第二个参数中传人把数字替换成的字符串(如果去掉该参数,可以赋值为空),第三个参数是原字符串。
在上面的 HTML 文本中,如果想获取所有li节点的歌名,直接用正则表达式来提取可能比较烦琐。例如,写成这样:
results = re.findall('<li.*?>\s*?(<a.*?>)?(\w+)(</a>)?\s*?</li>', html, re.S)
for result in results:print(result[1])
运行结果如下:
一路上有你
往事随风
光辉岁月
记事本
但愿人长久
而此时借助 sub 方法就比较简单了。可以先用 sub 方法将a节点去掉,只留下文本,然后再利用findall提取就好了:
html = re.sub('<a.*?>|</a>', '', html)
print(html)
results = re.findall('<li.*?>(.*?)</li>', html, re.S)
for result in results:print(result.strip())
运行结果如下:
<div id="songs-list">
<h2 class="title">经典老歌</h2>
<p class="introduction">
经典老歌列表
</p>
<ul id="list" class="list-group">
<li data-view="2">一路上有你</li>
<li data-view="7">沧海一声笑</li>
<li data-view="4" class="active">
往事随风
</li>
<li data-view="6"> 光辉岁月</li>
<li data-view="5">记事本
</li>
<li data-view="5">但愿人长久
</li>
</ul>
</div>
一路上有你
沧海一声笑
往事随风
光辉岁月
记事本
但愿人长久
可以看到,经过 sub 方法处理后,a节点就没有了,然后通过 findall 方法直接提取即可。可以发现,在适当的时候借助 sub 方法,可以起到事半功倍的效果。
compile
前面所讲的方法都是用来处理字符串的方法,最后再介绍一下compile 方法,这个方法可以将正则字符串编译成正则表达式对象,以便在后面的匹配中复用。实例代码如下:
import recontent1 = '2019-12-15 12:00'
content2 = '2019-12-17 12:55'
content3 = '2019-12-22 13:21'
pattern = re.compile('\d{2}:\d{2}')
result1 = re.sub(pattern, '', content1)
result2 = re.sub(pattern, '', content2)
result3 = re.sub(pattern, '', content3)
print(result1, result2, result3)
这个实例里有3个日期,我们想分别将这3个日期中的时间去掉,这时可以借助 sub方法。该方法的第一个参数是正则表达式,但是这里没有必要重复写3个同样的正则表达式,此时就可以借助compile 方法将正则表达式编译成一个正则表达式对象,以便复用。
运行结果如下:
2019-12-15 2019-12-17 2019-12-22
另外,compile 还可以传人修饰符,例如re.s等修饰符,这样在 search、findall 等方法中就不需要额外传了。所以,可以说 compile 方法是给正则表达式做了一层封装,以便我们更好地复用。
总结
到此为止,正则表达式的基本用法就介绍完了,后面会通过具体的实例来巩固这些方法。
相关文章:

基础库正则表达式
我们已经可以用requests 库来获取网页的源代码,得到 HTML 代码。但我们真正想要的数据是包含在 HTML代码之中的,要怎样才能从 HTML,代码中获取想要的信息呢?正则表达式就是其中一个有效的方法。 本篇博客我们将了解一下正则表达式的相关用法。正则表达…...
【spring专题】spring如何解析配置类和扫描包路径
文章目录 目标重要的组件加载配置类启动解析组件定位配置类解析配置类 扫描过程总结 目标 这是我们使用注解方式启动spring容器的核心代码 AnnotationConfigApplicationContext applicationContext new AnnotationConfigApplicationContext(MyConfig.class); User user (Us…...
MyBatis框架的入门
目录 MyBatis第一章:框架的概述1. MyBatis框架的概述 第二章:MyBatis的入门程序1. 创建数据库和表结构2. MyBatis的入门步骤 MyBatis 第一章:框架的概述 1. MyBatis框架的概述 MyBatis是一个优秀的基于Java的持久层框架,内部对…...

代码随想录D22-23 回溯算法01-02 Python
理论回顾 回溯法也可以叫做回溯搜索法,它是一种搜索的方式。回溯是递归的副产品,只要有递归就会有回溯。 回溯的本质是穷举,穷举所有可能,然后选出我们想要的答案,如果想让回溯法高效一些,可以加一些剪枝…...
【网络云计算】2024第50周-每日【2024/12/13】小测-理论-写10个Bash Shell脚本-解析
文章目录 1. 计算1到100的和2. 列出当前目录下所有文件和文件夹3. 检查文件是否存在4. 备份文件到指定目录(简单示例)5. 打印系统当前日期和时间6. 统计文件中的行数7. 批量重命名文件(将.txt后缀改为.bak)8. 查找进程并杀死&…...
MATLAB转换C语言--问题(一)FFT 和 IFFT 的缩放因子
1. MATLAB 中的 FFT 和 IFFT 在 MATLAB 中,fft 和 ifft 函数具有以下缩放行为: fft:执行快速傅里叶变换(FFT),不进行缩放。ifft:执行逆快速傅里叶变换(IFFT),…...

轻松上手:使用 Vercel 部署 HTML 页面教程
😀 在学习前端的过程中,部署项目往往是一个令人头疼的问题。然而,Vercel 为我们提供了一个便捷且免费的解决方案。 Vercel 是一个强大的云平台,专门用于前端项目的部署和托管。它不仅支持多种前端框架和静态网站生成器࿰…...
如何运用 HTM?
一、HTM 概述 HTM(Hierarchical Temporal Memory,分层时序记忆)是一种基于神经科学原理构建的计算模型,旨在模拟大脑的学习和记忆机制,以处理复杂的时间序列数据和模式识别任务。它具有独特的架构和算法,能…...

12.16【net】【study】
路由表是路由器或者其他互联网网络设备上存储的一张表,它记录了到达特定网络目的地的路径。路由表中的每一行(即一个路由条目)包含了目的地网络地址、子网掩码、下一跳地址、出接口等信息。 Destinations(目的地)和 R…...
2023和2024历年美赛数学建模赛题,算法模型分析!
文末获取历年优秀论文解析,可交流解答 2023年题目分析 MCM(Mathematical Contest in Modeling) 问题 A:遭受旱灾的植物群落 概述:要求建立预测模型,模拟植物群落在干旱和降水充裕条件下随时间的变化。类…...
Node.js内置模块
1.内置模块 Node.js的中文网参考手册:https://nodejs.cn//api 帮助文档 API文档:查看对应的模块,左边是模块,右边是模块的成员 源码:https://github.com/nodejs/node/tree/main/lib 查看 例如: http.js 创建web服务器的模块 -->进入源码中,搜索…...

测评|携程集团25年社招在线测评北森题库、真题分析、考试攻略
携程集团社招入职测评北森题库主要考察以下几个方面: 1. **言语理解**:这部分主要测试应聘者运用语言文字进行思考和交流、迅速准确地理解和把握文段要旨的能力。 2. **资料分析**:包括文字题和图表题,考察应聘者快速找出关键信息…...

快速启动Go-Admin(Gin + Vue3 + Element UI)脚手架管理系统
Go-Admin 是一个基于 Gin Vue Element UI & Arco Design & Ant Design 的前后端分离权限管理系统脚手架。它包含了多租户支持、基础用户管理功能、JWT 鉴权、代码生成器、RBAC 资源控制、表单构建、定时任务等功能。该项目的主要编程语言是 Go 和 JavaScript。 ps&a…...
数据分流:优化数据处理流程的关键策略
引言 在大数据时代,企业面临着数据量的激增和数据类型的多样化。为了有效地管理和分析这些数据,数据分流成为了一个重要的策略。数据分流指的是将数据按照特定的规则和流程分配到不同的处理路径,以优化数据处理效率和准确性。本文将探讨数据…...

RabbitMQ如何构建集群?
大家好,我是锋哥。今天分享关于【RabbitMQ如何构建集群?】面试题。希望对大家有帮助; RabbitMQ如何构建集群? 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 在RabbitMQ中,集群(Cluster&#x…...

RNN LSTM Seq2Seq Attention
非端到端: data -》 cleaning -》 feature Engining (70%-80%工作 设计特征)-》 分类器 -》预测 端到端 End-to-End: data -》 cleaning -》Deep learning(表示学习,从数据中学习特征) -》…...

硬件设计-ADC和低本底噪声为何至关重要
简介 在工程领域,精度是核心要素。无论是对先进电子设备执行质量和性能检测,还是对复杂系统进行调试,测量精度的高低都直接关系到项目的成功与否。这时,示波器中的垂直精度概念就显得尤为重要,它衡量的是电压与实际被…...
个性化域名配置
1 申请免费SSL证书 访问 https://certbot.eff.org ,可申请 通配符证书,每次申请可以使用3个月,到期可以免费续期。 2 配置nginx server index.conf 配置如下: server {listen 80;server_name biwow.com www.biwow.com;return …...
uniapp中打包应用后,组件在微信小程序和其他平台实现不同的样式
今天,我们来介绍一下,uniapp中如何实现打包应用后,组件在微信小程序和其他平台不同的样式,在这里,我们使用背景颜色进行演示,使用 UniApp 提供的 uni.getSystemInfoSync() 方法来获取系统信息,包…...

MRI脑肿瘤检测数据集,使用500张原始图片标注,支持yolo,coco,voc格式
MRI脑肿瘤检测数据集,使用500张原始图片标注,支持yolo,coco,voc格式 数据集下载: https://download.csdn.net/download/pbymw8iwm/90125474 https://download.csdn.net/download/pbymw8iwm/90125473 https://downl…...

【Axure高保真原型】引导弹窗
今天和大家中分享引导弹窗的原型模板,载入页面后,会显示引导弹窗,适用于引导用户使用页面,点击完成后,会显示下一个引导弹窗,直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…...
云计算——弹性云计算器(ECS)
弹性云服务器:ECS 概述 云计算重构了ICT系统,云计算平台厂商推出使得厂家能够主要关注应用管理而非平台管理的云平台,包含如下主要概念。 ECS(Elastic Cloud Server):即弹性云服务器,是云计算…...
React Native 导航系统实战(React Navigation)
导航系统实战(React Navigation) React Navigation 是 React Native 应用中最常用的导航库之一,它提供了多种导航模式,如堆栈导航(Stack Navigator)、标签导航(Tab Navigator)和抽屉…...
多场景 OkHttpClient 管理器 - Android 网络通信解决方案
下面是一个完整的 Android 实现,展示如何创建和管理多个 OkHttpClient 实例,分别用于长连接、普通 HTTP 请求和文件下载场景。 <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas…...

CMake基础:构建流程详解
目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...
java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别
UnsatisfiedLinkError 在对接硬件设备中,我们会遇到使用 java 调用 dll文件 的情况,此时大概率出现UnsatisfiedLinkError链接错误,原因可能有如下几种 类名错误包名错误方法名参数错误使用 JNI 协议调用,结果 dll 未实现 JNI 协…...

iPhone密码忘记了办?iPhoneUnlocker,iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版分享
平时用 iPhone 的时候,难免会碰到解锁的麻烦事。比如密码忘了、人脸识别 / 指纹识别突然不灵,或者买了二手 iPhone 却被原来的 iCloud 账号锁住,这时候就需要靠谱的解锁工具来帮忙了。Aiseesoft iPhone Unlocker 就是专门解决这些问题的软件&…...
土地利用/土地覆盖遥感解译与基于CLUE模型未来变化情景预测;从基础到高级,涵盖ArcGIS数据处理、ENVI遥感解译与CLUE模型情景模拟等
🔍 土地利用/土地覆盖数据是生态、环境和气象等诸多领域模型的关键输入参数。通过遥感影像解译技术,可以精准获取历史或当前任何一个区域的土地利用/土地覆盖情况。这些数据不仅能够用于评估区域生态环境的变化趋势,还能有效评价重大生态工程…...

RNN避坑指南:从数学推导到LSTM/GRU工业级部署实战流程
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。 本文全面剖析RNN核心原理,深入讲解梯度消失/爆炸问题,并通过LSTM/GRU结构实现解决方案,提供时间序列预测和文本生成…...

从“安全密码”到测试体系:Gitee Test 赋能关键领域软件质量保障
关键领域软件测试的"安全密码":Gitee Test如何破解行业痛点 在数字化浪潮席卷全球的今天,软件系统已成为国家关键领域的"神经中枢"。从国防军工到能源电力,从金融交易到交通管控,这些关乎国计民生的关键领域…...