当前位置: 首页 > news >正文

爬虫 学习HTML标签和元素的基本概念,了解网页的结构和内容

HTML(Hypertext Markup Language)是一种用于创建网页的标记语言,由一系列的标签组成。标签使用尖括号(< 和 >)包围,并且通常成对出现,一个是开始标签,一个是结束标签。

HTML文档的基本结构如下:


<!DOCTYPE html>
<html>
<head>
  <title>页面标题</title>
</head>
<body>
  页面内容...
</body>
</html>



<!DOCTYPE html>:声明文档类型为HTML5。

<html>:表示HTML文档的根元素。

<head>:该元素用于定义文档的头部信息,包括页面标题、引入外部样式表和脚本等。

<title>:用于定义页面的标题,会显示在浏览器的标题栏或标签页中。

<body>:HTML文档的主体内容。


在<body>元素中,可以使用不同的标签来组织和呈现网页的内容。一些常见的HTML标签及其作用如下:



<h1>到<h6>:定义标题,从大到小表示不同级别的标题。

<p>:定义段落。

<a>:定义超链接,通常用于跳转到其他页面或锚点位置。

<img>:插入图像,指定图片的URL、宽度和高度等属性。

<ul>和<ol>:定义无序列表和有序列表。

<li>:定义列表项。

<div>:用于将文档分割为独立的区块,可用于布局和样式分组。

<span>:用于在行内文本中应用样式或标记特殊内容。

此外,还有一些特殊的标签和属性用于添加特定功能或样式:

<header>、<nav>、<main>、<footer>等:用于定义网页的不同部分,方便搜索引擎和辅助技术的理解。

<table>、<tr>、<td>等:用于创建表格。

<form>、<input>、<button>等:用于创建表单,接收用户输入。

<style>:用于定义内部样式表。

<script>:用于引入JavaScript代码。

id和class属性:用于标识和选择具有相同样式或功能的元素。

通过使用HTML标签和属性,我们可以构建出具有结构化和语义化的网页内容。爬虫就是利用这些HTML标签和内容来解析和提取所需的数据。

本文由 mdnice 多平台发布

相关文章:

爬虫 学习HTML标签和元素的基本概念,了解网页的结构和内容

HTML&#xff08;Hypertext Markup Language&#xff09;是一种用于创建网页的标记语言&#xff0c;由一系列的标签组成。标签使用尖括号&#xff08;< 和 >&#xff09;包围&#xff0c;并且通常成对出现&#xff0c;一个是开始标签&#xff0c;一个是结束标签。 HTML文…...

mysql将id重新修改为递增

文章目录 场景解决,排序的话可以先按照一定大小改一下,然后将id字段删掉,再重新生成即可清空表数据,并将自增id改为1开始 场景 好比我有个配置表: CREATE TABLE config (id int NOT NULL AUTO_INCREMENT,config_key varchar(20) NOT NULL,config_value varchar(500) NOT NU…...

http、https笔记

目录 HTTP 基本概念状态码&#xff1a;get和post的区别&#xff1a;http 常⻅字段&#xff1a;http的缺点&#xff1a; HTTP/1.1HTTP/3HTTPSHTTPS和HTTP区别对称加密和⾮对称加密⾮对称加密 HTTP 基本概念 状态码&#xff1a; 1xx 中间状态&#xff0c;比如post的continue 20…...

飞凌嵌入式「国产」嵌入式核心板大盘点(三)——龙芯中科、赛昉科技

为了帮助各位工程师朋友详细了解飞凌嵌入式推出的“国产化”产品&#xff0c;小编专门开设了「国产平台大盘点专题」。上周&#xff0c;已经带大家盘点了飞凌嵌入式联合瑞芯微电子和全志科技两个国产处理器品牌打造的平台&#xff0c;今天&#xff0c;将继续为大家介绍龙芯和赛…...

以vue2为例,用npm开发环境在后端部署vue2项目(更推荐使用nginx部署)

因为之前一致出现的跨域问题&#xff0c;从而想到了这个办法&#xff0c;属于偏方。推荐使用nginx部署&#xff0c;再去解决跨域问题。 接下来聊一聊本文所使用的方法。 首先将你的前端vue项目拷贝一份到服务器&#xff0c;准备一个dockerfile文件&#xff0c;用这个进行部署首…...

docker容器监控:Cadvisor +Prometheus+Grafana的安装部署

目录 Cadvisor PrometheusGrafana的安装部署 一、安装docker&#xff1a; 1、安装docker-ce 2、阿里云镜像加速器 3、下载组件镜像 4、创建自定义网络 二、部署Cadvisor 1、被监控主机上部署Cadvisor容器 2、访问cAdvisor页面 三、安装prometheus 1、部署Prometheus…...

前端食堂技术周刊第 93 期:7 月登陆 Web 平台的新功能、Node.js 工具箱、Nuxt3 开发技巧、MF 重构方案

美味值&#xff1a;&#x1f31f;&#x1f31f;&#x1f31f;&#x1f31f;&#x1f31f; 口味&#xff1a;橙橙冰萃美式 食堂技术周刊仓库地址&#xff1a;https://github.com/Geekhyt/weekly 大家好&#xff0c;我是童欧巴。欢迎来到前端食堂技术周刊&#xff0c;我们先来…...

获取 Android 的 SHA1 值

1、调试版&#xff0c;可以直接在 Android studio 中的 gradle 中查看。也可以用下面方法进行 前提要先确定签名文件所在的路径&#xff1a;调试版默认使用的签名文件是debug.keystore&#xff0c;文件处于 C 盘用户目录下的.android文件夹下。打开命令行工具&#xff0c; 1、…...

! [remote rejected] develop -> develop (pre-receive hook declined)

问题 git push 远程提交dao develop 分支失败&#xff0c;出现下面错误信息 remote: GitLab: You are not allowed to push code to protected branches on this project. To https://xxx.com.cn/xxx/xxx/xxx/xxx.git/! [remote rejected] develop -> develop (pre-receiv…...

最强的表格组件—AG Grid使用以及License Key Crack

PS: 想要官方 License Key翻到最后面 Ag Grid简介 Ag-Grid 是一个高级数据网格&#xff0c;适用于JavaScript/TypeScript应用程序&#xff0c;可以使用React、Angular和Vue等流行框架进行集成。它是一种功能强大、灵活且具有高度可定制性的表格解决方案&#xff0c;提供了丰富…...

【算法】逆波兰表达式

文章目录 定义求法代码思想&#xff1a; 定义 逆波兰表达式也称为“后缀表达式”&#xff0c;是将运算符写在操作数之后的运算式。 求法 *如&#xff1a;(ab)c-(ab)/e的转换过程&#xff1a; 先加上所有的括号。 (((ab)*c)-((ab)/e))将所有的运算符移到括号外面 (((ab) c)* …...

添加SQLCipher 到项目中

文章目录 一、克隆下载SQLCipher二、手动导入1. 生成sqlite3.c2. 在项目中添加命令3. 添加 Security.framework 三、CocoaPods导入 SQLCipher官方地址 一、克隆下载SQLCipher $ cd ~/Documents/code $ git clone https://github.com/sqlcipher/sqlcipher.git二、手动导入 1.…...

轻松预约,尽享美食,详解餐厅预约小程序的设计与实现

随着智能手机的普及和人们生活水平的提高&#xff0c;餐厅预约已经成为人们日常生活中的一部分。为了更好地满足人们的需求&#xff0c;许多餐厅开始使用小程序来提供更方便快捷的预约服务。本文将介绍如何制作一款餐厅预约小程序的详细步骤。 1. 进入乔拓云网后台&#xff0c;…...

数据结构--栈和队列3.1(栈-顺序结构)

目录 栈&#xff08;Stack&#xff09;栈顶&#xff08;top&#xff09;栈底&#xff08;bottom&#xff09;空栈&#xff08;不含任何元素&#xff09; 创建栈 入栈操作 出栈操作 销毁一个栈 计算栈的当前容量 实例分析 栈的插入操作叫做进栈&#xff08;Push&#xf…...

pdf怎么压缩到1m?这样做压缩率高!

PDF是目前使用率比较高的一种文档格式&#xff0c;因为它具有很高的安全性&#xff0c;还易于传输等&#xff0c;但有时候当文件体积过大时&#xff0c;会给我们带来不便&#xff0c;这时候简单的解决方法就是将其压缩变小。 想要将PDF文件压缩到1M&#xff0c;也要根据具体的情…...

AttentionFreeTransformer 源码解析(一):AFTFull、AFTSimple、AFTLocal

我觉得源码写的很好懂&#xff0c;我就不加注释了&#xff0c;直接上计算流程图。 AFTFull class AFTFull(nn.Module):def __init__(self, max_seqlen, dim, hidden_dim64):super().__init__()max_seqlen: the maximum number of timesteps (sequence length) to be fed indim…...

C++ 计算 拟合优度R^2

解决的问题&#xff1a; 拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度&#xff0c;度量拟合优度的统计量是可决系数(亦称确定系数) R?。R最大值为 1。R%的值越接近1&#xff0c;说明回归直线对观测值的拟合程度越好&#xff0c;反之&#xff0c;R%值越小&#x…...

Springboot-Retrofit HTTP工具框架快速使用

在SpringBoot项目直接使用okhttp、httpClient或者RestTemplate发起HTTP请求&#xff0c;既繁琐又不方便统一管理。 因此&#xff0c;在这里推荐一个适用于SpringBoot项目的轻量级HTTP客户端框架retrofit-spring-boot-starter&#xff0c;使用非常简单方便&#xff0c;同时又提供…...

微信小程序实现人脸识别(从一个没有开通人脸核身的小程序跳转到要给开通人脸核身的小程序,进行人脸识别后再跳转回来)

A小程序没有开通人脸识别功能,B小程序开通了人脸识别。 总体思路是:从A小程序需要进行人脸识别的地方携带参数跳转到B小程序进行人脸识别,识别后把参数传递回来。 A小程序的参考代码如下: //人脸识别相关 start powerDrawerFace(e){var that = thisthat.setData({faceO…...

CSS-grid布局

网格布局也叫grid布局&#xff0c;平常写样式的时候基本上都是用的flex布局。 像以下布局&#xff0c;用flex布局就可能会有有点麻烦&#xff0c;这时候用grid布局就方便的多了。 或者是照片墙 grid布局就是将容器划分为行和列&#xff0c;产生单元格&#xff0c;然后在指定的…...

AI 术语通俗词典:正则化

正则化是统计学、机器学习和人工智能中非常常见的一个术语。它用来描述一种控制模型复杂度的方法。换句话说&#xff0c;正则化是在回答&#xff1a;当模型已经有能力把训练数据拟合得很好时&#xff0c;怎样防止它学得过头&#xff0c;从而在新数据上表现变差。如果说模型训练…...

Pixel Couplet Gen快速上手:微信小程序Canvas渲染像素春联的兼容性适配方案

Pixel Couplet Gen快速上手&#xff1a;微信小程序Canvas渲染像素春联的兼容性适配方案 1. 项目介绍与核心价值 Pixel Couplet Gen是一款基于ModelScope大模型驱动的创新春联生成器。与传统春联设计不同&#xff0c;它采用了独特的8-bit像素游戏风格&#xff0c;将中国传统元…...

DeepSeek 量化交易实战:用标准化提示词模板实现 AI 辅助交易决策

前言随着大模型技术的快速发展&#xff0c;AI 辅助交易已经从概念走向实战。但绝大多数投资者都面临同一个问题&#xff1a;不知道怎么写提示词才能让大模型给出专业、可执行的交易决策。要么得到的建议空泛无用&#xff0c;要么不符合 A 股市场的交易规则&#xff0c;甚至出现…...

real-anime-z多场景落地:同人创作、轻小说配图、社交平台头像批量生成

real-anime-z多场景落地&#xff1a;同人创作、轻小说配图、社交平台头像批量生成 1. 平台介绍与核心价值 real-anime-z是一款专为二次元内容创作设计的文生图工具&#xff0c;基于Tongyi-MAI/Z-Image基础模型和Devilworld/real-anime-z风格模型构建。这个开箱即用的解决方案让…...

NVMe驱动开发避坑指南:手把手处理PRP List内存对齐与边界条件

NVMe驱动开发实战&#xff1a;PRP List内存对齐与边界条件全解析 刚接手NVMe驱动开发时&#xff0c;我以为PRP&#xff08;Physical Region Page&#xff09;不过是简单的内存地址描述符。直到某个深夜&#xff0c;SSD突然返回"Invalid PRP Entry"错误&#xff0c;追…...

终极cocur/slugify高级配置指南:掌握正则表达式、大小写控制和分隔符定制技巧

终极cocur/slugify高级配置指南&#xff1a;掌握正则表达式、大小写控制和分隔符定制技巧 【免费下载链接】slugify Converts a string to a slug. Includes integrations for Symfony, Silex, Laravel, Zend Framework 2, Twig, Nette and Latte. 项目地址: https://gitcode…...

《Docker 部署 Calibre-Web:搭建电子书图书馆》

《Docker 部署 Calibre-Web&#xff1a;搭建电子书图书馆》 核心&#xff1a;挂载书籍目录&#xff0c;支持在线预览和下载 一、Calibre-Web 是什么&#xff1f; Calibre 是知名的电子书管理软件&#xff0c;而 Calibre-Web 是其 Web 版&#xff0c;支持浏览器管理、在线阅读、…...

3分钟搞定Dell G15散热控制:开源神器Thermal Control Center完全指南

3分钟搞定Dell G15散热控制&#xff1a;开源神器Thermal Control Center完全指南 【免费下载链接】tcc-g15 Thermal Control Center for Dell G15 - open source alternative to AWCC 项目地址: https://gitcode.com/gh_mirrors/tc/tcc-g15 你是一个文章写手&#xff0c…...

JavaScript多智能体AI框架KaibanJS开发指南

1. 项目概述&#xff1a;JavaScript生态中的多智能体AI框架作为一名长期工作在JavaScript和AI交叉领域的开发者&#xff0c;我见证了近年来AI技术在前端和后端应用中的爆发式增长。然而&#xff0c;一个明显的痛点始终存在&#xff1a;绝大多数先进的AI框架&#xff08;如LangC…...

用 FastMCP 构建出行龙虾技能:从 MCP Server 到 Python/Node.js 双版本 Skill Client

参考实现: python:https://github.com/lonngxiang/travel-skill nodejs:https://github.com/lonngxiang/travel-skill-nodejs 本文完整拆解一个生产级 MCP 技能的技术实现——服务端用 FastMCP 框架,客户端提供 Python 和 Node.js 两套实现,最终通过 SKILL.md 接入 AI Age…...