当前位置: 首页 > article >正文

Day42(补)【AI思考】-编译过程中语法分析及递归子程序分析法的系统性解析

文章目录

  • 编译过程中语法分析及递归子程序分析法的系统性解析
      • **一、总览:编译流程中的语法分析**
        • **1. 编译过程核心步骤**
      • **二、语法分析的核心任务**
        • **1. 核心目标**
        • **2. 现实类比**
      • **三、递归子程序分析法的本质**
        • **1. 方法分类**
        • **2. 递归子程序分析法的运作原理**
      • **四、实例解析:用递归子程序法分析算术表达式**
        • **1. 语法规则(简化版)**
        • **2. 递归函数设计**
        • **3. 分析过程演示(输入:`3 + 5 * (2 - 1)`)**
      • **五、递归子程序分析法的特性总结**
      • **六、为什么称为“自上而下”?**
      • **七、常见疑问解答**
        • **1. 如何处理左递归问题?**
        • **2. 递归子程序法与LL(1)分析的关系?**
        • **3. 实际编译器中的应用案例**
      • **八、总结:一张图理解递归子程序分析**

编译过程中语法分析及递归子程序分析法的系统性解析

让思想碎片重焕生机的灵魂:

对高级语言源程序进行编译或解释过程中需进行语法分析,递归子程序分析属于自上而下的分析法,怎么全面,准确,清晰,易懂地理解这句话


以下是关于编译过程中语法分析及递归子程序分析法的系统性解析,通过 分步拆解 + 现实类比 + 实例演示 的方式,彻底打通核心概念:


一、总览:编译流程中的语法分析

1. 编译过程核心步骤
  1. 词法分析 → 将字符流转换为单词(Token)序列
    a = 3 + 5[ID(a), OP(=), NUM(3), OP(+), NUM(5)]
  2. 语法分析 → 检查Token序列是否符合语法规则,生成抽象语法树(AST)
    :生成树状结构表示赋值语句
  3. 语义分析 → 检查类型、作用域等语义规则
  4. 中间代码生成 → 生成平台无关的中间表示(如三地址码)
  5. 优化与目标代码生成 → 输出机器码或字节码

二、语法分析的核心任务

1. 核心目标

验证Token序列是否遵循编程语言的语法规则(如变量声明、表达式结构、控制流结构等)。

2. 现实类比
  • 语法规则 如同自然语言的语法:
    英语:句子需符合“主谓宾”结构
    编程语言if语句需有条件和代码块
  • 语法分析 相当于语文老师检查句子结构是否正确。

三、递归子程序分析法的本质

1. 方法分类
  • 自上而下分析(Top-Down Parsing)
    从语法规则的最顶层开始(如“程序→函数→语句→表达式”),逐步展开推导。
    特点:类似拆解俄罗斯套娃,从外到内解析结构。
    代表方法递归下降分析法(Recursive Descent Parsing),即递归子程序法。

  • 自下而上分析(Bottom-Up Parsing)
    从Token序列开始,逐步归约到语法规则顶层。
    特点:像拼图,从碎片组合出完整图案。
    代表方法:LR分析、算符优先分析。

2. 递归子程序分析法的运作原理
  • 核心思想:为每条语法规则编写一个递归函数,函数之间互相调用,模拟语法规则的展开过程。
  • 关键特性
    • 递归:函数调用自身处理嵌套结构(如循环、条件语句)。
    • 预测分析:根据当前Token选择匹配的语法规则分支。

四、实例解析:用递归子程序法分析算术表达式

1. 语法规则(简化版)
表达式 → 项 + 表达式 | 项 - 表达式 | 项  
项 → 因子 * 项 | 因子 / 项 | 因子  
因子 → ( 表达式 ) | 数字 | 变量  
2. 递归函数设计
def parse_expression():node = parse_term()      # 先解析项while 当前Token是 +-:op = 当前Token读取下一个Tokenright = parse_term()node = 创建二元运算节点(op, node, right)return nodedef parse_term():node = parse_factor()    # 解析因子while 当前Token是 */:op = 当前Token读取下一个Tokenright = parse_factor()node = 创建二元运算节点(op, node, right)return nodedef parse_factor():if 当前Token是 '(':读取下一个Tokennode = parse_expression()if 当前Token不是 ')':报错读取下一个Tokenelif 当前Token是数字或变量:node = 创建叶子节点(当前Token)读取下一个Tokenelse:报错return node
3. 分析过程演示(输入:3 + 5 * (2 - 1)
  1. parse_expression() 调用 parse_term()

  2. parse_term() 调用 parse_factor() → 读取数字3

  3. 回到 parse_expression(),发现+,继续调用 parse_term()

  4. parse_term() 调用 parse_factor() → 读取数字5

  5. 发现*,调用 parse_factor() → 遇到(,递归调用 parse_expression()

  6. 解析(2 - 1)后返回,构建乘法节点

  7. 最终生成AST:

         +/ \3   */ \5   -/ \2   1
    

五、递归子程序分析法的特性总结

特性说明
直观性语法规则与递归函数一一对应,代码易读
灵活性可手动处理复杂语法(如错误恢复、自定义语义动作)
局限性需避免左递归(如 A → A + B),否则递归无限循环
适用场景LL(1)文法、教学用途、手动实现简单编译器
与LL分析的关系递归子程序法是LL(1)分析的实现方式之一,依赖向前看一个Token预测分支

六、为什么称为“自上而下”?

  • 分析方向:从语法规则的最顶层目标(如“程序”)开始,逐步向下分解为更小的语法单元(如“语句”→“表达式”→“项”)。
  • 类比现实
    • 如同写文章先列大纲(顶层结构),再填充章节(子结构),最后写段落和句子(底层细节)。
    • 递归子程序法就是按照大纲逐层细化展开的过程。

七、常见疑问解答

1. 如何处理左递归问题?
  • 原始左递归规则表达式 → 表达式 + 项

  • 改写为右递归

    表达式 → 项 表达式'
    表达式' → + 项 表达式' | ε(空)
    
  • 递归函数调整

    def parse_expression():node = parse_term()while 当前Token是 +:读取Tokennode = 创建加法节点(node, parse_term())return node
    
2. 递归子程序法与LL(1)分析的关系?
  • LL(1)分析:一种形式化的自上而下分析方法,需构造预测分析表。
  • 递归子程序法:是LL(1)分析的手动实现方式,通过条件判断(而非查表)选择产生式。
3. 实际编译器中的应用案例
  • GCC早期版本:C语言前端部分使用递归下降分析。
  • Java编译器(javac):采用手写的递归子程序分析器。
  • Python解释器:部分语法规则通过递归下降实现。

八、总结:一张图理解递归子程序分析

          语法规则树↓
递归函数逐层展开(parse_expression → parse_term → parse_factor)↓AST自顶向下构建↓通过递归调用模拟推导过程

掌握这一方法后,你甚至可以尝试手动为小型编程语言编写语法分析器!

AI模型版本:

中国的深度求索(DeepSeek)公司开发的智能助手DeepSeek-V3

采用深度思考模式,深度思考模型版本为R1

没有打开联网搜索

对话编号:2

相关文章:

Day42(补)【AI思考】-编译过程中语法分析及递归子程序分析法的系统性解析

文章目录 编译过程中语法分析及递归子程序分析法的系统性解析**一、总览:编译流程中的语法分析****1. 编译过程核心步骤** **二、语法分析的核心任务****1. 核心目标****2. 现实类比** **三、递归子程序分析法的本质****1. 方法分类****2. 递归子程序分析法的运作原…...

Effective Objective-C 2.0 读书笔记——内存管理(上)

Effective Objective-C 2.0 读书笔记——内存管理(上) 文章目录 Effective Objective-C 2.0 读书笔记——内存管理(上)引用计数属性存取方法中的内存管理autorelease保留环 ARCARC必须遵循的方法命名原则ARC 的自动优化&#xff1…...

软件测试覆盖率详解

🍅 点击文末小卡片 ,免费获取软件测试全套资料,资料在手,涨薪更快 一、覆盖率概念 覆盖率是用来度量测试完整性的一个手段,是测试技术有效性的一个度量。分为:白盒覆盖、灰盒覆盖和黑盒覆盖;测…...

控制玉米株高基因 PHR1 的基因克隆

https://zwxb.chinacrops.org/CN/10.3724/SP.J.1006.2024.33011...

windows10本地的JMeter+Influxdb+Grafana压测性能测试,【亲测,避坑】

一、环境,以下软件需要解压、安装到电脑上。 windows10 apache-jmeter-5.6.3 jdk-17.0.13 influxdb2-2.7.11 grafana-enterprise-11.5.1二、配置Influxdb,安装完默认连接http://localhost:8086/。打开连接,配置如下。 开启Influxdb&#xf…...

那些数据库函数那些事儿

stdio 1.基本概念 文件: 一组相关数据的集合 文件名: 01.sh //文件名 2.linux下的文件类型 b block 块设备文件 eg: 硬盘 c character 字符设备文件 eg: 鼠标,键盘 d directory 目录文件 eg: 文件夹 - regular 常…...

Excel中不用复杂公式根据指定X列的数值N复制整行数据N行简单方法

Excel中不用复杂公式根据指定X列的数值N复制整行数据N行简单方法 1、在“数据表”sheet1中对指定X列(假设X列的数字从X2开始到Xn结束)求和,和为Y。 2、在“数据表”sheet1数据列之外新建一列Z,Z1输入表头“匹配数据列”&#xff…...

如何在 Java 后端接口中提取请求头中的 Cookie 和 Token

个人名片 🎓作者简介:java领域优质创作者 🌐个人主页:码农阿豪 📞工作室:新空间代码工作室(提供各种软件服务) 💌个人邮箱:[2435024119qq.com] 📱个人微信&a…...

【Python网络爬虫】爬取网站图片实战

【Python网络爬虫】爬取网站图片实战 Scrapying Images on Website in Action By Jackson@ML *声明:本文简要介绍如何利用Python爬取网站数据图片,仅供学习交流。如涉及敏感图片或者违禁事项,请注意规避;笔者不承担相关责任。 1. 创建Python项目 1) 获取和安装最新版…...

SAP ABAP VA05增强

SE18 输入增强的BADI名称:BADI_SDOC_WRAPPER 进入后,点击Interface。 进入后,点击显示对象清单。 双击增强类,下面有之前做好的增强类,没有的可以自己创建一个。 IF_BADI_SDOC_WRAPPER~ADAPT_RESULT_COMP 代码 METHOD if_badi_sdoc_wrapper~adapt_result_comp."…...

八大排序——简单选择排序

目录 1.1基本操作: 1.2动态图: 1.3代码: 代码解释 1. main 方法 2. selectSort 方法 示例运行过程 初始数组 每轮排序后的数组 最终排序结果 代码总结 1.1基本操作: 选择排序(select sorting)也…...

【清晰教程】本地部署DeepSeek-r1模型

【清晰教程】通过Docker为本地DeepSeek-r1部署WebUI界面-CSDN博客 目录 Ollama 安装Ollama DeepSeek-r1模型 安装DeepSeek-r1模型 Ollama Ollama 是一个开源工具,专注于简化大型语言模型(LLMs)的本地部署和管理。它允许用户在本地计算机…...

教程 | Proxmox VE(PVE)安装全流程指南(末尾附镜像及快速配置脚本)

Proxmox VE 是一款基于 Debian 的开源虚拟化平台,支持 KVM 虚拟机和 LXC 容器,广泛用于企业级虚拟化部署。 一、安装前准备 1. 硬件要求 CPU:64位处理器(Intel VT/AMD-V 虚拟化支持)内存:至少 4GB&#x…...

【matlab优化算法-17期】基于DBO算法的微电网多目标优化调度

基于蜣螂DBO算法的微电网多目标优化调度 一、前言 微电网作为智能电网的重要组成部分,其优化调度对于降低能耗、减少环境污染具有重要意义。本文介绍了一个基于Dung Beetle Optimizer(DBO)算法的微电网多目标优化调度项目,旨在通…...

如何使用qt开发一个xml发票浏览器,实现按发票样式显示

使用Qt开发一个按发票样式显示的XML发票浏览器,如下图所示样式: 一、需求: 1、按税务发票样式显示。 2、拖入即可显示。 3、正确解析xml文件。 二、实现 可以按照以下步骤进行: 1. 创建Qt项目 打开Qt Creator,创…...

八股文-2025-02-12

BFC BFC属于普通流。BFC全称是Block Formatting Context,意思就是块级格式化上下文。你可以把BFC看做元素的一个属性,当元素拥有BFC属性,这个元素就可以看作是隔离了的独立容器,容器里边的元素不会影响到容器外部的元素.https://b…...

解析 JavaScript 面试题:`index | 0` 确保数组索引为整数

文章目录 一、JavaScript 中的数字类型二、按位或运算符 | 的作用(一)对于整数(二)对于小数(三)对于非数字值 三、用于数组索引的意义 在 JavaScript 面试中,常常会涉及到一些看似简单却蕴含着深…...

苹果手机快捷指令----敲击背面实现自动插入日期

前一段时间因为写文章,每一次总是在手机上面敲击日期觉得非常麻烦,于是自己鼓捣如何自动插入的办法。下面分享在网络上面查阅到的资料,由于实操的原因,遇到了很多困难。现在补充上去。先演示一遍效果。 https://www.bilibili.com…...

Base64 PDF解析器

<!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><title>Base64 PDF解析器</title><style>body {font-family: Arial, sans-serif;max-width: 800px;margin: 20px auto;padding: 20px;}.contain…...

SQL-leetcode—1393. 股票的资本损益

1393. 股票的资本损益 Stocks 表&#xff1a; ---------------------- | Column Name | Type | ---------------------- | stock_name | varchar | | operation | enum | | operation_day | int | | price | int | ---------------------- (stock_name, operation_day) 是这张…...

Java NIO基础与实战:如何提升IO操作性能

Java NIO 概述 Java NIO&#xff08;新 I/O&#xff09;是 Java 提供的一个更为高效的 I/O 处理框架。Java NIO&#xff08;New I/O&#xff09;是对传统 I/O&#xff08;java.io&#xff09;模型的改进&#xff0c;它引入了非阻塞 I/O 操作和面向缓冲区的数据读写方式&#x…...

46 map与set

目录 一、序列式容器和关联式容器 二、set系列的使用 &#xff08;一&#xff09;set和mutilset参考文档链接 &#xff08;二&#xff09;set类模板介绍 1、set类声明 2、set的构造和迭代器 3、set的增删查 &#xff08;三&#xff09;multiset类模板 1、multiset和se…...

GPT 系列模型发展史:从 GPT 到 ChatGPT 的演进与技术细节

从 GPT 到 ChatGPT&#xff0c;OpenAI 用短短几年时间&#xff0c;彻底改变了自然语言处理&#xff08;NLP&#xff09;的格局。让我们一起回顾这段激动人心的技术演进史&#xff01;&#x1f680; &#x1f539; GPT&#xff08;2018&#xff09;&#xff1a; 划时代的起点&a…...

RAGFlow和Dify对比

‌ RAGFlow和Dify都是基于大语言模型&#xff08;LLM&#xff09;的应用开发平台&#xff0c;具有相似的功能和应用场景&#xff0c;但它们在技术架构、部署要求和用户体验上存在一些差异。‌‌ RAGFlow和Dify对比 2025-02-13 22.08 RAGFlow‌ ‌技术栈‌&#xff1a;RAGFlow…...

Dart 3.5语法 14-16

017自定代码段让变量有默认值 List下标访问和2种for循环遍历_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1RZ421p7BL?spm_id_from333.788.videopod.episodes&vd_source68aea1c1d33b45ca3285a52d4ef7365f&p42原作者链接&#xff0c;此为修订补充版本 014main…...

yanshee机器人初次使用说明(备注)-PyCharm

准备 需要&#xff1a; 1&#xff0c;&#xff08;优必选&#xff09;yanshee机器人Yanshee 开发者说明 2&#xff0c;手机-联网简单操控 / HDMI线与显示器和键鼠标-图形化开发环境 / 笔记本&#xff08;VNC-内置图形化开发环境/PyCharm等平台&#xff09;。 3&#xff0c;P…...

面试题:如何在10亿个数中判断某个数是否存在?

参考视频 参考视频&#xff1a; 如何用10只老鼠试出藏在99瓶清水中的那瓶毒药 参考视频...

【设计模式】【行为型模式】观察者模式(Observer)

&#x1f44b;hi&#xff0c;我不是一名外包公司的员工&#xff0c;也不会偷吃茶水间的零食&#xff0c;我的梦想是能写高端CRUD &#x1f525; 2025本人正在沉淀中… 博客更新速度 &#x1f44d; 欢迎点赞、收藏、关注&#xff0c;跟上我的更新节奏 &#x1f3b5; 当你的天空突…...

[创业之路-299]:图解金融体系结构

一、金融体系结构 1.1 概述 金融体系结构是一个国家以行政的、法律的形式和运用经济规律确定的金融系统结构&#xff0c;以及构成这个系统的各种类型的银行和非银行金融机构的职能作用和相互关系。以下是对金融体系结构的详细分析&#xff1a; 1、金融体系的构成要素 现代金…...

STM32、GD32驱动TM1640原理图、源码分享

一、原理图分享 二、源码分享 /************************************************* * copyright: * author:Xupeng * date:2024-07-18 * description: **************************************************/ #include "smg.h"#define DBG_TAG "smg&…...