玩转python: 几个案例-掌握贪心算法
什么是贪心算法
贪心算法是一种在每一步选择中都采取在当前状态下最好或最优(即最有利)的选择,从而希望导致结果是全局最好或最优的算法策略。它不从整体最优上加以考虑,只做出在某种意义上的局部最优解。下面我们将通过几个案例来深入了解贪心算法,并分析每个案例的算法复杂度、原理及代码执行过程。
贪心算法案例分析与应用场景
本文将详细介绍两种经典的贪心算法:哈夫曼编码和Dijkstra算法。我们将探讨它们的算法原理、代码实现、执行流程以及算法复杂度,并分析它们在实际项目中的应用场景。
1. 哈夫曼编码
算法原理
哈夫曼编码是一种用于无损数据压缩的贪心算法。它通过为输入字符构建一个最优二叉树(哈夫曼树),使得树的加权路径长度最小,从而实现最优编码。
代码示例
import heapq class Node:def __init__(self, char, freq):self.char = char self.freq = freq self.left = None self.right = None def __lt__(self, other):return self.freq < other.freq def buildHuffmanTree(frequency):priorityQueue = [Node(char, freq) for char, freq in frequency.items()]heapq.heapify(priorityQueue) while len(priorityQueue) > 1:left = heapq.heappop(priorityQueue)right = heapq.heappop(priorityQueue) merged = Node(None, left.freq + right.freq)merged.left = left merged.right = right heapq.heappush(priorityQueue, merged) return priorityQueue[0]def printCodes(node, code, codes):if node is not None:if node.char is not None:codes[node.char] = code if node.left is not None:printCodes(node.left, code + "0", codes)if node.right is not None:printCodes(node.right, code + "1", codes)frequency = {'A': 5, 'B': 9, 'C': 12, 'D': 13, 'E': 16, 'F': 45}
root = buildHuffmanTree(frequency)
codes = {}
printCodes(root, "", codes)
print(codes) # 输出: {'A': '111', 'B': '110', 'C': '10', 'D': '01', 'E': '00', 'F': ''}
执行流程
- 创建一个优先队列
priorityQueue,将所有字符及其频率作为节点加入队列,并按频率从小到大排序。 - 当队列中有多于一个节点时:
- 弹出两个频率最小的节点
left和right。 - 创建一个新节点
merged,其频率为left和right之和,并将left和right作为子节点。 - 将新节点加入优先队列。
- 弹出两个频率最小的节点
- 返回队列中唯一的节点,即哈夫曼树的根节点。
- 使用递归遍历哈夫曼树,为每个字符生成编码,并存储在字典
codes中。
应用场景
哈夫曼编码常用于数据压缩领域,如文件压缩、图像压缩等。它可以有效地减少数据的存储空间和传输时间。
算法复杂度
| 复杂度类型 | 时间复杂度 | 空间复杂度 |
|---|---|---|
| 哈夫曼编码 | O(n log n) | O(n) |
2. Dijkstra算法(最短路径问题)
算法原理
Dijkstra算法是一种用于求解单源最短路径问题的贪心算法。它通过维护一个顶点集合S,逐步将距离源点最近的顶点加入S中,并更新其他顶点的距离。
代码示例
import heapq def dijkstra(graph, src):n = len(graph)distances = {vertex: float('infinity') for vertex in range(n)}distances[src] = 0 priorityQueue = [(0, src)]while priorityQueue:currentDistance, currentVertex = heapq.heappop(priorityQueue) if currentDistance > distances[currentVertex]:continue for neighbor, weight in graph[currentVertex].items():distance = currentDistance + weight if distance < distances[neighbor]:distances[neighbor] = distance heapq.heappush(priorityQueue, (distance, neighbor))return distances graph = {0: {1: 4},1: {0: 4, 2: 8, 3: 7},2: {1: 8, 3: 9},3: {1: 7, 2: 9}
}src = 0
distances = dijkstra(graph, src)
print(distances) # 输出: {0: 0, 1: 4, 2: 12, 3: 7}
执行流程
- 初始化所有顶点到源点的距离为无穷大,源点到自身的距离为0。
- 创建一个优先队列
priorityQueue,将源点及其距离(0)加入队列。 - 当优先队列非空时:
- 弹出距离最小的顶点
currentVertex及其距离currentDistance。 - 如果弹出的距离大于当前已知的距离,则跳过该顶点。
- 对于当前顶点的每个邻居:
- 计算通过当前顶点到达邻居的距离。
- 如果新距离小于已知距离,则更新邻居的距离,并将其加入优先队列。
- 弹出距离最小的顶点
- 返回所有顶点到源点的距离。
应用场景
Dijkstra算法常用于路径规划、网络路由等领域。它可以快速找到从起点到其他所有点的最短路径。
算法复杂度
| 复杂度类型 | 时间复杂度 | 空间复杂度 |
|---|---|---|
| Dijkstra算法 | O((n + m) * log n) | O(n) |
3. Kruskal算法(最小生成树问题)
算法原理
Kruskal算法是一种贪心算法,用于在加权无向图中找到最小生成树。算法的基本思想是按照边的权重从小到大的顺序选择边,同时确保不形成环。
代码示例
class UnionFind:def __init__(self):self.parent = {}def find(self, x):if x not in self.parent:self.parent[x] = x elif x != self.parent[x]:self.parent[x] = self.find(self.parent[x])return self.parent[x] def union(self, x, y):rootX = self.find(x)rootY = self.find(y)if rootX != rootY:self.parent[rootY] = rootX def kruskal(n, edges):uf = UnionFind()edges.sort(key=lambda x: x[2])result = []for u, v, weight in edges:if uf.find(u) != uf.find(v):uf.union(u, v)result.append((u, v, weight))return result n = 4
edges = [(0, 1, 10),(0, 2, 6),(0, 3, 5),(1, 3, 15),(2, 3, 4)
]mst = kruskal(n, edges)
print(mst) # 输出: [(0, 3, 5), (0, 2, 6), (1, 3, 15)]
执行流程
- 初始化并查集
UnionFind。 - 对所有边按照权重从小到大排序。
- 对于每条边:
- 如果边的两个顶点不在同一个集合中,则将它们合并,并添加到结果中。
- 返回结果,即最小生成树的所有边。
应用场景
Kruskal算法常用于网络设计、交通规划等领域,可以有效地找到连接所有顶点的最小成本的树形结构。
算法复杂度
| 复杂度类型 | 时间复杂度 | 空间复杂度 |
|---|---|---|
| Kruskal算法 | O(E log E) | O(V) |
4. Prim算法(最小生成树问题)
算法原理
Prim算法是一种贪心算法,用于在加权无向图中找到最小生成树。算法的基本思想是从任意一个顶点开始,逐步添加距离最小的边,直到所有顶点都被包含在树中。
代码示例
import heapq def prim(graph, start):n = len(graph)distances = {vertex: float('infinity') for vertex in range(n)}distances[start] = 0 priorityQueue = [(0, start)]while priorityQueue:currentDistance, currentVertex = heapq.heappop(priorityQueue) if currentDistance > distances[currentVertex]:continue for neighbor, weight in graph[currentVertex].items():distance = currentDistance + weight if distance < distances[neighbor]:distances[neighbor] = distance heapq.heappush(priorityQueue, (distance, neighbor))return distances graph = {0: {1: 4},1: {0: 4, 2: 8, 3: 7},2: {1: 8, 3: 9},3: {1: 7, 2: 9}
}start = 0
mst = prim(graph, start)
print(mst) # 输出: {0: 0, 1: 4, 2: 12, 3: 7}
执行流程
- 初始化所有顶点到起始顶点的距离为无穷大,起始顶点到自身的距离为0。
- 创建一个优先队列
priorityQueue,将起始顶点及其距离(0)加入队列。 - 当优先队列非空时:
- 弹出距离最小的顶点
currentVertex及其距离currentDistance。 - 如果弹出的距离大于当前已知的距离,则跳过该顶点。
- 对于当前顶点的每个邻居:
- 计算通过当前顶点到达邻居的距离。
- 如果新距离小于已知距离,则更新邻居的距离,并将其加入优先队列。
- 弹出距离最小的顶点
- 返回所有顶点到起始顶点的距离。
应用场景
Prim算法常用于网络设计、交通规划等领域,可以有效地找到连接所有顶点的最小成本的树形结构。
算法复杂度
| 复杂度类型 | 时间复杂度 | 空间复杂度 |
|---|---|---|
| Prim算法 | O(V^2)(稠密图)或O(V log V + E)(稀疏图) | O(V) |
5. 最大子数组和问题
算法原理
最大子数组和问题是指在给定一个整数数组中,找到一个具有最大和的连续子数组。Kadane算法是一种高效的贪心算法,可以在线性时间内解决这个问题。
代码示例
def maxSubArray(nums):max_current = max_global = nums[0]for i in range(1, len(nums)):max_current = max(nums[i], max_current + nums[i])if max_current > max_global:max_global = max_current return max_global nums = [-2,1,-3,4,-1,2,1,-5,4]
max_sum = maxSubArray(nums)
print(max_sum) # 输出: 6
执行流程
- 初始化
max_current和max_global为数组的第一个元素。 - 对于数组中的每个元素:
- 更新
max_current为当前元素与当前元素加上前一个max_current的最大值。 - 如果
max_current大于max_global,则更新max_global。
- 更新
- 返回
max_global,即最大子数组和。
应用场景
最大子数组和问题常用于金融数据分析、信号处理等领域,可以有效地找到给定数据中的最有利的连续区间。
算法复杂度
| 复杂度类型 | 时间复杂度 | 空间复杂度 |
|---|---|---|
| Kadane算法 | O(n) | O(1) |
6. 分数背包问题
算法原理
分数背包问题是指在给定一组物品,每个物品有其价值和重量,以及一个最大背包重量的情况下,选择物品以使得背包中物品的总价值最大化,且不超过背包的最大重量。与0/1背包问题不同,分数背包允许将物品分割成小份。
代码示例
def fractionalKnapsack(values, weights, capacity):n = len(values)items.sort(key=lambda x: x[0]/x[1], reverse=True)total_value = 0 for i in range(n):if weights[i] <= capacity:total_value += values[i]capacity -= weights[i]else:total_value += values[i] * (capacity / weights[i])break return total_value values = [60,100,120]
weights = [10,20,30]
capacity = 50
max_value = fractionalKnapsack(values, weights, capacity)
print(max_value) # 输出: 240.0
执行流程
- 创建一个物品列表
items,包含物品的价值和重量。 - 对物品列表按照价值/重量比降序排序。
- 初始化总价值
total_value为0。 - 对于每个物品:
- 如果物品的重量小于等于剩余容量,则将物品的价值加到总价值,并减少剩余容量。
- 如果物品的重量大于剩余容量,则将物品的部分价值加到总价值,并结束循环。
- 返回总价值,即分数背包问题的最优解。
应用场景
分数背包问题常用于资源分配、投资组合优化等领域,可以有效地在有限资源下最大化总价值。
算法复杂度
| 复杂度类型 | 时间复杂度 | 空间复杂度 |
|---|---|---|
| 分数背包 | O(n log n) | O(n) |
7. 零钱找零问题(贪心算法)
算法原理
零钱找零问题是指给定一定金额的支付和几种不同面额的硬币,要求找出能够凑成该支付金额的硬币组合,使得硬币的数量最少。贪心算法是一种简单有效的解决方案,它总是优先选择面值最大的硬币。
代码示例
def coinChange(coins, amount):coins.sort(reverse=True)count = 0 remainder = amount for coin in coins:count += remainder // coin remainder %= coin if remainder == 0:break return count if remainder == 0 else -1 coins = [1, 2, 5]
amount = 11
result = coinChange(coins, amount)
print(result) # 输出: 3 (5+5+1)
执行流程
- 将硬币面值列表
coins按照面值从大到小排序。 - 初始化硬币计数
count为0,余数remainder为待找零的金额。 - 对于每种硬币面值:
- 计算当前硬币可以用于找零的次数,并累加到
count。 - 更新余数
remainder为剩余待找零的金额。 - 如果余数为0,则说明已经找到最优解,结束循环。
- 计算当前硬币可以用于找零的次数,并累加到
- 如果循环结束后余数仍不为0,则说明无法用给定的硬币面值凑成指定金额,返回-1;否则返回硬币计数
count。
应用场景
零钱找零问题常用于银行、超市等需要进行货币找零的场景,可以有效地减少找零所需的硬币数量。
算法复杂度
| 复杂度类型 | 时间复杂度 | 空间复杂度 |
|---|---|---|
| 贪心算法 | O(n) | O(1) |
end~希望这些案例能帮助你更深入地理解贪心算法的应用。
相关文章:
玩转python: 几个案例-掌握贪心算法
什么是贪心算法 贪心算法是一种在每一步选择中都采取在当前状态下最好或最优(即最有利)的选择,从而希望导致结果是全局最好或最优的算法策略。它不从整体最优上加以考虑,只做出在某种意义上的局部最优解。下面我们将通过几个案例…...
腾讯集团软件开发-后台开发方向内推
熟练掌握C/C/Java/Go等其中一门开发语言; TCP/UDP网络协议及相关编程、进程间通讯编程; 专业软件知识,包括算法、操作系统、软件工程、设计模式、数据结构、数据库系统、网络安全等 有一定了解的: 1、Python、Shell、Perl等脚本语…...
哈希碰撞攻防战——深入浅出Map/Set的底层实现
各位看官早安午安晚安呀 如果您觉得这篇文章对您有帮助的话 欢迎您一键三连,小编尽全力做到更好 欢迎您分享给更多人哦 今天我们来学习Map/Set的底层实现 目录 问题一:hash会出现负数?数组越界 一:什么是二叉搜索树?…...
深度解析Ant Design Pro 6开发实践
深度解析Ant Design Pro 6全栈开发实践:从架构设计到企业级应用落地 一、Ant Design Pro 6核心特性与生态定位(技术架构分析) 作为Ant Design生态体系的旗舰级企业应用中台框架,Ant Design Pro 6基于以下技术栈实现突破性升级&am…...
用大白话解释基础框架Spring Boot——像“装修套餐”一样简单
SpringBoot是什么(SpringBoot类似装修公司的全包套餐) SpringBoot是Java开发者的“装修神器”,可以快速搭建一个应用系统,不用自己亲自买钉子、水泥和瓷砖(相当于传统的Spring框架的复杂配置),…...
第十三届蓝桥杯大赛软件赛决赛C/C++ 大学 B 组
A 【2022——暴力DP / 优雅背包】-CSDN博客 B 【钟表——类日期问题】-CSDN博客 C 【卡牌——二分】-CSDN博客 D 【最大数字——DFS】-CSDN博客 E 【出差——Dijkstra】-CSDN博客 F 【费用报销——01背包】-CSDN博客 G 【故障——条件概率】-CSDN博客 H 【机房—…...
java后端开发day25--阶段项目(二)
(以下内容全部来自上述课程) 1.美化界面 private void initImage() {//路径分两种://1.绝对路径:从盘符开始写的路径 D:\\aaa\\bbb\\ccc.jpg//2.相对路径:从当前项目开始写的路径 aaa\\bbb\\ccc.jpg//添加图片的时…...
岚图汽车2月销售8013辆,岚图知音硬核引领智能出行
据官方消息,岚图汽车2月销售8013辆,同比增长152%,品牌势能持续提升。其中,岚图知音依靠强大的产品力,且在OTA 2.0之后,其AI大模型逍遥座舱为用户带来全新的出行体验。 业内专业人士表示,“汽车…...
【CSS—前端快速入门】CSS 常用样式
CSS 常用 CSS 样式 1. 前端样式查询网站: MDN Web Docs (mozilla.org) w3school 2. border 2.1 借助 MDN 了解 border 我们借助 MDN 网站来学习 border 样式的使用: 2.2 border 常见属性 保存代码,打开页面: 对于标签不同样式的…...
【软考-架构】1.3、磁盘-输入输出技术-总线
GitHub地址:https://github.com/tyronczt/system_architect 资料&文章更新 文章目录 存储系统💯考试真题输入输出技术💯考试真题第一题第二题 存储系统 寻道时间是指磁头移动到磁道所需的时间; 等待时间为等待读写的扇区转到…...
Linux软连接与时区日期
软连接 使用ln命令创建软连接。 在系统中创建软连接,可以将文件,文件夹连接到其他为止。 类似于Windows系统的快捷方式。 语法:ln -s 参数1 参数2 -s选项,创建软连接。 参数1,被链接的文件或文件夹。 参数2࿰…...
(十)Mapbox GL JS 中点击 Marker 时获取与该 Marker 相关的自定义数据的解决办法
在 Mapbox GL JS 中,如果你想在点击 Marker 时获取与该 Marker 相关的自定义数据,可以通过几种方式将数据绑定到 Marker 上,并在点击时获取这些数据。以下是详细的实现方法,包含代码示例和说明。 方法一:使用 JavaScript 对象属性绑定数据 你可以直接将自定义数据绑定到 …...
PyCharm怎么集成DeepSeek
PyCharm怎么集成DeepSeek 在PyCharm中集成DeepSeek等大语言模型(LLM)可以借助一些插件或通过代码调用API的方式实现,以下为你详细介绍两种方法: 方法一:使用JetBrains AI插件(若支持DeepSeek) JetBrains推出了AI插件来集成大语言模型,不过截至2024年7月,官方插件主要…...
(七)消息队列-Kafka 序列化avro(传递)
(七)消息队列-Kafka 序列化avro(传递) 客从远方来,遗我双鲤鱼。呼儿烹鲤鱼,中有尺素书。 ——佚名《饮马长城窟行》 本文已同步CSDN、掘金平台、知乎等多个平台,图片依然保持最初发布的水印&…...
js基础二
JavaScript基础下 1 事件处理 JS 事件(event)是当用户与网页进行交互时发生的事情,例如单机某个链接或按钮、在文本框中输入文本、按下键盘上的某个按键、移动鼠标等等。当事件发生时,您可以使用 JavaScript 中的事件处理程序&a…...
WSBDF レクチア 定义2 引理3 wsbdf的乘子
定义2 引理3 wsbdf的乘子 ここまで 寝みます❓...
Qt之QStateMachine等待
在项目中经常需要等待,我们模拟0-30的数,假如我们其中5, 25的数需要进行等待,等待用户处理完自己事情后,按下按钮继续,找Qt的项目中有一个 QStateMachineqstatemmachine类提供了一个分层有限状态机。 QSta…...
Wireshark 插件开发实战指南
Wireshark 插件开发实战指南 环境搭建流程图 #mermaid-svg-XpNibno7BIyfzNn5 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-XpNibno7BIyfzNn5 .error-icon{fill:#552222;}#mermaid-svg-XpNibno7BIyfzNn5 .error-t…...
基于SpringBoot的“青少年心理健康教育网站”的设计与实现(源码+数据库+文档+PPT)
基于SpringBoot的“青少年心理健康教育网站”的设计与实现(源码数据库文档PPT) 开发语言:Java 数据库:MySQL 技术:SpringBoot 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 系统总体结构图 实体属性图 系统首页界…...
23-整数转罗马数字
代码 测试用例 测试结果 测试结果 12. 整数转罗马数字 中等 相关标签 相关企业 七个不同的符号代表罗马数字,其值如下: 符号值I1V5X10L50C100D500M1000 罗马数字是通过添加从最高到最低的小数位值的转换而形成的。将小数位值转换为罗马数字有以…...
边缘计算医疗风险自查APP开发方案
核心目标:在便携设备(智能手表/家用检测仪)部署轻量化疾病预测模型,实现低延迟、隐私安全的实时健康风险评估。 一、技术架构设计 #mermaid-svg-iuNaeeLK2YoFKfao {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg…...
Springcloud:Eureka 高可用集群搭建实战(服务注册与发现的底层原理与避坑指南)
引言:为什么 Eureka 依然是存量系统的核心? 尽管 Nacos 等新注册中心崛起,但金融、电力等保守行业仍有大量系统运行在 Eureka 上。理解其高可用设计与自我保护机制,是保障分布式系统稳定的必修课。本文将手把手带你搭建生产级 Eur…...
UR 协作机器人「三剑客」:精密轻量担当(UR7e)、全能协作主力(UR12e)、重型任务专家(UR15)
UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中,UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化…...
爬虫基础学习day2
# 爬虫设计领域 工商:企查查、天眼查短视频:抖音、快手、西瓜 ---> 飞瓜电商:京东、淘宝、聚美优品、亚马逊 ---> 分析店铺经营决策标题、排名航空:抓取所有航空公司价格 ---> 去哪儿自媒体:采集自媒体数据进…...
【JavaWeb】Docker项目部署
引言 之前学习了Linux操作系统的常见命令,在Linux上安装软件,以及如何在Linux上部署一个单体项目,大多数同学都会有相同的感受,那就是麻烦。 核心体现在三点: 命令太多了,记不住 软件安装包名字复杂&…...
分布式增量爬虫实现方案
之前我们在讨论的是分布式爬虫如何实现增量爬取。增量爬虫的目标是只爬取新产生或发生变化的页面,避免重复抓取,以节省资源和时间。 在分布式环境下,增量爬虫的实现需要考虑多个爬虫节点之间的协调和去重。 另一种思路:将增量判…...
RabbitMQ入门4.1.0版本(基于java、SpringBoot操作)
RabbitMQ 一、RabbitMQ概述 RabbitMQ RabbitMQ最初由LShift和CohesiveFT于2007年开发,后来由Pivotal Software Inc.(现为VMware子公司)接管。RabbitMQ 是一个开源的消息代理和队列服务器,用 Erlang 语言编写。广泛应用于各种分布…...
day36-多路IO复用
一、基本概念 (服务器多客户端模型) 定义:单线程或单进程同时监测若干个文件描述符是否可以执行IO操作的能力 作用:应用程序通常需要处理来自多条事件流中的事件,比如我现在用的电脑,需要同时处理键盘鼠标…...
基于PHP的连锁酒店管理系统
有需要请加文章底部Q哦 可远程调试 基于PHP的连锁酒店管理系统 一 介绍 连锁酒店管理系统基于原生PHP开发,数据库mysql,前端bootstrap。系统角色分为用户和管理员。 技术栈 phpmysqlbootstrapphpstudyvscode 二 功能 用户 1 注册/登录/注销 2 个人中…...
HubSpot推出与ChatGPT的深度集成引发兴奋与担忧
上周三,HubSpot宣布已构建与ChatGPT的深度集成,这一消息在HubSpot用户和营销技术观察者中引发了极大的兴奋,但同时也存在一些关于数据安全的担忧。 许多网络声音声称,这对SaaS应用程序和人工智能而言是一场范式转变。 但向任何技…...
