当前位置: 首页 > article >正文

数据结构之字典树(Trie)

字典树Trie详解1. 引言字典树Trie也称为前缀树或单词查找树是一种特殊的树形数据结构用于高效地存储和检索字符串集合。它特别适用于需要快速查找前缀匹配的场景如自动补全、拼写检查、IP路由等应用。2. 基本概念2.1 定义字典树是一种有序树其中每个节点都包含一个字符。从根节点到任何节点的路径都表示一个字符串该字符串由路径上所有节点的字符连接而成。2.2 核心特性前缀共享具有相同前缀的字符串共享相同的路径高效查找查找时间与字符串长度成正比与字典大小无关空间效率通过共享公共前缀减少存储空间3. 数据结构设计3.1 节点结构每个Trie节点通常包含字符值子节点指针/数组标记表示是否为单词结尾可选计数器记录前缀出现次数classTrieNode:def__init__(self):self.children{}# 字符到子节点的映射self.is_end_of_wordFalse# 标记是否为单词结尾self.count0# 可选记录前缀出现次数3.2 根节点Trie的根节点通常为空不包含任何字符作为所有字符串的起始点。4. 基本操作4.1 插入操作插入操作的时间复杂度为O(L)其中L是插入字符串的长度。definsert(self,word):nodeself.rootforcharinword:ifcharnotinnode.children:node.children[char]TrieNode()nodenode.children[char]node.is_end_of_wordTruenode.count14.2 查找操作查找操作同样具有O(L)的时间复杂度。defsearch(self,word):nodeself.rootforcharinword:ifcharnotinnode.children:returnFalsenodenode.children[char]returnnode.is_end_of_word4.3 前缀查找前缀查找用于判断是否存在以给定前缀开头的字符串。defstarts_with(self,prefix):nodeself.rootforcharinprefix:ifcharnotinnode.children:returnFalsenodenode.children[char]returnTrue5. 高级特性5.1 前缀计数可以扩展Trie节点以支持前缀计数功能。defcount_prefix(self,prefix):nodeself.rootforcharinprefix:ifcharnotinnode.children:return0nodenode.children[char]returnnode.count5.2 删除操作删除操作需要考虑多种情况删除单词但不影响其他单词删除节点时需要确保不破坏其他路径defdelete(self,word):def_delete(node,word,depth):ifnotnode:returnFalseifdepthlen(word):ifnotnode.is_end_of_word:returnFalsenode.is_end_of_wordFalsenode.count-1returnlen(node.children)0charword[depth]child_nodenode.children.get(char)ifnotchild_node:returnFalseshould_delete_child_delete(child_node,word,depth1)ifshould_delete_child:delnode.children[char]returnlen(node.children)0andnotnode.is_end_of_wordreturnFalse_delete(self.root,word,0)6. 实现变体6.1 压缩Trie压缩Trie也称为基数树通过合并单子节点路径来减少空间占用。6.2 双数组Trie使用两个数组实现提高缓存局部性适合大规模数据。6.3 Patricia TriePatricia Trie也称为 radix tree通过合并具有共同前缀的节点来优化存储。7. 时间复杂度分析操作时间复杂度空间复杂度插入O(L)O(L)查找O(L)O(1)前缀查找O(L)O(1)删除O(L)O(1)其中L是字符串的长度。8. 空间复杂度分析Trie的空间复杂度在最坏情况下为O(N×L)其中N是插入的字符串数量L是字符串的平均长度但在实际应用中由于前缀共享空间占用通常远小于这个理论值。9. 应用场景9.1 自动补全Trie是自动补全功能的理想选择可以快速找到所有以给定前缀开头的单词。9.2 拼写检查通过构建字典Trie可以高效地检查单词是否存在。9.3 IP路由在路由表中Trie可以高效地匹配IP地址前缀。9.4 字符串搜索在文本编辑器中Trie可以用于快速查找和替换操作。9.5 前缀统计在搜索引擎中Trie可以用于统计不同前缀的搜索频率。10. 优缺点分析10.1 优点快速查找查找时间与字典大小无关前缀匹配高效天然支持前缀搜索空间优化通过共享前缀减少存储有序性可以按字典序遍历所有字符串10.2 缺点空间占用对于稀疏数据可能占用较多空间实现复杂度相比哈希表实现更复杂内存局部性可能不如数组结构好11. 性能优化11.1 节点压缩合并单子节点路径减少节点数量。11.2 数组实现使用固定大小的数组代替字典提高访问速度。11.3 缓存优化优化数据结构以提高缓存命中率。12. 与其他数据结构的比较12.1 与哈希表比较特性Trie哈希表查找时间O(L)O(1)平均前缀查找O(L)不支持空间占用较高较低有序性支持不支持12.2 与二叉搜索树比较特性Trie二叉搜索树查找时间O(L)O(log N)前缀查找O(L)不支持字符串专用是否13. 实际应用案例13.1 搜索引擎自动补全classAutocompleteSystem:def__init__(self):self.trieTrie()self.load_dictionary()defsuggest(self,prefix):returnself.trie.words_with_prefix(prefix)13.2 拼写检查器classSpellChecker:def__init__(self):self.dictionaryTrie()self.load_words()defcheck_word(self,word):returnself.dictionary.search(word)defsuggest_corrections(self,word):# 实现基于Trie的拼写建议算法pass14. 总结字典树是一种强大而高效的数据结构特别适用于字符串处理场景。虽然它在某些情况下可能占用较多空间但其前缀匹配的效率和有序性使其在许多应用中成为不可或缺的工具。理解Trie的工作原理和实现细节对于解决字符串相关问题是至关重要的。

相关文章:

数据结构之字典树(Trie)

字典树(Trie)详解 1. 引言 字典树(Trie),也称为前缀树或单词查找树,是一种特殊的树形数据结构,用于高效地存储和检索字符串集合。它特别适用于需要快速查找前缀匹配的场景,如自动补全…...

C++常量表达式constexpr在编译期计算与模板元编程中的结合

C常量表达式constexpr与模板元编程的结合为现代C带来了前所未有的编译期计算能力,这种技术组合不仅提升了程序性能,还增强了代码的表达能力。在C11引入constexpr后,开发者能够在编译期完成复杂的计算,而模板元编程则提供了类型操作…...

开源字体 Source Sans 3 从零开始的全面应用指南

开源字体 Source Sans 3 从零开始的全面应用指南 【免费下载链接】source-sans Sans serif font family for user interface environments 项目地址: https://gitcode.com/gh_mirrors/so/source-sans 价值定位:为什么 Source Sans 3 是现代 UI 设计的理想选择…...

FramePack视频扩散技术探索:从原理到实践的全流程指南

FramePack视频扩散技术探索:从原理到实践的全流程指南 【免费下载链接】FramePack Lets make video diffusion practical! 项目地址: https://gitcode.com/gh_mirrors/fr/FramePack 副标题:如何解决AI舞蹈视频创作中的效率与质量平衡问题 FrameP…...

如何用abcjs在浏览器中快速生成专业五线谱:完整免费教程

如何用abcjs在浏览器中快速生成专业五线谱:完整免费教程 【免费下载链接】abcjs javascript for rendering abc music notation 项目地址: https://gitcode.com/gh_mirrors/ab/abcjs 在数字化音乐创作与分享的时代,abcjs作为一个强大的JavaScript…...

GD32F303用J-Link烧录报错0x08000000?别慌,试试这个STM32解锁工具

GD32F303 J-Link烧录报错0x08000000的终极解决方案 当你在使用J-Link烧录GD32F303芯片时遇到"Programming failed address 0x08000000"的错误提示,这通常意味着芯片的Flash存储器处于保护状态。这种保护机制原本是为了防止意外擦除或修改重要数据&#x…...

紧急预警:C++27 std::filesystem::copy_options::recursive_nowait 已被证实引发静默截断!附官方补丁+3行兼容封装方案(2025 Q2前必读)

第一章&#xff1a;C27 文件系统库扩展应用C27 标准对 <filesystem> 库进行了实质性增强&#xff0c;新增了异步路径遍历、符号链接元数据深度解析、跨设备硬链接原子创建以及基于策略的路径规范化接口。这些特性显著提升了在复杂存储拓扑&#xff08;如容器挂载点、分布…...

避坑指南:树莓派读取NTC热敏电阻温度不准?可能是你的Steinhart-Hart公式用错了

树莓派温度监测精度提升实战&#xff1a;从Steinhart-Hart公式到系统级校准 当你在树莓派上搭建的温度监测系统显示当前室温为32C&#xff0c;而实际温度计读数却是28C时&#xff0c;这种偏差可能让人抓狂。这不是简单的测量误差&#xff0c;而是整个信号链中多个环节共同作用的…...

RBTray完全指南:Windows任务栏清理终极解决方案

RBTray完全指南&#xff1a;Windows任务栏清理终极解决方案 【免费下载链接】rbtray A fork of RBTray from http://sourceforge.net/p/rbtray/code/. 项目地址: https://gitcode.com/gh_mirrors/rb/rbtray 你是否经常感到Windows任务栏拥挤不堪&#xff1f;各种后台程序…...

AI音频分离效率提升指南:Demucs多轨道提取技术实战

AI音频分离效率提升指南&#xff1a;Demucs多轨道提取技术实战 【免费下载链接】demucs Code for the paper Hybrid Spectrogram and Waveform Source Separation 项目地址: https://gitcode.com/gh_mirrors/de/demucs 在数字音频处理领域&#xff0c;高质量音频分离技术…...

基于浏览器端异步检测的B站用户成分分析方案:社区互动效率提升92%的技术实现

基于浏览器端异步检测的B站用户成分分析方案&#xff1a;社区互动效率提升92%的技术实现 【免费下载链接】bilibili-comment-checker B站评论区自动标注成分油猴脚本&#xff0c;主要为原神玩家识别 项目地址: https://gitcode.com/gh_mirrors/bi/bilibili-comment-checker …...

百度网盘直链解析技术:突破下载限制的Python解决方案

百度网盘直链解析技术&#xff1a;突破下载限制的Python解决方案 【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 在数字资源共享日益频繁的今天&#xff0c;百度网盘作为国内主…...

苹果手机用微信,这 8 个设置赶紧关!隐私正在泄露

文章目录前言第一道门&#xff1a;别让陌生人在你家门口"数地砖"第二道门&#xff1a;给你的手机号穿上"隐身衣"第三道门&#xff1a;清理那些"寄生"在你账号上的第三方第四道门&#xff1a;关掉"附近的人"&#xff0c;拒绝被"雷…...

2025届毕业生推荐的五大AI学术方案推荐榜单

Ai论文网站排名&#xff08;开题报告、文献综述、降aigc率、降重综合对比&#xff09; TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 人工智能技术迅猛发展&#xff0c;给毕业论文写作带来全新范式&#xff0c;借助自然语言处理…...

Win11Debloat终极指南:一键清理Windows 11的完整解决方案

Win11Debloat终极指南&#xff1a;一键清理Windows 11的完整解决方案 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and…...

Intv_AI_MK11 跨平台开发应用:基于 Qt 框架的桌面智能助手

Intv_AI_MK11 跨平台开发应用&#xff1a;基于 Qt 框架的桌面智能助手 1. 为什么需要跨平台智能助手 在日常工作和学习中&#xff0c;我们经常遇到这样的场景&#xff1a;在Windows上收集的资料&#xff0c;想在Mac上继续编辑&#xff1b;在Linux服务器上开发的代码&#xff…...

快马平台快速构建gitbash工作流原型:可视化模拟git命令助手

最近在尝试用InsCode(快马)平台快速验证一个Git工作流助手的原型&#xff0c;整个过程意外地顺畅。作为一个经常需要教新人使用Git的开发者&#xff0c;一直想做个可视化工具来降低学习门槛&#xff0c;但传统开发要配环境、写前后端&#xff0c;往往还没开始就放弃了。这次用快…...

从“页面描述”到“AI事实层”——让机器读懂你的品牌

引言:为什么你的产品信息在AI答案中“丢失”了? 陆薇在数字营销领域摸爬滚打了九年。她做过技术、干过内容、搞过数据分析,算得上是这个行业里少有的“多面手”。她所在的智联优选,一家主营智能家居产品的跨境电商品牌,在过去一年里已经按照《答案之书》第八篇和第九篇的…...

CentOS 7.6 下 OpenGauss 6.0 极简版安装踩坑实录:从用户权限到远程连接的全流程避坑

CentOS 7.6 下 OpenGauss 6.0 极简版安装实战&#xff1a;从权限配置到远程访问的深度排坑指南 国产数据库的崛起让OpenGauss逐渐成为企业级应用的新选择。但初次部署时&#xff0c;从用户权限到环境变量配置的每个环节都可能成为"拦路虎"。本文将带你穿越安装全流程…...

利用快马平台快速构建你的Skill-Vetter技能评估原型

利用快马平台快速构建你的Skill-Vetter技能评估原型 最近在做一个技能评估工具的原型验证&#xff0c;发现用传统方式从零开始搭建实在太费时间。后来尝试了InsCode(快马)平台&#xff0c;整个过程变得特别顺畅。这里分享一下如何用这个平台快速构建一个编程技能评估原型。 原…...

精选1款免费商用字体:思源宋体从选择到实战的高效应用指南

精选1款免费商用字体&#xff1a;思源宋体从选择到实战的高效应用指南 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 为什么选择免费商用字体对设计项目至关重要&#xff1f; 在当今…...

3个实用技巧轻松解决ComfyUI-Custom-Scripts新手难题

3个实用技巧轻松解决ComfyUI-Custom-Scripts新手难题 【免费下载链接】ComfyUI-Custom-Scripts Enhancements & experiments for ComfyUI, mostly focusing on UI features 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI-Custom-Scripts ComfyUI-Custom-Scr…...

【实战 01】任务定义:从经营维度构建 Text2SQL Agent 评测基准

0. 引言&#xff1a;数据分析的“最后一公里”在大型集团的数字化实践中&#xff0c;BI 看板解决了“看数”的问题&#xff0c;但无法解决“问数”的即时性。业务人员&#xff08;如置业顾问、项目总、财务经理&#xff09;往往有大量碎片的、非标的数据需求。Text2SQL Agent 的…...

语义分割骨干网络选型指南:MobileNet与Xception实战决策手册

语义分割骨干网络选型指南&#xff1a;MobileNet与Xception实战决策手册 【免费下载链接】deeplabv3-plus-pytorch 这是一个deeplabv3-plus-pytorch的源码&#xff0c;可以用于训练自己的模型。 项目地址: https://gitcode.com/gh_mirrors/de/deeplabv3-plus-pytorch 在…...

嵌入式Linux学习(Day05)C 语言(第二天)核心语法:运算符与流程控制(超详细笔记)

本文整理 C 语言运算符和流程控制语句核心知识点&#xff0c;结合表格梳理语法规则、搭配代码示例 实战练习&#xff0c;零基础友好&#xff0c;适合入门巩固、刷题备考&#xff0c;可直接用于 C 语言基础学习参考。一、运算符补充C 语言运算符是编程基础&#xff0c;本节重点…...

Ventoy RAID启动解决方案:突破存储阵列引导瓶颈的实战指南

Ventoy RAID启动解决方案&#xff1a;突破存储阵列引导瓶颈的实战指南 【免费下载链接】Ventoy A new bootable USB solution. 项目地址: https://gitcode.com/GitHub_Trending/ve/Ventoy 在服务器部署和高端PC应用中&#xff0c;从RAID阵列→磁盘冗余存储技术启动系统往…...

商用车辆电池健康数据深度解析:从真实充电记录到寿命预测

商用车辆电池健康数据深度解析&#xff1a;从真实充电记录到寿命预测 【免费下载链接】battery-charging-data-of-on-road-electric-vehicles This repository is transfered from the personal account of Dr. Zhognwei Deng (Michael Teng) 项目地址: https://gitcode.com/…...

超离谱!iOS 26.0.1 Filza 管理器发布,有效可用

Filza 内置 DarkSword 利用已发布&#xff0c;支持更多系统版本。 注意&#xff01;System 目录仍然无法修改&#xff0c;仅对 var/mobile 目录。能实现读取、写入、删除等操作。有点离谱&#xff01;Little_34306 作者刚发布网页版授权 Filza 方法&#xff0c;现在又发布 Fi…...

解锁3大维度:Helix Toolkit如何重构.NET开发者的3D开发体验

解锁3大维度&#xff1a;Helix Toolkit如何重构.NET开发者的3D开发体验 【免费下载链接】helix-toolkit Helix Toolkit is a collection of 3D components for .NET. 项目地址: https://gitcode.com/gh_mirrors/he/helix-toolkit Helix Toolkit是一套功能完备的.NET 3D组…...

告别虚拟机!在Win11的WSL2里用Rust给STM32点灯,保姆级避坑指南(含CMSIS-DAP配置)

在Win11的WSL2中用Rust点亮STM32&#xff1a;全流程避坑指南 当传统虚拟机因性能损耗和资源占用成为开发瓶颈时&#xff0c;WSL2的出现为嵌入式开发者提供了全新选择。本文将带你体验如何在Windows 11环境下&#xff0c;通过WSL2构建完整的Rust嵌入式开发工具链&#xff0c;并解…...