统计单词数
统计单词数
题目描述
一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数。
现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给定的文章中出现的次数和第一次出现的位置。注意:匹配单词时,不区分大小写,但要求完全匹配,即给定单词必须与文章中的某一独立单词在不区分大小写的情况下完全相同(参见样例 1),如果给定单词仅是文章中某一单词的一部分则不算匹配(参见样例 2)。
输入格式
共 2行。
第 1 行为一个字符串,其中只含字母,表示给定单词;
第 2 行为一个字符串,其中只可能包含字母和空格,表示给定的文章。
输出格式
一行,如果在文章中找到给定单词则输出两个整数,两个整数之间用一个空格隔开,分别是单词在文章中出现的次数和第一次出现的位置(即在文章中第一次出现时,单词首字母在文章中的位置,位置从 0 开始);如果单词在文章中没有出现,则直接输出一个整数 −1。
注意:空格占一个字母位
输入输出样例
输入 #1
To
to be or not to be is a question
输出 #1
2 0
输入 #2
to
Did the Ottoman Empire lose its power at that time
输出 #2
-1
说明/提示
数据范围
1≤ 第一行单词长度 ≤10。
1≤ 文章长度 ≤10^6。
解
这道题我先说一下错误思路,算是提供一下反例吧,
最开始我的思路是利用C++的流式字符串的特性把各个单词分开然后存储到一个字符串数组中,然后匹配字符串数组中数组元素,小写匹配看是否与目标单词一致,若一致,则计数器加一,记录首次符合条件的数组元素下标,然后根据下标计算前面有多少个字符,也就是在原字符串的首次出现下标。
这里面其实有个关键问题,就是我们并不能确定每个单词之间相隔多少个空格
这就导致了我们在流式操作后,无法计算得到正确的首次出现的下标位置
没办法,这种操作是行不通的,那么只能传统的使用滑动窗口的方式了,
设置滑动窗口大小为目标单词长度,再均变为小写字母后遍历字符串的对应窗口,看窗口内字符是否与目标单词匹配。这里面要注意循环时的结束条件,应为字符串长度-滑动窗口长度+1
当然,还有之后还有一步判断,就是保证成功匹配的是一个独立的单词而不是某单词的前缀,
这要求若滑动窗口不在首尾,前后一定是空格
若上述条件均满足,计数器加一,记录首次出现的位置即可
#include<bits/stdc++.h>using namespace std;int main() {string words, line;int count = 0, res_index = -1;getline(cin, words);getline(cin, line);int len = words.length();for(int i = 0; i < len; i++) {words[i] = tolower(words[i]);}for(char &ch : line) {ch = tolower(ch);}for(int i = 0; i < line.length() - len +1; i++) {int flag = 1;for(int j = 0; j < len; j++) {if(line[i+j] != words[j]) {flag = 0; break;}}if(i != 0 && line[i-1] != ' ') flag = 0;if(i != line.length() - len && line[i+len] != ' ') flag = 0;if(flag == 1) {count++;if(res_index == -1) res_index = i;}}if(res_index == -1) cout << -1 << endl;else {cout << count << " " << res_index << endl;}return 0;
}
相关文章:
统计单词数
统计单词数 题目描述 一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数。 现在,请你编程实现这一功能,具体要求是:给定一个单词࿰…...
c++pair的用法
pair简单来说就是可以存储两种类型数据的一个类,其内部是使用模板实现的,所以可以指定其内部的类型。 pair在#include <utility> pair的构造 pair<int, string> p1({ 1,"张三" });pair<int, string> p2;pair<int, str…...
石油炼化5G智能制造工厂数字孪生可视化平台,推进行业数字化转型
石油炼化5G智能制造工厂数字孪生可视化平台,推进行业数字化转型。在石油炼化行业,5G智能制造工厂数字孪生可视化平台的出现,为行业的数字化转型注入了新的活力。石油炼化行业作为传统工业的重要领域,面临着资源紧张、环境压力、安…...
IP代理技术革新:探索数据采集的新路径
引言: 随着全球化进程不断加深,网络数据采集在企业决策和市场分析中扮演着愈发重要的角色。然而,地域限制和IP封锁等问题常常给数据采集工作带来了巨大挑战。亿牛云代理服务凭借其强大的网络覆盖和真实住宅IP资源,成为解决这些问…...
流畅的 Python 第二版(GPT 重译)(一)
前言 计划是这样的:当有人使用你不理解的特性时,直接开枪打死他们。这比学习新东西要容易得多,不久之后,活下来的程序员只会用一个容易理解的、微小的 Python 0.9.6 子集来编写代码 。 Tim Peters,传奇的核心开发者&am…...
Vue+jquery+jquery.maphilight实现图片热区高亮以及点击效果
//鼠标悬浮效果 mounted() {this.setCurrentTask(0); //对于id为mapAll的热区图,设置鼠标放置在上面有一个颜色 fillColor填充颜色 strokeColor边框颜色 strokeWidth边框宽度 fillOpacity 是设置热区填充颜色的不透明度的属性。 alwaysOn:true 保持常量$(function(…...
靠谱!朋友圈一键转发和自动转发好友朋友圈
微信朋友圈在生活和工作中扮演着重要的社交和信息传播角色。尤其是对于一些企业来说,朋友圈是不可或缺的推广渠道。 今天就给大家分享一个能够实现一键转发和自动转发好友朋友圈的工具——微信管理系统,让大家都能有效的管理朋友圈。 1、定时发圈&…...
线性顺序表算法库
list.cpp 具体函数实现 #include <stdio.h> #include "list.h" #include <malloc.h>/************************************************** ①函数名: CreateList 功 能: 用数组构建顺序表 参 数: ①SqList *&L:传入的线性表 ②ElemType a[]:使用…...
java分割等和子集(力扣Leetcode416)
分割等和子集 力扣原题链接 给你一个只包含正整数的非空数组nums。请你判断是否可以将这个数组分割成两个子集,使得两个子集的元素和相等。 示例 1: 输入:nums [1,5,11,5] 输出:true 解释:数组可以分割成 [1, 5, 5] …...
383. 赎金信
给你两个字符串:ransomNote 和 magazine ,判断 ransomNote 能不能由 magazine 里面的字符构成。 如果可以,返回 true ;否则返回 false 。 magazine 中的每个字符只能在 ransomNote 中使用一次。 func canConstruct(ransomNote …...
【二】【单片机】有关独立按键的实验
自定义延时函数Delay 分别用Delay.c文件存储Delay函数。用Delay.h声明Delay函数。每次将这两个文件复制到工程中,直接使用。 //Delay.c void Delay(unsigned int xms) //11.0592MHz {while(xms--){unsigned char i, j;i 2;j 199;do{while (--j);}…...
AJAX踩坑指南(知识点补充)
JWT JSON Web Token是目前最为流行的跨域认证解决方案 如何获取:在使用JWT身份验证中,当用户使用其凭据成功登录时,将返回JSON Web Token(令牌) Token本质就是一个包含了信息的字符串 如何获取Token:登录成功之后,服务…...
备战蓝桥杯Day29 - 拼接最大数字问题
问题描述 有n个非负整数,将其按照字符串拼接的方式拼接为一个整数如何拼接可以使得得到的整数最大? 例: 32,94,128,1286,6,71可以拼接除的最大整数为 94716321286128。 问题思路 1.比较两个字符串的第一个数字,数值大的在前面,数值小的在…...
基于springboot的mysql实现读写分离
前言: 首先思考一个问题:在高并发的场景中,关于数据库都有哪些优化的手段?常用的有以下的实现方法:读写分离、加缓存、主从架构集群、分库分表等,在互联网应用中,大部分都是读多写少的场景,设置两个库,主库和读库,主库的职能是负责写,从库主要是负责读…...
Python爬虫之Scrapy框架系列(24)——分布式爬虫scrapy_redis完整实战【XXTop250完整爬取】
目录: 每篇前言:1.使用分布式爬取豆瓣电影信息(1)settings.py文件中的配置:(2)spider文件的更改:(3)items.py文件(两个项目一致!&…...
提升效率,稳定可靠:亚信安慧AntDB的企业价值
亚信安慧AntDB分布式数据库凭借平滑扩展、高可用性和低成本三大核心优势,在业界获得了极高的评价和认可。这些优点不仅为AntDB提供了巨大的市场发展潜力,也使其成为众多企业在数据管理上的首选解决方案。 AntDB的平滑扩展特性极大地提升了企业的灵活性和…...
洛谷入门——P1567 统计天数
统计天数 题目描述 炎热的夏日,KC 非常的不爽。他宁可忍受北极的寒冷,也不愿忍受厦门的夏天。最近,他开始研究天气的变化。他希望用研究的结果预测未来的天气。 经历千辛万苦,他收集了连续 N ( 1 ≤ N ≤ 1 0 6 ) N(1 \leq N …...
C++概述
目录 一、C关键字(63个) 二、C几个关键点: 三、C语言缺陷一:命名冲突 四、C新概念:命名空间(namespace) 五、命名空间的嵌套: 六、展开命名空间:(using …...
Linux学习笔记16 - 系统命令
1. Linux 常见系统管理命令 命令含义格式su切换用户su [选项] [用户名]ps显示系统由该用户运行的进程列表ps [选项]top动态显示系统中运行的程序(一般为每隔 5s)topkill输出特定的信号给指定 PID(进程号)的进程,并根据…...
读书笔记--阅读华为数据治理之旅有感
通过阅读华为的数据治理之旅,了解到华为公司作为高科技企业的引领者,在数据治理工作、数字化智能化转型方面的确有许许多多值得大家学习的地方,华为公司的业务范围广泛,市场竞争压力大,迫切需要用一些高效的手段来减轻员工的工作量,让员工各司其职,在各自承担的主营业务…...
重新思考输入边界:QKeyMapper如何颠覆Windows平台输入设备协作范式
重新思考输入边界:QKeyMapper如何颠覆Windows平台输入设备协作范式 【免费下载链接】QKeyMapper [按键映射工具] QKeyMapper,Qt开发Win10&Win11可用,不修改注册表、不需重新启动系统,可立即生效和停止。支持游戏手柄映射到键鼠…...
终极frpc-desktop轻量级模式配置指南:大幅降低资源占用的10个技巧
终极frpc-desktop轻量级模式配置指南:大幅降低资源占用的10个技巧 frpc-desktop是一款优秀的跨平台FRP桌面客户端,通过可视化配置轻松实现内网穿透功能。对于需要在低配置设备上长期运行的场景,掌握轻量级模式配置至关重要。本文将为您详细介…...
【C】运算符优先级
优先级运算符名称或含义使用形式结合方向说明1[]数组下标数组名[常量表达式]左到右--()圆括号(表达式)/函数名(形参表)--.成员选择(对象)对象.成员名--->成员选择(指针)对象指针->成员名--2-负号运算符-表达式右到左单目运算…...
BackgroundRemover:基于U-2-Net的智能背景移除工具完全指南
BackgroundRemover:基于U-2-Net的智能背景移除工具完全指南 【免费下载链接】backgroundremover Background Remover lets you Remove Background from images and video using AI with a simple command line interface that is free and open source. 项目地址:…...
前端团队协作:别让沟通成本拖垮你的项目
前端团队协作:别让沟通成本拖垮你的项目 什么是前端团队协作? 前端团队协作是指前端开发团队成员之间的协调与配合,包括代码管理、任务分配、沟通交流等方面。别以为前端开发只是写代码,团队协作不好,项目就会变成一场…...
别再只用柱状图了!用Origin玩转‘柱状+点线’组合图,轻松应对论文审稿人的图表挑剔
科研图表升级指南:用Origin打造兼具数据对比与趋势分析的组合图表 在学术论文写作中,图表是研究成果最直观的呈现方式。许多研究者习惯使用单一的柱状图展示数据,但当审稿人要求同时体现数值比较和时间趋势时,这种简单图表就显得力…...
办公效率提升:用深求·墨鉴批量处理发票、表单,省时省力
办公效率提升:用深求墨鉴批量处理发票、表单,省时省力 1. 为什么你需要这款OCR工具 财务小张每周都要处理上百张发票和表单,手动录入数据不仅耗时费力,还容易出错。市场部小李每个月整理客户反馈表,光是调整格式就要…...
从原理图到PCB:LM317与LM337正负电源设计实战与避坑指南
1. 线性电源与开关电源的抉择 刚入行那会儿,我也纠结过该用线性电源还是开关电源。现在做音频前级放大器项目,果断选择了LM317/LM337这套经典方案。线性电源最打动我的就是它的"干净"——就像用滤水壶慢慢过滤的自来水,虽然出水速度…...
如何在极域电子教室控制下找回学习自主权
如何在极域电子教室控制下找回学习自主权 【免费下载链接】JiYuTrainer 极域电子教室防控制软件, StudenMain.exe 破解 项目地址: https://gitcode.com/gh_mirrors/ji/JiYuTrainer 你是否经历过这样的场景?老师在全班电脑上开启了极域电子教室的屏幕广播&…...
ViT图像分类-中文-日常物品实战教程:中文标签本地化翻译与多语言扩展方法
ViT图像分类-中文-日常物品实战教程:中文标签本地化翻译与多语言扩展方法 想用AI模型识别你手机里的照片,却苦于模型只认识英文标签?比如,你拍了一张“包子”的照片,模型却告诉你这是“steamed stuffed bun”。今天&a…...
