当前位置: 首页 > news >正文

分享一个基于python爬虫的“今日头条”新闻数据分析可视化系统(源码、调试、LW、开题、PPT)

💕💕作者:计算机源码社
💕💕个人简介:本人 八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流!
💕💕学习资料、程序开发、技术解答、文档报告
💕💕如需要源码,可以扫取文章下方二维码联系咨询

💕💕Java项目
💕💕微信小程序项目
💕💕Android项目
💕💕Python项目
💕💕PHP项目
💕💕ASP.NET项目
💕💕Node.js项目
💕💕选题推荐

项目实战|基于python开发和数据爬取技术的新闻数据分析

文章目录

  • 1、选题背景
  • 2、研究目的和意义
  • 3、系统功能设计
  • 4、系统页面设计
  • 5、参考文献
  • 6、核心代码

1、选题背景

  随着互联网技术的迅猛发展,新闻资讯的传播渠道越来越广泛,尤其是社交媒体和新闻平台的崛起,使得海量新闻数据得以迅速产生。然而,这种信息的爆炸性增长也带来了巨大的数据处理和分析挑战。特别是在众多新闻平台中,如何从中提取有价值的信息、进行有效的数据分析成为了一个重要课题。以“今日头条”为例,该平台提供了丰富的新闻内容,但由于其数据量庞大且格式多样化,传统的数据处理方法难以满足需求。因此,基于Python的新闻数据分析系统应运而生,旨在通过自动化数据采集、清理与处理,提高数据分析的效率和准确性,并将其转化为具有实际价值的信息,帮助用户和管理者做出更加明智的决策。

2、研究目的和意义

  本系统的开发旨在构建一个综合性新闻数据分析平台,通过现代化的技术手段来提升新闻数据的处理和展示能力。系统通过Scrapy爬虫技术从“今日头条”获取实时新闻数据,这一过程不仅能够自动化地抓取大量数据,还能保证数据的及时性和全面性。系统将对采集到的数据进行详尽的清理和处理,并存储到MySQL数据库中,以确保数据的准确性和可追溯性。最终通过结合Python和Django框架构建Web应用,利用Echarts进行数据可视化展示,使得新闻转发数、点赞数、评论推荐等关键数据得以直观呈现,满足用户和管理者对新闻数据的分析需求。

  该新闻数据分析系统的开发具有重要的实际意义,新闻数据分析系统通过自动化的数据采集和处理,大幅度提升了新闻数据分析的效率,减少了人工干预,降低了数据处理的成本。其次,借助可视化技术,用户能够更直观地理解和分析新闻数据的各种指标,如新闻转发数、点赞数、评论推荐等,从而更好地把握新闻热点和舆论趋势。对于新闻媒体和分析人员来说,这种系统不仅能提升工作效率,还能为其提供有力的数据支持,帮助其制定更加精准的新闻发布和市场策略。最终,系统的开发推动了数据分析技术在新闻行业的应用进步,为新闻数据的深入挖掘和分析提供了坚实的技术基础。

3、系统功能设计

1. 新闻数据爬取与采集
系统的首要研究内容是利用Scrapy爬虫框架从“今日头条”平台自动化地抓取新闻数据。研究将着重于设计和实现高效的爬取策略,以处理不同类型的新闻页面和内容。这包括:
爬虫策略设计:确定爬虫的入口点,制定合理的爬取规则和策略,确保爬取的数据全面且有代表性。
数据提取:从网页中提取新闻标题、发布时间、新闻正文、转发数、点赞数、评论数等关键数据字段,处理各种格式的数据(如HTML、JSON等)。
反爬措施应对:研究应对网站的反爬虫措施,如IP封禁、验证码等,确保爬虫的稳定性和可靠性。
2. 数据清洗与存储
在数据采集后,研究将集中于数据的清洗和存储过程。这包括:
数据预处理:处理原始数据中的噪声和冗余信息,进行数据去重、格式化和标准化操作,保证数据的准确性和一致性。
数据存储:将清洗后的数据存入MySQL数据库,设计合理的数据表结构以支持高效的数据检索和管理。研究将包括数据库的设计、优化和维护,确保系统在高并发情况下的性能。
3. 数据可视化与分析
在数据存储后,系统的核心研究内容是如何将数据可视化,以便进行深入分析和展示。这包括:
数据分析:利用Python的数据分析库(如Pandas、NumPy等)对新闻数据进行统计分析,挖掘出有价值的信息,如新闻热点、舆论趋势等。
可视化设计:基于Echarts框架设计数据可视化界面,实现新闻转发数统计、词云图、新闻点赞统计、新闻媒体统计、新闻评论推荐等可视化展示。
用户界面设计:使用Django框架开发Web应用,实现用户管理、新闻数据管理、系统公告管理等功能,确保用户能够方便地访问和操作系统。
4. 系统功能实现与测试
最后,研究将集中于系统的功能实现和测试,确保系统的稳定性和性能。这包括:
系统功能实现:根据需求实现用户管理、新闻数据管理、系统公告管理等功能,确保系统的完整性和用户体验。
系统测试:进行系统的功能测试、性能测试和安全测试,发现并修复可能存在的问题,确保系统在实际应用中的稳定性和可靠性。

4、系统页面设计

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
如需要源码,可以扫取文章下方二维码联系咨询

5、参考文献

[1]洛桑顿珠.大数据背景下广播电视新闻编辑工作创新路径[J].卫星电视与宽带多媒体,2024,21(14):121-123.
[2]董卓奇,于歌,常奭鹏,等.分布式大数据新闻实时分析系统的设计与实现[J].办公自动化,2024,29(14):69-72.
[3]张丽丽.大数据时代,新闻出版如何进行自我升级[J].云端,2024,(27):57-59.
[4]蒋涛,潘云辉,崔鹏.融合新闻传播模式和传播者情感偏好的虚假新闻检测研究[J/OL].数据分析与知识发现,1-12[2024-08-18].http://kns.cnki.net/kcms/detail/10.1478.G2.20240605.0919.004.html.
[5]雷海涛.大数据技术在电视新闻生产中的应用[J].电视技术,2024,48(04):69-71+88.DOI:10.16280/j.videoe.2024.04.017.
[6]张雅慧.数学方法在新闻数据分析中的应用及实践研究[J].新闻研究导刊,2024,15(06):123-125.
[7]王昺南.大数据技术在财经新闻报道中的应用与挑战[J].新闻文化建设,2024,(05):20-22.
[8]郝珊,魏修治.数据新闻可视化信息误导分析框架与误导方式[J].情报杂志,2024,43(06):177-184.
[9]张飞鹏,徐一雄,陈曦,等.基于新闻文本情绪的区间值股票回报预测研究[J].计量经济学报,2024,4(01):204-230.
[10]贺鹏.大数据技术在新闻领域的应用[J].电视技术,2023,47(11):171-173.DOI:10.16280/j.videoe.2023.11.044.
[11]孙召娜,鞠在秋.大数据技术在电视新闻采编中的应用策略[J].新闻文化建设,2023,(20):128-130.
[12]元方,卢伟,沈浩.基于无监督技术的中文新闻事件数据构建与分析[J].中国传媒大学学报(自然科学版),2023,30(05):1-9.DOI:10.16196/j.cnki.issn.1673-4793.2023.05.003.
[13]周海燕.新媒体技术在新闻采编中的应用[J].电视技术,2023,47(10):77-79.DOI:10.16280/j.videoe.2023.10.019.
[14]肖筱林,王汉生.大数据分析在宏观金融领域的文献综述——基于中央银行的视角[J].经济管理学刊,2023,2(03):89-110.
[15]张墩瑞.新闻媒体中的数据挖掘技术在采访中的应用探究[J].中国传媒科技,2023,(07):92-95.DOI:10.19483/j.cnki.11-4653/n.2023.07.019.
[16]陈旭涧.基于元数据和知识图谱的碎片化数据分析[D].北方工业大学,2023. DOI:10.26926/d.cnki.gbfgu.2023.000248.
[17]郭健.广播电台融媒体数据分析平台的设计与实现[D].西华大学,2023. DOI:10.27411/d.cnki.gscgc.2023.000555.
[18]李亮.新闻简报编辑系统的设计与实现[D].北京邮电大学,2023. DOI:10.26969/d.cnki.gbydu.2023.001941.
[19]王明旭.基于数据挖掘的化工新闻文本分类研究[D].淮阴工学院,2023. DOI:10.27944/d.cnki.ghygy.2023.000078.
[20]陈梓涵.面向影视动画制作流程的三维数据视频生成方法研究[D].桂林电子科技大学,2023. DOI:10.27049/d.cnki.ggldc.2023.000583.

6、核心代码

# # -*- coding: utf-8 -*-# 数据爬取文件import scrapy
import pymysql
import pymssql
from ..items import XinwenxinxiItem
import time
from datetime import datetime,timedelta
import datetime as formattime
import re
import random
import platform
import json
import os
import urllib
from urllib.parse import urlparse
import requests
import emoji
import numpy as np
import pandas as pd
from sqlalchemy import create_engine
from selenium.webdriver import ChromeOptions, ActionChains
from scrapy.http import TextResponse
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait
# 新闻信息
class XinwenxinxiSpider(scrapy.Spider):name = 'xinwenxinxiSpider'spiderUrl = 'https://m.toutiao.com/list/?tag=__all__&max_time=0&min_behot_time=0&ac=wap&count=20&format=json_raw&_signature=UhRCxwAANCPxSQ.5Mm8FWVIUQt&i=&as=A1B6F6B334C36BD&cp=6634E3D65B8D2E1&aid=1698'start_urls = spiderUrl.split(";")protocol = ''hostname = ''realtime = Falsedef __init__(self,realtime=False,*args, **kwargs):super().__init__(*args, **kwargs)self.realtime = realtime=='true'def start_requests(self):plat = platform.system().lower()if not self.realtime and (plat == 'linux' or plat == 'windows'):connect = self.db_connect()cursor = connect.cursor()if self.table_exists(cursor, 'wx07vasx_xinwenxinxi') == 1:cursor.close()connect.close()self.temp_data()returnpageNum = 1 + 1for url in self.start_urls:if '{}' in url:for page in range(1, pageNum):next_link = url.format(page)yield scrapy.Request(url=next_link,callback=self.parse)else:yield scrapy.Request(url=url,callback=self.parse)# 列表解析def parse(self, response):_url = urlparse(self.spiderUrl)self.protocol = _url.schemeself.hostname = _url.netlocplat = platform.system().lower()if not self.realtime and (plat == 'linux' or plat == 'windows'):connect = self.db_connect()cursor = connect.cursor()if self.table_exists(cursor, 'wx07vasx_xinwenxinxi') == 1:cursor.close()connect.close()self.temp_data()returndata = json.loads(response.body)try:list = data["data"]except:passfor item in list:fields = XinwenxinxiItem()try:fields["title"] = emoji.demojize(self.remove_html(str( item["title"] )))except:passtry:fields["picture"] = emoji.demojize(self.remove_html(str( item["image_list"][0]["url"] )))except:passtry:fields["medianame"] = emoji.demojize(self.remove_html(str( item["media_name"] )))except:passtry:fields["gaishu"] = emoji.demojize(self.remove_html(str( item["abstract"] )))except:passtry:fields["pubtime"] = emoji.demojize(self.remove_html(str( item["datetime"] )))except:passtry:fields["commentcount"] = int( item["comment_count"])except:passtry:fields["repincount"] = int( item["repin_count"])except:passtry:fields["likecount"] = int( item["like_count"])except:passtry:fields["laiyuan"] = emoji.demojize(self.remove_html(str( item["url"] )))except:passyield fields# 详情解析def detail_parse(self, response):fields = response.meta['fields']return fields# 数据清洗def pandas_filter(self):engine = create_engine('mysql+pymysql://root:123456@localhost/spiderwx07vasx?charset=UTF8MB4')df = pd.read_sql('select * from xinwenxinxi limit 50', con = engine)# 重复数据过滤df.duplicated()df.drop_duplicates()#空数据过滤df.isnull()df.dropna()# 填充空数据df.fillna(value = '暂无')# 异常值过滤# 滤出 大于800 和 小于 100 的a = np.random.randint(0, 1000, size = 200)cond = (a<=800) & (a>=100)a[cond]# 过滤正态分布的异常值b = np.random.randn(100000)# 3σ过滤异常值,σ即是标准差cond = np.abs(b) > 3 * 1b[cond]# 正态分布数据df2 = pd.DataFrame(data = np.random.randn(10000,3))# 3σ过滤异常值,σ即是标准差cond = (df2 > 3*df2.std()).any(axis = 1)# 不满⾜条件的⾏索引index = df2[cond].index# 根据⾏索引,进⾏数据删除df2.drop(labels=index,axis = 0)# 去除多余html标签def remove_html(self, html):if html == None:return ''pattern = re.compile(r'<[^>]+>', re.S)return pattern.sub('', html).strip()# 数据库连接def db_connect(self):type = self.settings.get('TYPE', 'mysql')host = self.settings.get('HOST', 'localhost')port = int(self.settings.get('PORT', 3306))user = self.settings.get('USER', 'root')password = self.settings.get('PASSWORD', '123456')try:database = self.databaseNameexcept:database = self.settings.get('DATABASE', '')if type == 'mysql':connect = pymysql.connect(host=host, port=port, db=database, user=user, passwd=password, charset='utf8')else:connect = pymssql.connect(host=host, user=user, password=password, database=database)return connect# 断表是否存在def table_exists(self, cursor, table_name):cursor.execute("show tables;")tables = [cursor.fetchall()]table_list = re.findall('(\'.*?\')',str(tables))table_list = [re.sub("'",'',each) for each in table_list]if table_name in table_list:return 1else:return 0# 数据缓存源def temp_data(self):connect = self.db_connect()cursor = connect.cursor()sql = '''insert into `xinwenxinxi`(id,title,picture,medianame,gaishu,pubtime,commentcount,repincount,likecount,laiyuan)selectid,title,picture,medianame,gaishu,pubtime,commentcount,repincount,likecount,laiyuanfrom `wx07vasx_xinwenxinxi`where(not exists (selectid,title,picture,medianame,gaishu,pubtime,commentcount,repincount,likecount,laiyuanfrom `xinwenxinxi` where`xinwenxinxi`.id=`wx07vasx_xinwenxinxi`.id))order by rand()limit 50;'''cursor.execute(sql)connect.commit()connect.close()

💕💕作者:计算机源码社
💕💕个人简介:本人 八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流!
💕💕学习资料、程序开发、技术解答、文档报告
💕💕如需要源码,可以扫取文章下方二维码联系咨询

相关文章:

分享一个基于python爬虫的“今日头条”新闻数据分析可视化系统(源码、调试、LW、开题、PPT)

&#x1f495;&#x1f495;作者&#xff1a;计算机源码社 &#x1f495;&#x1f495;个人简介&#xff1a;本人 八年开发经验&#xff0c;擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等&#xff0c;大家有这一块的问题可以一起交流&…...

QT自定义信号槽

1.自定义信号槽 使用connect()可以让我们连接系统提供的信号和槽&#xff0c;同时也可以自定义信号槽。 例如以学生和老师构建类同时当老师触发信号下课同学收到信号执行“吃饭”这一动作代码示例 #include "SignalAndSlot.h" //Teacher Student 总框架…...

one-shot 序列图像红外小目标分割

one-shot 序列图像红外小目标分割 IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING 代码还未开源 GitHub - D-IceIce/one-shot-IRSTS few-shot&#xff1a;利用少量标注样本进行学习 one-shot: 属于few-shot的特殊情况&#xff0c;只用一个样本进行学习 zero-shot&am…...

JavaScript 单线程防阻塞的原理

JavaScript 是一种单线程语言,这意味着它一次只能执行一个任务。这种设计可能会导致一些问题,比如当遇到耗时的操作时,整个程序可能会被阻塞。为了解决这个问题,JavaScript 使用了事件循环和回调函数的机制,实现了非阻塞式的异步操作。 事件循环 JavaScript 有一个事件队列,用…...

Shell脚本发送邮件的详细步骤与配置方法?

Shell脚本发送邮件的进阶技巧&#xff1f;怎么配置Shell脚本发信&#xff1f; 使用Shell脚本发送邮件是一种高效的自动化手段&#xff0c;特别是在需要定期发送报告、通知或警告信息时。AokSend将详细介绍Shell脚本发送邮件的步骤与配置方法&#xff0c;帮助您更好地掌握这一技…...

如何把Phalcon 集成到PhpStorm里面

一 背景 按照上一篇文章里面写的Phalcon 创建项目过程中的一些坑, 最终我们在终端可以基于Phalcon命令创建对应的开发项目。但在这个过程中,存在一个问题:那就是写代码的时候,发现Phalcon对应的依赖提示都没有,如下: 从上面这个截图来看,就能发现,Phalcon的啥…...

python从入门到精通:循环语句

目录 前言 1、while循环的基础语法 2、while循环的嵌套 3、for循环的基础语法 range语句&#xff1a; for循环临时变量作用域&#xff1a; 4、for循环的嵌套 5、循环中断&#xff1a;break和continue 前言 循环普遍存在于日常生活中&#xff0c;同样&#xff0c;在程序中…...

Codeforces Round 965 (Div. 2)

前言 有人在过七夕&#xff0c;我在打 cf &#xff0c;还有某人独自一人在学校机房&#xff0c;凌晨一点骑上共享单车回宿舍欣赏沿途的秋风扫落叶。 Standings&#xff1a;2166 题目链接&#xff1a;Dashboard - Codeforces Round 965 (Div. 2) - Codeforces A. Find K Distin…...

Win10下载安装Mysql服务

Win10下载安装MySQL 一、官网下载MySQL 1.官网地址&#xff1a; https://www.mysql.com/ 2.在官网首页拉到最下方&#xff0c;点击MySQL Community Server&#xff1a; 3.根据个人电脑的操作系统选择&#xff0c;此处以Windows x64为例&#xff0c;选择第2个&#xff0c;点击…...

MVVM(Model-View-ViewModel)架构模式

在Android开发中&#xff0c;MVVM&#xff08;Model-View-ViewModel&#xff09;架构模式已经成为构建可维护和可扩展应用程序的重要选择。MVVM模式通过分离视图&#xff08;View&#xff09;、模型&#xff08;Model&#xff09;和视图模型&#xff08;ViewModel&#xff09;来…...

C#MVC返回DataTable到前端展示。

很久没写博客了&#xff0c;闭关太久&#xff0c;失踪人口回归&#xff0c;给诸位道友整点绝活。 交代下背景&#xff1a;要做一个行转列的汇总统计&#xff0c;而且&#xff0c;由于是行转列&#xff0c;列的数量不固定&#xff0c;所以&#xff0c;没法使用正常的SqlSugar框…...

HttpUtils工具类(二)Apache HttpClient 5 使用详细教程

目录 一、Apache HttpClient 5介绍 &#xff08;1&#xff09;核心特性 &#xff08;2&#xff09;Apache HttpClient 5 的新特性 &#xff08;3&#xff09;在 Java 项目的主要使用场景及缺点 使用场景&#xff1a; 缺点&#xff1a; 二、在实际项目中的应用 &#xf…...

Vue3.0生命周期钩子(包含:Vue 2.0 和 Vue 3.0)

1、Vue 2.0 生命周期钩子 每个应用程序实例在创建时都有一系列的初始化步骤。例如&#xff0c;创建数据绑定、编译模板、将实例挂载到 DOM 并在数据变化时触发 DOM 更新、销毁实例等。在这个过程中会运行一些叫做生命周期钩子的函数&#xff0c;通过这些钩子函数可以定义业务逻…...

遥感之常用各种指数总结大全

目前在遥感领域基本各种研究领域都会用到各种各样的指数&#xff0c;如水体指数&#xff0c;植被指数&#xff0c;农业长势指数&#xff0c;盐分指数&#xff0c;云指数&#xff0c;阴影指数&#xff0c;建筑物指数&#xff0c;水质指数&#xff0c;干旱指数等等众多。 本文对上…...

【C++】C++11新增特性

目录 C11简介&#xff1a; 1、统一的列表初始化&#xff1a; std::initializer_list 2、自动类型推导&#xff1a; auto&#xff1a; decltype&#xff1a; 3、final 和 override final&#xff1a; override&#xff1a; 4、默认成员函数控制&#xff1a; 显示缺省…...

【LeetCode每日一题】——662.二叉树最大宽度

文章目录 一【题目类别】二【题目难度】三【题目编号】四【题目描述】五【题目示例】六【题目提示】七【解题思路】八【时间频度】九【代码实现】十【提交结果】 一【题目类别】 广度优先搜索 二【题目难度】 中等 三【题目编号】 662.二叉树最大宽度 四【题目描述】 给…...

第二十三节、血量更新逻辑的实现

一、创建代码 引入命名空间 using UnityEngine.UI; 调用UI必须有这个代码 二、ScriptObject类 1、是一个持久化存储文件的类型 接收所有的事件方法 先继承SO类&#xff0c;然后创建项目菜单 2、进行订阅 放入事件类&#xff0c;关联代码&#xff0c;即可进行广播 传递给这…...

Spring Authorization Server 认证服务器搭建

Spring Authorization Server实现了oauth2和oidc,最近有了解相关技术的需求,所以就尝试着进行了基本的环境搭建和技术测试,目前只测试了授权码模式,做一个记录,后续需要用时方便查找和参考。 1. 版本要求 Spring Authorization Server 版本:1.3.1 JDK 版本:17 Spring B…...

秋招突击——8/15——知识补充——垃圾回收机制

文章目录 引言正文指针引用可达性分析算法垃圾回收算法标记清除算法标记整理算法复制分代收集 垃圾收集器Serial收集器ParNew并行收集器Parallel Scavenge吞吐量优先收集器Serial Old老年代收集器Parallel old收集器CMS收集器G1收集器&#xff08;Garbage First垃圾优先&#x…...

【iOS】UITableViewCell的重用问题解决方法

我自己在实验中对cell的重用总结如下&#xff1a; 非自定义Cell和非自定义cell的复用情况一样&#xff1a; 第一次加载创建tableView的时候&#xff0c;是屏幕上最多也显示几行cell就先创建几个cell&#xff0c;此时复用池里什么都没有开始下滑tableView&#xff0c;刚开始滑…...

开发一个微信小程序商城需要哪些技术栈

开发一个小程序商城需要掌握以下技术栈&#xff1a;‌ 前端技术&#xff1a;‌包括HTML、‌CSS和JavaScript&#xff0c;‌用于定义商城的页面结构、‌样式设计和交互功能。‌ 微信小程序专用技术&#xff1a;‌如WXML、‌WXSS、‌JavaScript和JSON&#xff0c;‌用于描述小程…...

望繁信科技荣膺上海市浦东新区博士后创新实践基地称号

近日&#xff0c;上海望繁信科技有限公司&#xff08;简称“望繁信科技”&#xff09;凭借在大数据流程智能领域的卓越表现&#xff0c;成功入选上海市浦东新区博士后创新实践基地。这一荣誉不仅是对望繁信科技创新能力和技术实力的高度认可&#xff0c;也标志着公司在推动产学…...

Nginx--代理与负载均衡(扩展nginx配置7层协议及4层协议方法、会话保持)

前言&#xff1a;本博客仅作记录学习使用&#xff0c;部分图片出自网络&#xff0c;如有侵犯您的权益&#xff0c;请联系删除 一、代理原理 1、反向代理产生的背景 单个服务器的处理客户端&#xff08;用户&#xff09;请求能力有一个极限&#xff0c;当接入请求过多时&#…...

Ubuntu20.4 系统安装后无wifi图标

0. 问题排查 1.检查 BIOS 设置: 有时候&#xff0c;无线网卡可能在 BIOS 中被禁用。重启电脑&#xff0c;进入 BIOS 设置&#xff0c;确保无线网卡选项是启用的。 2.检查硬件开关: 检查您的笔记本电脑是否有物理开关或键盘快捷键来启用或禁用无线网卡。 3.在软件更新中切换…...

牛客网SQL进阶135 :每个6/7级用户活跃情况

每个67级用户活跃情况_牛客题霸_牛客网 0 问题描述 基于用户信息表user_info、、试卷作答记录表exam_record、题目练习记录表practice_record&#xff0c;统计 每个6/7级用户总活跃月份数、2021年活跃天数、2021年试卷作答活跃天数、2021年答题活跃天数&#xff0c;结果 按照总…...

SQLite3使用接口写入二进制文件

使用接口的方式写入二进制文件 &#xff0c;有二种方案。 一、全部文件 一次性写下到数据中 使用sqlite3_bind_blob接口 FILE* fpfopen("user.bmp","rb"); iLenfread(buffer,1,65535,fp); fclose(fp);sqlite3_prepare(pDB,"insert into user values …...

在复杂的数据库架构中,如何优化 SQL 查询以提高性能和减少资源消耗?

在优化 SQL 查询以提高性能和减少资源消耗时&#xff0c;可以考虑以下几个方面&#xff1a; 使用索引&#xff1a;为经常被查询的列创建索引&#xff0c;可以大大加快查询速度。同时&#xff0c;避免过多的索引&#xff0c;因为过多的索引会增加写入操作的开销。 编写高效的查…...

【HarmonyOS】端云一体化初始化项目

简介 端云一体化开发是HarmonyOS对云端开发的支持、实现端云联动。云开发服务提供了云函数、云数据库、云存储等服务&#xff0c;可以使开发者专注于应用的业务逻辑开发&#xff0c;无需关注基础设施&#xff0c;例如&#xff1a;服务器、操作系统等问题。 因此&#xff0c;…...

LLM之KG:利用大语言模型(LLM)对文本语料提取概念和概念之间的语义关系进而实现自动构建知识图谱

LLM之KG:利用大语言模型(LLM)对文本语料提取概念和概念之间的语义关系进而实现自动构建知识图谱 目录 ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例 LLMs之AutoKG:《大型语言模型在知识图…...

Spring Security 6如何使用?

Spring Security 6 是一个功能强大且高度可定制的身份验证和访问控制框架&#xff0c;它专注于为基于Java的应用程序提供全面的安全解决方案。以下是对Spring Security 6的详细解析&#xff1a; 一、核心功能 身份验证&#xff08;Authentication&#xff09;&#xff1a; 验…...