当前位置: 首页 > news >正文

机器学习入门之 pandas

pandas 有三种数据结构

一种是 Series

一种是 Dataframe

import  pandas as  pd
import  numpy as  np
score = np.random.randint(0,100,[10,5])score[0,0] = 100Datascore = pd.DataFrame(score)subject = ["语文","数学","英语","物理","化学"]Datascore.columns = subjectstuName = {"同学"+ str(i) for i  in range(10)}Datascore.index = stuNameprint(Datascore)print(Datascore.shape)

使用  列表  做数据传入  可以更方便使用列表的下标更改数据

import  pandas as  pd
import  numpy as  np
import  matplotlib.pyplot as  plt
# 读取 csv的 文档
starbucks =    pd.read_csv('directory.csv')
# 按照 Country 进行分组聚合
count = starbucks.groupby(['Country']).count()
# 绘制直线图
count['Brand'].plot(kind = "bar",figsize=(20,8))
plt.show()

import  matplotlib.pyplot as plt
import pandas as pd
import numpy as  np
# 使得数据显示完全
pd.set_option('display.max_columns', 1000)
pd.set_option('display.width', 1000)
pd.set_option('display.max_colwidth', 1000)# 读取文件
MovieDate = pd.read_csv("IMDB-Movie-Data.csv")
# 取平均值  取平均值函数 mean()
meanData=MovieDate["Rating"].mean()
print(meanData)
# 获取导演的人数  使用获取标签  然后使用 unipue去掉重复值  然后获取到对应的数量
DirectorCount = MovieDate["Director"].unique().shape[0]
print(DirectorCount)
import  matplotlib.pyplot as plt
import pandas as pd
import numpy as  np
# 使得数据显示完全
pd.set_option('display.max_columns', 1000)
pd.set_option('display.width', 1000)
pd.set_option('display.max_colwidth', 1000)# 读取文件
MovieDate = pd.read_csv("IMDB-Movie-Data.csv")
# 取平均值  取平均值函数 mean()
meanData=MovieDate["Rating"].mean()# 获取导演的人数  使用获取标签  然后使用 unipue去掉重复值  然后获取到对应的数量
DirectorCount = MovieDate["Director"].unique().shape[0]# 获得 Rating  和 Values的分布
# 使用pandas的画图工具来画的话,无法精细的描绘图像,还是需要使用matplotlib
MovieDate["Rating"].plot(kind="hist")
# 创建画布
plt.figure(figsize=(20,8),dpi=100)
# 描绘直方图  添加数据就可以弹出图形
plt.hist(MovieDate["Rating"])
# 修改刻度
# 确定最大值  最小值   分组
Maxrate = MovieDate['Rating'].max()
Minrate = MovieDate['Rating'].min()
# linespace  np的一个函数  可以创建等差数列,这些数列均匀的分布在范围内  返回一维数组类型
# start end num-->分成的组数
xticks=np.linspace(Minrate,Maxrate,num=21)
# 只能填入
plt.xticks(xticks)
plt.show()

相关文章:

机器学习入门之 pandas

pandas 有三种数据结构 一种是 Series 一种是 Dataframe import pandas as pd import numpy as np score np.random.randint(0,100,[10,5])score[0,0] 100Datascore pd.DataFrame(score)subject ["语文","数学","英语","物理&quo…...

Django之JWT库与SimpleJWT库的使用

Django之JWT库与SimpleJWT库的使用 JWTJWT概述头部(header)载荷(payload)签名(signature) Django使用JWT说明jwt库的使用安装依赖库配置settings.py文件配置urls.py文件创建视图配置权限 SimpleJWT库的使用安装SimpleJWT库配置Django项目配置路由创建用户接口测试身份认证自定义…...

Jmeter远程服务模式运行时引用csv文件的路径配置

问题 在使用jmeter过程中,本机的内存等配置不足,启动较多的线程时,可以采用分布式运行。 在分布式运行的时候,jmeter会自动将脚本从master主机发送到remote主机上,所以不需要考虑将脚本拷贝到remote主机。但是jmeter…...

《OWASP代码审计》学习——注入漏洞审计

一、注入的概念 注入攻击允许恶意用户向应用程序添加或注入内容和命令,以修改其行为。这些类型的攻击是常见且广泛的,黑客很容易测试网站是否易受攻击,攻击者也很容易利用这些攻击。如今,它们在尚未更新的遗留应用程序中非常常见…...

Linux虚拟机中安装MySQL5.6.34

目录 第一章、xshell工具和xftp的使用1.1)xshell下载与安装1.2)xshell连接1.3)xftp下载安装和连接 第二章、安装MySQL5.6.34(不同版本安装方式不同)2.1)关闭防火墙,传输MySQL压缩包到Linux虚拟机2.2&#x…...

Django的FBV和CBV

Django的FBV和CBV 基于django开发项目时,对于视图可以使用 FBV 和 CBV 两种模式编写。 FBV,function base views,其实就是编写函数来处理业务请求。 from django.contrib import admin from django.urls import path from app01 import view…...

[每周一更]-(第57期):用Docker、Docker-compose部署一个完整的前后端go+vue分离项目

文章目录 1.参考项目2.技能点3.GO的Dockerfile配置后端的结构如图Dockerfile先手动docker调试服务是否可以启动报错 4.Vue的Dockerfile配置前端的结构如图nginx_docker.confDockerfile构建 5.docker-compose 整合前后端docker-compose.yml错误记录(1)ip端…...

springboot-mybatis的增删改查

目录 一、准备工作 二、常用配置 三、尝试 四、增删改查 1、增加 2、删除 3、修改 4、查询 五、XML的映射方法 一、准备工作 实施前的准备工作: 准备数据库表 创建一个新的springboot工程,选择引入对应的起步依赖(mybatis、mysql驱动…...

HTML5(H5)的前生今世

目录 概述HTML5与其他HTML的区别CSS3与其他CSS版本的区别总结 概述 HTML5是一种用于构建和呈现网页的最新标准。它是HTML(超文本标记语言)的第五个版本,于2014年由万维网联盟(W3C)正式推出。HTML5的前身可以追溯到互联…...

抽象工厂模式(Abstract Factory)

抽象工厂模式提供一个创建一组相关或相互依赖的对象的接口,而无须指定它们具体的类,每个子类可以生产一系列相关的产品。 The Abstract Factory Pattern is to provide an interface for creating families of related or dependent objects without s…...

Java 实现下载文件工具类

package com.liunian.utils;import lombok.SneakyThrows;import javax.servlet.ServletOutputStream; import javax.servlet.http.HttpServletResponse; import java.io.File; import java.io.FileInputStream;/*** ClassName DownloadFileUtils* Author liuyan 下载文件工具类…...

C# 12 预览版的新功能

作者:Kathleen Dollard 排版:Alan Wang Visual Studio 17.7 Preview 3 和 .NET 8 Preview 6 的发布推进了 C# 12的发展。此预览版包含的功能为将来的性能增强奠定了基础。现在,您能够在库中更方便的使用内联函数。此预览版首次推出了一项实验…...

34.利用matlab解 多变量多目标规划问题(matlab程序)

1.简述 学习目标:适合解 多变量多目标规划问题,例如 收益最大,风险最小 主要目标法,线性加权法,权值我们可以自己设定。 收益函数是 70*x(1)66*x(2) ; 风险函数是 0.02*x(1)^20.01*x(2)^20.04*(x…...

暑假刷题第18天--7/30

165. 小猫爬山 - AcWing题库(dfs) #include<iostream> #include<string> #include<bitset> #include<cstring> #include<algorithm> using namespace std; const int N18; bool vis[N]; int a[N],n,ans,sum[N],k; bool cmp(int x,int y){retur…...

通向架构师的道路之Apache整合Tomcat

一、先从J2EE工程的通用架构说起 这是一个通用的Web即B/S工程的架构&#xff0c;它由&#xff1a; Web Server App Server DB Server 三大部分组成&#xff0c;其中&#xff1a; Web Server 置于企业防火墙外&#xff0c;这个防火墙&#xff0c;大家可以认为是…...

如何消除“信息孤岛”对业务增长的威胁?

根据CMSWire的数据&#xff0c;员工平均每天要花36%的时间来查找和整合信息。但44%的情况下&#xff0c;他们找不到信息。这种时间和精力的浪费就是信息孤岛造成的。 什么是信息孤岛&#xff1f; 当部门存储数据并限制其他人访问数据时&#xff0c;就会出现信息孤岛&#xff…...

Kali部署dvwa和pikachu靶场

kali换源 进入 vim /etc/apt/sources.list deb https://mirrors.aliyun.com/kali kali-rolling main non-free contrib deb-src https://mirrors.aliyun.com/kali kali-rolling main non-free contrib替换完后更新源 apt-get upadteDVWA靶场环境搭建 使用git从github上把DV…...

​LeetCode解法汇总722. 删除注释

目录链接&#xff1a; 力扣编程题-解法汇总_分享记录-CSDN博客 GitHub同步刷题项目&#xff1a; https://github.com/September26/java-algorithms 原题链接&#xff1a;力扣 描述&#xff1a; 给一个 C 程序&#xff0c;删除程序中的注释。这个程序source是一个数组&#x…...

Linux中的firewall-cmd

2023年8月4日&#xff0c;周五上午 目录 打开端口关闭端口查看某个端口是否打开查看当前防火墙设置firewall-cmd中的服务在防火墙中什么是服务&#xff1f;为什么会有服务&#xff1f;打开或关闭服务查看某个服务是否打开firewall-cmd中的 zones查看所有可用的zones&#xff0…...

python 最大归一化

最大归一化是将数据转化到[-1,1]范围之间。公式如下 其中|X|max为x特征的绝对值的最大值。 数据标准化算法介绍—数据建模工具_预处理_Max_字段 """ 最大绝对值归一化&#xff08;max abs normalization &#xff09;&#xff1a;也就是将数值变为单位长度&…...

大功率双路直流电机驱动板设计资料集,含原理图、PCB、测试源码及器件选型分析,光耦隔离驱动,稳...

大功率双路直流电机驱动板的设计源文件&#xff0c;包括原理图、PCB、原理图与PCB器件库、BOM清单、stm32测试源 &#xff08;的是设计资料&#xff0c;的是资料&#xff0c;不是实际的产品哈&#xff09;&#xff0c;另外可对该图的设计原理&#xff0c;器件参数选型进行在线 …...

RexUniNLU开源NLU模型实战:金融研报关系抽取+事件时间线自动生成案例

RexUniNLU开源NLU模型实战&#xff1a;金融研报关系抽取事件时间线自动生成案例 1. 引言&#xff1a;当研报分析遇上智能信息抽取 想象一下这个场景&#xff1a;作为一名金融分析师&#xff0c;你刚收到一份长达50页的行业深度研究报告。你需要从中找出所有提到的公司、它们之…...

周红伟:龙虾安装大全,这应该是最详细的 OpenClaw 安装手册了(附20+张图)

OpenClaw 是一个开源 AI 代理框架&#xff0c;由奥地利开发者 Peter Steinberger 创建&#xff0c;专注于构建自主 AI 代理&#xff0c;能够执行实际任务&#xff08;如写代码、管理文件、浏览网页等&#xff09;&#xff0c;而非仅限于聊天。它从一个简单原型迅速演变为 GitHu…...

技术适配器中的接口转换与兼容处理

技术适配器中的接口转换与兼容处理 在现代软件开发中&#xff0c;系统间的集成与协作越来越普遍&#xff0c;但由于不同系统可能采用不同的技术栈、协议或数据格式&#xff0c;接口兼容性问题成为开发中的常见挑战。技术适配器作为一种中间层解决方案&#xff0c;通过接口转换…...

MATLAB GUI:打造你的专属图像美化工具箱

1. MATLAB GUI图像处理工具箱入门指南 第一次接触MATLAB GUI开发时&#xff0c;我也曾被那些专业术语吓到。但后来发现&#xff0c;用MATLAB做个图像处理工具箱其实比想象中简单得多。就像搭积木一样&#xff0c;把各种功能模块组合起来&#xff0c;就能做出一个实用的图像美化…...

痞子衡嵌入式:turbo-spiboot - 一种基于MCUBoot协议的二级SPI加载APP提速方案壕

前面我们对 Kafka 的整体架构和一些关键的概念有了一个基本的认知&#xff0c;本文主要介绍 Kafka 的一些配置参数。掌握这些参数的作用对我们的运维和调优工作还是非常有帮助的。 写在前面 Kafka 作为一个成熟的事件流平台&#xff0c;有非常多的配置参数。详细的参数列表可以…...

Docker 容器中运行 AI CLI 工具:用户隔离与持久化卷实战指南捉

环境安装 pip install keystone-engine capstone unicorn 这3个工具用法极其简单&#xff0c;下面通过示例来演示其用法。 Keystone 示例 from keystone import * CODE b"INC ECX; ADD EDX, ECX" try:ks Ks(KS_ARCH_X86, KS_MODE_64)encoding, count ks.asm(CODE)…...

MAA明日方舟助手:解放双手的终极自动化解决方案

MAA明日方舟助手&#xff1a;解放双手的终极自动化解决方案 【免费下载链接】MaaAssistantArknights 《明日方舟》小助手&#xff0c;全日常一键长草&#xff01;| A one-click tool for the daily tasks of Arknights, supporting all clients. 项目地址: https://gitcode.c…...

手把手教你用pip download和--platform参数,提前备好Linux服务器离线Python环境

手把手教你用pip download和--platform参数&#xff0c;提前备好Linux服务器离线Python环境 在Linux服务器上部署Python应用时&#xff0c;最让人头疼的莫过于服务器无法访问外网。想象一下&#xff0c;当你兴冲冲地准备部署一个精心开发的应用&#xff0c;却因为依赖包无法下载…...

2023年iMac 21.5寸内存与SSD升级实战指南

1. 为什么你的iMac需要升级内存和SSD&#xff1f; 2019款iMac 21.5寸标配的8GB内存和机械硬盘&#xff08;或小容量Fusion Drive&#xff09;放在2023年确实有点力不从心了。我去年接手朋友这台机器时&#xff0c;开个Photoshop都要等半分钟&#xff0c;更别说同时运行几个设计…...