最新要闻
- 不是“空中楼阁”:努比亚Pad 3D搭载全球最大Leia 3D内容生态
- 【报资讯】男子车停路边去吃烧烤 回来瞬间崩溃:路边已装上护栏
- 【独家焦点】作文游西湖300字(精选40篇)
- 千里托运奔驰GLC被淋满牛粪 女子崩溃:花1900元洗了5遍
- 【世界速看料】情侣打车3小时后跑单拉黑司机 司机:246元车费没了
- 世界资讯:微软承认向无法升级的设备推荐Win11:已进行修复
- 环球即时:压水堆
- 当前滚动:这些“领导”短信收到没?专门针对iPhone用户诈骗:全国多地预警
- 环球精选!王一博、梁朝伟《无名》北美院线扩映!豆瓣降至6.7分
- 当前简讯:大爷怒斥夜市挂日本元素油纸伞:主办方回应令人不解
- 环球头条:导演新海诚:中国动画电影迟早会超过日本
- 天天热文:开办以来首位!跨性别演员柏林电影节获奖
- 微速讯:长城放出王炸?长城水平对置八缸发动机摩托曝光 真猛兽
- 环球热头条丨可以两天一充的骁龙8 Gen2手机:出现了
- 每日热讯!马里肯涅巴地区发生武装抢劫 中使馆提醒关注当地安全情况
- 威马汽车再发内部信:部分员工复工 其余人员无薪休假
手机
iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
- 警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- 男子被关545天申国赔:获赔18万多 驳回精神抚慰金
- 3天内26名本土感染者,辽宁确诊人数已超安徽
- 广西柳州一男子因纠纷杀害三人后自首
- 洱海坠机4名机组人员被批准为烈士 数千干部群众悼念
家电
关于数据分析中的绘图分析的学习报告
一、箱型图分析箱型图依据实际数据绘制,对数据没有任何限制性要求,只是真实直观地表现数据分布的本来面貌;箱型图判断异常值的标准以四分位数和四分位距为基础。其中四分位数具有一定的鲁棒性:多大25%的数据可以变得任意远而不会严重扰动四分位数,所以异常值不能对这个标准施加影响。由此可见,箱型图识别异常值的结果比较客观,在识别异常值方面有一定的优越性。下面是使用python检测代码对餐饮日销额数数据异常值进行检测`import pandas as pdcatering_sale = "D:/a/data/catering_sale.xls" # 餐饮数据data = pd.read_excel(catering_sale, index_col = u"日期") # 读取数据,指定“日期”列为索引列print(data)print(data.describe(),data.describe().max()-data.describe().min())
import matplotlib as mplmpl.use("TkAgg") # !IMPORTANTimport matplotlib.pyplot as plt # 导入图像库plt.rcParams["font.sans-serif"] = ["SimHei"] # 用来正常显示中文标签plt.rcParams["axes.unicode_minus"] = False # 用来正常显示负号plt.figure() # 建立图像p = data.boxplot(return_type="dict") # 画箱线图,直接使用DataFrame的方法x = p["fliers"][0].get_xdata() # "flies"即为异常值的标签y = p["fliers"][0].get_ydata()y.sort() # 从小到大排序,该方法直接改变原对象for i in range(len(x)):if i>0:plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))else:plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))plt.title("异常值检测箱型图(学号:3130)")plt.show() # 展示箱线图`得到的箱型图如下:从箱型图可以看出,超过上下界的8个日销搜额数据可能为异常值。结合具体业务可以把865.0,4060.3,4065.2归为正常值,将22.0,51.0,60.0,6607.4,9106.44归为异常值。最后确定过滤规则为日销额在400元以下或5000元以上则属于异常数据。接下来编写过滤程序,对异常数据进行后续处理。
(资料图片)
二、绘制频率直方图对数据进行分布分析能揭示数据的分布特征和分布类型。对于定量数据,想要了解其分布形式是对称的还是非对称的、发现某些特大或特小的可疑值,可做出频率分布表、绘制频率分布直方图进行直观分析;对于定性数据,可以用饼图直观的显示其分布情况。对”捞起生鱼片“在2014年第二个季度的销售数据绘制频率分布直方图# 代码3-3 捞起生鱼片的季度销售情况 import pandas as pd import numpy as np catering_sale = "D:/a/catering_fish_congee.xls" # 餐饮数据 data = pd.read_excel(catering_sale, names=["date", "sale"]) # 读取数据,指定“日期”列为索引 bins = [0, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000] labels = ["[0,500)", "[500,1000)", "[1000,1500)", "[1500,2000)", "[2000,2500)", "[2500,3000)", "[3000,3500)", "[3500,4000)"] data["sale分层"] = pd.cut(data.sale, bins, labels=labels) aggResult = data.groupby(by=["sale分层"])["sale"].agg([("sale", np.size)]) pAggResult = round(aggResult / aggResult.sum(), 2, ) * 100 import matplotlib as mpl import matplotlib.pyplot as plt mpl.use("TkAgg") # !IMPORTANT plt.figure(figsize=(8, 4)) # 设置图框大小尺寸 pAggResult["sale"].plot(kind="bar", width=0.6, fontsize=10) # 绘制频率直方图 plt.rcParams["font.sans-serif"] = ["SimHei"] # 用来正常显示中文标签 plt.title("季度销售额频率分布直方图 (学号:3130)", fontsize=10) plt.show()
得到直方图如下:
三、定性数据的分布分析——饼图和条形图对于定性变量,经常根据变量的分类类型来分组,可以采用饼图和条形图来描述定性变量的分布。饼图的每一个扇形部分代表每一个类型的所占百分比或频数,根据定性变量的类型数目将饼图分成几个部分,每一部分的大小与每一类型的频数成正比;条形图的高度代表每一个类型的百分比或频数,条形图的宽度是没有意义的。python代码如下:`import pandas as pdimport matplotlib as mplmpl.use("TkAgg") # !IMPORTANTimport matplotlib.pyplot as pltcatering_dish_profit = "D:/a/data/catering_dish_profit.xls"data = pd.read_excel(catering_dish_profit)
饼图
x = data["盈利"]labels = data["菜品名"]plt.figure(figsize=(8,6))plt.pie(x,labels=labels) #绘制饼图plt.rcParams["font.sans-serif"] = "SimHei"plt.title("菜品销售量分布(学号:3130)")plt.axis("equal") #作图为正方形plt.show()
条形图
x=data["菜品名"]y=data["盈利"]plt.figure(figsize=(8,4))plt.bar(x,y)plt.rcParams["font.sans-serif"] = "SimHei"plt.xlabel("菜品")plt.ylabel("销量")plt.title("菜品销售量分布条形图(学号:3130)")plt.show()`得到饼图和条形图如下图所示:
四、对比分析——折线图对比分析是把两个相互联系的指标进行比较,从数量上展示和说明研究对象规模的大小、水平高低、速度快慢以及各种关系是否协调。特别适用于指标间的横纵向比较、时间序列的比较分析。在对比分析中,选择合适的对比标准是十分关键的。例如:以各菜品的销售数据为例,从时间维度上分析,可以看到A部门、B部门、C部门三个部门的销售金额随时间的变化趋势,可以了解在此期间哪个部门的销售金额比较高、趋势比较平稳;还从单一部门,例如B部门,来做分析,了解各年份的销售对比情况。python代码如下:`#部门之间销售额比较import pandas as pdimport matplotlib as mptmpt.use("TKAgg")import matplotlib.pyplot as pltfrom pylab import mplmpl.rcParams["font.sans-serif"] = ["SimHei"]data = pd.read_excel("D:/a/data/dish_sale.xls")plt.figure(figsize=(8,4))plt.plot(data["月份"],data["A部门"],color="green",label="A部门",marker="o") #图例plt.plot(data["月份"],data["B部门"],color="red",label="B部门",marker="s")plt.plot(data["月份"],data["C部门"],color="skyblue",label="C部门",marker="x")plt.legend() #显示图例plt.ylabel("销售额(万元)")plt.title("3部门之间销售额的比较(学号:3130)")plt.show()
B部门各年份之间销售金额的比较
data = pd.read_excel("D:/a/data/dish_sale_b.xls")plt.figure(figsize=(8,4))plt.plot(data["月份"],data["2012年"],color="green",label="A部门",marker="o") #图例plt.plot(data["月份"],data["2013年"],color="red",label="B部门",marker="s")plt.plot(data["月份"],data["2014年"],color="skyblue",label="C部门",marker="x")plt.legend()plt.ylabel("销售额(万元)")plt.title("B部门各年份销售额的比较(学号:3130)")plt.show()`
得到的折线图如下图所示总体来看,3个部门的销售额呈递减趋势;A部门和C部门的递减趋势比较平稳;B部门的销售额下降趋势比较明显,进一步分析造成这种现象的原因,可能是原材料不足。
五、统计量分析用统计指标对定量数据进行统计描述,常从集中趋势和离中趋势两个方面进行分析。平均水平指标是对个体集中趋势的度量,使用最广泛的是均值和中位数;反应变异程度的指标则是对个体离开平均水平的度量,使用较广泛的是标准差、四分位间距。针对餐饮销量数据进行统计量分析如下:import pandas as pdcatering_sale = "D:/a/data/catering_sale.xls"data = pd.read_excel(catering_sale,index_col="日期") #指定“日期”列为索引data = data[(data["销量"]>400)&(data["销量"]<5000)] #过滤异常数据statistics = data.describe() #保存基本统计量statistics.loc["range"] = statistics.loc["max"]-statistics.loc["min"] #极差statistics.loc["var"] = statistics.loc["std"]-statistics.loc["mean"] #变异系数statistics.loc["dis"] = statistics.loc["75%"]-statistics.loc["25%"] #四分位数间距print(statistics)结果如下:
六、周期性分析周期性分析是探索某个变量是否随着时间的变化而呈现出某种周期变化趋势。要对正常用户和窃电用户在2012年2月份与3月份日用电量进行预测,可以分别分析正常用户和窃电用户的日用电量的时序图,来直观地估计其用电量变化趋势。代码如下:`import pandas as pdimport matplotlib as mptmpt.use("TKAgg")import matplotlib.pyplot as pltdf_normal = pd.read_csv("D:/a/data/user.csv")plt.figure(figsize=(8,4))plt.plot(df_normal["Date"],df_normal["Eletricity"])plt.xlabel("日期")
设置x轴刻度间隔
x_major_locator = plt.MultipleLocator(7)ax = plt.gca()ax.xaxis.set_major_locator(x_major_locator)plt.ylabel("每日电量")plt.title("正常用户电量趋势(学号3130)")plt.rcParams["font.sans-serif"] = ["SimHei"]plt.show()
窃电用户用电趋势
df_steal = pd.read_csv("D:/a/data/Steal user.csv")plt.figure(figsize=(10,9))plt.plot(df_steal["Date"],df_steal["Eletricity"])plt.xlabel("日期")plt.ylabel("日期")
设置x轴刻度间隔
x_major_locator = plt.MultipleLocator(7)ax = plt.gca()ax.xaxis.set_major_locator(x_major_locator)plt.title("窃电用户电量趋势(学号3130)")plt.rcParams["font.sans-serif"] = ["SimHei"]plt.show()`
总体来看,正常用户和窃电用户在2012年2月份与3月份日用电量呈现出周期性,以周为周期,因为周末不上班,所以周末用电量较低。工作日和非工作日的用电量比较平稳,没有太大的波动。而窃电用户在2012年2月份和3月份日用电量呈现出递减趋势,同样周末的用电量是最低的。
-
59.类的自动转换和强制类型转换
程序清单11 16stonewt h pragmaonce stone h--Stonewt类声明 ifndefSTONEWT_H_ defineSTONEWT_H_class
来源: 关于数据分析中的绘图分析的学习报告
LWIP学习记录---ARP协议(2)ARP数据包发送过程
go A*寻路记录
59.类的自动转换和强制类型转换
不是“空中楼阁”:努比亚Pad 3D搭载全球最大Leia 3D内容生态
【报资讯】男子车停路边去吃烧烤 回来瞬间崩溃:路边已装上护栏
【独家焦点】作文游西湖300字(精选40篇)
千里托运奔驰GLC被淋满牛粪 女子崩溃:花1900元洗了5遍
【世界速看料】情侣打车3小时后跑单拉黑司机 司机:246元车费没了
世界资讯:微软承认向无法升级的设备推荐Win11:已进行修复
环球即时:压水堆
当前滚动:这些“领导”短信收到没?专门针对iPhone用户诈骗:全国多地预警
环球精选!王一博、梁朝伟《无名》北美院线扩映!豆瓣降至6.7分
当前简讯:大爷怒斥夜市挂日本元素油纸伞:主办方回应令人不解
环球头条:导演新海诚:中国动画电影迟早会超过日本
天天最资讯丨pat乙级链表问题
LWIP学习记录------ARP协议(1)
天天热文:开办以来首位!跨性别演员柏林电影节获奖
微速讯:长城放出王炸?长城水平对置八缸发动机摩托曝光 真猛兽
环球热头条丨可以两天一充的骁龙8 Gen2手机:出现了
每日热讯!马里肯涅巴地区发生武装抢劫 中使馆提醒关注当地安全情况
威马汽车再发内部信:部分员工复工 其余人员无薪休假
【全球热闻】视觉四边等宽!魅族20系列边框仅1.57mm:比iPhone 14 Pro都窄
全球热点!Go编程实战:博客备份
Markdown简明教程
《使命召唤》前景动荡
世界新资讯:上海一高校推出高启强同款猪脚面:师生直呼“舌尖上的《狂飙》”
乌苏啤酒大促:立减64元 折合3元/瓶到手
信息:女子考研期间生娃初试395分 回应外界好奇:多亏家人替自己分担很多
每日焦点!高德、百度地图红绿灯读秒很神奇 接入交管平台?真相并非如此
【天天新要闻】《我们的日子》里,不要忽视这些法律问题
天天资讯:俄州“毒火车”引发环境灾难后 美国又一货运列车脱轨
中兴通
全球热讯:读Java性能权威指南(第2版)笔记02_ Java SE API技巧上
世界动态:你昨晚关注的那个福利姬 可能是假的
世界即时看!国产新能源疯狂内卷!哈弗H6 PHEV官降1.5万 配置全系顶配
【世界报资讯】iPhone 15 Pro Max渲染图出炉:对比14 Pro Max边框更窄、机身更厚
对接水仙后台(支持AndLua+、FA、FA2、AIDE lua、Simple Lua等)
【全球报资讯】Golang基于Mysql分布式锁实现集群主备
世界观热点:薪资4K-5K!公司招聘财务要求做饭被吐槽像保姆
天天百事通!男子长期高血糖导致视网膜病变:不可逆
热头条丨不愧是万元机皇!酷安网友给三星Galaxy S23 Ultra打最高分
当前聚焦:《蚁人3》上映9天中国内地票房破2亿 网友:回到小众也挺好
世界微资讯!如何给公众号投稿赚钱_怎样给公众号投稿赚钱
双亲委派机制
天天微动态丨中国教师队伍建设研究/京师教师教育论丛
当前视讯!即将让核污水倒入大海!日本港口大量有毒海胆聚集 或出现爆发式增长
三星降低QD-OLED面板成本!让电视更具竞争力
世界关注:努比亚Z50新版下周首销:骁龙8 Gen2旗舰焊门员 性价比无敌
最新:python实现客户端和服务端的UDP相互通信
【报资讯】hbuilderx打正式包所需的私钥证书的创建方法
全球新动态:2.【go-kit教程】go-kit启动http服务
室内单目深度估计-4
最新:kaggle中训练得到的output太大该怎么下载?
世界热消息:2消息,中超新贵签约32岁国脚,5中超外援上诉国际足联
环球新动态:超市宣称1元纸币将退出历史引热议 网友直呼太突然:官方回应不属实
视点!女子患异食癖3年吃上百块粉饼:体检身体无异常
天天热点!刷题疑问
环球速读:史上最好的真全面屏手机!努比亚Z50 Ultra上架接受预约
天天精选!禁止自带食材 关停300家店 海底捞从巨亏41亿到盈利13亿
天天讯息:day04-原生的API&注解方式
【环球新要闻】Git使用
美食博主三亚买3888元海鲜被好心人提醒多花1700:当事人心累
热消息:秋裤先别着急脱!“春捂”到底该“捂”哪儿?
前沿资讯!2023年安卓之光!小米13 Ultra手机壳曝光:背部造型抢眼
餐馆接到网吧10个外卖订单 结果被刷9个差评 店主:下次亲自送餐
天天微速讯:门店2299元 GXG男士羊毛大衣0.8折清仓大促:实付199元!
世界热资讯!乐堡苏打气泡酒12罐到手19.9元:低糖0脂无负担
威马员工在线讨薪:被恶心到了、恶心的事还有更多
广州塞车登“热搜”?“甜蜜的烦恼”重回一线城市,中国经济活力加快恢复
【Tire树】高效统计字符串
80、90后泪目 国产暗黑《赵云传重制版》试玩
1岁男童误食降糖药成植物人:愿康复顺利
环球速看:中央人民广播电台民族节目中心
Ubuntu安装Zabbix6.0
秒睡令人羡慕?医生提醒:可能是种睡眠障碍
《流浪地球2》科幻成真?武汉国博用特效“加建”太空电梯
今头条!【element UI】在 el-select 与 el-tree 结合组件
环球热文:python教程:模块的搜索路径
Python中模块的四种方式
《原子之心》种族主义漫画引争议:涉嫌歧视黑人!官方道歉
世界速读:我国载人航天将对国际开放 多国航天员希望参与中国空间站
每日热讯!驱动拖后腿 Intel显卡被低估:2000元档A770理论可刚RTX 3070
受贿、泄露内幕信息!湖北原副省长曹广晶被公诉
天天快看点丨下周发售!《卧龙:苍天陨落》新预告发布:PC/主机通吃
最新消息:EQ电动车中国表现欠佳 奔驰CEO:打价格战不是好事
环球热点!101岁老人每天赶2场麻将 医生:身体状态70岁
What's past is prologue
全球新资讯:车商不收特斯拉 新车一个月亏7万:新能源二手车都不受待见 厂商频降价
H5N1禽流感致死事件引世卫关注:事发柬埔寨、9年来首次
环球热点评!下单就送鲜蔬汤 海福盛冻干粥5杯大促:券后仅20.9元!
“真香定律”稳定发挥 迈凯伦全新SUV效果图曝光:预计售价282万
世界今日讯!关于修订《中国高尔夫球协会赛事活动管理办法》的通知
环球微头条丨中越边境民族文化艺术考察研究
每日热点:女子在门缝发现针头 是大妈拿注射器推大量不明液体:整栋楼遭殃 网友气愤
地球中心到底有什么?科学家发现竟是一个超大铁球 跟书里讲得不一样
NET6接口项目基础框架项目
Java 8 Lambda 方法引用 简记
全球看热讯:(数据库系统概论|王珊)第七章数据库设计-第三节:概念结构设计
Blender插件:水滴生成器(Droplet Generator)