Python数据预处理(三) 数据运算

liftword2个月前 (03-30)技术文章21

import pandas as pd


df=pd.read_excel(r'd:\mypythontest\sales.xlsx',sheet_name=0)

print(df)

df['合计']=df['Sale2013']+df['Sale2014']+df['Sale2015']+df['Sale2016']

print(df)

print(df.at[0,'Sale2013']>df.at[1,'Sale2014']) #单元格比较

print(df['Sale2013']<df['Sale2014']) #全列比较

print(df.count()) #所有列非空单元格的个数

print(df.count(axis=1)) #所有行非空单元格的个数

print(df['Sale2013'].count()) #指定列非空单元格的个数

print(df.sum()) #所有列求和

print(df.sum(axis=1)) #所有行求和

print(df['Sale2013'].sum()) #指定列求和

print(df.mean()) #求每列的平均值

print(df['Sale2013'].mean()) #求指定列的平均值

print(df.mean(axis=1)) #求每行平均值

print(df.max(axis=1)) #求每行的最大值

print(df.max()) #求每列的最大值

print(df.min(axis=1)) #求每行的最小值

print(df.min()) #求每列的最小值

print(df.median(axis=1)) #求每行的中位数

print(df.median()) #求每列的中位数

print(df.mode(axis=1)) #求每行的众数

print(df.mode()) #求每列的众数

print(df.var(axis=1)) #求每行的方差

print(df.var()) #求每列的方差

print(df.std(axis=1)) #求每行的标准差

print(df.std()) #求每列的标准差

print(df.quantile(0.5)) #求每列的二分之一分位数

print(df.quantile(0.5,axis=1)) #求每行的二分之一分位数

print(df['Sale2013'].corr(df['Sale2014'])) #求两列之间的相关性--皮尔逊相关系数

print(df.corr()) #所有数值列两两之间的相关系数

相关文章

机器学习入坑指南(二):数据预处理

机器学习初步:数据预处理机器学习离不开大量的数据。在对这些数据进行分析前,我们先学习一下在 Python 中如何导入数据并对它进行预处理。1 导入需要的库利用 Python 进行数据分析所必须的库有两...

使用PandasGUI进行探索性数据分析

Pandasgui是一个开源的python模块,它为pandas创建了一个GUI界面,我们可以在其中使用pandas的功能分析数据和使用不同的功能,以便可视化和分析数据,并执行探索性数据分析。探索性数...

Python 数据可视化:使用 Matplotlib 和 Pandas 实现动态数据分析

一、引言在当今时代,数据可视化已经成为数据处理和分析的重要手段。通过将数据以图形的形式呈现,我们可以更直观地理解数据,发现数据之间的关联,以及预测未来的趋势。Python 作为一种广泛应用于数据分析和...

Python在工控领域的应用与优势

前言之前利用Python编写了一些S7系列的PLC调试工具和组态开发,今天就具体讲讲Python在工控领域还有哪些应用与优势。Python在工业控制工控领域的应用逐渐增多,得益于其简洁的语法、丰富的生...

使用Python实现制造过程优化:从数据采集到智能决策

阅读文章前辛苦您点下“关注”,方便讨论和分享,为了回馈您的支持,我将每日更新优质内容。如需转载请附上本文源链接!在现代制造业中,优化制造过程是提高生产效率、降低成本和提升产品质量的关键。通过数据分析和...