一文讲述Pandas库的数据读取、数据获取、数据拼接、数据写出( 三 )


在Pandas库中,将数据导出为xlsx格式,使用的是DataFrame对象的to_excle()方法,其中这里面有4个常用的参数,详情如下 。

  • excel_writer:表示数据写到哪里去,可以是一个路径,也可以是一个ExcelWriter对象 。
  • sheet_name:设置导出到本地的Excel文件的Sheet名称 。
  • index:新导出到本地的文件,默认是有一个从0开始的索引列,设置index=False可以去掉这个索引列 。
  • columns:选择指定列导出,默认情况是导出所有列 。
  • encoding:有时候导出的文件会出现乱码的格式,这个时候就需要使用该参数设置文件编码格式 。
df1 = pd.read_excel("concat.xlsx",sheet_name="Sheet1")df2 = pd.read_excel("concat.xlsx",sheet_name="Sheet2")df3 = pd.concat([df1,df2],ignore_index=True)df3.to_excel(excel_writer="to_excel.xlsx",sheet_name="to_excel",index=None)6. ExcelWriter的使用有时候我们需要将多excel表写入同一个工作簿,这个时候就需要借助Pandas中的pd.ExcelWriter()对象,默认对于xls使用xlwt引擎,对于xlsx使用openpyxl引擎 。
这里面有两个参数,一个是路径参数Path,表示生成文件的存放路径,一个是时间格式化参数datetime_format,可以将生成文件中的时间列,按照指定时间格式化输出 。
df1 = pd.read_excel("concat.xlsx",sheet_name="Sheet1")df2 = pd.read_excel("concat.xlsx",sheet_name="Sheet2")with pd.ExcelWriter("excel_writer.xlsx",datetime_format="YYYY-MM-DD") as writer:    df1.to_excel(excel_writer=writer,sheet_name="df1",index=None)    df2.to_excel(excel_writer=writer,sheet_name="df2",index=None)【一文讲述Pandas库的数据读取、数据获取、数据拼接、数据写出】上面第三行代码,我们打开了一个ExcelWriter对象的同时,将所有设计到时间列的数据,进行格式化输出为年-月-日 。
接着第四行代码,我们将df1中的数据写到这个ExcelWriter对象中,将这个Sheet取名为df1 。
最后第五行代码,再将df2中的数据写入到这个ExcelWriter对象中,同样将Sheet取名为df1 。




推荐阅读