pandas之MultiIndex使用方法实战记录-计算机考试-空麓网

pandas之MultiIndex使用方法实战记录

Python 更新时间：2024-10-16 22:08:50 发布时间：2019-05-22 12:52:10 计算机考试归档最新发布

系列文章目录

一，pandas之MultiIndex的使用

文章目录

系列文章目录
前言
一、MultiIndex是什么？
二、使用步骤
- 1.引入库
- 2.将要使用复核索引的数据使用上MultiIndex
总结

前言

记录某次项目的数据处理中，涉及到多级表头的数据处理，pandas刚好有复合索引

MultiIndex方法

一、MultiIndex是什么？

MultiIndex 是pandas 的一种处理复核索引的方法。

参数：

(
    cls,
    levels=None,
    codes=None,
    sortorder=None,
    names=None,
    dtype=None,
    copy=False,
    name=None,
    verify_integrity: bool = True,
):

二、使用步骤 1.引入库

代码如下： import pandas as pd

2.将要使用复核索引的数据使用上MultiIndex

代码如下：

new_nor_sum1_df.columns = pd.MultiIndex(
            [['发薪公司', '纳税地', '中国籍', '非中国籍', "合计"], ['', '人数', '当月所得税']],
            codes=[[0, 1, 2, 2, 3, 3, 4, 4],
                   [0, 0, 1, 2, 1, 2, 1, 2]])

该处使用的某项目的模拟数据。

levels：[['发薪公司', '纳税地', '中国籍', '非中国籍', "合计"], ['', '人数', '当月所得税']]，

codes：[[0, 1, 2, 2, 3, 3, 4, 4], [0, 0, 1, 2, 1, 2, 1, 2]]

levels和codes是为了确定多级索引的对应关系。

levels的第一级列表['发薪公司', '纳税地', '中国籍', '非中国籍', "合计"]，对应codes的[0, 1, 2, 2, 3, 3, 4, 4]，

codes中是0代表’发薪公司’的位置，1代表‘纳税地’的位置， 2代表‘中国籍’的位置， 3代表‘非中国籍’的位置， 4代表‘合计’的位置。

leves的第二级列表['', '人数', '当月所得税']，对应codes的[0, 0, 1, 2, 1, 2, 1, 2]，codes中的0代表''的位置，1代表'人数'的位置，2代表'当月所得税'的位置。

debug一下代码展示一下效果：

实际excel效果：

总结

使用MultiIndex处理多级表头的DataFrame数据，非常方便，处理完数据后，生成excel后，在用openpyxl模块调整一下单元格格式，表格就很好看了，数据处理就是这么简单

转载请注明：文章转载自 http://www.konglu.com/

本文地址：http://www.konglu.com/it/1022809.html

免责声明：

我们致力于保护作者版权，注重分享，被刊用文章【pandas之MultiIndex使用方法实战记录】因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理，本文部分文字与图片资源来自于网络，转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益，请立即通知我们，情况属实，我们会第一时间予以删除，并同时向您表示歉意,谢谢!

pandas之MultiIndex使用方法实战记录

Python相关栏目本月热门文章