Pandas 模块-操纵数据(2)-重新索引-reindex()函数

人工智能47

2. 重新索引

请注意,DataFrame.rename() 函数是对行名和列名进行修改,并不修改数据,而DataFrame.reindex 可以引入新行/列,或者去掉旧行/列。

2.1 reindex() 函数

2.1.1 reindex() 语法

DataFrame.reindex(self, labels=None, index=None, columns=None, axis=None, method=None, copy=True, level=None, fill_value=nan, limit=None, tolerance=None)

使用可选的填充逻辑使DataFrame符合新索引。

  • labels : 类似数组,可选,新 labels / index "axis"指定的轴与之一致。
  • index, columns : 类似数组,可选;要使用的新labels/index 引要符合。最好是一个Index对象,以避免重复数据。
  • axis: 默认是 index
  • method : {默认 None,'backfill'/'bfill,'pad'/'ffill', 'nearest'},

用于在重新索引的DataFrame中填充孔的方法。

请注意:这仅适用于具有单调递增/递减索引的DataFrames/Series。

1) None (default): 不填补空白

2) pad / ffill: 将上一个有效观察值向前传播到下一个有效值。

3) backfill / bfill: 使用下一个有效观察值填充空白。

4) nearest: 使用最近的有效观测值来填补空白。

  • copy : boolean, 默认 True,即使传递的索引相同,也返回一个新对象。
  • level : int 或 name,在一个级别上广播,在传递的MultiIndex级别上匹配索引值。
  • fill_value : scalar, 默认为 np.NaN,用于缺失值的值。默认为NaN,但可以是任何"compatible"值。
  • limit : int, 默认 None。向前或向后填充的连续元素的最大数量。
  • tolerance: 可选。不精确匹配的原始标签和新标签之间的最大距离。

在匹配位置的索引值最符合公式

abs(index[indexer] - target)

Original: https://blog.csdn.net/u010701274/article/details/121491114
Author: 江南野栀子
Title: Pandas 模块-操纵数据(2)-重新索引-reindex()函数

相关文章
SELD_net_questions 人工智能

SELD_net_questions

SELD-net实验问题梳理 源代码调试时遇到的错误及解决 seld-net原版代码:https://gitee.com/karas1/seld-net 拿到源代码后,按照readme.md文件中的提...
解决No module named numpy问题 人工智能

解决No module named numpy问题

目录 前沿 解决 解决方法1: 方法2:(强行安装更新更高的版本) 前沿 最近开始学习python了,由于要简单处理一下图片,奈何能C++力太差,openCV上手有点难,想学习一下py简单的处理一下图...
处理复旦大学中文文分类数据集 人工智能

处理复旦大学中文文分类数据集

复旦大学中文文本分类数据集是一个小型轻量的数据集,常用于自然语言处理文本分类,文本聚类实验中,本文通过使用Python将该数据集进行基本处理,并分别存储到csv和sql文件中。 图1.1:原始数据格式...