Pandas DataFrame构造简析

人工智能74

参考书籍:《利用Python进行数据分析》

DataFrame简介:

DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。跟其他类似的数据结构相比(如R的data.frame),DataFrame中面向行和面向列的操作基本上是平衡的。其实,DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。

导入python库:

DataFrame构造:

1:直接传入一个由等长列表或NumPy数组组成的字典;

注意:key 会被解析为列数据,value 会被解析为行数据。

主动指定列排序方式:

此处 0-1位自动生成的列索引,当然了也可以主动指定。

需要注意的是:将列表或数组赋值给某个列时,其长度必须跟DataFrame的长度相匹配!!否则会报ValueError。

2:传入一个由嵌套的字典;

它就会被解释为:外层字典的键作为列,内层键则作为行索引。

请务必保证嵌套字典的key的一致性,不然的话,数据会异常,但不会显式的报错,而是显示出NaN,

3:传入一个二维nd.array;

当然了你也可以主动指定行和列索引(不赘述):

4:传入其他的数据(初始化方式基本类似);

Original: https://www.cnblogs.com/JansXin/p/8110472.html
Author: jansora
Title: Pandas DataFrame构造简析