数据分析之pandas(一)

人工智能37

一、pandas简介

pandas是python的一种数据包,是基于numpy的一个工具,里面有很多丰富的库和复杂的函数,是专门用作数据处理和数据分析的(Tips:数据分析一般都会用到这个库)。它提供了两种数据结构,Series和DataFrame,这两种数据结构增强了数据分析的能力。

二、Series

1.概念:简单来说,它就是列表中的一个列,类似于一维数组,由数据和索引index组成,可以保存不同的数据类型。
2.组成形式:pandas.Series(data,index,dtype,name,copy)
data数据、index索引、dtype类型、name名称、copy拷贝
3.举个例子( 如果没有安装pandas库,要先安装
安装方法一:命令提示符里面输入pip install pandas
安装方法二:在pycharm工具File–Settings–Python Interpreter,然后点击加号,搜索需要的库,安装即可

import pandas as pd
a = ['腾讯','阿里','美团']
s = pd.Serious(a,index['a','b','c'],name = '互联网巨头')
print(s)

输出:
a     腾讯
b     阿里
c     美团
Name:互联网巨头  dtype:object

三、DataFrame

1.概念:二维表格型数组,可以看做由Series组成的字典,可以设置行索引index和列索引colums,主要分为两种构建方式,分别为二维数组和字典创建,数据结构图如下图
数据分析之pandas(一)2.组成形式:
pandas.DataFrame( data, index, columns, dtype, copy)(参数含义同上)
3.关于DataFrame的创建举个例子:
(1)二维数组创建

import pandas as pd
data = pd.DataFrame{('姓名':['张三','李四,'赵五'],'年龄':['22','21','23'],'姓别':['男','女','男'])
df = pd.DataFrame(data)
print(df)

输出:
           姓名    年龄     性别
      0    张三     22       男
      1    李四     21       女
      2    赵五     23       男

(2)字典创建

import pandas as pd
data = [{'姓名':'张三','年龄':'22','性别':'男'},{'姓名':'李四','年龄':'21','性别':'女'},{'姓名':'赵五','年龄':'23','性别':'男']
df = pd.DataFrame
print(df)

4.查看
(1)查看行名 df.index
(2)查看列名 df.colums
(3)查看数据值 df.values
根据行 df.loc[ ]
根据列 df[ ].values
(4)查看行列数 df.shape[ ]
5.合并
使用join可以将两个DataFrame合并,但join这个方法还有how这个参数可以设置,合并两个DataFrame的交集或并集。参数为'inner'表示交集,'outer'表示并集。如果要合并多个Dataframe,可以用list把几个Dataframe装起来,然后使用concat转化为一个新的Dataframe。

Original: https://blog.csdn.net/zhang_wei_ya/article/details/123633043
Author: zhang_wei_ya
Title: 数据分析之pandas(一)

相关文章
图的基本概念和几个术语 人工智能

图的基本概念和几个术语

系列文章目录 文章目录 系列文章目录 一、图的定义 * 有向图 & 无向图 完全图的相关 无向图的连通、连通图及连通分量 & 有向图的强连通、强连通图、强连通分量 二 关于连通图、强连...
从零开始的语音分类 人工智能

从零开始的语音分类

SpeechBrain训练话语级分类器 SpeechBrain:作为一个基于 PyTorch 的开源一体化语音工具包,SpeechBrain 可用于开发最新的语音技术,包括语音识别、说话者识别、语音增...
公众号《AI大道理》征稿函 人工智能

公众号《AI大道理》征稿函

公众号《AI大道理》将进行长期征稿。 ​ 本征稿令主要征收AI相关知识、新闻、职场简历、项目实战、学习经验等等稿件。 AI包括计算机视觉、语音识别、自然语言处理三大块。 计算机视觉包括分类、目标检测、...
【语义分割】类别不平衡损失函数合集 人工智能

【语义分割】类别不平衡损失函数合集

在语义分割领域,我们会常常遇到类别不平衡的问题。比如要分割的目标(前景)可能只占图像的一小部分,因此负样本的比重很大,导致网络倾向于将所有样本判断为负样本。本文介绍了在数据不平衡时常用的一些损失函数。...
windows下完全离线安装Anaconda+Tensorflow 人工智能

windows下完全离线安装Anaconda+Tensorflow

由于工作平台原因,需要在内网下安装深度学习框架,不联网的话,需要提前下载好第三方库的安装包,再离线安装。这里以Anaconda和Tensorflow为例,看过几个博客,坑不少,所以这里写点心得。这里以...