数据分析
首先task4是一个项目做一个数据分析的题目是关于2020美国选举的。
数据集
所有候选人信息
CAND_ID 候选人ID
CAND_NAME 候选人姓名
CAND_PTY_AFFILIATION 候选人党派
候选人委员会链接信息
CAND_ID 候选人ID
CAND_ELECTION_YR 候选人选举年份
CMTE_ID 委员会ID
个人捐款档案信息
CMTE_ID 委员会ID
NAME 捐款人姓名
CITY 捐款人所在市
State 捐款人所在州
EMPLOYER 捐款人雇主/公司
OCCUPATION 捐款人职业
数据处理
将数据进行对应,通过ID关联两张表,这里引入了数据库的概念。将关联的数据转化为表。
数据探索与清洗
进过数据处理部分,我们获得了可用的数据集,现在我们可以利用调用shape属性查看数据的规模,调用info函数查看数据信息,调用describe函数查看数据分布。
数据分析
捐款金额分析了三次,一次是候选人,另一次是来自不同职业的人。来自不同大洲的捐款金额,可以看到不同人群、不同党派、不同职业的收入情况,进一步探索数据的奥秘。
[En]
The amount of donation has been analyzed three times, one is a candidate and the other is from different occupations. The amount of donations from different continents can see the income of different people, different parties and different occupations to further explore the mystery of the data.
数据可视化
可以将数据图形化很智能的一个功能
总结
整体看下来task4为我们介绍了怎么去分析做表,做图形等直观的让我们看到从数据面上两位候选人谁更容易竞选总统,可以看出python的智能和功能强大。这次学习更多的收获了怎么去使用python,怎么调用数据。以后会更多尝试使用python来分析各种数据,感谢阿里云有这么好的资源学习。
Original: https://blog.csdn.net/weixin_64756514/article/details/123520380
Author: book思议119
Title: 阿里云天池task4

【OpenCV】 级联分类器训练模型

深度学习与人类语言处理学习笔记(一)—— 语音识别(理论篇)

【Python-Tensorflow】tf.data.Dataset的解析与使用

识别红色区域(python+opencv)

Java中实现在线语音识别(科大讯飞免费的SKD)、SDK下载和IDEA项目搭建、成功运行【完整代码】

【自动驾驶轨迹规划之Frenet坐标系】

voice-clone中文语音克隆,API/DEMO/资源

如何注册Google Voice账号(电话号码)

s将两个数的除数保留两位小数

简洁的keras安装方法

【情感识别】基于支持向量机(SVM)实现语音情感识别matlab源码

pytorch安装详细步骤

避坑:利用zed2运行ORB-SLAM3(保姆级教程)(一)

YOLOv5-v6.0学习笔记
