阿里云天池task4

人工智能42

数据分析
首先task4是一个项目做一个数据分析的题目是关于2020美国选举的。

数据集
所有候选人信息

CAND_ID 候选人ID
CAND_NAME 候选人姓名
CAND_PTY_AFFILIATION 候选人党派
候选人委员会链接信息
CAND_ID 候选人ID
CAND_ELECTION_YR 候选人选举年份
CMTE_ID 委员会ID
个人捐款档案信息
CMTE_ID 委员会ID
NAME 捐款人姓名
CITY 捐款人所在市
State 捐款人所在州
EMPLOYER 捐款人雇主/公司
OCCUPATION 捐款人职业
数据处理
将数据进行对应,通过ID关联两张表,这里引入了数据库的概念。将关联的数据转化为表。

数据探索与清洗
进过数据处理部分,我们获得了可用的数据集,现在我们可以利用调用shape属性查看数据的规模,调用info函数查看数据信息,调用describe函数查看数据分布。

数据分析
捐款金额分析了三次,一次是候选人,另一次是来自不同职业的人。来自不同大洲的捐款金额,可以看到不同人群、不同党派、不同职业的收入情况,进一步探索数据的奥秘。

[En]

The amount of donation has been analyzed three times, one is a candidate and the other is from different occupations. The amount of donations from different continents can see the income of different people, different parties and different occupations to further explore the mystery of the data.

数据可视化
可以将数据图形化很智能的一个功能

总结
整体看下来task4为我们介绍了怎么去分析做表,做图形等直观的让我们看到从数据面上两位候选人谁更容易竞选总统,可以看出python的智能和功能强大。这次学习更多的收获了怎么去使用python,怎么调用数据。以后会更多尝试使用python来分析各种数据,感谢阿里云有这么好的资源学习。

Original: https://blog.csdn.net/weixin_64756514/article/details/123520380
Author: book思议119
Title: 阿里云天池task4

相关文章
【OpenCV】 级联分类器训练模型 人工智能

【OpenCV】 级联分类器训练模型

目录 一:OpenCV级联分类器概念 二:OpenCV级联分类器操作步骤 三:样本采集工作原理分析一 四:样本采集工作原理分析二 五:创建自己的级联分类器 5.1 创建自己的级联分类器第一步 5.2 ...
voice-clone中文语音克隆,API/DEMO/资源 人工智能

voice-clone中文语音克隆,API/DEMO/资源

一、项目说明 voice clone,是让计算机模仿指定说话人的语音、语调,实现任意输入文本的语音生成。 在足够多样的语音输入训练前提下,模型可以较真实的还原被模仿者。 这是一种深度语音造假技术(de...
简洁的keras安装方法 人工智能

简洁的keras安装方法

这里写自定义目录标题 写在前面 * 1 安装anaconda 2 安装TensorFlow 3 安装Keras 参考文献 写在前面 作为一个小白,为安装keras查阅了多篇文章都比较长,需要的背景知识...
pytorch安装详细步骤 人工智能

pytorch安装详细步骤

文章目录 (一)win—配置tensorflow-GPU (二)安装 pytorch * 2.1 创建虚拟环境 2.2正式安装pytorch 2.3 验证是否安装成功 (三)本文参考链接如下:(感谢各...