数据分析前需了解的基础知识
1.jupyter代码编辑器
2.pandas库基础知识
3.数据分析流程
pandas库
pandas库是一个专门用来解决数据分析问题的库,其有两大优点
1.速度快,可以快速处理大型数据集
2.效率高,能够提供大量高效处理数据的函数和方法
pandas库提供了两种数据结构
Series和DataFrame,来提升操作速度和效率
1.Series主要由一组数据及其对应的索引组成
比如:['张三','李四','王五'] ['0','1','2']这两组列表的数据为两两对应的
例:
`
temp_list1=[1,2,3,4]
temp_list2=[5,6,7,8]
temp_s=pd.Series(temp_list1)+pd.Series(temp_list2)
temp_s
2.DataFrame对象是一种表格型的数据结构,包含行索引,列索引和一组数据
例:
年龄018115216
综上,思维导图:
; 数据分析流程
一般来说有五个步骤
1.目标明确
2.数据处理
3.数据分析
4.数据展现
5.报告撰写
明确目标:在这一步中,您需要知道在此数据分析任务中需要解决哪些问题以及如何解决这些问题。
[En]
Clear goals: in this step, you need to know what problems need to be solved in this data analysis task and how to solve them.
数据处理:明确目标后,要对数据进行清理和整合,使数据干净、规范,以便以后进行分析。
[En]
Data processing: after defining the goal, it is necessary to clean and integrate the data to make the data clean and regular, so that the data can be analyzed later.
数据分析:在对数据进行处理后,可以对数据进行分析,最终得到解决问题的策略。
[En]
Data analysis: after the data has been processed, the data can be analyzed and finally the strategy to solve the problem can be obtained.
数据展现:在对数据进行分析后,需要将数据分析员所表达的观点以表格或图表的形式直观有效地传达出来。
[En]
Data presentation: after analyzing the data, it is necessary to convey the views expressed by the data analyst intuitively and effectively in the form of tables or charts.
报告写作:在对数据进行分析和展示后,需要对整个过程进行梳理和总结。
[En]
Report writing: after the analysis and presentation of the data, the whole process needs to be combed and summarized.
Original: https://blog.csdn.net/m0_54812370/article/details/123867784
Author: Hello world !
Title: 数据分析案例(口罩厂亏损)----明确目的

树莓派 USB麦克风 录音

论文阅读“Structural Deep Clustering Network”(WWW2020)

聚类分析、matlab我国各地区普通高等教育发展状况分析、Q型、R型聚类

FPN论文解读 和 代码详解

NER 的评价指标

小熊飞桨练习册-01手写数字识别

zcu111 with pynq环境下安装tensorflow

密度峰值聚类算法

树莓派4B32位官方系统配置tensorflow2.4以及pytorch1.7

tensorflow学习笔记:dropout来避免过拟合

AI+语音方面总结(一)

K210学习笔记——孤立词识别

聚类模型的简单介绍

【折腾】Jittor在ARM Mac下的安装
