pandas主要问题
1:不会分析-excel
2:代码:demo 推导 dataframe索引
数据分析概述
数据分析师
数据分析师是什么?
数据师Datician['detɪʃən]的一种,
它是指专门收集、整理和分析不同行业的行业数据,并根据数据做出行业研究、评估和预测的专业人员。
[En]
It refers to the professionals who specialize in collecting, collating and analyzing industry data in different industries, and make industry research, evaluation and prediction based on the data.
数据分析师有什么用?
这是一个用数据说话的时代,也是一个依靠数据竞争的时代。
世界500强企业中,有90%以上都建立了数据分析部门。
IBM、微软、Google等知名公司都积极投资数据业务,
建立数据部门,培养数据分析团队。
数据分析方法分类
; 数据分析项目参与角色
IT技术人员
搭建并维护分析平台、
创建数据仓库、数据更新维护
业务人员
提出业务需求、检验分析结果的准确性、
使用分析结果指导业务工作 业务人员
数据分析师
零碎工具辅助、提取数据、制作分析报告、
制作可视化看板,汇报分析结果
数据分析流程
; 工作内容
围绕数据分析师的三大类工作内容
一、零碎需求-用数据使业务问题细节明朗化
工具辅助
日常取数及业务问题发现
二、业务建模-数据拓维
三、提供周、月、季度、年整体分析报告
工具辅助: Excel高阶技能(高阶函数,条件格式)
案例应用: 项目排期表,考勤表
excel函数(重点)
python中的函数调用,如果是面向对象的话
p = Person()
p.eat()
p.run()
在 excel里面,
= 函数名(数据值,条件)
例
sum(a,b,c)
=sum(1,2,3)
回车
6
countif
countif(range,criteria)
计算某个区域中满足给定单元条件的单元格数目,
参数range为单元格区域,
参数criteria为判断条件
countifs(range1,criteria1,...)
统计一组条件所指定的单元格数,
range1:条件区域1。criteria1:条件1。
range2:条件区域2。Criteria2:条件2。等等。。。
(1)迟到次数
=COUNTIF(B2:K2,"b")
(2)旷课次数
=COUNTIF(B2:K2,"c")
(3)1日和2日都迟到人数:
=COUNTIFS(B2:B11,"b",C2:C11,"b")
SUM
语法:SUM(number1,number2,...)
语法:SUMIF(range, criteria, [sum_range])。
range:条件区域,
criteria:条件。
sum_range:求和区域。可以省略,当省略时,条件区域就是求和区域。
说明:单条件求和。
语法:SUMIFS(sum_range,
criteria_range1, criteria1,
[criteria_range2, criteria2], ...)。
sum_range:求和区域。
criteria_range1:条件区域1。criteria1:条件1。
criteria_range2:条件区域2。Criteria2:条件2。等等。。。
说明:多条件求和。
错误
=SUM(B2:B2)
=SUM(B3:B3)
=SUM(B4:B4)
=SUM(B5:B5)
=SUM(B6:B6)
正确
=SUM($B$2:B2)
=SUM($B$2:B3)
=SUM($B$2:B4)
=SUM($B$2:B5)
=SUM($B$2:B6
借
=SUMIF(D3:D14,"借",H3:H14)
贷
=SUMIF(D3:D14,"贷",H3:H14)
工行借方求和
=SUMIFS(H3:H14,E3:E14,"工行",D3:D14,"借")
工行金额>=80000金额求和
=SUMIFS(H3:H14,E3:E14,"工行",H3:H14,">=80000")
条件格式
本质是根据条件筛选数据
但excel中将数据标注颜色
》》开始》》条件格式
》》开始》》条件格式
注意,需要逐行设置,所以行前面不能加$
》》开始》》条件
row()获得单元格的行号
mod(m,n)获得m对n的余数
数据条:进度条
色阶:表示图像亮度强弱的指数标准,也就是我们说的色彩指数
图标集:图标的集合,使用小图标对数据标注
本质也是条件规则
; 日期时间类函数
日期类函数应用
使用日期时间类函数需注意数据格式的调整
year 获取指定日期的年
month 获取指定日期的月
day 获取指定日期的日
today 获取系统当前日期
now 获取系统当前日期和时间
date 返回标准日期格式的时间序列
eomonth 获取指定日期所在月(或前后月)的最后一天
0表示当月,1表示下一个月
weekday 获取指定日期的星期数
本月最后一天
=EOMONTH(A2,0)
本月天数
=DAY(B2)
(日期)是否是周末
=IF(WEEKDAY(A2,2)>=6,"周末","否")
2.项目计划表
步骤提示:
1.计算项目时长,起始日期差+1
2.运用if函数计算阶段剩余天数,当结束日期恰好为今天时显示为"仅剩今天"
3.运用条件格式突出显示"仅剩今天"行,如样表红色区域
4.运用开始时间和项目时长制作甘特图(选择堆积条形图)
(1)项目时长
=D22-C22+1
为什么要加1?
(2)距离项目结束还剩*天
=IF(D22<today(),0,if(d22=today(),"仅剩今天",d22-today())) < code></today(),0,if(d22=today(),"仅剩今天",d22-today()))>
》插入》全部图表》堆积条形图
1,选取数据,项目描述,开始时间,项目时长,插入堆积条形图
2,通过选择数据,修改y轴,只显示阶段一,阶段二,,
3,需要在x轴添加日期
4,设置y轴逆序
5,设置橙色条透明
6,设置开始时间,在坐标轴
案例应用-员工考勤统计
A公司为化工工厂,为了规范工厂员工的工作时间,需低成本制作员工考勤表,由门卫监督签到,最终由HR统
计每月、季度、年的考勤记录,上报公司。
公司员工考勤制度章程说明(部分):
员工病事假最小请假单位为1天;
每日填写实际出勤时长,全天最小出勤时长8小时;
思路:
1.工具:使用公司配置的Excel软件制作每月考勤表
2.使用:将月度考勤表分发至各负责人,由负责人填写后每月末提交至HR处
3.统计:以员工为维度,统计平日出勤天数、病假天数、事假天数、平时加班小时数、周末加班小时数
; 创建表头
1.创建年月下拉框,知识点数据验证-序列
搞定年,月的下拉
2.每月的起始日均为1,在起始日上填写数字1
3.运用加法运算及填充柄填充当月每一天日期,并结合IF()函数判断所得数字>当前月总天数时不显示
=IF(H24<day(eomonth(date($g$22,$i$22,1),0)),h24+1,"") 每月有几天? 生成第1天:="DATE(G22,I22,1)" 生成最后1天:="EOMONTH(DATE(G22,I22,1),0)" 取得天数:="DAY(EOMONTH(DATE(G22,I22,1),0))" 4.根据日期获取对应的星期数字,运用函数date()、weekday(),注意weekday函数的第二参数输入1="WEEKDAY(DATE($G$22,$I$22,H24),1)" 5.运用自定义格式将星期数字转换为标准星期,自定义格式语法输入aaa="IF(H24="","",WEEKDAY(DATE($G$22,$I$22,H24),1))" < code></day(eomonth(date($g$22,$i$22,1),0)),h24+1,"")>
设置高亮
6.运用条件格式,将周六日及无用列突出显示,选择公式判断如周日的C$3=1蓝色展示
; 计算每名员工10月、11月、12月的考勤,
参考函数countif,sumif;
出勤、病、事为天数,平时加班和周末加班为小时数"
统计病假
=COUNTIF(H5:AL5,"病")
统计事假
=COUNTIF(H5:AL5,"事")
统计出勤 周一到周五
=COUNTIFS($H$3:$AL$3,">1",$H$3:$AL$3,"<7",h5:al5,">=8")
周末加班=周六+周日
=SUMIF($H$3:$AL$3,7,H5:AL5)+SUMIF($H$3:$AL$3,1,H5:AL5)
平时加班
=SUMIFS(H5:AL5,$H$3:$AL$3,">1",$H$3:$AL$3,"<7")-b5*8 < code></7")-b5*8></7",h5:al5,">
第四季度的考勤汇总
Original: https://blog.csdn.net/u013621398/article/details/123839601
Author: 翁老师的教学团队
Title: 数据分析第4周第3天.md
相关阅读
Title: 机器学习TensorFlow安装之CPU版本
TensorFlow1.5发布的时候,出于好奇下载安装跑了一下演示的几个代码。最近,重新拿起书本学习深度学习,发现TensorFlow已经更新发布到了2.6版本了。由于这期间电换了电脑,为了学TensorFlow只有再次安装了!
两台电脑,一台笔记本电脑,没有独立显卡;另一台台式机,安装了NVIDIV的T1000入门显卡。所以我安装了两个版本的TensorFlow,cup版本的还算顺利,GPU版本的折腾了一个下午。
一、无显卡笔记本安装TensorFlow的cpu版本
笔记本配置:win10-64位专业版,I7,16G。cup版本的TensorFlow安装比较简单,目前最新版本的TensorFlow2.6.0 支持Python3.9.7,经过测试完全可以跑官网的示例。当然如果安装GPU版本的建议还是下载Python3.6版本的,可能会比较稳定,因为我在台式机上用Python3.9版本安装TensorFlow2.6没有成功,当然也可能会成功,(后面详述)反正我是后来用3.6版本装好的GPU版本。
1、安装Anaconda3
下载地址:Anaconda https://www.anaconda.com/products/individual-d
安装方法网上有很多,介绍的已经很全面了: https://blog.csdn.net/weixin_39618121/article/details/112610492
2、新建虚拟环境Tensor
conda create -n Tensor python=3
运行自动创建一个名称位Tensor的虚拟环境,python版本位最新的3.9.7。
python安装后,运行一下看看,一切正常,提示Python3.9.7已经安装。
接下来我们根据自己喜好下载一个代码编辑器,当然也可以用Python自带的,不过我还是喜欢用sublimetext,开源软件、插件很多基本都能满足需求,当然最主要原因的是免费^_^,下载地址: http://www.sublimetext.com/3
配置编辑器方法网上很多,这里给个链接:https://blog.csdn.net/samenmoer/article/details/89740271?utm_medium=distribute.pc_relevant_t0.none-task-blog-
3、安装TensorFlow
首先激活上一步创建的Tensor虚拟环境
activate Tensor
这里如果直接安装TensorFlow因为网络的问题可能会失败,所以我们先配置pip使用清华源:
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
或者我们可以直接将对应版本的TensorFlow下载到本地安装,下载地址在官网
Python 3.9(仅支持 CPU)https://storage.googleapis.com/tensorflow/windows/cpu/tensorflow_cpu-2.6.0-cp39-cp39-win_amd64.whl
然后使用安装命令在本地安装,(安装时将文件放在CMD窗口命令的当前目录下)
pip install tensorflow_cpu-2.6.0-cp39-cp39-win_amd64.whl
安装tensorflow
pip install tensorflow
安装后运行一段Tensor代码测试
python -c "import tensorflow as tf;print(tf.reduce_sum(tf.random.normal([1000, 1000])))"
如果你是按照我上面的步骤进行的,那么大概率这里会报错!并报出下面的提示:Cannot register 2 metrics with the same name: /tensorflow/api/keras/optimize
不过大家完全不用担心,这个是因为Keras版本问题造成的,使用conda list,命令查看一下当前Tensor虚拟环境下的包,找到其中的Keras看看版本号,我的解决办法是重新安装Keras的2.6版本版本
pip install keras==2.6.0
安装后重新运行TensorFlow测试代码,如果出现下面的输出那么恭喜你安装成功,可以愉快的学习了!
总体来说安装CPU版本的还是比较顺利的,但是安装GPU版本就比较折腾人了,我是花了一个下午的时间不断踩坑才安装成功。
Original: https://blog.csdn.net/tangqxj/article/details/122932752
Author: tangqxj
Title: 机器学习TensorFlow安装之CPU版本

MAC M1 anaconda安装tensorflow

Tensorflow Lite Model Maker实现图像分类和目标检测迁移学习

【Tensorflow】安装

行为型设计模式(中)

开发一个会叫自己“爷爷”的“孙子”,是一种什么样的体验?

python分割语音端点检测_【语音识别】语音端点检测及Python实现

深度学习环境安装所需软件介绍cuda+cudnn+driver+anaconda+keras+tensorFlow+Pycharm+Jupyer(下载地址+配图)
![[TensorFlow] 交叉熵损失函数,加权交叉熵损失函数](https://www.itcode1024.com/wp-content/themes/begin/prune.php?src=https://www.itcode1024.com/wp-content/themes/begin/img/loading.png&w=280&h=210&a=&zc=1)
[TensorFlow] 交叉熵损失函数,加权交叉熵损失函数

矩阵求导

关于ImportError: No module named ‘tensorflow‘报错的解决

Python实现图片美化,醉后不知天在水?(附上代码) | 机器学习

optical flow光流估计的评价指标

音频向量:VGGish(Pytorch)

深度学习之卷积神经网络——学习分享(二)
