python做数据分析的自定义字符串切片

人工智能31

pandas数据分析小技巧

有时候我们在用pandas读入数据之后,数据有点杂乱,我们想要进行改进,而且许多都是object类型的,其中切片操作非常常见,比如有这样的数据:

路口0500KV轻声细语路口135KV霞光路口2110KV大马路路口3是500KV轻声细语路口

我们的目的是把路口名称提取出来,怎么做呢?

我们发现字符串后面 路口两个字符是一致的,还有每个数据都有 KV这两个字符,但是路口名位置不固定,可以用 find函数找到某个字符的位置。

代码如下:

首先自定义函数用于切片,接着应用到某列

def cut_site(word):
    loc=word.find('V')
    word=word[loc+1:-2]
    return word
df['SITE_NAME']=df['路口'].apply(cut_site)

这样就生成了新列,这一列只有路口名,如下

路口SITE_NAME0500KV轻声细语路口轻声细语135KV霞光路口霞光2110KV大马路路口大马路3是500KV轻声细语路口轻声细语

用pandas读取数据后,主要用自定义函数,其中用到了find函数用来找字符出现的位置,接着用apply函数应用到某列。

Original: https://blog.csdn.net/xianzhetime/article/details/123694601
Author: 周振超的
Title: python做数据分析的自定义字符串切片

相关文章
自动语音呼叫中心系统 人工智能

自动语音呼叫中心系统

互联网行业是一个快速发展不断创新的行业,随着"互联网+"概念的引入,呼叫中心系统所要承载的功能和意义会随之加大。自动语音呼叫中心系统,基于雄厚的技术实力,众多的项目实施经验,让企业快速拥有企业总机、分...
gensim.models.word2vec() 参数详解 人工智能

gensim.models.word2vec() 参数详解

Word2vec是一个用来产生词向量的模型。是一个将单词转换成向量形式的工具。 通过转换,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 词向量...
ConvNeXt:A ConvNet for the 2020s 人工智能

ConvNeXt:A ConvNet for the 2020s

抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。 Original: https://blog.cs...