pandas数据分析小技巧
有时候我们在用pandas读入数据之后,数据有点杂乱,我们想要进行改进,而且许多都是object类型的,其中切片操作非常常见,比如有这样的数据:
路口0500KV轻声细语路口135KV霞光路口2110KV大马路路口3是500KV轻声细语路口
我们的目的是把路口名称提取出来,怎么做呢?
我们发现字符串后面 路口两个字符是一致的,还有每个数据都有 KV这两个字符,但是路口名位置不固定,可以用 find函数找到某个字符的位置。
代码如下:
首先自定义函数用于切片,接着应用到某列
def cut_site(word):
loc=word.find('V')
word=word[loc+1:-2]
return word
df['SITE_NAME']=df['路口'].apply(cut_site)
这样就生成了新列,这一列只有路口名,如下
路口SITE_NAME0500KV轻声细语路口轻声细语135KV霞光路口霞光2110KV大马路路口大马路3是500KV轻声细语路口轻声细语
用pandas读取数据后,主要用自定义函数,其中用到了find函数用来找字符出现的位置,接着用apply函数应用到某列。
Original: https://blog.csdn.net/xianzhetime/article/details/123694601
Author: 周振超的
Title: python做数据分析的自定义字符串切片
相关文章

自动语音呼叫中心系统
互联网行业是一个快速发展不断创新的行业,随着"互联网+"概念的引入,呼叫中心系统所要承载的功能和意义会随之加大。自动语音呼叫中心系统,基于雄厚的技术实力,众多的项目实施经验,让企业快速拥有企业总机、分...

gensim.models.word2vec() 参数详解
Word2vec是一个用来产生词向量的模型。是一个将单词转换成向量形式的工具。 通过转换,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 词向量...

ACL2022论文分类汇总-Prompt、句子表征、检索排序&摘要
写在前面 大家好,我是刘聪NLP。 ACL2022会议的论文已经出来一阵子了,将论文列表过了一边,筛选了一些自己正在做或者感兴趣方向的相关论文,包括:Prompt(35篇)、句子表征(21篇)、检索排...

语音识别(ASR)论文优选:WeNet
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:TTS 论文列表 http://yqli.tech/page/tts_paper.html ...

文本摘要数据集的整理、总结及介绍(持续更新ing…)
诸神缄默不语-个人CSDN博文目录 最近更新日期:2022.5.17 最早更新日期:2022.2.17 文章目录 1. 数据集及其详情对照表 * 1.1 中文数据集 - 1.1.1 LCSTS数据集 ...

【模型复现】CV、NLP多用途模型——Transformer复现
【模型复现】CV、NLP多用途模型——Transformer复现 极链AI云 注册链接 关注极链AI云公众号,学习更多知识! 文章目录 【模型复现】CV、NLP多用途模型——Transformer复现...

python3.9安装tensorflow-gpu2.6以上
1、机器环境说明: CPU:i5-7300HQ GPU:NVIDIA GeForce GTX 1050 1、查询对应版本链接: 在 Windows 环境中从源代码构建 | TensorFlow ten...

论文阅读《KnowPrompt: Knowledge-aware Prompt-tuning withSynergistic Optimization for Relation Extractio》
论文链接KnowPrompt: Knowledge-aware Prompt-tuning with Synergistic Optimization for Relation Extraction ...

文字转语音软件:Balabolka下载地址及Balabolka怎么添加语音库?
Balabolka能够进行简单的文本转语音任务,支持各种语言包,不过软件转出来的语音肯定比不上AI合成的,所以这个软件只能应对要求不高的任务。 Balabolka是文本到语音(TTS)的计划。全部电脑...

机器学习:Kmeans聚类算法总结及GPU配置加速demo
机器学习:Kmeans聚类算法总结及GPU配置加速demo * - Kmeans算法介绍 - 版本1:利用sklearn的kmeans算法,CPU上跑 - 版本2:利用网上的kmeans算法实现,GP...

【点云处理技术之open3d】第三篇:点云的高级操作篇——点云边界框、凸包、DBSCAN聚类、平面分割和隐点移除
文章目录 1. 点云边界框 2. 凸包(convex hull) 3. DBSCAN聚类 4. RANSAC平面分割 5. 隐点移除(Hidden point removal) 本文是 上一篇文章 的...

ci发什么音标_英语音标带发音方法详解,口语不好想学音标的看过这篇文章就够了…
最近和学生们聊天,很多学生和我说自己的口语不行,非常想提高自己的水平。但是口语的提高也不是一蹴而就的,也是需要一个慢慢积累和练习的过程,想提高口语水平其中最主要的就是发音,那么一定要学好音标。 很多人...

语音识别入门第一节:语音识别概述
目录 语音识别的定义 语音识别的重要性 语音交互 语音识别的挑战性 语音识别的发展历史 语音识别的深度学习时代 现代语音识别框架 语料库与工具包 语音识别的定义 语音识别:Automatic Spee...

基于matlab的GUI语音识别系统设计
目录 1.设计GUI 2.回调函数 3.对象显示 4.简单弹窗 5.倒计时设计 1.设计GUI 命令行输入下面的命令打开GUI设计界面。 guide 以下面的语言识别系统为例,下面为效果图。 2.回调...

ConvNeXt:A ConvNet for the 2020s
抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。 Original: https://blog.cs...