Python中的字符串查找操作方法总结

 更新时间:2016年06月27日 15:40:14   作者:mink的小屋  
这里我们来整理一下Python中的字符串查找操作方法总结,除了基本的find()方法外,还会讲解到朴素匹配算法和KMP算法的使用:
(福利推荐:【腾讯云】服务器最新限时优惠活动,云服务器1核2G仅99元/年、2核4G仅768元/3年,立即抢购>>>:9i0i.cn/qcloud

(福利推荐:你还在原价购买阿里云服务器?现在阿里云0.8折限时抢购活动来啦!4核8G企业云服务器仅2998元/3年,立即抢购>>>:9i0i.cn/aliyun

基本的字符串位置查找方法
Python 查找字符串使用 变量.find("要查找的内容"[,开始位置,结束位置]),开始位置和结束位置,表示要查找的范围,为空则表示查找所有。查找到后会返回位置,位置从0开始算,如果每找到则返回-1。

str = 'a,hello' 
print str.find('hello') # 在字符串str里查找字符串hello 
>> 2     # 输出结果 

朴素匹配算法

朴素匹配算法是对目标字符串和模板字符串的一一匹配。如果匹配得上,下标向右移一位, 否则清空并重新开始匹配。

target = 'abb aba'
pattern = 'aba'

def match(target, pattern):
  i = j = 0
  n, m = len(target), len(pattern)
  while i < n and j < m:
    # 如果字符相等则目标和模板的下标都向右移
    if target[i] == pattern[j]:
      i, j = i+1, j+1
    else:
      # 如果字符不相等则目标下标切换到不相等的下标
      # 模板下标移动到初始下标
      i = i - j + 1
      j = 0
  if j == m:
    return i - j
  return -1

把上面的加上print后打印一遍

#修改的地方
else:
  i = i -j + 1
  j = 0
  print(target[i], pattern[j], i, j)

# 打印结果
b a 1 0
b a 2 0
 a 3 0
a a 4 0

循环会一直到相等的匹配值, 这个方法效率低下,主要是在不匹配时会重新把模板字符循环一次。最多可能会出现 m * (n-m +1)次。m是模板字符的长度,n-m + 1是排除不等字符的次数。

KMP 算法

kmp是通过已知匹配的字符进行移位的算法,比如上面的abb 中跟abc比较的话 ab是已知的。

def match(target, pattern):
  i = j = 0
  n, m = len(target), len(pattern)
  while i < n and j < m:
    # 如果字符相等则目标和模板的下标都向右移
    if if j == -1 and target[i] == pattern[j]:
      i, j = i+1, j+1
    else:
      # 这里通过next 函数来判断位移个数
      i = i - j + pattern_next(pattern[:j])
      j = 0
  if j == m:
    return i - j
  return -1


def pattern_next(s):  
  prefix = [s[:i+1] for i in range(len(s)-1)]
  suffix = [s[i+1:] for i in range(len(s)-1)]
  l = list(set(prefix) & set(suffix))
  return len(l)

相关文章

  • 解决python 读取excel时 日期变成数字并加.0的问题

    解决python 读取excel时 日期变成数字并加.0的问题

    这篇文章主要介绍了python 读取excel时, 日期变成数字并加.0的问题,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-10-10
  • 使用Python如何将视频按照一定时间切割(比如:每10s进行裁切)

    使用Python如何将视频按照一定时间切割(比如:每10s进行裁切)

    这篇文章主要介绍了使用Python将视频按照一定时间切割(比如:每10s进行裁切),本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-07-07
  • 详解pandas df.iloc[]的典型用法

    详解pandas df.iloc[]的典型用法

    本文主要介绍了详解pandas df.iloc[]的典型用法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-08-08
  • python 如何把classification_report输出到csv文件

    python 如何把classification_report输出到csv文件

    这篇文章主要介绍了python 把classification_report输出到csv文件的操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • python的open函数常见用法

    python的open函数常见用法

    python打开文件使用open()函数,返回一个指向文件的指针,这篇文章主要介绍了python的open函数使用,需要的朋友可以参考下
    2022-11-11
  • Python基于PycURL实现POST的方法

    Python基于PycURL实现POST的方法

    这篇文章主要介绍了Python基于PycURL实现POST的方法,涉及Python实现curl传递post数据的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-07-07
  • Python学习笔记嵌套循环详解

    Python学习笔记嵌套循环详解

    这篇文章主要介绍了Python学习笔记嵌套循环详解,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-07-07
  • 在keras中实现查看其训练loss值

    在keras中实现查看其训练loss值

    这篇文章主要介绍了在keras中实现查看其训练loss值,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • Python的log日志功能及设置方法

    Python的log日志功能及设置方法

    今天小编就为大家分享一篇Python的log日志功能及设置方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Python实现动态二维码生成的示例代码

    Python实现动态二维码生成的示例代码

    这篇文章主要和大家分享两个制作二维码的Python库,可以生成普通的二维码、图片背景版二维码、动图GIF版二维。文中的示例代码讲解详细,感兴趣的可以学习一下
    2022-05-05

最新评论

?


http://www.vxiaotou.com