python统计文本字符串里单词出现频率的方法

 更新时间:2015年05月26日 16:45:49   作者:依山带水  
这篇文章主要介绍了python统计文本字符串里单词出现频率的方法,涉及Python字符串操作的相关技巧,需要的朋友可以参考下
(福利推荐:【腾讯云】服务器最新限时优惠活动,云服务器1核2G仅99元/年、2核4G仅768元/3年,立即抢购>>>:9i0i.cn/qcloud

(福利推荐:你还在原价购买阿里云服务器?现在阿里云0.8折限时抢购活动来啦!4核8G企业云服务器仅2998元/3年,立即抢购>>>:9i0i.cn/aliyun

本文实例讲述了python统计文本字符串里单词出现频率的方法。分享给大家供大家参考。具体实现方法如下:

# word frequency in a text
# tested with Python24  vegaseat  25aug2005
# Chinese wisdom ...
str1 = """Man who run in front of car, get tired.
Man who run behind car, get exhausted."""
print "Original string:"
print str1
print
# create a list of words separated at whitespaces
wordList1 = str1.split(None)
# strip any punctuation marks and build modified word list
# start with an empty list
wordList2 = []
for word1 in wordList1:
  # last character of each word
  lastchar = word1[-1:]
  # use a list of punctuation marks
  if lastchar in [",", ".", "!", "?", ";"]:
    word2 = word1.rstrip(lastchar)
  else:
    word2 = word1
  # build a wordList of lower case modified words
  wordList2.append(word2.lower())
print "Word list created from modified string:"
print wordList2
print
# create a wordfrequency dictionary
# start with an empty dictionary
freqD2 = {}
for word2 in wordList2:
  freqD2[word2] = freqD2.get(word2, 0) + 1
# create a list of keys and sort the list
# all words are lower case already
keyList = freqD2.keys()
keyList.sort()
print "Frequency of each word in the word list (sorted):"
for key2 in keyList:
 print "%-10s %d" % (key2, freqD2[key2])

希望本文所述对大家的Python程序设计有所帮助。

相关文章

  • 完美解决Django2.0中models下的ForeignKey()问题

    完美解决Django2.0中models下的ForeignKey()问题

    这篇文章主要介绍了完美解决Django2.0中models下的ForeignKey()问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • Python个人博客程序开发实例用户验证功能

    Python个人博客程序开发实例用户验证功能

    这篇文章主要介绍了怎样用Python来实现一个完整的个人博客系统,我们通过实操上手的方式可以高效的巩固所学的基础知识,感兴趣的朋友一起来看看吧
    2022-12-12
  • 关于Python turtle库使用时坐标的确定方法

    关于Python turtle库使用时坐标的确定方法

    这篇文章主要介绍了关于Python turtle库使用时坐标的确定方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-03-03
  • Python的numpy选择特定行列的方法

    Python的numpy选择特定行列的方法

    这篇文章主要介绍了Python的numpy选择特定行列的方法,有时需要抽取矩阵中特定行的特定列,比如,需要抽取矩阵x的0,1行的0,3列,结果为矩阵域,需要的朋友可以参考下
    2023-08-08
  • python中的colorlog库使用详解

    python中的colorlog库使用详解

    这篇文章主要介绍了python中的colorlog库详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • Python读取文件内容为字符串的方法(多种方法详解)

    Python读取文件内容为字符串的方法(多种方法详解)

    这篇文章主要介绍了Python读取文件内容为字符串的方法,本文通过三种方式给大家介绍,在文章末尾给大家提到了python读取txt文件中字符串,字符串用空格分隔的相关知识,需要的朋友可以参考下
    2020-03-03
  • Python实现简单的2048小游戏

    Python实现简单的2048小游戏

    这篇文章主要为大家详细介绍了Python实现简单的2048小游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-03-03
  • PyQt5 QLineEdit输入的子网字符串校验QRegExp实现

    PyQt5 QLineEdit输入的子网字符串校验QRegExp实现

    这篇文章主要介绍了PyQt5 QLineEdit输入的子网字符串校验QRegExp实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • Pytorch使用shuffle打乱数据的操作

    Pytorch使用shuffle打乱数据的操作

    这篇文章主要介绍了Pytorch使用shuffle打乱数据的操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • pycharm 实现本地写代码,服务器运行的操作

    pycharm 实现本地写代码,服务器运行的操作

    这篇文章主要介绍了pycharm 实现本地写代码,服务器运行的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06

最新评论

?


http://www.vxiaotou.com