使用python的chardet库获得文件编码并修改编码

 更新时间:2014年01月22日 11:25:01   作者:  
windows和linux采用了不同的编码,这让很多人伤透了脑经,这里我采用了Python的chardet库获得代码的编码,然后修改编码
(福利推荐:【腾讯云】服务器最新限时优惠活动,云服务器1核2G仅99元/年、2核4G仅768元/3年,立即抢购>>>:9i0i.cn/qcloud

(福利推荐:你还在原价购买阿里云服务器?现在阿里云0.8折限时抢购活动来啦!4核8G企业云服务器仅2998元/3年,立即抢购>>>:9i0i.cn/aliyun

首先需要安装chardet库,有很多方式,我才用的是比较笨的方式:sudo pip install chardet

复制代码 代码如下:

#!/usr/bin/env python
# coding: UTF-8
import sys
import os
import chardet

 
def print_usage():
  print '''usage:
  change_charset [file|directory] [charset] [output file]\n
  for example:
    change 1.txt utf-8 n1.txt
    change 1.txt utf-8
    change . utf-8
    change 1.txt
'''
def get_charset(s):
  return chardet.detect(s)['encoding']

 
def remove(file_name):
  os.remove(file_name)

 
def change_file_charset(file_name, output_file_name, charset):
  f = open(file_name)
  s = f.read()
  f.close()

  if file_name == output_file_name or output_file_name == "":
    remove(file_name)

  old_charset = get_charset(s)
  u = s.decode(old_charset)

  if output_file_name == "":
    output_file_name = file_name
  f = open(output_file_name, 'w')
  s = u.encode(charset)
  f.write(s)
  f.close()

 
def do(file_name, output_file_name, charset):
  if os.path.isdir(file_name):
    for item in os.listdir(file_name):
      try:
        if os.path.isdir(file_name+"/"+item):
          do(file_name+"/"+item, "", charset)
        else:
          change_file_charset(file_name+"/"+item, "", charset)
      except OSError, e:
        print e
  else:
    change_file_charset(file_name, output_file_name, charset)

 
if __name__ == '__main__':
  length = len(sys.argv)

  if length == 1:
    print_usage()
  elif length == 2:
    do(sys.argv[1], "", "utf-8")
  elif length == 3:
    do(sys.argv[1], "", sys.argv[2])
  elif length == 4:
    do(sys.argv[1], sys.argv[3], sys.argv[2])
  else:
    print_usage()

相关文章

  • python 进阶学习之python装饰器小结

    python 进阶学习之python装饰器小结

    这篇文章主要介绍了python 进阶学习之python装饰器小结,本文通过场景分析给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-09-09
  • python中tkinter窗口位置\坐标\大小等实现示例

    python中tkinter窗口位置\坐标\大小等实现示例

    这篇文章主要介绍了python中tkinter窗口位置\坐标\大小等实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07
  • Python3正则表达式之:(?(id/name)yes-pattern|no-pattern)条件性匹配

    Python3正则表达式之:(?(id/name)yes-pattern|no-pattern)条件性匹配

    (?(id/name)yes-pattern|no-pattern)的作用是对于给出的id或者name,先尝试去匹配 yes-pattern部分的内容,如果id或name条件不满足,则去匹配no-pattern部分的内容
    2021-10-10
  • django将图片保存到mysql数据库并展示在前端页面的实现

    django将图片保存到mysql数据库并展示在前端页面的实现

    这篇文章主要介绍了django将图片保存到mysql数据库并展示在前端页面的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-05-05
  • python模块中判断全局变量的赋值的实例讲解

    python模块中判断全局变量的赋值的实例讲解

    在本篇文章里小编给大家整理的是一篇关于python模块中判断全局变量的赋值的实例讲解内容,有兴趣的朋友们可以学习下。
    2021-03-03
  • Jupyter加载文件的实现方法

    Jupyter加载文件的实现方法

    这篇文章主要介绍了Jupyter加载文件的实现方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • Python input函数实现获取键盘输入的字符串流程讲解

    Python input函数实现获取键盘输入的字符串流程讲解

    这篇文章主要介绍了Python input函数实现获取键盘输入的字符串流程,input()是Python的内置函数,用于从控制台读取用户输入的内容。input()函数总是以字符串的形式来处理用户输入的内容,所以用户输入的内容可以包含任何字符
    2023-01-01
  • python字典中items()函数用法实例

    python字典中items()函数用法实例

    Python字典items()函数作用以列表返回可遍历的(键, 值)元组数组,下面这篇文章主要给大家介绍了关于python字典中items()函数用法的相关资料,需要的朋友可以参考下
    2022-11-11
  • python基础之匿名函数详解

    python基础之匿名函数详解

    这篇文章主要介绍了python基础之匿名函数详解,文中有非常详细的代码示例,对正在学习python基础的小伙伴们有很好的帮助,需要的朋友可以参考下
    2021-04-04
  • python控制结构的条件判断与循环示例详解

    python控制结构的条件判断与循环示例详解

    这篇文章主要为大家介绍了python控制结构的条件判断与循环示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-06-06

最新评论

?


http://www.vxiaotou.com