当前位置 : 主页 > 编程语言 > python >

python/GUI_删除字符串中的空白字符(空格/换行/空行等)字符(输入源包括中文文件

来源:互联网 收集:自由互联 发布时间:2022-06-14
文章目录 ​​GUI方法​​ ​​使用python自带的方法​​ GUI方法 比如使用vscode: ctrl+H,进行查找替换即可(将空格替换为空(不填写)),还支持正则 参考正则: ​​​^\s*\n​​ 您可以将常用的


文章目录

  • ​​GUI方法​​
  • ​​使用python自带的方法​​

GUI方法

比如使用vscode:
ctrl+H,进行查找替换即可(将空格替换为空(不填写)),还支持正则
参考正则:
​​​^\s*\n​​

您可以将常用的正则保存到某个文件中以便需要的时候随时读取
不论是linux还是windows都可以这么做

linux下通过​​grep​​​来查询你的字符串
windows下可以通过​​​sls​​​来查询
保存到文件中的时候可以以键值对的形式保存
例如

emptyLineRegex:^\s*\n
TencentCloudIp:174.24.117.101

python/GUI_删除字符串中的空白字符(空格/换行/空行等)字符(输入源包括中文文件)_正则表达式

使用python自带的方法

例如strip()方法不能够实现目的
换一个角度理解"字符删除",修改->替换
(从结果上看,首先应当理解为修改,而不是先入为主地认为是删除)
可以考虑使用replace()方法(或者正则表达式)相关替换方法
(使用场景:从pdf复制的文本往往会带有多余的空格,可以使用本脚处理
但是,对于英文,您可以考虑在正则表达式方法(sub())中稍作修改,比如修改为

""" 采用正则表达式for english (recommended)
根据情况自行调整 """
reg_pat=re.compile(r"\s+")
str_ret_reg=reg_pat.sub(" ",str_origin)import re
# str_origin=input("input your string:")
""" 如果读入的文本中包含中文,使用encoding='utf-8'参数,才不会保存 """
with open("raw_text_english","r",encoding='utf-8') as fis:
str_origin=fis.read()
""" 过滤掉空格/换行符 """
# str_ret_list=[chr for chr in str_origin if chr!=' ' and chr!='\n']
# str_ret="".join(str_ret_list)
""" 采用replace() method """
# str_ret_replace=str_origin.replace(" ", "").replace("\n", "")
""" 采用正则表达式(recommended)(for Chinese) """
# reg_pat=re.compile(r"\s")
# str_ret_reg=reg_pat.sub("",str_origin)

""" for english """
#reg_pat_english=re.compile(r"\s+")
#str_ret_reg=reg_pat_english.sub(" ",str_origin)

""" check out the result:replace the result by deferent method there """
str_ret=str_ret_reg
with open("ret_text","w") as fos:
fos.write(str_ret)
print(str_ret)


【文章原创作者:香港显卡服务器 http://www.558idc.com/hkgpu.html 网络转载请说明出处】
网友评论