文章目录 GUI方法 使用python自带的方法 GUI方法 比如使用vscode: ctrl+H,进行查找替换即可(将空格替换为空(不填写)),还支持正则 参考正则: ^\s*\n 您可以将常用的
文章目录
- GUI方法
- 使用python自带的方法
GUI方法
比如使用vscode:
ctrl+H,进行查找替换即可(将空格替换为空(不填写)),还支持正则
参考正则:
^\s*\n
您可以将常用的正则保存到某个文件中以便需要的时候随时读取
不论是linux还是windows都可以这么做
linux下通过grep来查询你的字符串
windows下可以通过sls来查询
保存到文件中的时候可以以键值对的形式保存
例如
emptyLineRegex:^\s*\n
TencentCloudIp:174.24.117.101
使用python自带的方法
例如strip()方法不能够实现目的
换一个角度理解"字符删除",修改->替换
(从结果上看,首先应当理解为修改,而不是先入为主地认为是删除)
可以考虑使用replace()方法(或者正则表达式)相关替换方法
(使用场景:从pdf复制的文本往往会带有多余的空格,可以使用本脚处理
但是,对于英文,您可以考虑在正则表达式方法(sub())中稍作修改,比如修改为
根据情况自行调整 """
reg_pat=re.compile(r"\s+")
str_ret_reg=reg_pat.sub(" ",str_origin)import re
# str_origin=input("input your string:")
""" 如果读入的文本中包含中文,使用encoding='utf-8'参数,才不会保存 """
with open("raw_text_english","r",encoding='utf-8') as fis:
str_origin=fis.read()
""" 过滤掉空格/换行符 """
# str_ret_list=[chr for chr in str_origin if chr!=' ' and chr!='\n']
# str_ret="".join(str_ret_list)
""" 采用replace() method """
# str_ret_replace=str_origin.replace(" ", "").replace("\n", "")
""" 采用正则表达式(recommended)(for Chinese) """
# reg_pat=re.compile(r"\s")
# str_ret_reg=reg_pat.sub("",str_origin)
""" for english """
#reg_pat_english=re.compile(r"\s+")
#str_ret_reg=reg_pat_english.sub(" ",str_origin)
""" check out the result:replace the result by deferent method there """
str_ret=str_ret_reg
with open("ret_text","w") as fos:
fos.write(str_ret)
print(str_ret)