在爬取某些文字信息的时候,可能有些文本是繁体字,有时需要作字符格式统一处理,就需要面临繁体字或者简体字转繁体字的需求。具体该如何进行转换呢? 目录 一、下载依赖
在爬取某些文字信息的时候,可能有些文本是繁体字,有时需要作字符格式统一处理,就需要面临繁体字或者简体字转繁体字的需求。具体该如何进行转换呢?
目录
一、下载依赖
二、代码实例
三、转换结果
一、下载依赖
链接:https://pan.baidu.com/s/1nui8DyKcUmlw1qaqy3NXvA (提取码:dyyg )
提示:需要将这两个代码文件和你的代码放在同级目录下
二、代码实例
#!/usr/bin/env python# -*- coding:utf-8 -*-
from langconv import *
# 繁体转简体
def TraditionalToSimplified(content):
line = Converter("zh-hans").convert(content)
return line
# 简体转繁体
def SimplifiedToTraditional(content):
line = Converter("zh-hant").convert(content)
return line
if __name__ == "__main__":
content = "鵬程萬裏"
# 繁体转简体
simpleContent = TraditionalToSimplified(content)
print(simpleContent)
# 简体转繁体
traditionalConent = SimplifiedToTraditional(simpleContent)
print(traditionalConent)
三、转换结果
鹏程万里鵬程萬里