你将会看到: 借助wordcloud+jieba的词云生成 如何批量修改文件名称 文章目录 1. 祝福话语文本准备 2. 下载图片 3. 批量修改图片名称 4. 批量读入图片生成词
你将会看到:
- 借助wordcloud+jieba的词云生成
- 如何批量修改文件名称
文章目录
- 1. 祝福话语文本准备
- 2. 下载图片
- 3. 批量修改图片名称
- 4. 批量读入图片生成词云
1. 祝福话语文本准备
来源:https://zhuanlan.zhihu.com/p/351042572
wordcloud.txt
花儿娇,酒儿醇,酒不醉人人自醉;水儿清,蜜儿浓,蜜不甜人人自甜;节儿乐,粽儿香,粽不迷人人自迷。端午,节不乐人人自乐!禁止端午节不理我,禁止吃棕忘了我,禁止包棕不帮我,禁止闲暇的时候不想我,禁止有搞笑的信息不发給我,端午节快乐!
今天端午节,愿你乘坐好运的龙舟,饮一杯消灾的雄黄酒,采一株长寿的艾叶,佩一个吉祥的香囊,吃一个香甜的粽子,有一个祥和的家庭,多一个幸福的微笑。祝你端午节快乐,合家团圆,万事如意!
甲:今年的端午节,你们老板发的是粽子还是其它什么啊? 乙:今年端午老板发脾气了。
今年送你的粽子不一般,有开心馅的‘粽’幸福,有平安馅的‘粽’健康,有吉祥馅的‘粽’如意,有财富馅的‘粽’好运,你可要收好,愿你端午节快乐。
今日端午,让我托诗人的福,请你多吃些粽子;偶尔的繁忙,不代表遗忘;夏日的到来,愿你心情舒畅,曾落下的问候,这一刻一起补偿,所有的关心,凝聚这条短信,祝端午节快乐。
花好月圆,美景常在;端午佳节,不能少你;万千话语,祝福永远;粽子传情意,香包保平安;雄黄酒添吉祥;送上祝福,祝你端午节快乐!
端午节即将来临之际,提前为你“端”上祝福:祝你幸福安康,万事如意,端午快乐!艾叶香,麦浪黄,人间美景是端阳。
端午节工作指导方针,以友谊为基础,以手机为平台,以短信为手段,以祝福为目标,以你为工作对象,以笑容为考核标准,工作完成以后请吃粽子宴。
常常把你思念,喜欢你青涩的外表,爱上你美丽的内心,总是忍不住想吻你,我要大声说‘我爱你~~粽子’,呵呵,端午节到了,愿你快乐相伴,万事如意。
锄禾在端午,汗滴禾下土。为了盘中餐,生活不怕苦。朋友送祝福,清凉能解暑。事业展鸿图,机会不胜数。健康永常驻,快乐不迷路!端午快乐!
“端”着温馨的祝福,“舞”起轻柔的思念,“节”省所有的时间,“祝”福亲爱的朋友,“拟”出别致的短信,“快”出动车的速度,“乐”在你的心上。
大家都夸你敏而好学,学什么像什么,我记得那天你学刘德华唱歌,真的很像耶。端午节来了,我想你也应该给大家模仿一下屈原跳江自杀,如何?
单纯的你,“粽”是被人关怀;善良的你,“粽”是被人保护;可爱的你,“粽”是被人疼爱。今天端午节,希望今天的你,“粽”是被人祝福。端午节快乐!
淡淡烟雨,淡淡愁,淡淡明月,上西楼,淡淡鱼儿水中游,淡淡蝴蝶落绣球,淡淡胭脂淡淡酒,淡淡酒解淡淡愁,淡淡思念给朋友,祝端午节快乐!
端午吃啥?粽子,吃前吊胃,吃中美味,吃后不足胃。端午玩啥?发短信,发前动心,发中开心,发后不烦心。愿你端午节吃得香,玩得乐!
端午节各省风俗:山东早起饮杯酒,传说可以辟邪毒;陕西兴安观竞渡,兴平端午耍人偶;湖南攸县供龙首,草船泛水送瘟疫;江苏嘉定过端午,无论贫富买鳇鱼。
“粽”想对你表白,我的思念是多么强烈;“粽”想对你倾诉,我的祝福是多么浪漫。一年一度的端午节,短信声声传耳边,啊!祝你快快乐乐端午节。
《红豆》寄相思,《糯米》呈祝愿,《大红枣》报平安,《土鸡蛋》爱装满,《荷叶》打个包,祝你端午吉祥如意,合家美满,顺顺利利!
当你睁开眼晴时,希望你能看到我祝福,祝你有个阳光般的心情;闭上眼睛前,要你收到我的问候,晚上做个好梦,祝端午节快乐!
独写菖蒲竹叶杯,蓬城芳草踏初回。情知不向瓯江死,舟楫何劳吊屈来。
独在异乡为异客,每逢佳节“粽”思亲。遥知兄弟登高处,万水千山“粽”是情。端午节,要吃“粽”,祝你“粽”横四海,“粽”是走运!端午节快乐!
2. 下载图片
3. 批量修改图片名称
编写一个函数来批量处理文件名,需要注意的是我们只处理某一文件类型,比如 .jpeg 文件。
所以,我们需要 传递两个参数 filePostFix 和 rootdir,filePostFix 表示需要修改的文件后缀,rootdir 表示遍历文件的路径。
为了实现有选择性的选择文件,核心代码是 if i[-len(filePostFix):] == filePostFix: ,表示仅仅修改选定的后缀文件名。
这里默认修改后的文件名是递增数字+文件后缀的形式。
使用 os 提供的 rename 方法修改名称,os.rename(oldname, newname)。
def renameFiles(rootdir="./", filePostFix=".jpeg"):fileList = os.listdir(rootdir)
index = 0
for i in fileList:
if i[-len(filePostFix):] == filePostFix:
oldname = rootdir + os.sep + fileList[index] # os.sep添加系统分隔符
newname = rootdir + os.sep + str(index) + filePostFix
os.rename(oldname, newname) # 用os模块中的rename方法对文件改名
index += 1
修改后的效果:
4. 批量读入图片生成词云
先通过文件名后缀判断是否是图片文件,然后使用 jieba 所提供的分词工具将文本划分为词组,使用 numpy 的 array 方法读入图片作为词云工具 wordcloud 的参数,最后使用 wordcloud 读入文本和图片生成词云。
def wordPic(rootdir="./", filePostFix=".jpeg"):fileList = os.listdir(rootdir)
for i in fileList:
if i[-len(filePostFix):] == filePostFix:
with open("wordcloud.txt", encoding="utf-8") as fp:
text = fp.read()
# 接收分词的字符串
word_list = jieba.cut(text)
# 分词后在单独个体之间加上空格
text = " ".join(word_list)
# 读入模板
mask = np.array(image.open(i))
wordcloud = WordCloud(
# 添加遮罩层
mask=mask,
font_path="C:\Windows\Fonts\SIMHEI.ttf",
background_color='white',
).generate(text)
wordcloud.to_image()
# image_produce.show()
wordcloud.to_file("word_pic" + i) # 保存词云图片