当前位置 : 主页 > 编程语言 > python >

python_处理文本标签_遍历目录

来源:互联网 收集:自由互联 发布时间:2022-07-19
python_处理文本标签_遍历目录 我们将训练评论转换成字符串列表,每个字符串对应一条评论。你也可以将评论 标签(正面 / 负面)转换成 labels 列表 遍历目录 import os imdb_dir = '/home/ubu


python_处理文本标签_遍历目录

我们将训练评论转换成字符串列表,每个字符串对应一条评论。你也可以将评论
标签(正面 / 负面)转换成 labels 列表
遍历目录

import os

imdb_dir = '/home/ubuntu/data/aclImdb'
train_dir = os.path.join(imdb_dir, 'train')

labels = []
texts = []

for label_type in ['neg', 'pos']:
dir_name = os.path.join(train_dir, label_type)
for fname in os.listdir(dir_name):
if fname[-4:] == '.txt':
f = open(os.path.join(dir_name, fname))
texts.append(f.read())
f.close()
if label_type == 'neg':
labels.append(0)
else:
labels.append(1)


上一篇:python_文件操作_复制图片
下一篇:没有了
网友评论