python_处理文本标签_遍历目录 我们将训练评论转换成字符串列表,每个字符串对应一条评论。你也可以将评论 标签(正面 / 负面)转换成 labels 列表 遍历目录 import os imdb_dir = '/home/ubu
python_处理文本标签_遍历目录
我们将训练评论转换成字符串列表,每个字符串对应一条评论。你也可以将评论
标签(正面 / 负面)转换成 labels 列表
遍历目录
imdb_dir = '/home/ubuntu/data/aclImdb'
train_dir = os.path.join(imdb_dir, 'train')
labels = []
texts = []
for label_type in ['neg', 'pos']:
dir_name = os.path.join(train_dir, label_type)
for fname in os.listdir(dir_name):
if fname[-4:] == '.txt':
f = open(os.path.join(dir_name, fname))
texts.append(f.read())
f.close()
if label_type == 'neg':
labels.append(0)
else:
labels.append(1)