python_文件系统操作 import os , sys path = "/tmp" # 查看当前工作目录 retval = os . getcwd () print "当前工作目录为 %s" % retval # 修改当前工作目录 #进入选定路径 os . chdir ( path ) import pandas as pd impo
python_文件系统操作
import os, syspath = "/tmp"
# 查看当前工作目录
retval = os.getcwd()
print "当前工作目录为 %s" % retval
# 修改当前工作目录
#进入选定路径
os.chdir( path )
import pandas as pd
import os
pd.set_option('max_colwidth',500)
pd.set_option('display.max_columns',None)
os.chdir('/home/')
加载CSV文件示例
os.chdir('/home/admin/POC/poc_data/')df_sqj=pd.read_csv('./shenqingjian/shenqingjian.csv')
#label=pd.read_csv('/home/sophonAdmin/POC/label.csv')
#header=None 不加载首行
df_crm=pd.read_csv('crm.csv',header=None,names=col_crm,dtype={'bel_org':str})
#dtype 设置字段类型
df_acct=pd.read_csv('Acct_poc.txt',encoding='gbk',dtype={'XACCOUNT':int,'CUSTR_NBR':str})
df_apma=pd.read_csv('apma_poc.txt',encoding='gbk',dtype={'ACCOUNT':int})
df_card=pd.read_csv('CARD.txt',names=col_card,encoding='gbk',dtype={'XACCOUNT':int,'CARD_NBR':str,'CUSTR_NBR':str})
df_custr=pd.read_csv('custr.txt',encoding='gbk',dtype=str)
df_train_stmt=pd.read_csv('train_stmt.csv',encoding='gbk',dtype={'XACCOUNT':int})
df_train_stma=pd.read_csv('train_stma.csv',encoding='gbk',dtype={'XACCOUNT':int})
df_custr=df_custr.rename(columns={'客户证件号':'CUSTR_NBR','参考资料编号':'CUSTR_REF'})
加载csv文件示例三:
# 加载csv文件data_dir = '/home/ubuntu/data/'
fname = os.path.join(data_dir, 'jena_climate_2009_2016.csv')
f = open(fname)
data = f.read()
f.close()
lines = data.split('\n')
header = lines[0].split(',')
lines = lines[1:]
print(header)
print(len(lines))
加载txt文件
import os#cd 移动到某个目录
os.chdir('/home/sophonAdmin/POC/poc_data/')
## 1. 定义样本
#根据APMA表中A 核准记录的申请书条形码+账号作为样本
#读取txt文件
df_apma=pd.read_csv('apma_poc.txt',encoding='gbk',dtype={'ACCOUNT':int}) # 申请件纪录