说简单点,Python模块就是带.py后缀的可执行文件,用来重复调用变量和函数。
比方说,你在数据分析过程中反复需要读取CSV文件,除了使用pandas等现成的库方法外,还可以自己写一个模块用于调用。
# -*- coding: utf-8 -*- import csv desc = '这是csv读取函数' print(desc) def read_csv(path): with open(path, newline='') as csvfile: reader = csv.DictReader(csvfile) for i in reader: print(i)
你只需要将上面脚本保存为.py文件,就可以通过import导入其中的read_csv函数,直接在你的代码中进行调用。
比如我将脚本保存为readcsv.py,并存放到当前文件夹里,在新的代码中调用,只需传入csv文件路径名,就可以读取相应文件。
from readcsv import read_csv read_csv("e:\test.csv")
得到如下结果:
这就是一个编写好的模块了,你可以随时随地进行调用,而不需要在代码中重复编写复杂的方法。
我们看到,运行代码后既直接使用了模块的常量,也调用了模块的函数,这就涉及到模块的功能定义:
❝Python 模块(Module),是一个 Python 文件,以 .py 结尾,包含了 Python 对象定义和Python语句。❞
模块相当于一个封装好的工具箱,你只需要传入相关参数,就可以使用其中的功能。
一般,大型的Python代码项目会有很多个模块,能让逻辑更清晰。
除了通过import导入外,.py模块文件还可以作为脚本直接运行。
我们在命令行切换到脚本所在目录,并输入:
python readcsv.py
就可以直接执行相应代码:
如果你在脚本代码中添加if __name__ == "__main__":语句,那么该语句后面的代码只有在直接执行脚本时生效,而import导入模块时不被执行。
# -*- coding: utf-8 -*- import csv desc = '这是csv读取函数' print(desc) def read_csv(path): with open(path, newline='') as csvfile: reader = csv.DictReader(csvfile) for i in reader: print(i) if __name__ == "__main__": print("直接运行脚本时生效")
这也是困惑很多人的一个问题,if __name__ == "__main__":到底有什么用?
__main__始终指当前执行模块的名称(包含后缀.py)。
__name__是内置变量,当该模块被直接执行的时候, __name__等于文件名(包含后缀 .py )。
如果该模块 import 到其他模块中,则该模块的 __name__等于模块名称(不包含后缀.py)。
所以当直接执行脚本时候,__name__ == "__main__"为真成立,可以继续执行后面代码。
而当import导入模块时候,__name__ == "__main__"为假,不成立,无法执行后面代码。
这种操作常用于为模块提供便捷用户接口,或用于测试(把模块当作执行测试套件的脚本运行)。
以下是python常用内建模块,供参考。