当前位置 : 主页 > 编程语言 > python >

Python爬虫技术--基础篇--判断与循环语句

来源:互联网 收集:自由互联 发布时间:2022-06-15
1.条件判断 计算机之所以能做很多自动化的任务,因为它可以自己做条件判断。 比如,输入用户年龄,根据年龄打印不同的内容,在Python程序中,用​​if​​语句实现: age = 20 if ag

1.条件判断

计算机之所以能做很多自动化的任务,因为它可以自己做条件判断。

比如,输入用户年龄,根据年龄打印不同的内容,在Python程序中,用​​if​​语句实现:

age = 20
if age >= 18:
print('your age is', age)
print('adult')

根据Python的缩进规则,如果​​if​​​语句判断是​​True​​,就把缩进的两行print语句执行了,否则,什么也不做。

也可以给​​if​​​添加一个​​else​​​语句,意思是,如果​​if​​​判断是​​False​​​,不要执行​​if​​​的内容,去把​​else​​执行了:

age = 3
if age >= 18:
print('your age is', age)
print('adult')
else:
print('your age is', age)
print('teenager')

注意不要少写了冒号​​:​​。

当然上面的判断是很粗略的,完全可以用​​elif​​做更细致的判断:

age = 3
if age >= 18:
print('adult')
elif age >= 6:
print('teenager')
else:
print('kid')

​​elif​​​是​​else if​​​的缩写,完全可以有多个​​elif​​​,所以​​if​​语句的完整形式就是:

if <条件判断1>:
<执行1>
elif <条件判断2>:
<执行2>
elif <条件判断3>:
<执行3>
else:
<执行4>

​​if​​​语句执行有个特点,它是从上往下判断,如果在某个判断上是​​True​​​,把该判断对应的语句执行后,就忽略掉剩下的​​elif​​​和​​else​​​,所以,请测试并解释为什么下面的程序打印的是​​teenager​​:

age = 20
if age >= 6:
print('teenager')
elif age >= 18:
print('adult')
else:
print('kid')

​​if​​判断条件还可以简写,比如写:

if x:
print('True')

只要​​x​​​是非零数值、非空字符串、非空list等,就判断为​​True​​​,否则为​​False​​。

再议 input

最后看一个有问题的条件判断。很多同学会用​​input()​​读取用户的输入,这样可以自己输入,程序运行得更有意思:

birth = input('birth: ')
if birth < 2000:
print('00前')
else:
print('00后')

输入​​1982​​,结果报错:

Traceback (most recent call last):
File "", line 1, in
TypeError: unorderable types: str() > int()

这是因为​​input()​​​返回的数据类型是​​str​​​,​​str​​​不能直接和整数比较,必须先把​​str​​​转换成整数。Python提供了​​int()​​函数来完成这件事情:

s = input('birth: ')
birth = int(s)
if birth < 2000:
print('00前')
else:
print('00后')

再次运行,就可以得到正确地结果。但是,如果输入​​abc​​呢?又会得到一个错误信息:

Traceback (most recent call last):
File "", line 1, in
ValueError: invalid literal for int() with base 10: 'abc'

原来​​int()​​函数发现一个字符串并不是合法的数字时就会报错,程序就退出了。

2.循环

要计算1+2+3,我们可以直接写表达式:

>>> 1 + 2 + 3
6

要计算1+2+3+...+10,勉强也能写出来。

但是,要计算1+2+3+...+10000,直接写表达式就不可能了。

为了让计算机能计算成千上万次的重复运算,我们就需要循环语句。

Python的循环有两种,一种是for...in循环,依次把list或tuple中的每个元素迭代出来,看例子:

names = ['Michael', 'Bob', 'Tracy']
for name in names:
print(name)

执行这段代码,会依次打印​​names​​的每一个元素:

Michael
Bob
Tracy

所以​​for x in ...​​​循环就是把每个元素代入变量​​x​​,然后执行缩进块的语句。

再比如我们想计算1-10的整数之和,可以用一个​​sum​​变量做累加:

sum = 0
for x in [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]:
sum = sum + x
print(sum)

如果要计算1-100的整数之和,从1写到100有点困难,幸好Python提供一个​​range()​​​函数,可以生成一个整数序列,再通过​​list()​​​函数可以转换为list。比如​​range(5)​​生成的序列是从0开始小于5的整数:

>>> list(range(5))
[0, 1, 2, 3, 4]

第二种循环是while循环,只要条件满足,就不断循环,条件不满足时退出循环。比如我们要计算100以内所有奇数之和,可以用while循环实现:

sum = 0
n = 99
while n > 0:
sum = sum + n
n = n - 2
print(sum)

在循环内部变量​​n​​​不断自减,直到变为​​-1​​时,不再满足while条件,循环退出。

break

在循环中,​​break​​语句可以提前退出循环。例如,本来要循环打印1~100的数字:

n = 1
while n <= 100:
print(n)
n = n + 1
print('END')

上面的代码可以打印出1~100。

如果要提前结束循环,可以用​​break​​语句:

n = 1
while n <= 100:
if n > 10: # 当n = 11时,条件满足,执行break语句
break # break语句会结束当前循环
print(n)
n = n + 1
print('END')

执行上面的代码可以看到,打印出1~10后,紧接着打印​​END​​,程序结束。

可见​​break​​的作用是提前结束循环。

continue

在循环过程中,也可以通过​​continue​​语句,跳过当前的这次循环,直接开始下一次循环。

n = 0
while n < 10:
n = n + 1
print(n)

上面的程序可以打印出1~10。但是,如果我们想只打印奇数,可以用​​continue​​语句跳过某些循环:

n = 0
while n < 10:
n = n + 1
if n % 2 == 0: # 如果n是偶数,执行continue语句
continue # continue语句会直接继续下一轮循环,后续的print()语句不会执行
print(n)

执行上面的代码可以看到,打印的不再是1~10,而是1,3,5,7,9。

可见​​continue​​的作用是提前结束本轮循环,并直接开始下一轮循环。

小结

循环是让计算机做重复任务的有效的方法。

​​break​​​语句可以在循环过程中直接退出循环,而​​continue​​​语句可以提前结束本轮循环,并直接开始下一轮循环。这两个语句通常都必须配合​​if​​语句使用。

要特别注意,不要滥用​​break​​​和​​continue​​​语句。​​break​​​和​​continue​​​会造成代码执行逻辑分叉过多,容易出错。大多数循环并不需要用到​​break​​​和​​continue​​​语句,上面的两个例子,都可以通过改写循环条件或者修改循环逻辑,去掉​​break​​​和​​continue​​语句。

有些时候,如果代码写得有问题,会让程序陷入“死循环”,也就是永远循环下去。这时可以用​​Ctrl+C​​退出程序,或者强制结束Python进程。

以下参考爬虫五天速成课件(将其结合,更全面复习)

Python爬虫技术--基础篇--判断与循环语句_Python

 Python爬虫技术--基础篇--判断与循环语句_if语句_02

 

 Python爬虫技术--基础篇--判断与循环语句_python_03

 

Python爬虫技术--基础篇--判断与循环语句_条件判断_04

 


上一篇:Python爬虫技术--基础篇--字符串与编码
下一篇:没有了
网友评论