一、定义:由一对单引号或双引号包含的一串字符。字符串是不可变类型,字符串之间可以进行加法、乘法的运算,运算的本质就是字符串拼接。
name="marsha" age="49" print(name+age) print(name*3) marsha49 namenamename
二、数据类型转换:str() 可以将任意数据类型转换成字符串类型。
#list>str a=[1,2,3] #list a=sir([1,2,3]) #str #dict>str a=str({"name":"marsha","age"=49}) #str #int>str x=str(57) #str #float>str y=str(3.1415) #tuple>str m=str((1,2,3)) #set>str L=str({1,2,3})
三、内置方法
A、取值:字符串可以按索引取值,可以取全值,可以部分取值;注意:取值不算空格;且,只能取,不能改 ;正向取从0开始数,反向取从-1开始数。
语法格式: [ ]
msg="hello world" print(msg) #取全值 print(msg[5]) #正向取 print(msg[-3]) #反向取 hello world w r
B、切片Slice:是一个取操作,不改变原值,属于浅拷贝,即:从一个大字符串中拷贝出一个字符串,正切从0开始数位,空格要算位,切片顾头不顾尾。 完整切片语法格式:object[start_index:end_index:step]。
step:正负数均可,其绝对值大小决定了切取数据时的‘‘步长”,而正负号决定了“切取方向”,正表示“从左往右”取值,负表示“从右往左”取值。当step省略时,默认为1,即从左往右以步长1取值。
start_index:表示起始索引(包含该索引对应值);该参数省略时,表示从对象“端点”开始取值,至于是从“起点”还是从“终点”开始,则由step参数的正负决定,step为正从“起点”开始,为负从“终点”开始。
end_index:表示终止索引(不包含该索引对应值);该参数省略时,表示一直取到数据“端点”,至于是到“起点”还是到“终点”,同样由step参数的正负决定,step为正时直到“终点”,为负时直到“起点”。
总结:
-
开头:当步长>0时,不写默认0。当步长<0时,不写默认-1
-
结束:当步长>0时,不写默认列表长度加一。当步长<0时,不写默认负的列表长度减一
-
步长:默认1,>0 是从左往右走,<0是从右往左走
(一)start_index、end_index、step三者可同为正、同为负,或正负混合。但必须遵循一个原则,即:当start_index表示的实际位置在end_index的左边时,从左往右取值,此时step必须是正数(同样表示从左往右);当start_index表示的实际位置在end_index的右边时,表示从右往左取值,此时step必须是负数(同样表示从右往左),即两者的取值顺序必须相同。
(二)当start_index或end_index省略时,取值的起始索引和终止索引由step的正负来决定,这种情况不会有取值方向矛盾,但正和负取到的结果顺序是相反的,因为一个向左一个向右。
(三)step的正负是必须要考虑的,尤其是当step省略时。比如msg[-1:],很容易就误认为是从“终点”开始一直取到“起点”,原因在于step省略时step=1表示从左往右取值,而起始索引start_index=-1本身就是对象的最右边元素了,再往右已经没数据了,因此结果只含有d一个元素。
(四)切片的返回结果类型和切片对象类型一致,返回的是切片对象的子序列。如:对一个列表切片返回一个列表;字符串切片返回字符串。
切片可以全切,正切,反切,还可以加步长切片。全切用[:],[: :]操作,反向全切用[::-1]操作。
msg="hell0 world" print(msg[:]) #正向全切 print(msg[::-1]) #反向全切 print(msg[0:8]) #正向切,从第一位切到第7位,即0,1,2,3,4,5,6,7 print(msg[0:8:2]) #正向切,步长为2,从第一位开始,两位两位的数,即0,2,4,6,注意,8不能数了,顾头不顾尾 print(msg[5:0:-1]) #反向切,步长位1,起点为5,终点为0,即5,4,3,2,1,0 #输出结果 hello world dlrow olleh hello wo hlow olleh
C、长度len:获取字符串的长度,即字符串的个数,起始位置为1。但凡存在于引号内的都算作字符,含空格
msg="hello world!" print(len(msg)) >>>12
D、成员运算in 和not in:返回布尔值True 或False
msg="hello world" print(‘hello’ in msg) print(“hello” not in msg) >>> True False
E、移除字符串首尾的空白字符:strip( ) #空白字符如:空格,\ n ,\ t;
移除首尾指定字符: strip (指定字符),如strip(*&$@)
移除左边的字符:lstrip( )
移除右边的字符:rstrip( )
msg=“ hello world \n ” res="**&hello world%" print(msg.strip()) print(res.strip(*$%))
print(res.lstrip(*&)) >>> hello world hello world
hello world%
F、切分:把一个字符串按照某种分隔符号进行切割,得到一个新的列表.
split():从左到右切分,默认以空格作为切分符号;
split('指定符号'):从左到右,按照指定的字符切割字符串;切分可以指定次数,如split(' : ' , 1)
rsplit():从右到左的顺序对字符串进行切分;
rsplit( '指定符号’ ):从右到左切分,按照指定的字符切割字符串。
info="my name is marsha" msg="marsha:49:max" print(info.split()) print(msg.split(':',1)) >>> ['my'', 'name', 'is','marsha'] ['marsha','49:max']
G、用 for in 循环取出字符中的每一个字符,含符号和空格
info='marsha:49' for x in info print(x) >>> m a r s h a : 4 9
H、字符串改写:lower( )全改小写;upper( )全改大写
msg='MaRsHa' print(msg.lower()) print(msg.upper()) >>> marsha MARSHA
I、判断字符串是否以括号内指定的字符开头:startswith(' '),结果返回布尔值;
判断字符串是否以括号内指定的字符结尾:endswith (' ') 结果返回布尔值。
msg='my name is marsha' print(msg.startswith('m')) print(msg.engswith('i')) >>> True False
J、格式化输出:format
a:按照位置一一对应传值:%s可以接收任意值, %d可以接收传的数字
info='my name in %s my age is %d' %('marsha','49') print(info) >>> 'my name is marsha my age is 49'
b:按照位置,用空的{}一一对应传值:{}.format(按中括号个数传值
info='my name is {} my age is {}'.format('marsha',49) print(info) >>> 'my name is marsha my age is 49'
c:不依赖位置传值:{变量名} .format(变量赋值)
info='my name is {name}{name} my age is {age}'.format(age=49,name='marsha') print(info) >>> 'my name is marsha marsha my age is 49'
d:把format传入的多个值当作一个列表,然后按照 {索引}取值
info='my name is {1} my age is {0}'.format('marsha',49) print(info) >>> 'my name is 49 my age is marsha'
K、' 指定分隔符 ’ . join( ):是从可迭代对象中取出多个字符串,然后按照指定的分隔符进行拼接,拼接的结果为字符串。它的使用与split( )相反
res='hello' print('%'.join(res) >>> 'h%e%l%l%o'
L、变量名.replace( ) :修改字符串中旧的字符,可以指定修改个数.
msg='my name is marsha,my age is 49' print(msg.replace('49','20')) print(msg.replace('my','your',1)) >>> 'my name is marsha, my age is 20' 'your name is marsha,my age is 49'
M、判断字符串是否为纯数字组成用 isdigit()返回布尔值
msg='ab3456' print(msg.isdigit( )) >>> False
N、字符串需要了解的其他操作
a: find()rfind():从指定范围内查找子字符串的起始索引,找得到则返回数字1,找不到则返回-1
b: index()rindex():同find,但在找不到时会报错
c: count():统计字符串在大字符串中出现的次数
d: center() 返回一个原字符串居中显示,并使用指定符号fillchar填充至长度 width 的新字符串。默认填充字符为空格。
ljust( )返回一个原字符串左对齐显示,并使用指定符号fillchar填充至长度 width 的新字符串。默认填充字符为空格。
rjust( )返回一个原字符串右对齐显示,并使用指定符号fillchar填充至长度 width 的新字符串。默认填充字符为空格。
zfill( )返回一个原字符串右对齐显示,并使用0填充至长度 width 的新字符串。
e: zxpandtabs()返回字符串中的 tab 符号('\t')转为空格后生成的新字符串。
f: captalize():首字母大写
swapcase():大小写翻转
title():每个单词的首字母大写
j: is数字系列(详情见以下代码)
msg='tony say hello' msg.find('o',1,3) # 在索引为1和2(顾头不顾尾)的字符中查找字符o的索引 1 msg.index('e',2,4) # 报错 ValueError msg = "hello everyone" msg.count('e') # 统计字符串e出现的次数 4 msg.count('e',1,6) # 字符串e在索引1~5范围内出现的次数 1 name='tony' name.center(30,'-') # 总宽度为30,字符串居中显示,不够用-填充 -------------tony------------- name.ljust(30,'*') # 总宽度为30,字符串左对齐显示,不够用*填充 tony************************** name.rjust(30,'*') # 总宽度为30,字符串右对齐显示,不够用*填充 **************************tony name.zfill(50) # 总宽度为50,字符串右对齐显示,不够用0填充 0000000000000000000000000000000000000000000000tony name = 'tony\thello' # \t表示制表符(tab键) print(name) tony hello name.expandtabs(1) # 修改\t制表符代表的空格数 tony hello message = 'hello everyone nice to meet you!' message.capitalize() Hello everyone nice to meet you! message1 = 'Hi girl, I want make friends with you!' message1.swapcase() hI GIRL, i WANT MAKE FRIENDS WITH YOU! msg = 'dear my friend i miss you very much' msg.title() Dear My Friend I Miss You Very Much #is数字系列 #在python3中 num1 = b'4' #bytes num2 = u'4' #unicode,python3中无需加u就是unicode num3 = '四' #中文数字 num4 = 'Ⅳ' #罗马数字 #isdigt:bytes,unicode >>> num1.isdigit() True >>> num2.isdigit() True >>> num3.isdigit() False >>> num4.isdigit() False #isdecimal:uncicode(bytes类型无isdecimal方法) >>> num2.isdecimal() True >>> num3.isdecimal() False >>> num4.isdecimal() False #isnumberic:unicode,中文数字,罗马数字(bytes类型无isnumberic方法) >>> num2.isnumeric() True >>> num3.isnumeric() True >>> num4.isnumeric() True # 三者不能判断浮点数 >>> num5 = '4.3' >>> num5.isdigit() False >>> num5.isdecimal() False >>> num5.isnumeric() False ''' 总结: 最常用的是isdigit,可以判断bytes和unicode类型,这也是最常见的数字应用场景 如果要判断中文数字或罗马数字,则需要用到isnumeric。 ''' # is其他 >>> name = 'tony123' >>> name.isalnum() #字符串中既可以包含数字也可以包含字母 True >>> name.isalpha() #字符串中只包含字母 False >>> name.isidentifier() True >>> name.islower() # 字符串是否是纯小写 True >>> name.isupper() # 字符串是否是纯大写 False >>> name.isspace() # 字符串是否全是空格 False >>> name.istitle() # 字符串中的单词首字母是否都是大写 False