1. 字符串特殊字符处理
采集回来的字段有可能经常会包含\xao
,\n
,
之类的特殊字符 通过split()
函数处理
''.join(item['title'].split())
2. 匹配字符串中的数字
import re
res = re.findall('\d+',item['shi']) //返回数组 根据索引去 res[0],res[1]
3. 字符串切割
url ="https://www.nuxtv.com/article/570"
url[url.find('/')+2:url.find('.')] //获取www
url[url.rfind('/')+1:] //获取570
4. 字符串替换
title.replace(" ","")