1. 字符串特殊字符处理

采集回来的字段有可能经常会包含\xao,\n, 之类的特殊字符 通过split()函数处理

''.join(item['title'].split())

2. 匹配字符串中的数字

import re
res = re.findall('\d+',item['shi']) //返回数组 根据索引去 res[0],res[1]

3. 字符串切割

url ="https://www.nuxtv.com/article/570"
url[url.find('/')+2:url.find('.')]  //获取www
url[url.rfind('/')+1:]  //获取570

4. 字符串替换

title.replace(" ","")