import requests
import re
z=requests.get('http://www.jxufe.edu.cn/')
html = z.text
example1=re.compile("<.*?>(.*)<.*?>")
txts = example1.findall(html)
st=""
for txt in txts:
st +=str(txt)
example2=re.compile(r"<[^>]+>",re.S)
example4 = example2.sub("",st)
example3=re.compile("&.*?;|")
final=example3.sub("",example4)
使用正则表达式匹配,再将列表转换为字符串,匹配字符串,然后将st中与example2匹配成功的字符替换为空