谢芷睿的作业二

代码


import requests
r=requests.get('http://www.jxufe.edu.cn/')
print(r.text)
html=r.text
from bs4 import BeautifulSoup
soup=BeautifulSoup(html)
txt1=soup.get_text()
import re
txt2=re.sub('\n+','\n',txt1)

结果

结果截图

解释

作业二:导入requests,用它访问江西财经大学主页并打印,链接到一个html里。再导入BeautifulSoup,从html文件中提取数据,赋予txt1。最后导入re模块,用正则表达式将多个换行符换为1个赋予txt2,让版面整洁。