作业三 年报提取

导入模块以及PDF文件

提取PDF的文本

函数getText()

函数getSubtext()

获取目录函数 getTOC()

获取所需要内容 getTOC_content()

导出HTML

结果展示