生成年报数目最多的10家公司

import包

标准化年报文件名

计算公司年报数目

创建并生成这10家公司年报的csv

提取csv中的年报链接

导入包

读取csv生成链接

一个示例

请求下载pdf内容

读取年报中的营业收入内容

提取样例

p = pdf_list[0]

doc = fitz.open('华天科技:2015年年度报告.pdf')

toc = doc.get_toc()

page_number = toc[7][2]

page7 = doc.load_page(page_number-1)

text1 = page7.getText()

定义提取营业收入的函数

设置循环,运用函数读取所有年报内容

以dataframe的形式输出提取内容

将df的内容按照公司名称归类排序

绘制图像

导入库

绘制图像

上海贝岭营业收入图像

提取上海贝岭内容并按照年份排序

上海贝岭图像

华天科技图像

华微电子

南大光电

台基股份

士兰微

康强电子

有研新材

欧比特

纳思达

苏州固锝

通富微电

长电科技