python_excel/analysis.py

35 lines
1.4 KiB
Python

import pandas as pd
# 读取工作薄中的四张表格
workbook = pd.ExcelFile("国考岗位修改.xls")
sheet1 = workbook.parse('中央党群机关')
sheet2 = workbook.parse('中央国家行政机关(本级)')
sheet3 = workbook.parse('中央国家行政机关省级以下直属机构')
sheet4 = workbook.parse('中央国家行政机关参照公务员法管理事业单位')
# 找出包含环境科学的行
#123
def find_environment_rows(sheet):
return sheet[sheet['专业'].str.contains('环境科学')]
def find_ecology_rows(sheet):
return sheet[sheet['专业'].str.contains("生态")]
# 在新工作表中合并包含环境科学的行
# environment_rows = pd.concat([find_environment_rows(sheet1), find_environment_rows(sheet2),
# find_environment_rows(sheet3), find_environment_rows(sheet4)])
ecology_rows = pd.concat([find_ecology_rows(sheet1), find_ecology_rows(sheet2),
find_ecology_rows(sheet3), find_ecology_rows(sheet4)])
# 创建一个新的工作薄并将结果写入其中
# with pd.ExcelWriter('environment_data.xlsx', engine='openpyxl') as writer:
# environment_rows.to_excel(writer, sheet_name='Environment Data', index=False)
with pd.ExcelWriter('ecology_data.xlsx', engine='openpyxl') as writer:
ecology_rows.to_excel(writer, sheet_name='ecology Data', index=False)
# print("包含环境科学的行已写入新工作薄 'environment_data.xlsx'")