python xlsxwriter 홈택스 txt파일 합치기
https://www.fun-coding.org/data_collection_advanced3.html
다양한 포멧의 데이터 수집: 다양한 데이터 저장/읽기 - 엑셀(xlsx) 파일 - 잔재미코딩
다양한 데이터 저장/읽기 - 엑셀(xlsx) 파일 3. 다양한 데이터 저장/읽기 - 엑셀(xlsx) 파일¶ 3.1. 다양한 데이터 읽기1 - xlsx 파일¶ pandas 라이브러리 활용 read_excel() 메서드 활용 In [43]: import pandas as pd
www.fun-coding.org
잔재미코딩 참조
===========================
import pandas as pd
# 탭으로 분리된(tsv) .txt 텍스트파일 불러오기
# data = pd.read_csv('파일경로', sep = "\t", , engine='python', encoding = "인코딩방식")
# data = pd.read_csv('txt_hometax.txt', sep = "\t", , engine='python', encoding = "utf-8")
data1 = pd.read_csv('../data/txt_hometax1.txt', sep = "\t",skiprows=4 , engine='python', encoding = "utf-8")
data2 = pd.read_csv('../data/txt_hometax2.txt', sep = "\t",skiprows=4 , engine='python', encoding = "utf-8")
data3 = pd.read_csv('../data/txt_hometax3.txt', sep = "\t",skiprows=4 , engine='python', encoding = "utf-8")
data0 = pd.read_csv('../data/txt_hometax0.txt', sep = "\t",skiprows=4 , engine='python', encoding = "utf-8")
df_before=pd.concat([data1, data2, data3,data0])
items=["합계금액","공급가액","세액"]
for item in items:
df_before[item] = df_before[item].replace('[\$,]', '', regex=True)
df_before[item] = pd.to_numeric(df_before[item])
# http://hleecaster.com/pandas-data-cleaning-2/
df=df_before.iloc[:,:17]
## XlsxWriter 엔진으로 Pandas writer 객체 만들기
writer = pd.ExcelWriter('../data/hometax_millni_pandas_xlsxWriter.xlsx', engine='xlsxwriter')
## DataFrame을 xlsx에 쓰기
df.to_excel(writer, sheet_name='Sheet1',index=False)
## Pandas writer 객체에서 xlsxwriter 객체 가져오기
workbook = writer.book
worksheet = writer.sheets['Sheet1']
## 포맷 만들기
# format1 = workbook.add_format({'num_format': '0%'})
formater = workbook.add_format({'border':1})
# worksheet.set_column('A:Q',None,formater)
format2 = workbook.add_format({'num_format': '#,##0','border':1})
## 컬럼에 포맷 적용
# worksheet.set_column('A:N',None, formater)
worksheet.set_column('A:N',None, formater)
# worksheet.set_column('O:Q', 20, format2)
worksheet.set_column('O:Q',None, format2)
# 출처: https://korbillgates.tistory.com/152 [생물정보학자의 블로그]
## Pandas writer 객체 닫기
writer.close()
# vs code 실행 단축키 Ctrl + F5