컴퓨터/Python

python xlsxwriter 홈택스 txt파일 합치기

풍경소리^^ 2020. 10. 11. 13:54

https://www.fun-coding.org/data_collection_advanced3.html

 

다양한 포멧의 데이터 수집: 다양한 데이터 저장/읽기 - 엑셀(xlsx) 파일 - 잔재미코딩

다양한 데이터 저장/읽기 - 엑셀(xlsx) 파일 3. 다양한 데이터 저장/읽기 - 엑셀(xlsx) 파일¶ 3.1. 다양한 데이터 읽기1 - xlsx 파일¶ pandas 라이브러리 활용 read_excel() 메서드 활용 In [43]: import pandas as pd

www.fun-coding.org

잔재미코딩 참조

===========================

import pandas as pd

 

# 탭으로 분리된(tsv) .txt 텍스트파일 불러오기

# data = pd.read_csv('파일경로', sep = "\t", , engine='python', encoding = "인코딩방식")

# data = pd.read_csv('txt_hometax.txt', sep = "\t", , engine='python', encoding = "utf-8")

data1 = pd.read_csv('../data/txt_hometax1.txt'sep = "\t",skiprows=4 , engine='python'encoding = "utf-8")

data2 = pd.read_csv('../data/txt_hometax2.txt'sep = "\t",skiprows=4 , engine='python'encoding = "utf-8")

data3 = pd.read_csv('../data/txt_hometax3.txt'sep = "\t",skiprows=4 , engine='python'encoding = "utf-8")

data0 = pd.read_csv('../data/txt_hometax0.txt'sep = "\t",skiprows=4 , engine='python'encoding = "utf-8")

df_before=pd.concat([data1, data2, data3,data0])

 

items=["합계금액","공급가액","세액"]

for item in items:

    df_before[item] = df_before[item].replace('[\$,]'''regex=True)

    df_before[item] = pd.to_numeric(df_before[item])

http://hleecaster.com/pandas-data-cleaning-2/

df=df_before.iloc[:,:17]

http://blog.naver.com/PostView.nhn?blogId=rising_n_falling&logNo=221622971970&parentCategoryNo=12&categoryNo=15&viewDate=&isShowPopularPosts=false&from=postView

 

## XlsxWriter 엔진으로 Pandas writer 객체 만들기

writer = pd.ExcelWriter('../data/hometax_millni_pandas_xlsxWriter.xlsx'engine='xlsxwriter')

 

## DataFrame을 xlsx에 쓰기

df.to_excel(writer, sheet_name='Sheet1',index=False)

 

## Pandas writer 객체에서 xlsxwriter 객체 가져오기

workbook = writer.book

worksheet = writer.sheets['Sheet1']

 

## 포맷 만들기

# format1 = workbook.add_format({'num_format': '0%'})

formater = workbook.add_format({'border':1})

# worksheet.set_column('A:Q',None,formater)

format2 = workbook.add_format({'num_format''#,##0','border':1})

 

## 컬럼에 포맷 적용

# worksheet.set_column('A:N',None, formater)

worksheet.set_column('A:N',None, formater)

# worksheet.set_column('O:Q', 20, format2)

worksheet.set_column('O:Q',None, format2)

 

# 출처: https://korbillgates.tistory.com/152 [생물정보학자의 블로그]

 

## Pandas writer 객체 닫기

writer.close()

 

# vs code 실행 단축키 Ctrl + F5