[Python] 파이썬으로 pdf 페이지 추출하기 (PyPDF2)

카테고리 없음

[Python] 파이썬으로 pdf 페이지 추출하기 (PyPDF2)

COMKONG 2022. 12. 13. 17:43

PDF 에서 일부 페이지를 추출해야 할 일이 종종 있다.

특정 프로그램을 깔기에는 귀찮고 온라인 사이트에서 해결하자니 개인정보가 걱정이 될 때가 있다.

그래서 Python 으로 해결할 수 있는 방법을 찾았다.

파이썬 파일 접근을 위해 PyPDF2 라는 패키지가 사용된다.

pip install PyPDF2

특정 파일

특정 페이지

특정 파일명

으로 저장할 수 있는 코드이다.

from PyPDF2 import PdfFileReader, PdfFileWriter

#파일명 받기
path = str(input("What is the file name?-ex.test.pdf\n"))

pdfReader = PdfFileReader(path, "rb")

newpdfWriter = PdfFileWriter()

#원하는 페이지 번호
while True:
    pgnum = int(input("Which page do you want to extract?-if finished please type 0\n"))
    if pgnum==0:
        break
    newpdfWriter.addPage(pdfReader.getPage(pgnum))
    print("Added page number  "+str(pgnum)+"\n")
    

#저장 이름 설정
newfile = str(input("Please type the new file name - ex.test\n"))

newpdfWriter.write(open("./"+newfile+".pdf", "wb"))

print("Saved successfully")

아래의 깃허브 레퍼지토리에서도 확인할 수 있다.

https://github.com/hanbin07/PDF-extracter.git

현재글[Python] 파이썬으로 pdf 페이지 추출하기 (PyPDF2)

KONG 블로그

CS PhD Student, 박사 유학 준비 과정/미국 생활 관련 글을 업로드 합니다.

미국박사, 박사원서, PhD, LA, Python, 박사준비, 미국, 토플, 미국유학, 토플팁, 토플시험장, 풀브라이트, 파이썬, unity, 풀브라이트인터뷰, 사후장학금, 유학준비, 박사유학, cs박사, 박사인터뷰,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

KONG 블로그

[Python] 파이썬으로 pdf 페이지 추출하기 (PyPDF2)

'카테고리 없음'의 다른글

티스토리툴바