Extract text to page using Python pdfMiner?

Question

Extract text to page using Python pdfMiner?

I experimented with pyPdf and pdfMiner to extract text from pdf files. I have some unfriendly pdf files that only pdfMiner can extract. I use the code here to extract text for the entire file. However, I would really like to extract page-based text as a function getPage(i).extractText()in pyPdf. Does anyone know how to extract text to a page using pdfMiner?

+5

python pdf

ezbentley Sep 26 '12 at 15:24

source share

1 answer

John · Accepted Answer · 2012-09-26T18:19:34+0000

for pageNumber, page in enumerate(PDFDocument.get_pages()):
    if pageNumber == 42:
        #do something with the page

There is a good article here.

Extract text to page using Python pdfMiner?

More articles: