pdf 변환

언어/python2019. 12. 18. 21:14
from pdflib import Document
import os
import base64

from ela_dir.Ela import Ela

class PDFObj():


    def __init__(self):

        #Ela.__init__(self)

        self._targetPath="./pdf_dir"


    def dirSearch(self):

        os.chdir(self._targetPath)
        cur = os.listdir()

        for f in cur:

            fname, fext = os.path.splitext(f)

            if fext == ".pdf":

                doc = Document(f)
                print(doc.metadata)

                for c, p in enumerate(doc):

                    strData = " ".join(p.lines).strip()
                    #encodedBytes = base64.b64encode(strData.encode("utf-8"))
                    #encodedStr = str(encodedBytes, "utf-8")

                    #e = {"page_" : c+1,
                    #     "data_" : encodedStr}

                    e = {"page_" : c+1, "data_": strData}

                    print(e)



if __name__ == "__main__":

    o = PDFObj()
    o.dirSearch()

'언어 > python' 카테고리의 다른 글

네이버 python 지식인 답변  (0) 2020.06.06
21대 국회의원 선거 크롤링  (0) 2020.04.15
python으로 pdf 파일 read  (0) 2019.12.08
백준 2108  (0) 2019.12.08
from csv to json convert + logstash  (0) 2019.11.26