Merge pull request #133 from timb07/speedup

Speed up handling of PDFs with large images
2018-07-15 11:27:35 +05:30 · 2018-07-15 11:27:35 +05:30 · 259b29299e
parent d437e5c637 083f11b165
commit 259b29299e
1 changed files with 2 additions and 1 deletions
--- a/pdfminer/pdfparser.py
+++ b/pdfminer/pdfparser.py
@ -102,7 +102,7 @@ class PDFParser(PSStackParser):
                return
            pos += len(line)
            self.fp.seek(pos)
-            data = self.fp.read(objlen)
+            data = bytearray(self.fp.read(objlen))
            self.seek(pos+objlen)
            while 1:
                try:
@ -120,6 +120,7 @@ class PDFParser(PSStackParser):
                objlen += len(line)
                if self.fallback:
                    data += line
            data = bytes(data)
            self.seek(pos+objlen)
            # XXX limit objlen not to exceed object boundary
            log.debug('Stream: pos=%d, objlen=%d, dic=%r, data=%r...', pos, objlen, dic, data[:10])