Python 3.4 compatibility + tests

2014-09-04 09:36:19 +02:00 · 2014-09-04 09:36:19 +02:00 · 4ab48d1803
parent 29c07ea770
commit 4ab48d1803
14 changed files with 911 additions and 925 deletions
--- a/.travis.yml
+++ b/.travis.yml
@ -7,5 +7,4 @@ install:
  - pip install six
  - pip install pycrypto
 script:
-  - make test
+  nosetests
  - nosetests
--- a/9
+++ b/9
@ -55,12 +55,5 @@ $(CMAPDST)/to-unicode-Adobe-Korea1.pickle.gz: $(CMAPDST)
 		$(CMAPDST) Adobe-Korea1 $(CMAPSRC)/cid2code_Adobe_Korea1.txt
 test: cmap
-	$(PYTHON) -m doctest \
+	nosetests
 		pdfminer/arcfour.py \
 		pdfminer/lzw.py \
 		pdfminer/ascii85.py \
 		pdfminer/runlength.py \
 		pdfminer/rijndael.py
 	$(PYTHON) -m pdfminer.ccitt
 	$(PYTHON) -m pdfminer.psparser
 	cd samples && $(MAKE) test
--- a/pdfminer/arcfour.py
+++ b/pdfminer/arcfour.py
@ -1,31 +1,22 @@
 #!/usr/bin/env python
 """ Python implementation of Arcfour encryption algorithm.
-
+See https://en.wikipedia.org/wiki/RC4
 This code is in the public domain.
 """
-
+import six # Python 2+3 compatibility
 ##  Arcfour
 ##
 class Arcfour(object):
    """
    >>> Arcfour(b'Key').process(b'Plaintext').encode('hex')
    'bbf316e8d940af0ad3'
    >>> Arcfour(b'Wiki').process(b'pedia').encode('hex')
    '1021bf0420'
    >>> Arcfour(b'Secret').process(b'Attack at dawn').encode('hex')
    '45a01f645fc35b383552544b9bf5'
    """
    def __init__(self, key):
-        s = range(256)
+        s = [i for i in range(256)] #because Py3 range is not indexable
        j = 0
        klen = len(key)
-        for i in xrange(256):
+        for i in range(256):
-            j = (j + s[i] + ord(key[i % klen])) % 256
+            j = (j + s[i] + six.indexbytes(key,i % klen)) % 256
            (s[i], s[j]) = (s[j], s[i])
        self.s = s
        (self.i, self.j) = (0, 0)
@ -35,20 +26,14 @@ class Arcfour(object):
        (i, j) = (self.i, self.j)
        s = self.s
        r = b''
-        for c in data:
+        for c in six.iterbytes(data):
            i = (i+1) % 256
            j = (j+s[i]) % 256
            (s[i], s[j]) = (s[j], s[i])
            k = s[(s[i]+s[j]) % 256]
-            r += chr(ord(c) ^ k)
+            r += six.int2byte(c ^ k)
        (self.i, self.j) = (i, j)
        return r
    encrypt = decrypt = process
 new = Arcfour
 # test
 if __name__ == '__main__':
    import doctest
    doctest.testmod()
--- a/pdfminer/ascii85.py
+++ b/pdfminer/ascii85.py
@ -23,13 +23,6 @@ def ascii85decode(data):
    The Adobe's ASCII85 implementation is slightly different from
    its original in handling the last characters.
    The sample string is taken from:
      http://en.wikipedia.org/w/index.php?title=Ascii85
    >>> ascii85decode(b'9jqo^BlbD-BleB1DJ+*+F(f,q')
    'Man is distinguished'
    >>> ascii85decode(b'E,9)oF*2M7/c~>')
    'pleasure.'
    """
    n = b = 0
    out = b''
@ -53,8 +46,8 @@ def ascii85decode(data):
    return out
 # asciihexdecode(data)
-hex_re = re.compile(r'([a-f\d]{2})', re.IGNORECASE)
+hex_re = re.compile(b'([a-f\d]{2})', re.IGNORECASE)
-trail_re = re.compile(r'^(?:[a-f\d]{2}|\s)*([a-f\d])[\s>]*$', re.IGNORECASE)
+trail_re = re.compile(b'^(?:[a-f\d]{2}|\s)*([a-f\d])[\s>]*$', re.IGNORECASE)
 def asciihexdecode(data):
@ -66,22 +59,16 @@ def asciihexdecode(data):
    EOD. Any other characters will cause an error. If the filter encounters
    the EOD marker after reading an odd number of hexadecimal digits, it
    will behave as if a 0 followed the last digit.
    >>> asciihexdecode(b'61 62 2e6364   65')
    'ab.cde'
    >>> asciihexdecode(b'61 62 2e6364   657>')
    'ab.cdep'
    >>> asciihexdecode(b'7>')
    'p'
    """
-    decode = (lambda hx: chr(int(hx, 16)))
+    def decode(x):
-    out = map(decode, hex_re.findall(data))
+        i=int(x,16)
        return six.int2byte(i)
    out=b''    
    for x in hex_re.findall(data):
        out+=decode(x)
    m = trail_re.search(data)
    if m:
-        out.append(decode('%c0' % m.group(1)))
+        out+=decode(m.group(1)+b'0')
-    return b''.join(out)
+    return out
 if __name__ == '__main__':
    import doctest
    doctest.testmod()
--- a/pdfminer/ccitt.py
+++ b/pdfminer/ccitt.py
@ -463,10 +463,10 @@ class CCITTG4Parser(BitParser):
        x0 = max(0, self._curpos)
        x1 = max(0, min(self.width, x1))
        if x1 < x0:
-            for x in xrange(x1, x0):
+            for x in range(x1, x0):
                self._curline[x] = self._color
        elif x0 < x1:
-            for x in xrange(x0, x1):
+            for x in range(x0, x1):
                self._curline[x] = self._color
        self._curpos = x1
        self._color = 1-self._color
@ -496,7 +496,7 @@ class CCITTG4Parser(BitParser):
                  self._refline[x1] == self._color):
                break
            x1 += 1
-        for x in xrange(self._curpos, x1):
+        for x in range(self._curpos, x1):
            self._curline[x] = self._color
        self._curpos = x1
        return
@ -506,12 +506,12 @@ class CCITTG4Parser(BitParser):
        if self._curpos < 0:
            self._curpos = 0
        x = self._curpos
-        for _ in xrange(n1):
+        for _ in range(n1):
            if len(self._curline) <= x:
                break
            self._curline[x] = self._color
            x += 1
-        for _ in xrange(n2):
+        for _ in range(n2):
            if len(self._curline) <= x:
                break
            self._curline[x] = 1-self._color
@ -527,184 +527,8 @@ class CCITTG4Parser(BitParser):
            self._flush_line()
        return
 import unittest
 ##  Test cases
 ##
 class TestCCITTG4Parser(unittest.TestCase):
    def get_parser(self, bits):
        parser = CCITTG4Parser(len(bits))
        parser._curline = [int(c) for c in bits]
        parser._reset_line()
        return parser
    def test_b1(self):
        parser = self.get_parser('00000')
        parser._do_vertical(0)
        self.assertEqual(parser._curpos, 0)
        return
    def test_b2(self):
        parser = self.get_parser('10000')
        parser._do_vertical(-1)
        self.assertEqual(parser._curpos, 0)
        return
    def test_b3(self):
        parser = self.get_parser('000111')
        parser._do_pass()
        self.assertEqual(parser._curpos, 3)
        self.assertEqual(parser._get_bits(), '111')
        return
    def test_b4(self):
        parser = self.get_parser('00000')
        parser._do_vertical(+2)
        self.assertEqual(parser._curpos, 2)
        self.assertEqual(parser._get_bits(), '11')
        return
    def test_b5(self):
        parser = self.get_parser('11111111100')
        parser._do_horizontal(0, 3)
        self.assertEqual(parser._curpos, 3)
        parser._do_vertical(1)
        self.assertEqual(parser._curpos, 10)
        self.assertEqual(parser._get_bits(), '0001111111')
        return
    def test_e1(self):
        parser = self.get_parser('10000')
        parser._do_vertical(0)
        self.assertEqual(parser._curpos, 1)
        parser._do_vertical(0)
        self.assertEqual(parser._curpos, 5)
        self.assertEqual(parser._get_bits(), '10000')
        return
    def test_e2(self):
        parser = self.get_parser('10011')
        parser._do_vertical(0)
        self.assertEqual(parser._curpos, 1)
        parser._do_vertical(2)
        self.assertEqual(parser._curpos, 5)
        self.assertEqual(parser._get_bits(), '10000')
        return
    def test_e3(self):
        parser = self.get_parser('011111')
        parser._color = 0
        parser._do_vertical(0)
        self.assertEqual(parser._color, 1)
        self.assertEqual(parser._curpos, 1)
        parser._do_vertical(-2)
        self.assertEqual(parser._color, 0)
        self.assertEqual(parser._curpos, 4)
        parser._do_vertical(0)
        self.assertEqual(parser._curpos, 6)
        self.assertEqual(parser._get_bits(), '011100')
        return
    def test_e4(self):
        parser = self.get_parser('10000')
        parser._do_vertical(0)
        self.assertEqual(parser._curpos, 1)
        parser._do_vertical(-2)
        self.assertEqual(parser._curpos, 3)
        parser._do_vertical(0)
        self.assertEqual(parser._curpos, 5)
        self.assertEqual(parser._get_bits(), '10011')
        return
    def test_e5(self):
        parser = self.get_parser('011000')
        parser._color = 0
        parser._do_vertical(0)
        self.assertEqual(parser._curpos, 1)
        parser._do_vertical(3)
        self.assertEqual(parser._curpos, 6)
        self.assertEqual(parser._get_bits(), '011111')
        return
    def test_e6(self):
        parser = self.get_parser('11001')
        parser._do_pass()
        self.assertEqual(parser._curpos, 4)
        parser._do_vertical(0)
        self.assertEqual(parser._curpos, 5)
        self.assertEqual(parser._get_bits(), '11111')
        return
    def test_e7(self):
        parser = self.get_parser('0000000000')
        parser._curpos = 2
        parser._color = 1
        parser._do_horizontal(2, 6)
        self.assertEqual(parser._curpos, 10)
        self.assertEqual(parser._get_bits(), '1111000000')
        return
    def test_e8(self):
        parser = self.get_parser('001100000')
        parser._curpos = 1
        parser._color = 0
        parser._do_vertical(0)
        self.assertEqual(parser._curpos, 2)
        parser._do_horizontal(7, 0)
        self.assertEqual(parser._curpos, 9)
        self.assertEqual(parser._get_bits(), '101111111')
        return
    def test_m1(self):
        parser = self.get_parser('10101')
        parser._do_pass()
        self.assertEqual(parser._curpos, 2)
        parser._do_pass()
        self.assertEqual(parser._curpos, 4)
        self.assertEqual(parser._get_bits(), '1111')
        return
    def test_m2(self):
        parser = self.get_parser('101011')
        parser._do_vertical(-1)
        parser._do_vertical(-1)
        parser._do_vertical(1)
        parser._do_horizontal(1, 1)
        self.assertEqual(parser._get_bits(), '011101')
        return
    def test_m3(self):
        parser = self.get_parser('10111011')
        parser._do_vertical(-1)
        parser._do_pass()
        parser._do_vertical(1)
        parser._do_vertical(1)
        self.assertEqual(parser._get_bits(), '00000001')
        return
 ##  CCITTFaxDecoder
 ##
    def test___init__(self):
        # c_citt_g4_parser = CCITTG4Parser(width, bytealign)
        raise SkipTest # TODO: implement your test here
    def test_feedbytes(self):
        # c_citt_g4_parser = CCITTG4Parser(width, bytealign)
        # assert_equal(expected, c_citt_g4_parser.feedbytes(data))
        raise SkipTest # TODO: implement your test here
    def test_output_line(self):
        # c_citt_g4_parser = CCITTG4Parser(width, bytealign)
        # assert_equal(expected, c_citt_g4_parser.output_line(y, bits))
        raise SkipTest # TODO: implement your test here
    def test_reset(self):
        # c_citt_g4_parser = CCITTG4Parser(width, bytealign)
        # assert_equal(expected, c_citt_g4_parser.reset())
        raise SkipTest # TODO: implement your test here
 class CCITTFaxDecoder(CCITTG4Parser):
--- a/pdfminer/lzw.py
+++ b/pdfminer/lzw.py
@ -96,14 +96,6 @@ class LZWDecoder(object):
 # lzwdecode
 def lzwdecode(data):
    """
    >>> lzwdecode(b'\x80\x0b\x60\x50\x22\x0c\x0c\x85\x01')
    '\x2d\x2d\x2d\x2d\x2d\x41\x2d\x2d\x2d\x42'
    """
    fp = BytesIO(data)
    s=LZWDecoder(fp).run()
    return b''.join(s)
 if __name__ == '__main__':
    import doctest
    doctest.testmod()
--- a/pdfminer/pdffont.py
+++ b/pdfminer/pdffont.py
@ -28,6 +28,8 @@ from .utils import nunpack
 from .utils import choplist
 from .utils import isnumber
 import six #Python 2+3 compatibility
 def get_widths(seq):
    widths = {}
@ -492,7 +494,7 @@ class PDFFont(object):
        return False
    def decode(self, bytes):
-        return map(ord, bytes)
+        return [six.indexbytes(bytes, i) for i,_ in enumerate(bytes)] # map(ord, bytes)
    def get_ascent(self):
        return self.ascent * self.vscale
@ -630,7 +632,7 @@ class PDFType3Font(PDFSimpleFont):
 # PDFCIDFont
 class PDFCIDFont(PDFFont):
-    def __init__(self, rsrcmgr, spec):
+    def __init__(self, rsrcmgr, spec, STRICT=False):
        try:
            self.basefont = literal_name(spec['BaseFont'])
        except KeyError:
@ -684,10 +686,10 @@ class PDFCIDFont(PDFFont):
        if self.vertical:
            # writing mode: vertical
            widths = get_widths2(list_value(spec.get('W2', [])))
-            self.disps = dict((cid, (vx, vy)) for (cid, (_, (vx, vy))) in widths.iteritems())
+            self.disps = dict((cid, (vx, vy)) for (cid, (_, (vx, vy))) in six.iteritems(widths))
            (vy, w) = spec.get('DW2', [880, -1000])
            self.default_disp = (None, vy)
-            widths = dict((cid, w) for (cid, (w, _)) in widths.iteritems())
+            widths = dict((cid, w) for (cid, (w, _)) in six.iteritems(widths))
            default_width = w
        else:
            # writing mode: horizontal
--- a/pdfminer/rijndael.py
+++ b/pdfminer/rijndael.py
--- a/pdfminer/runlength.py
+++ b/pdfminer/runlength.py
@ -6,6 +6,8 @@
 #  * public domain *
 #
 import six #Python 2+3 compatibility
 def rldecode(data):
    """
    RunLength decoder (Adobe version) implementation based on PDF Reference
@ -19,30 +21,24 @@ def rldecode(data):
        129 to 255, the following single byte is to be copied 257 - length
        (2 to 128) times during decompression. A length value of 128
        denotes EOD.
    >>> s = b'\x05123456\xfa7\x04abcde\x80junk'
    >>> rldecode(s)
    '1234567777777abcde'
    """
-    decoded = []
+    decoded = b''
    i = 0
    while i < len(data):
        #print 'data[%d]=:%d:' % (i,ord(data[i]))
-        length = ord(data[i])
+        length = six.indexbytes(data,i)
        if length == 128:
            break
        if length >= 0 and length < 128:
-            run = data[i+1:(i+1)+(length+1)]
+            for j in range(i+1,(i+1)+(length+1)):
                decoded+=six.int2byte(six.indexbytes(data,j))
            #print 'length=%d, run=%s' % (length+1,run)
-            decoded.append(run)
+            
            i = (i+1) + (length+1)
        if length > 128:
-            run = data[i+1]*(257-length)
+            run = six.int2byte(six.indexbytes(data,i+1))*(257-length)
            #print 'length=%d, run=%s' % (257-length,run)
-            decoded.append(run)
+            decoded+=run
            i = (i+1) + 1
-    return b''.join(decoded)
+    return decoded
 if __name__ == '__main__':
    import doctest
    doctest.testmod()
--- a/tests/test_pdfminer_ccitt.py
+++ b/tests/test_pdfminer_ccitt.py
@ -0,0 +1,167 @@
 #!/usr/bin/python
 # -*- coding: utf-8 -*-
 from nose.tools import assert_equal, assert_true, assert_false
 from nose import SkipTest
 import nose
 import logging
 from pdfminer.ccitt import *
 ##  Test cases
 ##
 class TestCCITTG4Parser():
    def get_parser(self, bits):
        parser = CCITTG4Parser(len(bits))
        parser._curline = [int(c) for c in bits]
        parser._reset_line()
        return parser
    def test_b1(self):
        parser = self.get_parser('00000')
        parser._do_vertical(0)
        assert_equal(parser._curpos, 0)
        return
    def test_b2(self):
        parser = self.get_parser('10000')
        parser._do_vertical(-1)
        assert_equal(parser._curpos, 0)
        return
    def test_b3(self):
        parser = self.get_parser('000111')
        parser._do_pass()
        assert_equal(parser._curpos, 3)
        assert_equal(parser._get_bits(), '111')
        return
    def test_b4(self):
        parser = self.get_parser('00000')
        parser._do_vertical(+2)
        assert_equal(parser._curpos, 2)
        assert_equal(parser._get_bits(), '11')
        return
    def test_b5(self):
        parser = self.get_parser('11111111100')
        parser._do_horizontal(0, 3)
        assert_equal(parser._curpos, 3)
        parser._do_vertical(1)
        assert_equal(parser._curpos, 10)
        assert_equal(parser._get_bits(), '0001111111')
        return
    def test_e1(self):
        parser = self.get_parser('10000')
        parser._do_vertical(0)
        assert_equal(parser._curpos, 1)
        parser._do_vertical(0)
        assert_equal(parser._curpos, 5)
        assert_equal(parser._get_bits(), '10000')
        return
    def test_e2(self):
        parser = self.get_parser('10011')
        parser._do_vertical(0)
        assert_equal(parser._curpos, 1)
        parser._do_vertical(2)
        assert_equal(parser._curpos, 5)
        assert_equal(parser._get_bits(), '10000')
        return
    def test_e3(self):
        parser = self.get_parser('011111')
        parser._color = 0
        parser._do_vertical(0)
        assert_equal(parser._color, 1)
        assert_equal(parser._curpos, 1)
        parser._do_vertical(-2)
        assert_equal(parser._color, 0)
        assert_equal(parser._curpos, 4)
        parser._do_vertical(0)
        assert_equal(parser._curpos, 6)
        assert_equal(parser._get_bits(), '011100')
        return
    def test_e4(self):
        parser = self.get_parser('10000')
        parser._do_vertical(0)
        assert_equal(parser._curpos, 1)
        parser._do_vertical(-2)
        assert_equal(parser._curpos, 3)
        parser._do_vertical(0)
        assert_equal(parser._curpos, 5)
        assert_equal(parser._get_bits(), '10011')
        return
    def test_e5(self):
        parser = self.get_parser('011000')
        parser._color = 0
        parser._do_vertical(0)
        assert_equal(parser._curpos, 1)
        parser._do_vertical(3)
        assert_equal(parser._curpos, 6)
        assert_equal(parser._get_bits(), '011111')
        return
    def test_e6(self):
        parser = self.get_parser('11001')
        parser._do_pass()
        assert_equal(parser._curpos, 4)
        parser._do_vertical(0)
        assert_equal(parser._curpos, 5)
        assert_equal(parser._get_bits(), '11111')
        return
    def test_e7(self):
        parser = self.get_parser('0000000000')
        parser._curpos = 2
        parser._color = 1
        parser._do_horizontal(2, 6)
        assert_equal(parser._curpos, 10)
        assert_equal(parser._get_bits(), '1111000000')
        return
    def test_e8(self):
        parser = self.get_parser('001100000')
        parser._curpos = 1
        parser._color = 0
        parser._do_vertical(0)
        assert_equal(parser._curpos, 2)
        parser._do_horizontal(7, 0)
        assert_equal(parser._curpos, 9)
        assert_equal(parser._get_bits(), '101111111')
        return
    def test_m1(self):
        parser = self.get_parser('10101')
        parser._do_pass()
        assert_equal(parser._curpos, 2)
        parser._do_pass()
        assert_equal(parser._curpos, 4)
        assert_equal(parser._get_bits(), '1111')
        return
    def test_m2(self):
        parser = self.get_parser('101011')
        parser._do_vertical(-1)
        parser._do_vertical(-1)
        parser._do_vertical(1)
        parser._do_horizontal(1, 1)
        assert_equal(parser._get_bits(), '011101')
        return
    def test_m3(self):
        parser = self.get_parser('10111011')
        parser._do_vertical(-1)
        parser._do_pass()
        parser._do_vertical(1)
        parser._do_vertical(1)
        assert_equal(parser._get_bits(), '00000001')
        return
 if __name__ == '__main__':
    nose.runmodule()
--- a/tests/test_pdfminer_crypto.py
+++ b/tests/test_pdfminer_crypto.py
@ -0,0 +1,52 @@
 #!/usr/bin/python
 # -*- coding: utf-8 -*-
 from nose.tools import assert_equal
 from nose import SkipTest
 import nose
 #test of various compression/encoding modules (previously in doctests):
 from pdfminer.ascii85 import *
 from pdfminer.arcfour import *
 from pdfminer.lzw import *
 from pdfminer.runlength import *
 from pdfminer.rijndael import *
 import binascii
 def hex(b): return binascii.hexlify(b) #encode('hex')
 def dehex(b): return binascii.unhexlify(b) #decode('hex')
 class TestAscii85():
    def test_ascii85decode(self):
        #The sample string is taken from: http://en.wikipedia.org/w/index.php?title=Ascii85
        assert_equal(ascii85decode(b'9jqo^BlbD-BleB1DJ+*+F(f,q'),b'Man is distinguished')
        assert_equal(ascii85decode(b'E,9)oF*2M7/c~>'),b'pleasure.')
    def test_asciihexdecode(self):
        assert_equal(asciihexdecode(b'61 62 2e6364   65'),b'ab.cde')
        assert_equal(asciihexdecode(b'61 62 2e6364   657>'),b'ab.cdep')
        assert_equal(asciihexdecode(b'7>'),b'p')
 class TestArcfour():
    def test(self):
        assert_equal(hex(Arcfour(b'Key').process(b'Plaintext')),b'bbf316e8d940af0ad3')
        assert_equal(hex(Arcfour(b'Wiki').process(b'pedia')),b'1021bf0420')
        assert_equal(hex(Arcfour(b'Secret').process(b'Attack at dawn')),b'45a01f645fc35b383552544b9bf5')
 class TestLzw():
    def test_lzwdecode(self):
        assert_equal(lzwdecode(b'\x80\x0b\x60\x50\x22\x0c\x0c\x85\x01'),b'\x2d\x2d\x2d\x2d\x2d\x41\x2d\x2d\x2d\x42')
 class TestRunlength():
    def test_rldecode(self):
        assert_equal(rldecode(b'\x05123456\xfa7\x04abcde\x80junk'),b'1234567777777abcde')
 class TestRijndaelEncryptor():
    def test_RijndaelEncryptor(self):
        key = dehex(b'00010203050607080a0b0c0d0f101112')
        plaintext = dehex(b'506812a45f08c889b97f5980038b8359')
        assert_equal(hex(RijndaelEncryptor(key, 128).encrypt(plaintext)),b'd8f532538289ef7d06b506a4fd5be9c9')
 if __name__ == '__main__':
    nose.runmodule()
--- a/tests/test_pdfminer_psparser.py
+++ b/tests/test_pdfminer_psparser.py
@ -102,6 +102,6 @@ func/a/b{(c)do*}def
        return
 if __name__ == '__main__':
-    import logging,sys,os,six
+    #import logging,sys,os,six
-    logging.basicConfig(level=logging.DEBUG, filename='%s_%d.%d.log'%(os.path.basename(__file__),sys.version_info[0],sys.version_info[1]))
+    #logging.basicConfig(level=logging.DEBUG, filename='%s_%d.%d.log'%(os.path.basename(__file__),sys.version_info[0],sys.version_info[1]))
    nose.runmodule()
--- a/tests/test_tools_dumppdf.py
+++ b/tests/test_tools_dumppdf.py
@ -1,7 +1,7 @@
 #!/usr/bin/python
 # -*- coding: utf-8 -*-
-import unittest, logging, os
+import nose, logging, os
 import tools.dumppdf as dumppdf
@ -16,7 +16,7 @@ def run(datapath,filename,options=None):
         s='dumppdf -o%s %s'%(o,i)
    dumppdf.main(s.split(' '))
-class TestDumpPDF(unittest.TestCase):
+class TestDumpPDF():
    def test_1(self):
@ -41,6 +41,6 @@ class TestDumpPDF(unittest.TestCase):
        run('../samples/nonfree/','naacl06-shinyama','-t -a')
 if __name__ == '__main__':
-    import logging,sys,os,six
+    #import logging,sys,os,six
-    logging.basicConfig(level=logging.DEBUG, filename='%s_%d.%d.log'%(os.path.basename(__file__),sys.version_info[0],sys.version_info[1]))
+    #logging.basicConfig(level=logging.DEBUG, filename='%s_%d.%d.log'%(os.path.basename(__file__),sys.version_info[0],sys.version_info[1]))
-    unittest.main()
+    nose.runmodule()
--- a/tests/test_tools_pdf2txt.py
+++ b/tests/test_tools_pdf2txt.py
@ -1,7 +1,7 @@
 #!/usr/bin/python
 # -*- coding: utf-8 -*-
-import unittest, logging, os
+import nose, logging, os
 import tools.pdf2txt as pdf2txt
@ -16,7 +16,7 @@ def run(datapath,filename,options=None):
         s='pdf2txt -o%s %s'%(o,i)
    pdf2txt.main(s.split(' '))
-class TestDumpPDF(unittest.TestCase):
+class TestDumpPDF():
    def test_1(self):
@ -41,4 +41,4 @@ class TestDumpPDF(unittest.TestCase):
        run('../samples/nonfree/','naacl06-shinyama')
 if __name__ == '__main__':
-    unittest.main()
+    nose.runmodule()