sapl/compilacao/file2dispositivo.py


								import re


								from odf.element import Node, Text

								from odf.opendocument import load

								from odf.table import Table, TableCell, TableRow

								from odf.text import (List, ListHeader, ListItem, ListLevelStyleBullet,

								                      ListLevelStyleNumber, ListStyle, Note)


								from sapl import utils


								class Parser(object):


								    parser_list = []


								    def parser(self, _filepath):


								        self.filepath = _filepath


								        return self.re_parser()


								    def re_parser(self):


								        self.parser_list = []


								        # odt identificado pela extensão ou teste caso o arquivo sem extensão

								        if self.filepath.endswith('.odt') or\

								                not re.search(r"(\w+)\.(\w+)", self.filepath):


								            try:

								                odtparser = OdtParser()


								                self.parser_list = odtparser.parser(self.filepath)


								                return self.parser_list

								            except Exception as e:

								                print(e)

								                # TODO: Continue para outros formatos

								                pass


								        # doc identificado pela extensão ou teste caso o arquivo sem extensão

								        if self.filepath.endswith(('.doc', 'docx')) or\

								                not re.search(r"(\w+)\.(\w+)", self.filepath):


								            try:

								                # TODO

								                return []

								            except Exception as e:

								                # TODO: Continue para outros formatos

								                pass


								        return []


								    def _reduce_terms(self, _nodes=None, level=0):

								        print(level)

								        if not _nodes:

								            nodes = self.parser_list

								        else:

								            nodes = _nodes


								        fstr = True

								        i = -1

								        for nd in nodes:

								            i += 1

								            # print(nd)


								            if not _nodes:

								                fstr = False

								                if nd[0] == 'table:table':

								                    continue


								            if isinstance(nd, list):

								                fstr = False

								                nodes[i] = self._reduce_terms(nd, level=level + 1)


								        if fstr:

								            return ' '.join(nodes)

								        return nodes


								class OdtParser(Parser):

								    FNC1 = '1'

								    FNCI = 'I'

								    FNCi = 'i'

								    FNCA = 'A'

								    FNCa = 'a'

								    FNC8 = '*'

								    FNCN = 'N'


								    def re_parser(self):


								        self.textdoc = load(self.filepath)

								        self.level_list = 0

								        self.control_list = {}


								        # mm = ODF2MoinMoin(self.filepath)

								        # self.parser_list = [mm.toString(), ]


								        self.parser_list = self._import_itens(self.textdoc.text, level=0)


								        # self._reduce_terms()


								        return self.parser_list


								    def _import_itens(self, element, level=0):

								        try:

								            result = []

								            for el in element.childNodes:

								                print(level, el.tagName)

								                _r = ''

								                if el.tagName == 'Text':

								                    _r = str(el)

								                else:

								                    if el.isInstanceOf(Note):

								                        continue

								                    elif el.isInstanceOf(Table):

								                        _r = self._import_table(el, level=level + 1)

								                    elif el.isInstanceOf(List):

								                        _r = self._import_list(el, level=level + 1)

								                    # elif el.isInstanceOf(P):

								                    #    _r = [self.extractText(el),]

								                    elif el.hasChildNodes():

								                        _r = self._import_itens(el, level=level + 1)

								                    else:

								                        _r = str(el)


								                if _r:

								                    if isinstance(_r, str):

								                        result += [_r, ]

								                    else:

								                        result += _r


								            return result

								        except Exception as e:

								            print(e)


								    def _import_table(self, element, level=0):

								        result = ''

								        print(level)

								        try:

								            if element.isInstanceOf(Table):

								                result += '<table width="100%">'


								            for el in element.childNodes:

								                _r = ''

								                if isinstance(el, Text):

								                    _r = str(el)

								                else:

								                    if el.isInstanceOf(TableRow):

								                        _r = self._import_table(el, level=level + 1)

								                        _r = '<tr>%s</tr>' % (''.join(_r))

								                        result += ''.join(_r)

								                    elif el.isInstanceOf(TableCell):

								                        _r = self._import_table(el, level=level + 1)

								                        if el.getAttribute('numberrowsspanned'):

								                            _r = '<td rowspan="%s">%s</td>' % (

								                                el.getAttribute('numberrowsspanned'),

								                                ''.join(_r))

								                        elif el.getAttribute('numbercolumnsspanned'):

								                            _r = '<td colspan="%s">%s</td>' % (

								                                el.getAttribute('numbercolumnsspanned'),

								                                ''.join(_r))

								                        else:

								                            _r = '<td>%s</td>' % (''.join(_r))


								                        result += ''.join(_r)

								                    else:

								                        _r = self.extractText(el)

								                        # _r = self._reduce_terms(_r)

								                        if isinstance(_r, list):

								                            result += '<br>'.join(_r)

								                        else:

								                            if _r:

								                                result += _r + '<br>'


								            if element.isInstanceOf(Table):

								                result += '</table>'


								            return [result, ]

								        except Exception as e:

								            print(e)


								    def _import_list(self, element, level=0):

								        self.level_list += 1

								        result = []

								        print(level)


								        numsufixo = ''

								        numformat = ''

								        startvalue = ''


								        count_list_item = 0


								        try:

								            if element.isInstanceOf(List):

								                _stylename = element.getAttribute('stylename')


								                if _stylename:

								                    self.stylename = _stylename


								                liststyles = self.textdoc.getElementsByType(ListStyle)


								                for liststyle in liststyles:

								                    if liststyle.getAttribute('name') == self.stylename:

								                        break


								                stylesnumbers = liststyle.getElementsByType(

								                    ListLevelStyleNumber)


								                for item in stylesnumbers:

								                    if item.getAttribute('level') == str(self.level_list):

								                        numsufixo = item.getAttribute('numsuffix') or ''

								                        numformat = item.getAttribute('numformat') or ''

								                        startvalue = item.getAttribute('startvalue') or ''

								                        break


								                if not numformat:

								                    stylesbullets = liststyle.getElementsByType(

								                        ListLevelStyleBullet)

								                    for item in stylesbullets:

								                        if item.getAttribute('level') == str(self.level_list):

								                            numformat = '*'

								                            break


								                _id = element.getAttribute('id')

								                if _id:

								                    self.id_last_list = _id


								                if self.id_last_list not in self.control_list:

								                    self.control_list[self.id_last_list] = [0, ] * 10


								                if _id:

								                    if not element.getAttribute('continuelist') and\

								                            self.level_list == 1:

								                        self.control_list[self.id_last_list] = [0, ] * 10


								        except Exception as e:

								            print(e)


								        try:

								            flag_first = True

								            for el in element.childNodes:

								                prefixo = ''

								                if isinstance(el, Text):

								                    _r = [str(el), ]

								                else:

								                    if el.isInstanceOf(ListHeader) or\

								                            el.isInstanceOf(ListItem):


								                        if startvalue and flag_first:

								                            self.control_list[self.id_last_list][

								                                self.level_list - 1] = int(startvalue) - 1

								                            flag_first = False


								                        self.control_list[self.id_last_list][

								                            self.level_list - 1] += 1

								                        count_list_item = self.control_list[self.id_last_list][

								                            self.level_list - 1]


								                        if numformat == OdtParser.FNC1:

								                            prefixo = str(count_list_item)

								                        elif numformat == OdtParser.FNCI:

								                            prefixo = utils.int_to_roman(count_list_item)

								                        elif numformat == OdtParser.FNCi:

								                            prefixo = utils.int_to_roman(

								                                count_list_item).lower()

								                        elif numformat == OdtParser.FNCA:

								                            prefixo = utils.int_to_letter(count_list_item)

								                        elif numformat == OdtParser.FNCa:

								                            prefixo = utils.int_to_letter(

								                                count_list_item).lower()

								                        elif numformat == OdtParser.FNC8:

								                            prefixo = '*'

								                        else:

								                            prefixo = str(count_list_item)


								                        prefixo += numsufixo


								                    _r = self._import_itens(el, level=level + 1)


								                if _r:

								                    if prefixo:

								                        _r[0] = '%s %s' % (prefixo, _r[0])

								                        result += _r

								                    else:

								                        result += _r


								            self.level_list -= 1

								            return result


								        except Exception as e:

								            print(e)


								    def extractText(self, odfElement):

								        """ Extract text content from an Element, with whitespace represented

								            properly. Returns the text, with tabs, spaces, and newlines

								            correctly evaluated. This method recursively descends through the

								            children of the given element, accumulating text and "unwrapping"

								            <text:s>, <text:tab>, and <text:line-break> elements along the way.

								        """

								        result = []


								        if len(odfElement.childNodes) != 0:

								            for child in odfElement.childNodes:

								                if child.nodeType == Node.TEXT_NODE:

								                    result.append(child.data)

								                elif child.nodeType == Node.ELEMENT_NODE:

								                    subElement = child

								                    tagName = subElement.qname

								                    if tagName == (u"urn:oasis:names:tc:opendocument:xmlns:" +

								                                   "text:1.0", u"line-break"):

								                        result.append("\n")

								                    elif tagName == (u"urn:oasis:names:tc:opendocument:" +

								                                     "xmlns:text:1.0", u"tab"):

								                        result.append("\t")

								                    elif tagName == (u"urn:oasis:names:tc:opendocument:" +

								                                     "xmlns:text:1.0", u"s"):

								                        c = subElement.getAttribute('c')

								                        if c:

								                            spaceCount = int(c)

								                        else:

								                            spaceCount = 1


								                        result.append(" " * spaceCount)

								                    else:

								                        result.append(self.extractText(subElement))

								        return ''.join(result)