Personally I need to transform a string into a list, in a peculiar way.
I found in this post what I need to do. But I'm lost to the applied regex.
I have numerous string in the following format:
["DECRETO Nº 76.326 DE 23 DE SETEMBRO DE 1975.",
'DECRETO Nº 76.326, DE 23 DE SETEMBRO DE 1975.',
'DECRETO-LEI Nº 76.326 DE 23 DE SETEMBRO DE 1975.',
'LEI Nº 76.326 DE 23 DE SETEMBRO DE 1975.',
"Decreto Nº 76.326 DE 23 DE SETEMBRO DE 1975",
"Decreto Nº 76.326 de 23 DE Setembro de 1975.",
"DECRETO - LEI Nº 76.326 DE 23 DE SETEMBRO DE 1975.",
"DECRETO- LEI Nº 76.326 DE 23 DE SETEMBRO DE 1975.",
"DECRETO -LEI Nº 76.326 DE 23 DE SETEMBRO DE 1975."]
My ultimate goal is to transform them so they look like this:
"DECRETO-LEI Nº 76.326, DE 23 DE SETEMBRO DE 1975" ou
"DECRETO Nº 76.326, DE 23 DE SETEMBRO DE 1975" ou
"LEI Nº 76.326, DE 23 DE SETEMBRO DE 1975"
I thought of turning them into a list with regex and join
to return the string, but I think there could be a simpler way.
def truncus22():
''''''
s = 'DECRETO-LEI nº 76.326 De 23 de setembro de 1975.'
s = re.sub('\.$', '', re.sub(' ', ' ', s))
return ', '.join(re.split("(?<!^)\s+(?=D)(?!.\s)", s)).upper()
Look here folks an example that I had thought. But it works only in 01 of the cases presented ...
I need to edit the original string by removing duplicate spaces, adding a comma before the date, removing spaces in the hyphen, and the end point of all strings