[addresses/dictionaries] Updates to Portuguese configs, variations for Brasil
This commit is contained in:
@@ -19,10 +19,56 @@ components:
|
|||||||
|
|
||||||
unit:
|
unit:
|
||||||
# If no unit number is specified
|
# If no unit number is specified
|
||||||
null_probability: 0.3
|
null_probability: 0.7
|
||||||
alphanumeric_probability: 0.65
|
alphanumeric_probability: 0.25
|
||||||
standalone_probability: 0.05
|
standalone_probability: 0.05
|
||||||
|
|
||||||
|
|
||||||
|
combinations:
|
||||||
|
# For unit types like 2/34 (more common in Canada and Australia)
|
||||||
|
house_number_unit:
|
||||||
|
components:
|
||||||
|
- house_number
|
||||||
|
- unit
|
||||||
|
label: house_number
|
||||||
|
separators:
|
||||||
|
- separator: "-"
|
||||||
|
probability: 0.9
|
||||||
|
- separator: " - "
|
||||||
|
probability: 0.05
|
||||||
|
- separator: /
|
||||||
|
probability: 0.05
|
||||||
|
probability: 0.005
|
||||||
|
house_number_floor:
|
||||||
|
components:
|
||||||
|
- house_number
|
||||||
|
- unit
|
||||||
|
label: house_number
|
||||||
|
separators:
|
||||||
|
- separator: "-"
|
||||||
|
probability: 0.9
|
||||||
|
- separator: " - "
|
||||||
|
probability: 0.05
|
||||||
|
- separator: /
|
||||||
|
probability: 0.05
|
||||||
|
probability: 0.005
|
||||||
|
|
||||||
|
house_number_staircase_unit:
|
||||||
|
components:
|
||||||
|
- house_number
|
||||||
|
- staircase
|
||||||
|
- unit
|
||||||
|
label: house_number
|
||||||
|
separators:
|
||||||
|
- separator: "-"
|
||||||
|
probability: 0.9
|
||||||
|
- separator: " - "
|
||||||
|
probability: 0.05
|
||||||
|
- separator: /
|
||||||
|
probability: 0.05
|
||||||
|
probability: 0.005
|
||||||
|
|
||||||
|
|
||||||
numbers:
|
numbers:
|
||||||
default: &numero
|
default: &numero
|
||||||
canonical: número
|
canonical: número
|
||||||
@@ -148,6 +194,19 @@ levels:
|
|||||||
canonical_probability: 0.3
|
canonical_probability: 0.3
|
||||||
abbreviated_probability: 0.4
|
abbreviated_probability: 0.4
|
||||||
sample_probability: 0.3
|
sample_probability: 0.3
|
||||||
|
pavimento_terreo: &pavimento_terreo
|
||||||
|
canonical: pavimento terréo
|
||||||
|
abbreviated: pt
|
||||||
|
sample: true
|
||||||
|
canonical_probability: 0.3
|
||||||
|
abbreviated_probability: 0.4
|
||||||
|
sample_probability: 0.3
|
||||||
|
terreo: &terreo
|
||||||
|
canonical: terréo
|
||||||
|
sample: true
|
||||||
|
canonical_probability: 0.3
|
||||||
|
abbreviated_probability: 0.4
|
||||||
|
sample_probability: 0.3
|
||||||
baixos: &baixos
|
baixos: &baixos
|
||||||
canonical: baixos
|
canonical: baixos
|
||||||
abbreviated: bxs
|
abbreviated: bxs
|
||||||
@@ -663,8 +722,16 @@ units:
|
|||||||
sample_probability: 0.3
|
sample_probability: 0.3
|
||||||
numeric:
|
numeric:
|
||||||
direction: left
|
direction: left
|
||||||
|
conjunto: &conjunto
|
||||||
|
canonical: conjunto
|
||||||
|
abbreviated: conj
|
||||||
|
sample: true
|
||||||
|
canonical_probability: 0.4
|
||||||
|
abbreviated_probability: 0.3
|
||||||
|
sample_probability: 0.3
|
||||||
suite: &suite
|
suite: &suite
|
||||||
canonical: suite
|
canonical: suite
|
||||||
|
sample: true
|
||||||
canonical_probability: 0.7
|
canonical_probability: 0.7
|
||||||
sample_probability: 0.3
|
sample_probability: 0.3
|
||||||
numeric:
|
numeric:
|
||||||
@@ -686,6 +753,13 @@ units:
|
|||||||
canonical: sala
|
canonical: sala
|
||||||
numeric:
|
numeric:
|
||||||
direction: left
|
direction: left
|
||||||
|
unidade: &unidade
|
||||||
|
canonical: unidade
|
||||||
|
abbreviated: un
|
||||||
|
sample: true
|
||||||
|
canonical_probability: 0.7
|
||||||
|
abbreviated_probability: 0.1
|
||||||
|
sample_probability: 0.2
|
||||||
|
|
||||||
alphanumeric: &unit_alphanumeric
|
alphanumeric: &unit_alphanumeric
|
||||||
default: *apartamento
|
default: *apartamento
|
||||||
@@ -725,17 +799,19 @@ units:
|
|||||||
- alternative: *porta
|
- alternative: *porta
|
||||||
probability: 0.05
|
probability: 0.05
|
||||||
- alternative: *letra
|
- alternative: *letra
|
||||||
probability: 0.02
|
probability: 0.015
|
||||||
|
- alternative: *unidade
|
||||||
|
probability: 0.005
|
||||||
|
|
||||||
zones:
|
zones:
|
||||||
residential: *unit_alphanumeric
|
residential: *unit_alphanumeric
|
||||||
commercial:
|
commercial:
|
||||||
default: *suite
|
default: *sala
|
||||||
probability: 0.6
|
probability: 0.6
|
||||||
alternatives:
|
alternatives:
|
||||||
- alternative: *escritorio
|
- alternative: *escritorio
|
||||||
probability: 0.2
|
probability: 0.2
|
||||||
- alternative: *sala
|
- alternative: *suite
|
||||||
probability: 0.2
|
probability: 0.2
|
||||||
|
|
||||||
numeric_probability: 0.9 # e.g. escritório 1
|
numeric_probability: 0.9 # e.g. escritório 1
|
||||||
@@ -748,12 +824,12 @@ units:
|
|||||||
whitespace_probability: 0.1
|
whitespace_probability: 0.1
|
||||||
|
|
||||||
alpha:
|
alpha:
|
||||||
default: *suite
|
default: *sala
|
||||||
probability: 0.7
|
probability: 0.7
|
||||||
alternatives:
|
alternatives:
|
||||||
- alternative: *escritorio
|
- alternative: *escritorio
|
||||||
probability: 0.15
|
probability: 0.15
|
||||||
- alternative: *sala
|
- alternative: *suite
|
||||||
probability: 0.1
|
probability: 0.1
|
||||||
- alternative: *letra
|
- alternative: *letra
|
||||||
probability: 0.05
|
probability: 0.05
|
||||||
@@ -830,16 +906,44 @@ countries:
|
|||||||
default: *andar_terreo
|
default: *andar_terreo
|
||||||
probability: 0.4
|
probability: 0.4
|
||||||
alternatives:
|
alternatives:
|
||||||
- alternative: *rez_do_chao
|
- alternative: *terreo
|
||||||
probability: 0.34
|
probability: 0.2
|
||||||
- alternative: *baixos
|
- alternative: *baixos
|
||||||
probability: 0.2
|
probability: 0.2
|
||||||
|
- alternative: *rez_do_chao
|
||||||
|
probability: 0.13
|
||||||
|
- alternative: *pavimento_terreo
|
||||||
|
probability: 0.01
|
||||||
# Andar / Piso 0 is uncommon
|
# Andar / Piso 0 is uncommon
|
||||||
- alternative: *andar
|
- alternative: *andar
|
||||||
probability: 0.05
|
probability: 0.05
|
||||||
- alternative: *piso
|
- alternative: *piso
|
||||||
probability: 0.01
|
probability: 0.01
|
||||||
|
|
||||||
|
|
||||||
|
postcodes:
|
||||||
|
alphanumeric:
|
||||||
|
default:
|
||||||
|
canonical: código de endereçamento postal
|
||||||
|
abbreviated: cep
|
||||||
|
sample: true
|
||||||
|
canonical_probability: 0.001
|
||||||
|
abbreviated_probability: 0.995
|
||||||
|
sample_probability: 0.004
|
||||||
|
|
||||||
|
numeric:
|
||||||
|
# Postcodes in Brazil are sometimes prefixed by CEP
|
||||||
|
direction: left
|
||||||
|
|
||||||
|
numeric_affix:
|
||||||
|
affix: cep
|
||||||
|
direction: left
|
||||||
|
# null_probability means the chance of doing nothing e.g. just the postal code
|
||||||
|
null_probability: 0.7
|
||||||
|
numeric_probability: 0.18
|
||||||
|
numeric_affix_probability: 0.12
|
||||||
|
strict_numeric: true
|
||||||
|
|
||||||
po_boxes:
|
po_boxes:
|
||||||
alphanumeric:
|
alphanumeric:
|
||||||
default:
|
default:
|
||||||
@@ -850,4 +954,30 @@ countries:
|
|||||||
abbreviated_probability: 0.6
|
abbreviated_probability: 0.6
|
||||||
sample_probability: 0.3
|
sample_probability: 0.3
|
||||||
numeric:
|
numeric:
|
||||||
direction: left
|
direction: left
|
||||||
|
|
||||||
|
units:
|
||||||
|
zones:
|
||||||
|
commercial:
|
||||||
|
default: *conjunto
|
||||||
|
probability: 0.8
|
||||||
|
alternatives:
|
||||||
|
- alternative: *sala
|
||||||
|
probability: 0.1
|
||||||
|
- alternative: *suite
|
||||||
|
probability: 0.05
|
||||||
|
- alternative: *escritorio
|
||||||
|
probability: 0.05
|
||||||
|
|
||||||
|
alpha:
|
||||||
|
default: *conjunto
|
||||||
|
probability: 0.75
|
||||||
|
alternatives:
|
||||||
|
- alternative: *sala
|
||||||
|
probability: 0.1
|
||||||
|
- alternative: *suite
|
||||||
|
probability: 0.05
|
||||||
|
- alternative: *escritorio
|
||||||
|
probability: 0.05
|
||||||
|
- alternative: *letra
|
||||||
|
probability: 0.05
|
||||||
|
|||||||
@@ -1,3 +1,5 @@
|
|||||||
andar terréo|at|a.t|a t|andar terreo
|
andar terréo|at|a.t|a t|andar terreo
|
||||||
baixos|bxs
|
baixos|bxs
|
||||||
rés-do-chão|res-do-chao|rés do chão|res do chao|résdochão|resdochao|rc|r / c|r.c|r c|rdc|r / d / c|r/r / chão|r / chao|r-d-c|r d c |r.d.c
|
rés-do-chão|res-do-chao|rés do chão|res do chao|résdochão|resdochao|rc|r / c|r.c|r c|rdc|r / d / c|r/r / chão|r / chao|r-d-c|r d c |r.d.c
|
||||||
|
pavimento terréo|pt|p.t|p t|pavimento terreo
|
||||||
|
terréo|terreo
|
||||||
|
|||||||
@@ -1 +1 @@
|
|||||||
sem número|sem numero|sn|s.n.|s.n|s / n|s n
|
sem número|sem numero|sn|s.n.|s.n|s / n|s n|s / nº|s.nº|snº|s / no
|
||||||
1
resources/dictionaries/pt/postcodes.txt
Normal file
1
resources/dictionaries/pt/postcodes.txt
Normal file
@@ -0,0 +1 @@
|
|||||||
|
código de endereçamento postal|cep|c.e.p|c e p|c de e p|c de ep|codigo de enderecamento postal
|
||||||
@@ -1,8 +1,10 @@
|
|||||||
apartamento|ap|apt|apto|apt.o
|
apartamento|ap|apt|apto|apt.o
|
||||||
casa
|
casa
|
||||||
|
conjunto|conj|cj
|
||||||
letra
|
letra
|
||||||
lote|lt
|
lote|lt
|
||||||
parcela
|
parcela
|
||||||
porta|pta
|
porta|pta
|
||||||
moradia
|
moradia
|
||||||
sala
|
sala
|
||||||
|
unidade|un
|
||||||
@@ -26,7 +26,7 @@ class AddressConfig(object):
|
|||||||
self.cache = {}
|
self.cache = {}
|
||||||
|
|
||||||
for filename in os.listdir(config_dir):
|
for filename in os.listdir(config_dir):
|
||||||
if filename not in ('en.yaml', 'es.yaml', 'ca.yaml', 'fr.yaml', 'de.yaml', 'nl.yaml', 'da.yaml', 'nb.yaml', 'sv.yaml', 'pt.yaml'):
|
if filename not in ('en.yaml', 'es.yaml', 'ca.yaml', 'fr.yaml', 'de.yaml', 'nl.yaml', 'da.yaml', 'nb.yaml', 'sv.yaml', 'pt.yaml', 'pl.yaml'):
|
||||||
continue
|
continue
|
||||||
|
|
||||||
config = yaml.load(open(os.path.join(ADDRESS_CONFIG_DIR, filename)))
|
config = yaml.load(open(os.path.join(ADDRESS_CONFIG_DIR, filename)))
|
||||||
|
|||||||
Reference in New Issue
Block a user