From 99816f55b1a539a86c5354987a8844aa19834830 Mon Sep 17 00:00:00 2001 From: Al Date: Tue, 3 Mar 2015 18:45:04 -0500 Subject: [PATCH] [dictionaries] Spanish dictionaries --- .../es/academic_degrees/academic_degrees.txt | 2 + .../es/building_types/building_types.txt | 7 + .../es/company_types/company_types.txt | 48 +++++++ .../es/directionals/directionals.txt | 10 ++ .../es/given_names/given_names.txt | 3 + data/dictionaries/es/no_number/no_number.txt | 1 + .../personal_suffixes/personal_suffixes.txt | 1 + .../es/personal_titles/personal_titles.txt | 132 ++++++++++++++++++ .../es/place_names/place_names.txt | 89 ++++++++++++ .../es/post_office/post_office.txt | 1 + .../dictionaries/es/qualifiers/qualifiers.txt | 19 +++ data/dictionaries/es/stopwords/stopwords.txt | 32 +++++ .../es/street_types/street_types.txt | 107 ++++++++++++++ data/dictionaries/es/surnames/surnames.txt | 6 + data/dictionaries/es/synonyms/synonyms.txt | 54 +++++++ data/dictionaries/es/toponyms/toponyms.txt | 2 + .../dictionaries/es/unit_types/unit_types.txt | 43 ++++++ 17 files changed, 557 insertions(+) create mode 100644 data/dictionaries/es/academic_degrees/academic_degrees.txt create mode 100644 data/dictionaries/es/building_types/building_types.txt create mode 100644 data/dictionaries/es/company_types/company_types.txt create mode 100644 data/dictionaries/es/directionals/directionals.txt create mode 100644 data/dictionaries/es/given_names/given_names.txt create mode 100644 data/dictionaries/es/no_number/no_number.txt create mode 100644 data/dictionaries/es/personal_suffixes/personal_suffixes.txt create mode 100644 data/dictionaries/es/personal_titles/personal_titles.txt create mode 100644 data/dictionaries/es/place_names/place_names.txt create mode 100644 data/dictionaries/es/post_office/post_office.txt create mode 100644 data/dictionaries/es/qualifiers/qualifiers.txt create mode 100644 data/dictionaries/es/stopwords/stopwords.txt create mode 100644 data/dictionaries/es/street_types/street_types.txt create mode 100644 data/dictionaries/es/surnames/surnames.txt create mode 100644 data/dictionaries/es/synonyms/synonyms.txt create mode 100644 data/dictionaries/es/toponyms/toponyms.txt create mode 100644 data/dictionaries/es/unit_types/unit_types.txt diff --git a/data/dictionaries/es/academic_degrees/academic_degrees.txt b/data/dictionaries/es/academic_degrees/academic_degrees.txt new file mode 100644 index 00000000..94e2056d --- /dev/null +++ b/data/dictionaries/es/academic_degrees/academic_degrees.txt @@ -0,0 +1,2 @@ +licenciada|lcda|lda +licenciado|lic|lcdo|ldo \ No newline at end of file diff --git a/data/dictionaries/es/building_types/building_types.txt b/data/dictionaries/es/building_types/building_types.txt new file mode 100644 index 00000000..dfd2ad78 --- /dev/null +++ b/data/dictionaries/es/building_types/building_types.txt @@ -0,0 +1,7 @@ +caserio|csrio +casa +chalet|chlet +complejo|compj|compl|complj +condominio|cond +edificio|edifc|edfc|edif +viviendas|vvdas \ No newline at end of file diff --git a/data/dictionaries/es/company_types/company_types.txt b/data/dictionaries/es/company_types/company_types.txt new file mode 100644 index 00000000..99f1dc53 --- /dev/null +++ b/data/dictionaries/es/company_types/company_types.txt @@ -0,0 +1,48 @@ +asociacion en participacion|a en p +asociacion civil|ac|a c +banco|bco +club atletico +club de futbol|cf|c f|futbol club|fc|f c +compania|cia|c ia|ca|c a|comp +compania anonima|ca|c a +compania por acciones|c por a|cxa|c x a +empresa|empr|emp +empresa individual de responsabilidad limitada|eirl|e i r l +empresa publica|ep|e p +empresa unipersonal|e u +sociedad|sdad|soc +sociedad anonima|sa|s a|sdad anon +sociedad anonima abierta|saa|s a a +sociedad anonima bursatil|sab|s a b +sociedad anonima deportiva|sad|s a d +sociedad anonima de capital variable|sa de cv|s a de c v +sociedad anonima cooperativa catalana limitada|sccl|s c c l +sociedad anonima espanola|sae +sociedad anonima financiera de inversion|safi|s a f i +sociedad anonima inscrita de capital abierto|saica|s a i c a +sociedad anonima laboral|sal +sociedad anonima promotora de inversion|sapi|s a p i +sociedad anonima simplificada|sas|s a s +sociedad civil|sc|s c +sociedad colectiva|snc|s n c|soc cal|y cia sc|y cia s c|& cia sc|& cia s c +sociedad comanditaria|scra|s cra +sociedad cooperativa|scoop|s coop +sociedad cooperativa limitada|scl|s c l +sociedad de capital e industria|scel|s c e l +sociedad de garantia reciproca|sgr|s g r +sociedad de responsabilidad limitada|srl|s r l|s de rl|s de r l +sociedad del estado|se|s e +sociedad en comandita|s en c|sc|y cia s en c|& cia s en c +sociedad en comandita por acciones|s en c por a|sca|s c a|cia sca|cia s c a +sociedad en nombre colectivo|cia|s en nc|s en n c +sociedad en nombre colectivo de responsabilidad limitada|cia ltda|ltda +sociedad gestora de instituciones de inversion colectiva|sgiic|s g i i c +sociedad limitada|sl|s l|sdad ltda +sociedad limitada laboral|sll|s l l +sociedad limitada nueva empresa|slne|s l n e +sociedad limitada unipersonal|slu|s l u +sociedad por acciones|spa|s p a +union deportiva|ud +union +y compania|& compania|y cia|& cia +y sucesores|& sucesores \ No newline at end of file diff --git a/data/dictionaries/es/directionals/directionals.txt b/data/dictionaries/es/directionals/directionals.txt new file mode 100644 index 00000000..092aab87 --- /dev/null +++ b/data/dictionaries/es/directionals/directionals.txt @@ -0,0 +1,10 @@ +este|e +norte|n +noreste|nordeste|ne|n e +noroeste|nw|n w +oeste|w +oriente|ote +poniente|pte +sur|s +sureste|se|s e +suroeste|sw|s w \ No newline at end of file diff --git a/data/dictionaries/es/given_names/given_names.txt b/data/dictionaries/es/given_names/given_names.txt new file mode 100644 index 00000000..d3f2b568 --- /dev/null +++ b/data/dictionaries/es/given_names/given_names.txt @@ -0,0 +1,3 @@ +federico|fco +francisco|fco|franc +maria|ma|m a \ No newline at end of file diff --git a/data/dictionaries/es/no_number/no_number.txt b/data/dictionaries/es/no_number/no_number.txt new file mode 100644 index 00000000..bff4b0ac --- /dev/null +++ b/data/dictionaries/es/no_number/no_number.txt @@ -0,0 +1 @@ +sin numero|s / n|s n|sn \ No newline at end of file diff --git a/data/dictionaries/es/personal_suffixes/personal_suffixes.txt b/data/dictionaries/es/personal_suffixes/personal_suffixes.txt new file mode 100644 index 00000000..e390606e --- /dev/null +++ b/data/dictionaries/es/personal_suffixes/personal_suffixes.txt @@ -0,0 +1 @@ +junior|iunior|jr \ No newline at end of file diff --git a/data/dictionaries/es/personal_titles/personal_titles.txt b/data/dictionaries/es/personal_titles/personal_titles.txt new file mode 100644 index 00000000..92b6c61e --- /dev/null +++ b/data/dictionaries/es/personal_titles/personal_titles.txt @@ -0,0 +1,132 @@ +abad|abd +abogada|abga|abgda|abg da +abogado|abg|abgdo|abg do +administrador|admor|adm or|admr +administradora|admora|adm ora|admra +agrimensor|agrim +alcalde|alcde +alferez|alf|alfz +almirante|alm|almte|alte +alteza +arquitecto|arq +arquitecta|arqa +arquitectors|arqs|arqos +arzobispo|arz +baron|bar +baronesa +brigadier|brg|bg|brig +brigadier general|brg general|brg gral|brg genl|brg gnal|brg gn|bg general|bg gral|bg genl|bg gnal|bg gn|brig general|brig gral|brig genl|brig gnal|brig gn +caballero|cab +cabo primero|cp|c p +cabo segundo|cs|c s +cabo tercero|ct|c t +cacique|cque +capitan|cap|capt|ctn|cptn +cardenal|card|cnal +clerigo|clg +comandante|cmdt|cmte|comte|cte +comisario|cmro +conde|cde +condesa|cdesa +consejal|cjal +consejero|cons|consejo +contralmirante|contralmte +coronel|cnel|col|crn +diacono|diac +diacona|diaca +diputado|dip +director|dir +directora|dira|dir a +doctor|dr +doctora|dra +don|d +dona|da|dna|d a +dragoneante|dg +duque|dq +duquesa|dqsa|dqa +embajador|emb +enfermera|enf|enfa +escritor +escritora +excelencia|exca|exc a +excelentisima|excma +excelentisimo|excmo +fray|fr +gendarme|gdme +general|gral|genl|gnal|gn +gobernadora|gdora|goba +gobernador|gdor|gob +hermana|hna +hermanas|hnas +hermano|hno +hermanos|hnos +infanta|infa|infta +infante|inf|infte +ingeniera|inga +ingeniero|ing|ingo +inspector|insp +intendente|int +jefe|jf +juez|jz +licenciada|lda|lica|lic a +licenciado|ldo|lic|lico|lic o +locutor|loc +madre|me|m e +maestro|mstro|mtro +majestad +mariscal|mscal +marques|mq|marqs +marquesa|mqa|marqsa +mayor|my|may +mayor de brigada|may brig|my brig +mayor general|mg|m g|my gen|my gral +ministerio|min +ministro|mtro +monsenor|mons|msnr +notario|not +nuestra senora|ns|n s|ntra sra +obispo|ob +padre|pe|p e|pdre|p dre +piloto fluvial|plto flvial +presidenta|pdta|presa|pres a|presida|presid a|pta +presidente|pdte|pres|presid|pte +principe +principal|pral +procurador|proc +profesor|prof|profr +profesora|profa|profra +reina|ra +reverendo|rvdo|rdo|rvd|rev +reverendo|rvdo|rdo|rvd|rev +reverendisima|rma|rvdma +reverendisimo|rmo|rvdmo +rey +reyes +san|s +santa|sta +sant|st +santo|sto +sargento|sarg|sgto|sargto +sargento ayudante|sarg ay|sgto ay|sargto ay +sargento mayor|sm|s m|sarg my|sgto my|sargto my +sargento primero|sp|s p +sargento segundo|sg|s g +sargento viceprimero|sargento vice primero|sv|s v +secretario|secreto|secto +secretaria|secreta|secta +senador|sen +senor|sr +senora|sra +senores|srs|sres +senorita|srta +serenisima|serma|ser ma +serenisimo|sermo|ser mo +soldado|sold +subteniente|subte|stn +teniente|tn|tte +teniente coronel|tcnl|tte cnel|tte col|tn cnel|tn col +teniente general|tn gral|tte gral|tn gen|tte gen +teniente primero|tte pro|tn pro +vicealmirante|vice almirante|v alm|v alte|v almte +vizconde|vde +vizcondesa|vdesa \ No newline at end of file diff --git a/data/dictionaries/es/place_names/place_names.txt b/data/dictionaries/es/place_names/place_names.txt new file mode 100644 index 00000000..c783c1ec --- /dev/null +++ b/data/dictionaries/es/place_names/place_names.txt @@ -0,0 +1,89 @@ +aeropuerto +albergue +apartamentos|aptos +arboleda|arb +arrabal|arral +arroyo|arry +asuntos exteriores|aa ee +atletico|atl o|atlo +ayuntamiento +balneario|balnr +banco +bar +biblioteca|bibl +borda +cafeteria +campo|cpo +cantera|cantr +cantina|canti +caserio|csrio +casa +casas +castillo|cast +cementerio +charcuteria +clinica +club|clb +colegio +comisario de policia +correos +corretaje +convento|cnvto +cooperativa|coop +cortijo|crtjo +dehesa|dhsa +de capital variable|de cv|de c v +diseminado|disem +embajada +escuela +escuelas +estacion|estcn +estacionamiento|estto +fabrica|fca|fbrca +farmacia +ferrocarril|fc|f c +ferrocarriles|ff cc|ffcc +granja|granj +hacienda|hda +heladeria +hipodromo|hipod +horno +hospital|hosp +hostal +hotel +iglesia|igl|igla +iglesias|iglas +instituto|inst +libreria +mercado|merc +mirador|mrdor +monasterio|mtrio +muebles +muelle|meull +pabellon +palacio|palac +palacios|palacs +panaderia +parque|pque|parq|pq|pqe +pasteleria +pescaderia +pilar +playa +puebla|pbla +pueblo|pblo +puente|pnte +puerta|pta +puerto|pto +rancho|rch|rcho +restaurante +sanatorio|sanat +santuario|santu +sociedad|soc +taberna +taller +talleres +tienda +torre +transito|trans +universidad|univ|uni|univers +villa \ No newline at end of file diff --git a/data/dictionaries/es/post_office/post_office.txt b/data/dictionaries/es/post_office/post_office.txt new file mode 100644 index 00000000..6f72e914 --- /dev/null +++ b/data/dictionaries/es/post_office/post_office.txt @@ -0,0 +1 @@ +apartado|apdo \ No newline at end of file diff --git a/data/dictionaries/es/qualifiers/qualifiers.txt b/data/dictionaries/es/qualifiers/qualifiers.txt new file mode 100644 index 00000000..7b8a4681 --- /dev/null +++ b/data/dictionaries/es/qualifiers/qualifiers.txt @@ -0,0 +1,19 @@ +aldea +auzoa +barriada|barda +barrio|bo|brio|brrio +barrios|bos|brios|brrios +bloque|blque|bloq|blq +colonia|col +ciudad|cdad|cd +distrito|dtto +estado|edo +isla|isl|is +islas|isls|iss +poligono|polig +poligono residencial|polig res|pgres|pg res|pr|p r +poligono industrial|polig ind|pgind|pg ind|pi|p i +seccion|secc|sccn|scn|sec +sector|sect +urbanizacion|urb +zona|zna \ No newline at end of file diff --git a/data/dictionaries/es/stopwords/stopwords.txt b/data/dictionaries/es/stopwords/stopwords.txt new file mode 100644 index 00000000..fb95bb6e --- /dev/null +++ b/data/dictionaries/es/stopwords/stopwords.txt @@ -0,0 +1,32 @@ +a +al +allende +cerca +con +de +debajo +del +dela +des +detras +e +el +en +encima +enfrente +entre +i +junta +hasta +la +lado +las +lo +los +mas +para|pa +por +sin +un +una +y \ No newline at end of file diff --git a/data/dictionaries/es/street_types/street_types.txt b/data/dictionaries/es/street_types/street_types.txt new file mode 100644 index 00000000..bfb7054c --- /dev/null +++ b/data/dictionaries/es/street_types/street_types.txt @@ -0,0 +1,107 @@ +acceso|acces +alameda|alam +alqueria|alque +andador|andad +angosta|angta +apeadero|apdro +autopista|auto +autovia|autov +avenida|av|avd|avda +bajada|bjada +banda|bda +barranco|branc +barranquillo|bqllo +barriada|barda +barrio|bo +bloque|blque|bloq|blq +boulevard|blvd|bvd +brazal|brzal +bulevar|bulev|blev|blv|bv +calle|c|cl|cll|c /|ca +calleja|cllja +callejon|callej|cjon|cllon|cj +calle privada|calle priv|c priv|cl priv|cll priv|c / priv +callejuela|cjla +callizo|cllzo +calzada|czada|calz +camino|cno|cmo|cmno|cm +camino hondo|ch|c h +camino nuevo|cn|c n +camino viejo|cv|c v +caminito|cmt +camping|campg +cantera|cantr +canton|cant +carrera|cra|carra|carr +carretera|ctra|cr +carreterin|ctrin +carretil|crtil +carril|crril +cerrada|cda|cer +cinturon|cint +circuito|cto +circunvalacion|ccvcn +corredor|crrdo +costanilla|cstan +costera +cuesta|custa +diagonal|diag +diseminado|disem +espalda|eslda +estrada|estda +explanada|expla +extramuros|extrm +galeria|gale +glorieta|gta|g +gran via|gv|g v +hacienda|hda +ladera|ldera +laderas|lderas +llanura|llnra +malecon|malec +mirador|mrdor +muelle|meull +pantano|pant +paraje|praje +parque|pque|parq|pq|pqe +particular|parti +partida|ptda +pasadizo|pzo +pasaje|psaje|psj +paseo|po|pso|pseo|ps|p|p.o +paseo maritimo|psmar|ps mar +paso +pasillo|psllo +peatonal|peat +periferico|perif +plaza|pl|plza|pza|p za +plazoleta|pzta|plzta|plta +plazuela|plzla +poblado|pbdo +prazuela|przla +prolongacion|prol +puebla|pbla +pueblo|pblo +puente|pnte +rambla|rbla +rampla|rampa +retorno|ret|rt +ribera|bra +rincon|rcon|rin|rncn|rncon +rinconada|rcda|rcnda +ronda|rda +rotonda|rtda +rua +ruta|rta +sector|sect +sendera|sedra +sendero|send|sedro +subida|sbida +transito|trans +transversal|trval|trvsal +trasera|tras +travesia|trva|trvsia +vereda|vreda|ver +viaducto|vcto|vd +via|v +vista|vst|vsta|vist \ No newline at end of file diff --git a/data/dictionaries/es/surnames/surnames.txt b/data/dictionaries/es/surnames/surnames.txt new file mode 100644 index 00000000..9f3d2855 --- /dev/null +++ b/data/dictionaries/es/surnames/surnames.txt @@ -0,0 +1,6 @@ +fernandez|fdez +lopez|lpez +hernandez|hdez +gonzalez|glez +martinez|mnez +rodriguez|rguez \ No newline at end of file diff --git a/data/dictionaries/es/synonyms/synonyms.txt b/data/dictionaries/es/synonyms/synonyms.txt new file mode 100644 index 00000000..b09572b5 --- /dev/null +++ b/data/dictionaries/es/synonyms/synonyms.txt @@ -0,0 +1,54 @@ +abril|abr|abl +agosto|ag|agto|ag to|agt +altura|alt +alturas|alts +arboleda|arb +arrabal|arral +bosque|bsq +brigada|brig +cabo|cbo +campo|cpo|cmpo +campos|cpos|cmpos +canal|cnl +capital federal|cap fed +centro|cntro|ctro +cerro|crro +codigo postal|cp|c p +distrito federal|df|d f +distrito postal|dp|d p +enero|en|eno|ene|en o +diciembre|dic|dicbre|dic bre|dice|dic e|dbre|d bre|10bre|10 bre +febrero|febo|feb o|febro|feb ro|febr|feb +gobierno|gob|gobno|gob no +grande|gr +guerra|ga +independencia|indep +infanteria|infa|ynfa|ynfanta +junio|jun|jn +julio|jul|jl +lago|lg +lagos|lgs +laguna|lgna +llanura|llnra +llanuras|llnras +marzo|mzo|mar +mayo|my|may +militar|milr +monte|mt|mte|mnte +montes|mts|mtes|mntes|mnts +nacional|nal|nacl +noviembre|nbre|n bre|nvre|n vre|nove|nov e|novre|nov re|novbre|nov bre|9bre|9 bre +octubre|oct|octbre|oct bre|octe|oct e|8bre|8 bre +prado|prdo +primeros|pros +privada|priv +punta|pnta +real|rl +republica|rep +revolucion|rev +ribera|ribr +septiembre|setbre|set bre|sepe|sep e|sepbre|sep bre|7bre|7 re|7 bre|sep|set +sierra|srra +valle|vlle +volcan|vlcn +voluntarios|voluntos \ No newline at end of file diff --git a/data/dictionaries/es/toponyms/toponyms.txt b/data/dictionaries/es/toponyms/toponyms.txt new file mode 100644 index 00000000..a4542cb0 --- /dev/null +++ b/data/dictionaries/es/toponyms/toponyms.txt @@ -0,0 +1,2 @@ +barcelona|barna +madd|madrid \ No newline at end of file diff --git a/data/dictionaries/es/unit_types/unit_types.txt b/data/dictionaries/es/unit_types/unit_types.txt new file mode 100644 index 00000000..08c34d34 --- /dev/null +++ b/data/dictionaries/es/unit_types/unit_types.txt @@ -0,0 +1,43 @@ +cobertizo|cbtiz +colonia|col +conjunto|cjto|conj|cto +cooperativa|coop +corral|crral +corralillo|crrlo +cortijo|crtjo +cuadra|cuadr +demarcacion|demar +departamento|dept|depto +derecha|dcha +diseminado|disem +entrada|entd|entr +escalera|esca +escaleras|escas +escalinata|escal|escalin +estancias|estanc|est +extension|ext +extramuros|extrm +extrarradio|extrr +interior|int +izquierda|izq|izda|izqa|izqda +jardin|jdin|jard +jardines|jdins|jards +mansion|mans +mansiones|manses +nucleo|ncleo +numero|#|num|no|numr|numro|nro +officina|off +partida|ptda +poblado|pbdo|pob|pobl +poligono|polig +poligono residencial|polig res|pgres|pg res|pr|p r +poligono industrial|polig ind|pgind|pg ind|pi|p i +portal|prtal|prtl +portcio|prtco +portillo|ptilo|ptllo +puerta|pta +quebrada|qbda +residencial|resid|res +sector|sect +trasera|tras +vecindario|vecin \ No newline at end of file