From b9736e3070ff6a1921e8af2f687b6a9f4010d8a7 Mon Sep 17 00:00:00 2001 From: Al Date: Fri, 10 Jul 2015 14:08:42 -0400 Subject: [PATCH] [dictionaries] Polish dictionaries --- data/dictionaries/pl/academic_degrees.txt | 2 + data/dictionaries/pl/building_types.txt | 1 + data/dictionaries/pl/company_types.txt | 4 ++ data/dictionaries/pl/directionals.txt | 8 ++++ data/dictionaries/pl/level_types.txt | 1 + data/dictionaries/pl/personal_suffixes.txt | 2 + data/dictionaries/pl/personal_titles.txt | 54 ++++++++++++++++++++++ data/dictionaries/pl/place_names.txt | 29 ++++++++++++ data/dictionaries/pl/post_office.txt | 1 + data/dictionaries/pl/qualifiers.txt | 9 ++++ data/dictionaries/pl/stopwords.txt | 3 ++ data/dictionaries/pl/street_types.txt | 12 +++++ data/dictionaries/pl/synonyms.txt | 19 ++++++++ data/dictionaries/pl/toponyms.txt | 1 + data/dictionaries/pl/unit_types.txt | 4 ++ 15 files changed, 150 insertions(+) create mode 100644 data/dictionaries/pl/academic_degrees.txt create mode 100644 data/dictionaries/pl/building_types.txt create mode 100644 data/dictionaries/pl/company_types.txt create mode 100644 data/dictionaries/pl/directionals.txt create mode 100644 data/dictionaries/pl/level_types.txt create mode 100644 data/dictionaries/pl/personal_suffixes.txt create mode 100644 data/dictionaries/pl/personal_titles.txt create mode 100644 data/dictionaries/pl/place_names.txt create mode 100644 data/dictionaries/pl/post_office.txt create mode 100644 data/dictionaries/pl/qualifiers.txt create mode 100644 data/dictionaries/pl/stopwords.txt create mode 100644 data/dictionaries/pl/street_types.txt create mode 100644 data/dictionaries/pl/synonyms.txt create mode 100644 data/dictionaries/pl/toponyms.txt create mode 100644 data/dictionaries/pl/unit_types.txt diff --git a/data/dictionaries/pl/academic_degrees.txt b/data/dictionaries/pl/academic_degrees.txt new file mode 100644 index 00000000..c5a1181b --- /dev/null +++ b/data/dictionaries/pl/academic_degrees.txt @@ -0,0 +1,2 @@ +adwokat|adw +wielmozny \ No newline at end of file diff --git a/data/dictionaries/pl/building_types.txt b/data/dictionaries/pl/building_types.txt new file mode 100644 index 00000000..d9dc0cd6 --- /dev/null +++ b/data/dictionaries/pl/building_types.txt @@ -0,0 +1 @@ +budowa|bud \ No newline at end of file diff --git a/data/dictionaries/pl/company_types.txt b/data/dictionaries/pl/company_types.txt new file mode 100644 index 00000000..784268e8 --- /dev/null +++ b/data/dictionaries/pl/company_types.txt @@ -0,0 +1,4 @@ +spółka|s-ka +spółka akcyjna|s-ka akc +spółdzielnia|spółdz|spnia +stowarzyszenie|stow \ No newline at end of file diff --git a/data/dictionaries/pl/directionals.txt b/data/dictionaries/pl/directionals.txt new file mode 100644 index 00000000..36922d69 --- /dev/null +++ b/data/dictionaries/pl/directionals.txt @@ -0,0 +1,8 @@ +północ|polnoc|płn|pln +północny wschód|polnocny wschod|pn.-wsch.|pn-wsch|pn wsch|płn.-wsch.|płn-wsch|płn wsch|pln.-wsch.|pln-wsch|pln wsch +północny zachód|polnocny zachod|pn.-zach.|pn-zach|pn zach|płn.-zach.|płn-zach|płn zach|pln.-zach.|pln-zach|pln zach +wschód|wschod +południe|poludnie|pd|płd|pld +południowy wschód|poludniowy wschod|pd.-wsch.|pd-wsch|pd wsch|płd.-wsch.|płd-wsch|płd wsch|pld.-wsch.|pld-wsch|pld wsch +południowy zachód|poludniowy zachod|pd.-zach.|pd-zach|pd zach|płd.-zach.|płd-zach|płd zach|pld.-zach.|pld-zach|pld zach +zachód|zachod \ No newline at end of file diff --git a/data/dictionaries/pl/level_types.txt b/data/dictionaries/pl/level_types.txt new file mode 100644 index 00000000..1743a487 --- /dev/null +++ b/data/dictionaries/pl/level_types.txt @@ -0,0 +1 @@ +piętro|p|ptr \ No newline at end of file diff --git a/data/dictionaries/pl/personal_suffixes.txt b/data/dictionaries/pl/personal_suffixes.txt new file mode 100644 index 00000000..b8b1b59b --- /dev/null +++ b/data/dictionaries/pl/personal_suffixes.txt @@ -0,0 +1,2 @@ +młodszy|mł +starszy|st \ No newline at end of file diff --git a/data/dictionaries/pl/personal_titles.txt b/data/dictionaries/pl/personal_titles.txt new file mode 100644 index 00000000..83e0fc0b --- /dev/null +++ b/data/dictionaries/pl/personal_titles.txt @@ -0,0 +1,54 @@ +adjunkt|adj +admirał|admiral|adm +ambasador|amb +architekt|arch +arcybiskup|abp +asystent|as +bosman|bosm +bosman sztabowy|bosm sztab +biskupa|bpa +doktora|dr +dowódca|dowodca|dca|d-ca +dyrektor|dyr +dziekan|dziek +generała|generala|gen +generał broni|gen broni +generał brygady|gen bryg +generał dywizji|gen dyw +honorowy|hon +hrabia|hr +inżynier|inż +kapral|kpr +kapitan|kpt +kapitan marynarki|kpt mar +kardynała|kardynala|kard +kierownik|kier +kontradmirał|kontradmiral|kadm|kontradm +komandor|kmdr +komandor porucznik|kmdr por +komandor podporucznik|kmdr ppor +komendant|kmdt|kom +ksiądz|ks +lekarz|lek +magister|mgr +major|mjr +marynarz|mar +marszałka|marszalka|marsz +minister|min +ojciec|o +pułkownik|płk +podoficer|podofic +podsekretarz|podsekr +profesor|prof +sekretarz|sekt +senator|sen +sierżant|sierz +starszy bosman|st bosm +strzelec|strz +starszy sierżant|st sierz +starszy sierżant sztabowy|st sierz sztab +starszy strzelec|st strz +święty|swiety|św|sw +wielebny|w +wiceadmirał|wiceadmiral|wiceadm +wiceminister|wicemin \ No newline at end of file diff --git a/data/dictionaries/pl/place_names.txt b/data/dictionaries/pl/place_names.txt new file mode 100644 index 00000000..8ef5956d --- /dev/null +++ b/data/dictionaries/pl/place_names.txt @@ -0,0 +1,29 @@ +akademia|akad +bank +bazylika +biblioteka|bibl|b-ka|bka +biblioteka narodowa|bn +biblioteczka|bczka|b-czka +farmacja|farm +fabryka|f-ka +gimnazjum|gim +gospodarka|gosp +hotel +instytut|inst +katedra +kolejowy|kol +kościół|kosciol +liceum|lic +muzeum +muzeum narodowe|mn +opat|op +organizacja|organ +ośrodek|ośr +parkowa +politechnika +stacja|st +stacja kolejowa|st kol +szkoła +technikum|techn +uniwersytet|u|un|uniw +zakład|zaklad|zakł|zakl \ No newline at end of file diff --git a/data/dictionaries/pl/post_office.txt b/data/dictionaries/pl/post_office.txt new file mode 100644 index 00000000..419dc20f --- /dev/null +++ b/data/dictionaries/pl/post_office.txt @@ -0,0 +1 @@ +skrytka pocztowa|skr poczt \ No newline at end of file diff --git a/data/dictionaries/pl/qualifiers.txt b/data/dictionaries/pl/qualifiers.txt new file mode 100644 index 00000000..b40e15f0 --- /dev/null +++ b/data/dictionaries/pl/qualifiers.txt @@ -0,0 +1,9 @@ +blok|bl +dzielnica|dziel +gmina|gm +kwartał|kwartal|kw +okręg|ok +osiedle|os +wieś +wyspa +województwo|wojewodztwo|woj \ No newline at end of file diff --git a/data/dictionaries/pl/stopwords.txt b/data/dictionaries/pl/stopwords.txt new file mode 100644 index 00000000..e2d67453 --- /dev/null +++ b/data/dictionaries/pl/stopwords.txt @@ -0,0 +1,3 @@ +i +na +koło|k \ No newline at end of file diff --git a/data/dictionaries/pl/street_types.txt b/data/dictionaries/pl/street_types.txt new file mode 100644 index 00000000..a3241ff5 --- /dev/null +++ b/data/dictionaries/pl/street_types.txt @@ -0,0 +1,12 @@ +aleja|al +autostrada +boczna +bulwar +droga +obwodnica +plac|pl +rondo +rynek +szosa +ulica|ul +zaulek \ No newline at end of file diff --git a/data/dictionaries/pl/synonyms.txt b/data/dictionaries/pl/synonyms.txt new file mode 100644 index 00000000..5d86c996 --- /dev/null +++ b/data/dictionaries/pl/synonyms.txt @@ -0,0 +1,19 @@ +administracja|admin|adm +adres|adr +batalion|baon|bn +botanika|bot +bracia|b-cia|bcia +brygada|bryg +centralny|centr +cieśnina|cieśn +dolny|dln +federacja|fed +górny|g +jezioro|jez +narodowy|nar +państwowy|państw +republika|rep +rzeka|rz +siostry|ss +stary|st +szeregowy|szer|szereg \ No newline at end of file diff --git a/data/dictionaries/pl/toponyms.txt b/data/dictionaries/pl/toponyms.txt new file mode 100644 index 00000000..8de95321 --- /dev/null +++ b/data/dictionaries/pl/toponyms.txt @@ -0,0 +1 @@ +warszawa|w-wa|wwa \ No newline at end of file diff --git a/data/dictionaries/pl/unit_types.txt b/data/dictionaries/pl/unit_types.txt new file mode 100644 index 00000000..d3e67abd --- /dev/null +++ b/data/dictionaries/pl/unit_types.txt @@ -0,0 +1,4 @@ +departament|dep +mieszkanie|m +oddział|oddz +pokój|pok \ No newline at end of file