moja strona

Już po samej końcówce polskiego słowa widać, czy będzie łatwo do niego znaleźć rym. Na przykład jest sporo słów z końcówką "-ocy", a dość mało słów z końcówką "-alias". Zrobiłem dziś do tego prostą statystykę. Z mojego słownika rymów wziąłem wszystkie rymujące się pary, zrobiłem z tego zbiór unikatowych słów, z każdego słowa wyciągnąłem końcówkę od ostatniej akcentowanej samogłoski do końca słowa, w każdej końcówce zmieniłem "Ó" w "U", "CH" w "H" a "RZ" w "Ż" (tak, wiem, mógłbym też zmienić "dka" w "tka" i wszystkie takie, ale nie chciało mi się tym razem, to miała być zabawa na jedno popołudnie) no i policzyłem, ile było słów do każdej końcówki. A na koniec posortowałem.

Oto wyniki: plik json z pełnymi statystykami oraz plik csv mówiący tylko, ile słów było dla danej końcówki. A oto program, którym to zbadałem.

Skraje wyników wyszły mi takie:

"AMI",99
"ONY",89
"ANY",76
"AŁA",66
"ONA",65
"OŚCI",52
"EGO",51
"ANIE",50
"ENIA",49
"AŁY",48
(...)
"ITNE",1
"ĄŻKĄ",1
"OZŁ",1
"YDEL",1
"OMPEI",1
"IGSIĘ",1
"ESSE",1
"ARSTWA",1

Ja wiem, że te wyniki to nie jest cała prawda o tym, jak sprawdzić, które słowo łatwo będzie użyć w rymowanym tekście, bo nie uwzględnia na przykład tego, że nie chcemy używać rymów gramatycznych. Ale z czasem dojdę i do tego, pracuję nad większą rzeczą związaną z rymami.