Już po samej końcówce polskiego słowa widać, czy będzie łatwo do niego znaleźć rym. Na przykład jest sporo słów z końcówką "-ocy", a dość mało słów z końcówką "-alias". Zrobiłem dziś do tego prostą statystykę. Z mojego słownika rymów wziąłem wszystkie rymujące się pary, zrobiłem z tego zbiór unikatowych słów, z każdego słowa wyciągnąłem końcówkę od ostatniej akcentowanej samogłoski do końca słowa, w każdej końcówce zmieniłem "Ó" w "U", "CH" w "H" a "RZ" w "Ż" (tak, wiem, mógłbym też zmienić "dka" w "tka" i wszystkie takie, ale nie chciało mi się tym razem, to miała być zabawa na jedno popołudnie) no i policzyłem, ile było słów do każdej końcówki. A na koniec posortowałem.
Oto wyniki: plik json z pełnymi statystykami oraz plik csv mówiący tylko, ile słów było dla danej końcówki. A oto program, którym to zbadałem.
Skraje wyników wyszły mi takie:
"AMI",99 "ONY",89 "ANY",76 "AŁA",66 "ONA",65 "OŚCI",52 "EGO",51 "ANIE",50 "ENIA",49 "AŁY",48 (...) "ITNE",1 "ĄŻKĄ",1 "OZŁ",1 "YDEL",1 "OMPEI",1 "IGSIĘ",1 "ESSE",1 "ARSTWA",1
Ja wiem, że te wyniki to nie jest cała prawda o tym, jak sprawdzić, które słowo łatwo będzie użyć w rymowanym tekście, bo nie uwzględnia na przykład tego, że nie chcemy używać rymów gramatycznych. Ale z czasem dojdę i do tego, pracuję nad większą rzeczą związaną z rymami.