2015.01.02 06:57
[komunikat] lista wulgaryzmów polskich
Wrzuciłem na stronę (tu: http://czterycztery.pl/slowo/wulgaryzmy/ ) robioną przeze mnie listę wulgaryzmów polskich. Miłej lektury! Będę wdzięczny, jeśli obejrzycie ją i zgłosicie mi (w komentarzach do niniejszego wpisu) ewentualne problemy. Tylko proszę, jeśli tu w komentarzach będziecie używać wulgaryzmów, zakodujcie je w rot13.
komentarze:
2020.05.15 18:13 Marcin
Uuu, szkoda, że nie znałem tej listy, kiedy robiłem https://github.com/MarcinCiura/przetak
Jeśli kiedyś wrócę do Przetaka, będę o niej pamiętał.
2020.05.15 18:27 Piotrek
O, to fajnie, gdybyś ją użył - bo pewnie przy okazji wypatrzyłbyś, czego w niej brakuje.
2021.01.22 23:33 Marcin
Cześć. Poniżej wkleiłem dodatkowe wulgaryzmy z Twojej fajnej listy słów, odsiane najpierw Przetakiem, a potem ręcznie. Mam też roboczą listę słów, które można usunąć z Twojej listy wulgaryzmów.
oheqry
oheqrynpu
oheqrynzv
oheqryr
oheqryrz
oheqryv
oheqrybz
oheqryój
oheqrybjv
oheqryh
pvbg
pvbgn
pvbgą
pvbgnpu
pvbgnzv
pvbgę
pvbgb
pvbgbz
pvbgl
pvcę
qrovy
qrovyn
qrovynpu
qrovynzv
qrovyr
qrovyrz
qrovyv
qrovybz
qrovyój
qrovybjv
qrovyh
qhcę
qhcxvrz
qhcxój
qhcxbjv
qhcxh
qherń
qheav
qheavn
qheavnpu
qheavnzv
qheavr
qheavbz
qheavój
qheavbjv
qheavh
qlzn
vqvbpv
vqvbpvr
vqvbgn
vqvbgą
vqvbgnpu
vqvbgnzv
vqvbgę
vqvbgb
vqvbgbz
vqvbgój
vqvbgl
wro
wronłnol
wronłnolz
wronłnolś
wronłol
wronłolz
wronłolś
wronyvol
wronyvolśpvr
wronyvolśzl
wronłbol
wronłlol
wronłlolśpvr
wronłlolśzl
wronab
wropvr
wropvrż
wrovąp
wrozl
wrozlż
wrożr
xergla
xerglan
xerglanpu
xerglanzv
xerglarz
xerglav
xerglavr
xerglabz
xerglaój
xerglabjv
xerglal
xhej
xheję
avrfenwąpn
avrfenwąpą
avrfenwąprw
cvreqby
cvreqbyąp
cvreqbypvr
cvreqbypvrż
cvreqbyvłnol
cvreqbyvłnolz
cvreqbyvłnolś
cvreqbyvłol
cvreqbyvłolz
cvreqbyvłolś
cvreqbyvyvol
cvreqbyvyvolśpvr
cvreqbyvyvolśzl
cvreqbyvłbol
cvreqbyvłlol
cvreqbyvłlolśpvr
cvreqbyvłlolśzl
cvreqbyzl
cvreqbyzlż
cvreqbybab
cvreqbyżr
fenw
fenwąp
fenwąpn
fenwąpą
fenwąprw
fenwpvr
fenwpvrż
fenwzl
fenwzlż
fenwżr
fenłnol
fenłnolz
fenłnolś
fenłol
fenłolz
fenłolś
fenyvol
fenyvolśpvr
fenyvolśzl
fenłbol
fenłlol
fenłlolśpvr
fenłlolśzl
fenab
gęcnpl
gęcnx
gęcnxn
gęcnxnpu
gęcnxnzv
gęcnxv
gęcnxvrz
gęcnxbz
gęcnxój
gęcnxbjv
gęcnxh
2021.01.23 05:01 Piotrek
Dziękuję, postaram się w weekend dodać je do listy!
2021.01.23 14:35 Marcin
Super. Ja natomiast pracuję nad Przetakiem. Czy możesz podać licencję swojej listy słów i listy wulgaryzmów? I co byś powiedział na zakodowanie listy wulgaryzmów w rot13?
2021.01.23 15:30 Piotrek
Zaproponuj jaką chcesz licencję, a ja się (raczej) zgodzę i napiszę przy liście, że jest dostępna na tej licencji.
Wolę jej nie kodować w rot13, bo wolę mieć roboty mniej niż więcej (chyba że z jakiegoś powodu mocno Ci na tym zależy) - ale oczywiście Ty swoją kopię używaną w Przetaku traktuj jak zechcesz.
2021.01.23 15:37 Piotrek
A swoją drogą, to rozważ, czy w Przetaku zechcesz użyć listę słów (czyli http://czterycztery.pl/slowo/wulgaryzmy/wulgaryzmy.txt), czy też listę regekspów, z których tę listę słów wygenerowałem (czyli).
A może w ogóle zechcesz po prostu przejąć ode mnie tę listę słów, tak żeby ta lista, regekspy, z których została wygenerowana itp stała się integralną częścią Przetaka i Ty byłbyś jej opiekunem, właścicielem itp? Wtedy miałbyś wygodniej, bo jakbyś chciał coś do niej dodać, usunąć, zmienić itp, to nie musiałoby to przechodzić przeze mnie. Ja zaś na stronie http://czterycztery.pl/slowo/wulgaryzmy/ napisałbym informację, że aktualnie ta lista jest częścią programu Przetak, który jest tu-a-tu, więc osoby zainteresowane niech przejdą tam.
2021.01.27 18:38
Dzięki za odpowiedź. Przetakowe wzorce powstają na podstawie dwu list słów: ogólnej i niefajnej*). Teraz użyję do ich tworzenia Twojej fajnej listy słów, a wulgaryzmy i słowa obelżywe wezmę z kilku źródeł. Do Twojej fajnej listy dam jawny link, dzięki czemu Przetak będzie reklamować Twoją stronę, a Twoja strona — Przetak. :) Listę niefajną będę natomiast udostępniać osobom, które o nią poproszą. Zamiast licencji proponuję dla obu Twoich list domenę publiczną, co uprości korzystanie z nich przeze mnie i przez inne osoby.
*) Przetakowe wzorce to piątki kolejnych znaków w zapisie słów oraz punkty przypisane tym piątkom przez regresję logistyczną. Na przykład punkty za słowo "kwiatek" są równe
Punkty("kwia) +
Punkty(kwiat) +
Punkty(wiate) +
Punkty(iatek) +
Punkty(atek").
Punkty za fajne słowa lądują po przeciwnej stronie zera niż punkty za słowa niefajne. Nawet jedno niefajne słowo w tekście działa jak łyżka dziegciu w beczce miodu.
2021.01.27 18:58 P.
Świetnie, odpowiada mi ten plan. Niniejszym umieszczam moją listę wulgaryzmów w domenie publicznej.
Powodzenia z Przetakiem!
powrót na stronę główną
RSS