2023.12.04 07:13
podmianka zmieniająca długi tekst w inny długi tekst

Przyjrzyjmy się napisowi "pies je zupę". Jest to tekst w języku polskim, poprawny gramatycznie i sensowny. Możemy w tym tekście popodmieniać słowa w ten sposób, że:
* każde wystąpienie słowa "pies" zmienię na "kogo"
* każde wystąpienie słowa "je" zmienię na "dziś"
* każde wystąpienie słowa "zupę" zmienię na "widziałeś"
Jak widzisz, dla każdego słowa w tekście źródłowym powiedziałem, na jakie słowo zmienię każde wystąpienie tego słowa - i następnie zastosowałem te podmianki. Tę operację będę nazywał "podmianką".
W efekcie otrzymujemy napis "kogo dziś widziałeś". To też jest tekst w języku polskim, też poprawny gramatycznie i sensowny - ale znaczący coś innego.
Teraz mam serię pytań:
1. Ten tekst był krótki. A czy istnieje jakiś długi tekst, dla którego da się znaleźć taką podmiankę, żeby powstał tekst poprawny gramatycznie (ale znaczący coś innego)?
2. A poprawny gramatycznie i sensowny (ale znaczący coś innego)?
3. A poprawny gramatycznie i sensowny, ale napisany w innym języku (ale znaczący coś innego)?
4. A teraz pytania 1-3, ale nie "czy istnieje jakiś długi tekst ..." tylko "czy dla każdego długiego tekstu ...".
5. A jeśli mogę w podmiance podmieniać jedno słowo na napis składający się z kilku słów?
6. A jeśli mogę w podmiance podmieniać napis składający się z kilku słów na jedno słowo?
7. A jeśli przed podmianką usuwam z tekstu wszystkie nielitery, podmianka może zmieniać dowolne napisy w dowolne napisy (niekoniecznie całe słowa w całe słowa), byleby każda litera napisu źródłowego przeszła przez podmiankę, a następnie po podmiance wstawiam spacje, znaki interpunkcyjne itp tak, jak mi wygodnie?
Dla pytań 1-3 wydaje mi się, że odpowiedź brzmi "nie" - dowodzi tego fakt, że da się nauczyć sztuczną inteligencję tłumaczenia z języka A na język B trenując ją tylko na materiałach w języku A i całkiem innych materiałach w języku B (jak w https://blog.research.google/2023/12/unsupervised-speech-to-speech.html ). Jeśli tak, to odpowiedź na pytanie 4 też brzmi "nie". Ale wtedy jest inne ciekawe pytanie: dla pytań 1-4 jaki jest najdłuższy tekst, dla którego odpowiedź brzmi "tak"?

komentarze:
2023.12.04 07:15 P.

Przy tym ja mam nadzieję, że większość z odpowiedzi brzmi "nie" - bo to daje nadzieję, że kiedyś uda nam się odczytać nawet te teksty starożytne, dla których nie mamy kamienia z Rosetty.


2023.12.05 18:49 P.

Patrz: Harris, Z. S. (1954). Distributional structure. Word, 10, 146–162. https://doi.org/10.1080/00437956.1954.11659520



ksywa:

tu wpisz cyfrę cztery: (tu wpisz cyfrę cztery: (to takie zabezpieczenie antyspamowe))

komentarze wulgarne albo co mi się nie spodobają będę kasował


powrót na stronę główną

RSS