2021.01.20 13:22 plik tekstowy z wersjami alternatywnymi

Czasem jak się robi OCR, to program oceerujący nie jest pewien, czy litera, którą widzi, to (przykładowo) "a" czy "o" - i musi wybrać, co ma wstawić w plik tekstowy, który jest wynikiem oceerowania. Ale jeśli ten wynik oceerowania ma potem służyć nie do czytania dla człowieka ale do przeszukiwania, to byłoby dobrze, gdyby programy oceerujące umiały zapisywać wynik swojego działania w formacie, w którym mogłyby być alternatywne wersje. Coś w stylu "We wsi B(a|o)bino zdechła (koza|kura)". I żeby potem były narzędzia umiejące to przeszukiwać, tak że jeśli szukam słowo "Bobino" to żeby znalazło.

komentarze:

ksywa:

tu wpisz cyfrę cztery: (to takie zabezpieczenie antyspamowe)

komentarze wulgarne albo co mi się nie spodobają będę kasował


powrot na strone glowna

RSS