Často kladené dotazy

Jak to funguje?

V podstatě vezmu nějakej vzorek textu (právě teď to jsou  http://www.henryklahola.nazory.cz/Cirkev.htmhttp://www.henryklahola.nazory.cz/Snatek.htmhttp://www.henryklahola.nazory.cz/Duse.htmhttp://www.henryklahola.nazory.cz/Intelektual.htm ) a zbavím ho veškerejch věcí, který s vlastním textem nemají nic společnýho (HTML, Javascript). Co zbyde se rozseká na slova a z nich se udělá model N-gramů, což je něco jako zjištění všech kombinací ntic slov v textu (ngramům se dvěma slovama se říká bigram a se třema trigram) a jejich frekvencí. Na základě toho modelu se pak vygeneruje text. Na začátek textu se používá prvních pár ntic modelu. To není úplně ideální, takže generuju ještě jeden krátkej text a počáteční slova beru z něj.

Proč to děláš?

Jsem fanouškem JUDr.PhDr.Mgr. et Mgr.Henryka Laholy.

A kdo to je?

Aha. No asi bych bejt tebou začal na týhle stránce (po slovensky stránke). A potom už se můžeš klidně pustit do pročítání Henrykových listů psaných nejen česky, po slovensky jakožto i v  dalších indoevropských jazycích, Martine.

Co je "Lahola lite"?

Lahola lite používá k vygenerování textu bigramy namísto trigramů (viz. předchozí).

Proč je to tak ošklivý?

Nemám čas ani grafický cítění. Pokud bys měl hezkej grafickej návrh, určitě se ozvi.

Jsou tyhle stránky nevládní?

Samozřejmě.

Podporuješ homosexuálce?

Jasně, Martine.

Kolik máš titulů?

Zatím mám jedináčka a není z Karlovy University (v Praze!).

Asi se nudíš, viď?

Jo.

Hele, chci udělat něco podobnýho...

Kostra těhle stránek bylo víceméně tohle. Jinak zdroják Laholátoru najdeš taky na GitHubu. Klidně si posluž.

Martine?

Martine!

text JUDr.PhDr.Mgr. et Mgr.Henryk Lahola, prgačina starenka L.P. MMXI, jede na Flask & NLTK
Už jsme vyhenrykovali 45472 listůch.