Jiří Milička

Research interests

 • Arabic
 • corpus linguistics
 • quantitative linguistics

Membership

 • Od poloviny roku 2014 člen redakční rady Journal of Quantitative Linguistics

Bibliography

Articles (more here and here)

 • Type-token & Hapax-token Relation: A Combinatorial Model. In Glottotheory 2/1 . 2009, pp. 99–110. (Dostupné zde)
 • Knihtisk v dějinách islámské kultury. In Nový Orient 64/2. 2009, pp. 42–46. (Dostupné zde, nekrácená verze zde)
 • Budování česko-arabského paralelního korpusu. In Mnohojazyčný korpus Intercorp: Možnosti studia. Praha 2010, pp. 221–225.
 • A Combinatorial Method for a Context Comparison. In Issues in Quantitative Linguistics 2. Lüdenscheid 2011, pp. 104–110.
 • Valency and Information Structure: A quantitative approach to from – to juxtaposition in Arabic. In Proceedings of CLC 2011
 • (S Janem Chromým) Experimentální zkoumání stylotvorných faktorů: první výstupy. In Naše řeč 95/4. 2012, pp. 181–186.
 • Minimal Ratio: An Exact Metric for Keywords, Collocations etc. In Czech and Slovak Linguistic Review 1/12. 2012, pp. 62–70.
 • Rank-frequency Relation & Type-token Relation: Two Sides of the Same Coin. In: Ivan Obradović, Emmerich Kelih and Reinhard Kohler (Eds). Methods and Applications of Quantitative Linguistics. University of Belgrade and Academic Mind. 2013, pp. 163–172.
 • (S Miroslavem Kubátem) Vocabulary Richness Measure in Genres. In: Journal of Quantitative Linguistics 4/20. 2013, pp. 339–349.
 • Menzerath’s Law: The whole is greater than the sum of its parts. In: Journal of Quantitative Linguistics 2/21. 2014, pp. 85–99.
 • (S Petrem Zemánkem) Quotations, Relevance and Time Depth: Medieval Arabic Literature in Grids and Networks. In: 14th Conference of the European Chapter of the Association for Computational Linguistics. 2014, pp. 17–24. (Dostupné zde)
 • (S Georgiem Mikrem) Distribution of the Menzerath’s Law on the Syllable Level in Greek texts. In: Empirical Approaches to Text and Language Analysis. RAM-Verlag Lüdenscheid, 2014, pp. 181–189.
 • Konfidenční intervaly v empirické lingvistice. In: Lingvistika Praha 2014.
 • (S Petrem Zemánkem) Ranking Search Results for Arabic Diachronic Corpora. Google-like search engine for (non)linguists. In Proceedings of CITALA 2014 (5th International Conference on Arabic Language Processing).
 • Is the Distribution of L-Motifs Inherited from the Word Lengths Distribution? In: Sequences in Language and Text. 2015. De Gruyter Mouton, pp 133–146.
 • Synergetic linguistics: Do we need better explanatory mechanism? Glottotheory. 6/2. 2015, pp. 291–298.
 • Is Menzerath’s Law a consequence of segment inventory inhomogeneity? Czech and Slovak Linguistic Review. 2/2015. 2016, pp 62–71.
 • (S Petrem Zemánkem) Restricted Collocability and its Use in Arabic Corpus Linguistics. In Gloria Corpas Pastor (Ed.): Computerised and Corpus-based Approaches to Phraseology: Monolingual and Multilingual Perspectives [zde]. Editions Tradulex, Geneva. 2016. pp 69–80.
 • Key Length Motifs in Czech and Arabic Texts. In Emmerich Kelih, Róisín Knight, Ján Mačutek, Andrew Wilson (Eds.): Studies in Quantitative Linguisitcs 23. RAM – Verlag. 2016. pp 27–42.
 • (S Vojtěchem Diatkou) The Effect of Iconicity Flash Blindness – An Empirical Study. In Dimensions of Iconicity. John Benjamins. 2017.
 • (S Janem Mačutkem a Radkem Čechem) Menzerath-Altmann Law in Syntactic Dependency Structure. In Proceedings of the Fourth International Conference on Dependency Linguistics (Depling 2017). ACL series. Dostupné zde, celý sborník zde.
 • (S Patrickem Juolou a Petrem Zemánkem) Authorship and Time Attribution of Arabic Texts Using JGAAP. In: Intelligent Natural Language Processing: Trends and Applications. 2018, Springer International Publishing AG.

Software (more here)

 • Zumky: Komunikační nástroj pro všechny, kteří si váží svého času, klidu a soukromí.
 • KeyWorder: Program pro rozpoznávání klíčových slov v textu pomocí minimálního poměru.
 • TypeTokener: Program, který měří type-token relation, hapax-token relation atd. zvoleného textu a následně pomocí změřené distribuce typů tyto veličiny zpětně modeluje.
 • ThematicConcentration: Program, který měří tematickou koncentraci zvoleného textu.
 • Lexicographers‘ Calculator Program pro plánování rozsahu korpusu.
 • Tinfi: Program, který označuje části textu, jež z něj vyčnívají.
 • BlackSquare: Program pro jednoduché (nejen) lingvistické experimenty.

Translations

 • Muntasir al-Qaffáš: On. In Antologie moderních arabských povídek. Praha 2011, pp 93-97.
 • (Přeloženo s Annou Humlovou) Alí ad-Du’áží: Po hospodách kolem Středozemního moře. Praha, Malvern 2013, 76 s.

Stáže

 • 4/2013–6/2013 Stáž na Univerzitě v Trieru.
 • 10/2013–11/2013 Stáž na Národní a Kapodistrijské univerzitě v Athénách.

Vědecké granty

 • 2012-2013 Vícejazyčný korpus dialogů zachycující procesuální vrstvu jazyka (Grantová agentura Univerzity Karlovy)
 • 2014-2015 Empirický výzkum arbitrárnosti v jazyce (vnitřní grant FF UK)

Výuka

 • Arabština a korpus
 • Úvod do kvantitativní lingvistiky

Conferences

 • 9/2017 (S Janem Mačutkem a Radkem Čechem) Referát a poster Menzerath-Altmann Law in Syntactic Dependency Structure na konferenci Depling (Pisa).
 • 5/2017 (S Hanou Kalábovou) Referát Vowel Disharmony in Czech: Description and Explanation na konferenci Linguistics Prague.
 • 3/2017 Referát From – To Construction in Arabic and Czech na konferenci Word Order and Information Structure: a Cross- and Intra-Linguistic Perspective (Olomouc; zvaná).
 • 2/2017 Referát Menzerathův-Altmannův zákon: adorovaný model podivného vztahu na kolokviu Kritické pohledy na Menzerathův-Altmannův zákon (Ostrava; zvaná).
 • 8/2016 (S Karolínou Vyskočilovou) Referát Models of noisy channels that speech gets over na konferenci QUALICO (Trier).
 • 12/2015 (S Petrem Zemánkem) Referát Methods and Linguistic Theories na Digital Arabic and Persian Research Workshop (Leipzig; zvaná).
 • 11/2015 Poster From Linguistic Theory to an Effective Quotation Extraction Algorithm na symposiu Methods and Linguistic Theories (MaLT 2015) (Bamberg).
 • 10/2015 (S Vojtěchem Diatkou) Referát Můžou se neikonická slova někdy chovat jako ikonická? na konferenci Lingvistika Praha.
 • 7/2015 (S Petrem Zemánkem) Poster Hypertextualizer. Quotation Extraction Software na konferenci Corpus Linguistics 2015 (Lancaster).
 • 7/2015 (S Vojtěchem Diatkou) Poster The Iconicity of the „Non-Iconic Words“ and its Effects on the Language Processing na 12th International Symposium of Psycholinguistics (Valencia).
 • 6/2015 (S Petrem Zemánkem) Referát Restricted Collocability and its Use in Arabic Corpus Linguistics na konferenci EUROPHRAS 2015 (Malaga).
 • 3/2015 (S Vojtěchem Diatkou) Referát Are Iconic Words Statistically more Iconic than Non-Iconic Ones? A New Method of Testing na 10th International Symposium on Iconicity in Language and Literature (Tübingen).
 • 6/2014 Referát Three Models for the Menzerath’s Law na konferenci QUALICO (organizováno IQLA).
 • 5/2014 Referát Konfidenční intervaly v empirické lingvistice na konferenci Lingvistika Praha.
 • 4/2014 (S Petrem Zemánkem) Referát Quotations, Relevance and Time Depth: Medieval Arabic Literature in Grids and Networks na konferenci EACL v Göteborgu organizovaná Association for Computational Linguistics.
 • 7/2012 Referát Rank-frequency Relation & Type-token Relation: Two Sides of the Same Coin na konferenci QUALICO.
 • 7/2011 Referát Valency and the Information Structure. A Quantitative Approach na Corpus Linguistics Conference v Birminghamu.
 • 4/2011 (S Petrem Zemánkem) Referát Arabic Plurals in Context. A Corpus Study na Workshop on Arabic Corpus Linguistics v Lancasteru.
 • 9/2009 Referát Budování česko-arabského paralelního korpusu na konferenci Intercorp v Praze.
Úvod > Academic staff > Jiří Milička