The Zipf Mystery

3669

image

In het Engels is “the” het meest gebruikte woord in teksten. Het tweede woord op de ranglijst “of” komt de helft minder voor (1/2). Het derde woord “and” 1/3 van de frequentie van nr 1 etc… In natuurlijke taal is de “frequentie van voorkomen van een woord ruwweg omgekeerd evenredig met de rang van het woord in de frequentietabel.” Dit wordt de Wet van Zipf genoemd naar de ontdekker van dit fenomeen George Kingsley Zipf. Bron: www.wikipedia.org

In het volgende filmpje gaat Michael op zoek naar een verklaring voor dit Zipf-mysterie:


Comments are closed.