Vraag 13Unieke woorden
2 punten

De taalkundige Gustav Herdan ontdekte een algemeen verband tussen UU en TT voor grotere teksten. Dit verband werd door Harold Stanley Heap bekendgemaakt en wordt de wet van Herdan-Heap genoemd.

De internationale nieuwsdienst Reuters heeft een database – de zogeheten RCV1 – beschikbaar gesteld ten behoeve van taalonderzoek. Onderzoekers hebben voor RCV1 het verband tussen UU en TT bepaald. In figuur 2 is log(U)\log(U) tegen log(T)\log(T) uitgezet.

De grafiek in figuur 2 geeft het werkelijke verband tussen UU en TT in RCV1 en de gestippelde lijn geeft een benadering volgens de wet van Herdan-Heap.

Iemand leest een tekst die bestaat uit de eerste 7432 woorden uit RCV1.

Figuur 1 bij vraag 13
Klik om te vergroten
Figuur 2 bij vraag 13
Klik om te vergroten

Ga met behulp van figuur 2 na of deze tekst voldoet aan de wet van Herdan-Heap.

Maak je uitwerking op papier

Upload daarna een foto voor AI-beoordeling