Согласно этой теории, длина слова отражает количество информации, которую оно содержит. В рамках данного исследования было изучено использование слов на 11 европейских языках. В этих целях были проанализированы субтитры фильмов, содержимое интернет-ресурсов и статистические материалы Google. Оценку информативности слова исследователи проводили исходя из их предсказуемости. То есть слова, наиболее часто встречающиеся в сочетании с комбинацией нескольких других, например, “eat” в “you are what you eat” – содержат наименьшую информационную содержательность. Напротив, если слово имеет наименьшее отношение к этой группе слов, например, “contagious” в “you are contagious” – более содержательны.
Таким образом, результаты исследования показали, что длина около 10% слов действительно варьируется именно от содержательного критерия – показатель сам по себе невысокий, однако, он, по крайней мере, в три раза превышает количество слов, длина которых зависит от частотности употребления.