
Как пишет «Лента.ру», работа основана на корпусе текстов, полученном компанией Google в процессе оцифровки книг. Он охватывает около пяти миллионов произведений, написанных начиная с 1520 года по настоящее время.
Как стало извествно, ученые анализировали, как список самых часто встречающихся в текстах фраз меняется от года к году. Оказалось, что наиболее древние тексты сильнее всего отличаются друг от друга. Например, десятка самых часто встречающихся фраз в книгах, изданных в 1600 году, могла совершенно не совпадать с такой же десяткой из книг 1610 года.
Однако, на рубеже восемнадцатого и девятнадцатого столетий в употреблении фраз произошла достаточно резкая стабилизация. Ученые объясняют это процессами самоорганизации, которые выражаются в возрастании предпочтительного связывания лексем друг с другом. Условно говоря, слова, которые часто употребляются вместе, со временем образуют устойчивое словосочетание (что можно наблюдать и для других явлений - рreferential attachment).
Самыми часто употребляемыми фразами в английском языке за последние 50 лет стали такие словосочетания как «the end of the» (в конце), «at the same time» (в то же время; вместе с тем), и «the United States of America» (Соединенные Штаты Америки).
Исследование опубликовано в журнале Journal of the Royal Society Interface.