17 грудня 2010

Свобода і рабство

Існує проект, в якому аналізується частота певних слів в оцифрованих книгах (4% від усіх надрукованих книг). Є навіть додаток Google: Books Ngram Viewer. Ось сайт проекту Culturomics.
Спробував для російських книг з 1900 по 2008 рр. порівняти частоту вживання слів "свобода" і "рабство". Ось так виглядає результат.


Як бачимо, на початку ХХ ст. є чітка кореляція між вживанням цих слів. Причому з 1905 по 1913 рр. частота зменшувалася. А потім десь з 16-17 року почала зростати. І стрімко зростала до 1920 р. Причини зрозумілі і пов'язані з політичними трансформаціями.

Далі за сталінської епохи відбувається стрімке падіння вживання цих слів з мінімумом на початку 1930-х років. Особливо це помітно для слова "свобода".

Друга світова війна викликала підвищення інтересу до проблеми свободи у літературі. Думаю, тут в основному йшлося про свободу від зовнішньої загрози.

Закінчення війни повернуло ситуацію на довоєнний рівень. І частота вживання слів "свобода" та "рабство" повільно зменшувалася до кінця 80-х років, можливо з невеликим "бугорком", який припадає на час смерті Сталіна.

В кінці ХХ-го століття кореляція між вживанням цих понять зникає. "Свобода" частішає, а "рабство" майже не змінюється (хіба зовсім ледве росте). Або ж слово "свобода" більше вживається у філософському сенсі з відривом від свого антоніму, або ж просто слово "рабство" стало "не модним".

Зрозуміле й падіння вживання слова "свобода" на початку путінізму і невелике зростання, яке розпочалося після "Помаранчевої революції" :-) Мабуть що інтерес до проблеми свободи в Росії знову підвищується. Цікаво подивитися у якій формі відбуватиметься подальше зростання, якщо воно звичайно буде.

2 коментарі:

Андрій Корнілов сказав...

помоєму кореляція спостерігається вздовж всього таймлайна. що, в принципі, і не дивно. цікавий інструмент

Олег Суховірський сказав...

Мені все ж здається, що в кінці 20-го сторіччя кореляція досить слабка. Ще дуже сильно на форму кривої впливає вибір зглажування. Я навіть не чекав, що так сильно. Мабуть число, яке вказується для "smoothing " це не зовсім "зглажування" в тому розумінні, яке я звик бачити.