Николай _
22
All posts from Николай _
Николай _ in Mikola – последний из комонян,

Про твиттеры, доуджонсы, журналисты и копипастеры

Ну правда, достали уже с этим копипастом про якобы опубликованную работу о том, что настроения твиттера предсказывают изменение индекса Доу-Джонса. Мне интересно кто-нибудь из копипастеров оригинальный текст хотя бы смотрел? Для справки - электронная статься на arxiv.org не является полноценной научной публикацией. Обычно туда скидывают все, что ни попадя, в надежде на то, что когда-нибудь работу опубликует солидный журнал и приоритет будет спорным.

Беглый просмотр показал.

Настроения твиттера измеряются пятью различными численными характеристиками. Только две из них на статистике около 150 дней более-менее коррелируют с изменениями американского индекса.

Далее сравниваются несколько предсказательных моделей, наиболее интересные из которых следующие:

1. D(i)=a+cD(i-1)+dD(i-2)+eD(i-3)

2. D(i)=a+cD(i-1)+dD(i-2)+eD(i-3)+fX(i-1)+gX(i-2)+hX(i-3)

Где D(i) изменение индекса в день i, X(i) - один из измерителей настроений твиттера в день i.

Первая модель (только по предыдущим значениям изменения индекса)  дает правильный прогноз направления с вероятностью 73,3 % . Вторая (с использованием ценовых данных и данных твиттера) с вероятностью 86,7 %.

Я думаю, что ребята сразу круто ошиблись, поскольку получить вероятность 73,3 для индекса с использованием только ценовых данных можно в двух случаях

1. Недостаточной статистики.

2. Использования средних цен, вместо цен закрытия.

Авторы не указали какие именно цены они предсказывали. Подозреваю, что средние, что в принципе не интересно. Банальная модель взятия предыдущего направления средней цены даст вероятность 60-65 %. Для практики этот прогноз не имеет никакого смысла.

Кроме того они ничего не написали про модель, в которой прогнозными факторами выступало бы только настроение твиттера. Опять же думаю, что они ее исследовали, но публиковать не стали, ибо результаты плачевны.

Далее они дали своей статье скандальное и интригующее название. Журналисты прочитав скандальное название начали копипастить куда ни попадя.  Копипастеры продолжили.

 

Вот и вся история.