О письмах климатологов
Dec. 7th, 2009 11:12 pmУ одного знакомого в лаборатории шеф провел заседание в связи со скандалом с письмами (лаборатория к климату никакого отношение не имеет). Основная тема: "следите за базаром в е-майлах". С примерами того, чего не надо писать, из реальных писем своих сотрудников. Причем он имел ввиду не то, что надо жульничать, но не писать про это в е-майлах, а то, что многое в их деятельности, будучи вырванным из контекста, выглядит не лучше, чем пресловутые письма климатологов. Например, не надо писать "let's play with these data", или "is there any data analysis trick?", или "нам надо срочно что-то сделать, чтобы убедить всех, что этот довод наших опонентов неверен".
PS. Хотя, честно говоря, из того, что я слышу про эту и подобные лаборатории, не будучи вырваными из контекста, их методы обработки данных тоже не из самых честных. Но не настолько, как может показаться по письмам, и, вроде бы, полностью соответствуют стандартам области.
PS. Хотя, честно говоря, из того, что я слышу про эту и подобные лаборатории, не будучи вырваными из контекста, их методы обработки данных тоже не из самых честных. Но не настолько, как может показаться по письмам, и, вроде бы, полностью соответствуют стандартам области.
no subject
Date: 2009-12-08 10:55 am (UTC)no subject
Date: 2009-12-08 12:43 pm (UTC)no subject
Date: 2009-12-08 05:59 pm (UTC)Относительно обработки данных -- в любом нетривиальном эксперименте/измерении помимо статистической погрешности бывает и т.н. "систематическая". Точно определить ее невозможно. Обработка также может вносить дополнительные отклонения.
no subject
Date: 2009-12-08 09:02 pm (UTC)no subject
Date: 2009-12-09 10:24 pm (UTC)no subject
Date: 2009-12-09 11:57 pm (UTC)нет, это извиняющаяся улыбка, за то, что не согласен :)
Date: 2009-12-11 01:37 pm (UTC)2. "...р=0.05, публикуется" -- в феноменологии это один из самых распространенных способов отбора моделей. не вижу причин, по которым от него надо отказываться
Re: нет, это извиняющаяся улыбка, за то, что не согласен :
Date: 2009-12-11 02:29 pm (UTC)2. Честная сттистика получается, когда сначала выпирают нулевую гипотезу, а потом проводят обработку данных. p=0.05 означает, грубо говоря, что вероятность того, что гипотеза подтвердилась случайно не больше 5%. То есть, опять же грубо говоря, из 20 подтвержденных таким образом гипотез, только одна неверна. Если я сразу проверяю десяток гипотез, то почти половина подтвержденных окажется неверной. Вобще если сначала обработать данные, а потом придумывать гипотезу, то, при должной сноровке, всегда можно что-то придумать. Но статистичискую достоверность полученной гипотезы можно будет проверять только на новых данных, собранных уже после того, как гипотеза была предложена.
no subject
Date: 2009-12-30 07:36 pm (UTC)no subject
Date: 2009-12-30 07:54 pm (UTC)no subject
Date: 2009-12-30 08:03 pm (UTC)no subject
Date: 2009-12-30 08:43 pm (UTC)