Замена коэффициентов корреляции Пирсона на ранговые коэффициенты корреляции

ПРОДОЛЖИТЕЛЬНОСТЬ ЖИЗНИ ЧЕЛОВЕКА

 

Замена коэффициентов корреляции Пирсона на ранговые коэффициенты корреляции

 

 

Проблема корректной обработки данных

 

Специфика анализа межвидовых различий обусловлена двумя обстоятельствами: неточностью и ненадежностью исходных данных, а также вариацией огромного числа взаимозависимых признаков у разных видов. Как уже отмечалось, точность используемых видовых показателей продолжительности жизни иллюзорна. Поэтому в настоящее время можно с достаточной надежностью оценить лишь ранговое положение видов по долговечности их особей.

 

Так, можно с уверенностью говорить, что человек живет дольше собаки, собака живет дольше морской свинки, морская свинка живет дольше крысы, а последняя живет дольше мыши. Таким образом, надежным является лишь ранговое положение или, попросу говоря, место, которое занимает каждый вид в упорядоченном ряду значений продолжительности жизни.

 

Поэтому корректная обработка подобных данных должна сводиться к расчету именно ранговых коэффициентов корреляции Сгтирмена или Кендалла, а не традиционных коэффициентов корреляции Пирсона, используемых практически во всех современных исследованиях. В результате такой практики ненадежность исходных данных делает сомнительными и конечные результаты расчетов, в то время как использование ранговых коэффициентов корреляции позволило бы получать более устойчивые результаты, менее зависимые от конкретных числовых значений продолжительности жизни.

 

Другим аргументом в пользу замены коэффициентов корреляции Пирсона на ранговые коэффициенты корреляции является наличие выбросов в анализируемых данных. Хорошо известно, что использование коэффициента корреляции Пирсона и оценка доверительных интервалов для него оправданны лишь тогда, когда совместное распределение изучаемых признаков можно хотя бы приближенно считать двумерно нормальным [Айвазян и др., 1985].

 

В случае же межвидовых сопоставлений это условие практически никогда не выполняется, и более того, весьма типична ситуация, когда одна-две точки резко выпадают из общего поля точек. Среди таких выпадающих точек чаще всего бывает точка, относящаяся к человеку (см., например, рис. 25 в работе [Culler, 1984а]). Причины подобных выбросов мы уже обсуждали, отмечая их возможную артефактную природу. В данном случае важно другое: такие резко выпадающие точки при традиционном способе обработки данных способны создать иллюзию сильной связи между изучаемыми переменными, поскольку при этом получаются очень высокие значения коэффициентов корреляции Пирсона.

 

Между тем хорошо известно, что высокие значения коэффициента корреляции в данном случае ничего не доказывают, а подобный анализ данных является типичным примером некорректного исследования [Айвазян и др.. 1985]. Нередко бывает достаточно исключить из рассмотрения одну такую резко выпадающую точку, чтобы "обнаруженная" связь между переменными полностью исчезла. Однако более корректно не исключение данных из анализа, а использование ранговых коэффициентов корреляции, которые устойчивы по отношению к величине отклонения выпадающих точек.

 

Другой недостаток современных методов анализа межвидовых различий состоит в том, что такой анализ обычно ограничивается только попарным сопоставлением переменных, т.е. расчетом парных коэффициентов корреляции. Именно таким образом было проведено большинство исследований, результаты которых отражены в табл. 12—14. Между тем специфика межвидовых различий такова, что сравниваемые виды отличаются по огромному числу признаков, которые к тому же достаточно тесно коррелируют друг с другом.

 

Поэтому связь между продолжительностью жизни и изучаемым признаком может быть не прямой, а косвенной, т.е. обусловленной влиянием выпавшей из анализа третьей переменной на оба изучаемых признака. Поэтому для корректного исследования влияния изучаемого признака на продолжительность жизни необходимо рассчитывать не парные коэффициенты корреляции, а частные коэффициенты корреляции, в которых устранено влияние других признаков на продолжительность жизни.

 

Примером подобного исследования является работа Гарвея и Заммуто [Harvey, Zammuto, 1985], в которой показано, что существует сильная положительная связь между возрастом первой репродукции и продолжительностью жизни в диких условиях (коэффициент корреляции составлял 0,976).

 

Поскольку вес тела также положительно коррелирует с продолжительностью жизни и возрастом первой репродукции, был рассчитан частный коэффициент корреляции между продолжительностью жизни и возрастом первой репродукции при устранении влияния веса тела. Этот коэффициент составил 0,892, что свидетельствует о том, что изучаемая связь между двумя переменными существует и при исключении влияния веса тела. К сожалению, в данном конкретном исследовании авторы использовали традиционный коэффициент корреляции Пирсона, в то время как частные коэффициенты корреляции можно рассчитывать и с помощью рангового коэффициента корреляции Кендалла [Kendall, 1962].

 

 



 

К содержанию книги: Биология продолжительности жизни

 

 

Последние добавления:

 

Биогеронтология. Старение и долголетие человека

 

ПАЛЕОПАТОЛОГИЯ. БОЛЕЗНИ ДРЕВНИХ ЛЮДЕЙ

 

 ГЕОЛОГИЯ БЕЛАРУСИ

 

ВАСИЛИЙ ДОКУЧАЕВ

 

ЗЕМЛЕДЕЛИЕ. ПОЧВОВЕДЕНИЕ. АГРОХИМИЯ