首頁 資訊 三行情書:線性回歸分析快速成文法

三行情書:線性回歸分析快速成文法

來源:泰然健康網(wǎng) 時(shí)間:2024年12月02日 17:38

第29天 線性回歸分析的快速成文法

在第28講,我們介紹了利用tableone開展生存分析,快速形成文章,不知道看完之后有什么樣的感受? R語言原來可以這么簡(jiǎn)單地幫助我們。今天我們?cè)谖覀冐灤┦冀K的數(shù)據(jù)庫(kù)elder1、elder2進(jìn)行線性分析。

一、準(zhǔn)備工作

首先我們將導(dǎo)入數(shù)據(jù)

t1<-read.csv("elder1.csv")

t2<-read.csv("elder2.csv")

可以查看數(shù)據(jù)

str(t1)

str(t2)

再則我們啟動(dòng)重要的數(shù)據(jù)包dplyr

library(dplyr)

現(xiàn)在我們通過dplyr的join函數(shù)把兩個(gè)數(shù)據(jù)庫(kù)進(jìn)行合并

tt<-inner_join(t1,t2,by="ID")

str(tt)

合并產(chǎn)生的數(shù)據(jù)庫(kù)我們把它保存起來,這樣下次我們可以再利用。

write.csv(tt,file ="tt.csv")

然后,當(dāng)然 要導(dǎo)入tableone與broom包備用

library(tableone)  

library(broom)

二、本講的案例

我們還是按照第25講的案例,分別探討影響自評(píng)健康的因素,自評(píng)健康在數(shù)據(jù)庫(kù)中的變量為health, 影響因素包括血壓、血糖、體重指數(shù)、性別、戶籍、文化程度、婚姻狀況、生活方式、睡眠。

雖然這個(gè)案例非常爛,但是很容易理解。到底對(duì)于老年而言,什么因素對(duì)健康自評(píng)影響最大呢?由于我們的結(jié)局health為定量數(shù)據(jù),且研究因素很多,一般我們會(huì)開展線性回歸分析,而且是逐步回歸分析方法。當(dāng)然在回歸分析之前,也要做一些其它工作,才能形成一片論文。

具體的統(tǒng)計(jì)分析策略包括

1) 開展統(tǒng)計(jì)描述 描述人群的基本特征

2) 進(jìn)行差異性比較,篩選P值較小者納入回歸分析模型(P<0.2)

3)開展多因素線性回歸分析

三、進(jìn)行數(shù)據(jù)整理

數(shù)據(jù)整理工作并非什么新鮮事,但是卻是最重要的

1.新變量產(chǎn)生

#利用dplyr包mutute語句產(chǎn)生新變量體重指數(shù)bmi

tt<-mutate(tt, bmi=weight/(height^2)*10000)

2.變量的轉(zhuǎn)換

變量轉(zhuǎn)換的內(nèi)容很多,對(duì)于 研究因素為定量的變量,可以直接作為定量納入回歸分析,也可以進(jìn)行分組轉(zhuǎn)換,這里轉(zhuǎn)成二分類或者多分類。部分程序如下。

血糖的轉(zhuǎn)換

tt$sugar1<-ifelse(tt$sugar>7.0,1,0)

bmi的轉(zhuǎn)換

> tt$ bmi1 [tt$ bmi <=18.5]<-1

> tt$bmi1[is.na(tt$ bmi)==T]<-NA

> tt$bmi1[tt$ bmi >=28]<-4

> tt$ bmi1 [tt$ bmi >=24 & tt$ bmi <28]<-3

> tt$ bmi1 [tt$ bmi >=18.5 & tt$ bmi <24]<-2

> tt$ bmi1 [tt$ bmi <=18.5]<-1

> tt$bmi1[is.na(tt$ bmi)==T]<-NA

> table(tt$bmi1)

  1    2    3    4

血壓的轉(zhuǎn)換

> tt$pressure [tt$SBP>=140 | tt$DBP>=90]<-1

> tt$pressure [tt$SBP< 140 & tt$DBP< 90]<-0

> table(tt$pressure)

  0    1

2514 1517

分類變量的轉(zhuǎn)換

又比如我們對(duì)income的變量進(jìn)行進(jìn)一步的歸類,本例是8類的分組變成3組。

> tt$income1<-tt$income

> tt$income1[tt$income>=6]<-3

> tt$income1[tt$income>=3 & tt$income<=5]<-2

> tt$income1[tt$income<=2]<-1

> table(tt$income1)

  1    2    3

%1 1098  288

3.變量批量因子化

# 把所有該納為因子的但還沒有的統(tǒng)一轉(zhuǎn)為因子(分組變量)

varsToFactor <- c("sex","huji","education","marriage","income1","smoking","drinking","exercise","sleep","sugar1","pressure","bmi1")

tt[varsToFactor] <- lapply(tt[varsToFactor], factor)

str(tt)

4.部分變量需要對(duì)照組進(jìn)行重新設(shè)置,bmi1、marriage

tt$marriage<-factor(tt$marriage, levels = c(2,1,3,4,5))

tt$bmi1<-factor(tt$bmi1, levels = c(2,1,3,4))

5.剔除缺失記錄

tt1<-na.omit(tt) # 剔除缺失值的記錄

注意:這是為了操作方便采用的簡(jiǎn)單粗暴的方法,實(shí)際R語言運(yùn)作中,可以采用更溫和的方法來處理。

四、影響自評(píng)的健康的影響因素研究

現(xiàn)在結(jié)合R語言、tableone包開展線性回歸三行成文章。

1. 不同人群自評(píng)健康得分的差異性比較

Tableone 目前無法直接有函數(shù)搞定定量數(shù)據(jù)的差異性,但鄭老師有辦法,我們先搞個(gè)自編函數(shù)吧

function1<-function(x,y,z){

 table2<-c(1:6)

 dim(table2)<-c(3,2)

 for (i in 1 :length(y)){

   tableOne <- CreateTableOne(vars = x, strata = y[i],data = z)

   table1<-print(tableOne,showAllLevels = TRUE)

   tx<-t(table1)

   table2<-rbind(table2,tx)

 }

 return(table2)

}

現(xiàn)在就可以了, 這結(jié)果是國(guó)內(nèi)首創(chuàng)哦!

tx<-function1(c("health"),c("sex","huji","education1","marriage","income1","smoking","drinking","exercise","sugar1","pressure","bmi1"),tt1)

write.csv(tx,file="tablexx.csv") #形成統(tǒng)計(jì)分析的excel表

2.線性回歸分析

我們構(gòu)建tt1數(shù)據(jù)中有一個(gè)health變量,這是患者健康自評(píng)得分,為定量數(shù)據(jù),我們可以開展健康自評(píng)的影響因素研究。多因素線性回歸利用自帶函數(shù)lm( )函數(shù)構(gòu)建

lm.log<-lm(health~pressure+sugar1+bmi1+sex+huji+education1+marriage+income1+smoking+drinking+exercise ,data = tt1)

lm.step<-step(lm.log)

table31<-ShowRegTable(lm.step, exp = FALSE, digits = 2, pDigits = 3,

         printToggle = TRUE, quote = FALSE, ciFun = confint)

table32<-tidy(lm.step)

table3<-cbind(table31,table32) #table31 table32是兩個(gè)結(jié)果,現(xiàn)在合并成一個(gè)總表

write.csv(table3,file="table3.csv") # 數(shù)據(jù)導(dǎo)出

上述兩表就是利用tableone快速形成的表格,你看還不錯(cuò)吧!

更多閱讀

1.給所有R語言初學(xué)者的幾點(diǎn)建議 | 寫在R語言公益培訓(xùn)班順利結(jié)束后

2.“30天學(xué)會(huì)R語言”系列推文開啟:一起來關(guān)注學(xué)習(xí)吧

3.【資源**】精選R語言入門學(xué)習(xí)資源:視頻+文檔,初學(xué)者者必備!

相關(guān)知識(shí)

輕醫(yī)美市場(chǎng)快速增長(zhǎng),監(jiān)管下的醫(yī)療美容需回歸“醫(yī)療本質(zhì)”
羊水監(jiān)測(cè)護(hù)墊法快速診斷胎膜早破的可行性分析研究
人體成分分析實(shí)驗(yàn)報(bào)告.pptx
醫(yī)療美容市場(chǎng)快速擴(kuò)容:回歸醫(yī)療本質(zhì),完善人才建設(shè)
1分鐘減肥法 快速恢復(fù)魔鬼曲線
2023 年全國(guó)健身市場(chǎng)回歸,健身行業(yè)發(fā)展?jié)摿薮?/a>
醫(yī)美消費(fèi)應(yīng)回歸理性
人體成分分析儀
雅思大作文范文分析
如何進(jìn)行健康快速減肥?..

網(wǎng)址: 三行情書:線性回歸分析快速成文法 http://www.u1s5d6.cn/newsview215160.html

推薦資訊