實(shí)例健康診斷項(xiàng)有哪些
實(shí)例健康診斷功能是一種自助診斷方式,可以對(duì)實(shí)例的系統(tǒng)狀態(tài)、網(wǎng)絡(luò)狀態(tài)、磁盤狀態(tài)等進(jìn)行全方位的診斷,幫助您了解實(shí)例健康情況,及時(shí)發(fā)現(xiàn)并解決常見的問題。本文介紹該功能支持的診斷項(xiàng),并提供了詳細(xì)的診斷范圍及建議操作供您參考。
診斷項(xiàng)
實(shí)例健康診斷功能支持以下診斷:
計(jì)算服務(wù)健康診斷:診斷云服務(wù)器ECS底層的資源和虛擬化層,確保ECS底層服務(wù)無異常。
網(wǎng)絡(luò)服務(wù)健康診斷:檢查實(shí)例內(nèi)部網(wǎng)絡(luò)組件狀態(tài),以及外部網(wǎng)絡(luò)環(huán)境異常等情況。
存儲(chǔ)服務(wù)健康診斷:檢查實(shí)例磁盤的運(yùn)行狀態(tài)是否存在異常。
實(shí)例配置管理診斷:檢查實(shí)例在啟動(dòng)過程中或運(yùn)行中,是否被某個(gè)操作阻塞(block)導(dǎo)致實(shí)例無法啟動(dòng)或者運(yùn)行異常。
安全控制健康診斷:檢查實(shí)例關(guān)聯(lián)的所有安全組入方向常見端口的放行狀態(tài)。
費(fèi)用類診斷:檢查實(shí)例本身和實(shí)例關(guān)聯(lián)組件(例如公網(wǎng)IP流量、EIP流量)是否欠費(fèi)。
資源配額診斷:檢查核心資源的使用量是否即將達(dá)到配額上限。
實(shí)例操作系統(tǒng)內(nèi)相關(guān)配置診斷(Linux):檢查實(shí)例操作系統(tǒng)內(nèi)的系統(tǒng)文件、關(guān)鍵進(jìn)程、常用業(yè)務(wù)端口占用狀態(tài)、防火墻狀態(tài)等是否正常。
實(shí)例操作系統(tǒng)內(nèi)相關(guān)配置診斷(Windows):檢查實(shí)例操作系統(tǒng)內(nèi)的常用業(yè)務(wù)端口占用狀態(tài)、防火墻狀態(tài)等是否正常。
說明
計(jì)算服務(wù)健康診斷、網(wǎng)絡(luò)服務(wù)健康診斷、存儲(chǔ)服務(wù)健康診斷、實(shí)例配置管理診斷發(fā)現(xiàn)的異常屬于非實(shí)時(shí)態(tài)異常,診斷結(jié)果會(huì)包括過去12小時(shí)內(nèi)存在過的異常用于查看歷史問題,不一定需要實(shí)時(shí)修復(fù)。安全控制健康診斷、費(fèi)用類診斷、資源配額診斷、實(shí)例操作系統(tǒng)內(nèi)相關(guān)配置診斷發(fā)現(xiàn)的異常屬于實(shí)時(shí)態(tài)異常,在當(dāng)前診斷時(shí)就存在,建議實(shí)時(shí)修復(fù)此類異常。
計(jì)算服務(wù)健康診斷
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
實(shí)例申請(qǐng)資源異常
因CPU或內(nèi)存資源不足,導(dǎo)致實(shí)例無法正常啟動(dòng)。
檢查該實(shí)例所需要的CPU、內(nèi)存等物理資源是否充足。
在需要重新為實(shí)例分配資源時(shí),例如從節(jié)省停機(jī)模式啟動(dòng)實(shí)例,如果因?yàn)閹齑娌蛔銓?dǎo)致物理資源不足,將使實(shí)例無法啟動(dòng)。您可以等待幾分鐘后重新嘗試開機(jī),或者在其他地域或可用區(qū)嘗試重新創(chuàng)建實(shí)例。
實(shí)例操作系統(tǒng)異常
實(shí)例操作系統(tǒng)出現(xiàn)了內(nèi)核Panic、OOM異?;騼?nèi)部宕機(jī)等故障。
檢查該實(shí)例的操作系統(tǒng)(Guest OS)內(nèi)部是否存在內(nèi)核Panic、OOM異?;騼?nèi)部宕機(jī)等故障。
此類故障可能是由于實(shí)例配置不當(dāng)或用戶空間的程序配置不當(dāng)導(dǎo)致的,您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
實(shí)例虛擬化異常
實(shí)例在運(yùn)行中出現(xiàn)崩潰或異常暫停。
檢查該實(shí)例底層虛擬化層核心服務(wù)是否出現(xiàn)異常。
出現(xiàn)此類異常可能會(huì)導(dǎo)致實(shí)例崩潰或出現(xiàn)異常暫停,您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
實(shí)例所在宿主機(jī)告警
實(shí)例所在的物理設(shè)備出現(xiàn)故障告警。
檢查該實(shí)例所在的底層物理機(jī)是否有故障。
如果底層物理機(jī)存在故障,則可能會(huì)影響實(shí)例的運(yùn)行狀態(tài)或性能。您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
實(shí)例性能受限
積分型實(shí)例當(dāng)前處于性能受限模式。
檢查突發(fā)性能實(shí)例的CPU積分余額是否足夠支付維持高性能所需的積分。
如果積分不夠,則該突發(fā)性能實(shí)例在業(yè)務(wù)高峰時(shí)只能使用基準(zhǔn)性能,而無法啟動(dòng)突發(fā)性能。
實(shí)例CPU異常
實(shí)例因CPU爭搶而出現(xiàn)異常,或者獨(dú)享型實(shí)例的CPU綁定失敗。
檢查共享型實(shí)例底層是否存在CPU爭搶。
如果存在CPU爭搶,可能導(dǎo)致該實(shí)例無法獲得CPU或出現(xiàn)其他異常。您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
實(shí)例管控系統(tǒng)異常
ECS實(shí)例后臺(tái)管控系統(tǒng)發(fā)生異常。
檢查該實(shí)例的后臺(tái)管控系統(tǒng)是否正常工作。
如果后臺(tái)管控系統(tǒng)未正常工作,可能會(huì)導(dǎo)致實(shí)例運(yùn)行異常。您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
實(shí)例性能短暫受損
檢查實(shí)例是否受到底層軟硬件問題的影響,導(dǎo)致性能短暫受損。
檢查實(shí)例是否存在因底層軟硬件問題導(dǎo)致的性能受損。
如果存在性能受損,會(huì)提示發(fā)生時(shí)間,請(qǐng)您檢查該實(shí)例的歷史系統(tǒng)事件或者系統(tǒng)日志進(jìn)行確認(rèn)。具體操作,請(qǐng)參見查看歷史系統(tǒng)事件和查看實(shí)例的系統(tǒng)日志和屏幕截圖。
網(wǎng)絡(luò)服務(wù)健康診斷
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
實(shí)例的底層網(wǎng)絡(luò)鏈路存在丟包
實(shí)例對(duì)應(yīng)的底層網(wǎng)絡(luò)物理設(shè)施或網(wǎng)絡(luò)服務(wù)存在丟包。
檢查該實(shí)例的底層網(wǎng)絡(luò)鏈路是否存在丟包現(xiàn)象。
如果存在,將影響實(shí)例的網(wǎng)絡(luò)連通性或網(wǎng)絡(luò)吞吐,例如導(dǎo)致實(shí)例無法遠(yuǎn)程連接,或網(wǎng)速過慢。您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
實(shí)例的網(wǎng)絡(luò)配置不一致
實(shí)例當(dāng)前生效的網(wǎng)絡(luò)配置與底層服務(wù)配置存在不一致。
檢查該實(shí)例的底層網(wǎng)絡(luò)配置是否一致。
如果實(shí)例的底層網(wǎng)絡(luò)配置不一致 ,將影響實(shí)例的網(wǎng)絡(luò)性能。您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
實(shí)例鏈路層異常
實(shí)例網(wǎng)卡鏈路層出現(xiàn)異常。
通過向網(wǎng)卡發(fā)送ARP(地址解析協(xié)議)請(qǐng)求來驗(yàn)證實(shí)例基礎(chǔ)網(wǎng)絡(luò)配置是否正常。
如果請(qǐng)求失敗,則很有可能是實(shí)例未正常啟動(dòng)或網(wǎng)絡(luò)配置有問題,您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
網(wǎng)卡加載異常
實(shí)例的網(wǎng)卡加載異常。
檢查該實(shí)例的網(wǎng)卡是否能正常加載。
如果網(wǎng)卡無法正常加載,將影響實(shí)例的網(wǎng)絡(luò)連通性,例如實(shí)例無法遠(yuǎn)程連接。您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
網(wǎng)卡丟包
網(wǎng)卡入方向或出方向存在丟包現(xiàn)象。
檢查該實(shí)例的網(wǎng)卡入方向或出方向是否存在丟包現(xiàn)象。
如果存在,將影響實(shí)例的網(wǎng)絡(luò)連通性或網(wǎng)絡(luò)吞吐,例如導(dǎo)致實(shí)例無法遠(yuǎn)程連接,或網(wǎng)速過慢。您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
網(wǎng)絡(luò)會(huì)話異常
網(wǎng)卡會(huì)話無法正常建立,或會(huì)話數(shù)超過上限。
檢查該實(shí)例的網(wǎng)卡是否能正常建立會(huì)話。
如果網(wǎng)卡無法建立會(huì)話或已建立的會(huì)話超過限制,將影響實(shí)例的網(wǎng)絡(luò)連通性或網(wǎng)絡(luò)吞吐,例如導(dǎo)致實(shí)例無法遠(yuǎn)程連接,或網(wǎng)速過慢。您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
DDos攻擊的防護(hù)狀態(tài)異常
檢查實(shí)例的公網(wǎng)IP是否受到DDoS攻擊以及防護(hù)狀態(tài)。
檢查該實(shí)例的IP地址是否受到了DDoS攻擊。
阿里云免費(fèi)提供的DDoS原生防護(hù)服務(wù)可以幫您完成一定程度的攻擊流量清洗,緩解DDoS攻擊造成的不可用,但如果攻擊流量已超出您實(shí)例的防護(hù)能力,仍會(huì)導(dǎo)致實(shí)例進(jìn)入不可用狀態(tài),無法正常訪問。更多DDoS攻擊詳情,請(qǐng)參見什么是DDoS攻擊。
您可以視情況購買其他DDoS防護(hù)產(chǎn)品抵御DDoS攻擊,更多信息,請(qǐng)參見如何選擇DDoS防護(hù)產(chǎn)品。
阿里云DDoS預(yù)防最佳方案,請(qǐng)參見緩解DDoS攻擊的最佳實(shí)踐。
網(wǎng)絡(luò)流量達(dá)到實(shí)例網(wǎng)絡(luò)帶寬上限
檢查實(shí)例的網(wǎng)絡(luò)突發(fā)帶寬是否受到限制。
檢查該實(shí)例的突發(fā)網(wǎng)絡(luò)帶寬。
如果突發(fā)網(wǎng)絡(luò)帶寬已超過實(shí)例規(guī)格對(duì)應(yīng)的網(wǎng)絡(luò)突發(fā)帶寬上限,會(huì)導(dǎo)致網(wǎng)絡(luò)性能成為業(yè)務(wù)瓶頸,請(qǐng)您將實(shí)例升級(jí)至網(wǎng)絡(luò)帶寬能力更高的實(shí)例規(guī)格。具體操作,請(qǐng)參見修改實(shí)例規(guī)格。
說明
不同實(shí)例規(guī)格的網(wǎng)絡(luò)突發(fā)帶寬能力,請(qǐng)參見實(shí)例規(guī)格族。
網(wǎng)絡(luò)流量因達(dá)到實(shí)例網(wǎng)絡(luò)帶寬上限而受限
檢查實(shí)例的內(nèi)外網(wǎng)帶寬總量是否達(dá)到該實(shí)例規(guī)格對(duì)應(yīng)的網(wǎng)絡(luò)帶寬上限。
檢查該實(shí)例的內(nèi)外網(wǎng)帶寬總量。
如果帶寬總量已超過實(shí)例規(guī)格對(duì)應(yīng)的網(wǎng)絡(luò)基礎(chǔ)帶寬上限,會(huì)導(dǎo)致網(wǎng)絡(luò)性能成為業(yè)務(wù)瓶頸,請(qǐng)您將實(shí)例升級(jí)至網(wǎng)絡(luò)帶寬能力更高的實(shí)例規(guī)格。具體操作,請(qǐng)參見修改實(shí)例規(guī)格。
說明
不同實(shí)例規(guī)格的網(wǎng)絡(luò)基礎(chǔ)帶寬能力,請(qǐng)參見實(shí)例規(guī)格族。
存儲(chǔ)服務(wù)健康診斷
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
磁盤擴(kuò)容未生效
在控制臺(tái)對(duì)Linux實(shí)例的磁盤擴(kuò)容后,檢查是否需要進(jìn)一步執(zhí)行擴(kuò)容命令。
檢查在控制臺(tái)對(duì)該實(shí)例的磁盤擴(kuò)容后,是否已經(jīng)生效。如果在控制臺(tái)完成了擴(kuò)容操作但實(shí)際沒有生效,需要手動(dòng)執(zhí)行擴(kuò)容命令擴(kuò)容分區(qū)和文件系統(tǒng)。具體操作,請(qǐng)參見步驟一:擴(kuò)容云盤容量。
實(shí)例磁盤IO hang
磁盤IO hang,導(dǎo)致磁盤無法讀寫。
檢查該實(shí)例的系統(tǒng)盤是否存在IO hang的情況(即磁盤內(nèi)的文件系統(tǒng)因讀寫IO延遲過高導(dǎo)致系統(tǒng)不穩(wěn)定或宕機(jī))。
如果出現(xiàn)IO hang,云盤無法進(jìn)行讀寫操作。建議您查看云盤的性能指標(biāo),具體操作,請(qǐng)參見查看云盤監(jiān)控信息。
如果您使用的是Alibaba Cloud Linux 2操作系統(tǒng),檢測(cè)IO hang的操作,請(qǐng)參見檢測(cè)文件系統(tǒng)和塊層的IO hang。
實(shí)例磁盤加載異常
創(chuàng)建或掛載磁盤時(shí)出現(xiàn)錯(cuò)誤。
檢查該實(shí)例在啟動(dòng)時(shí)云盤是否能正常掛載。
如果掛載失敗,則會(huì)導(dǎo)致實(shí)例無法正常啟動(dòng)。請(qǐng)停止實(shí)例后再次啟動(dòng)實(shí)例,或重新掛載云盤,進(jìn)行恢復(fù)。掛載云盤的操作,請(qǐng)參見掛載數(shù)據(jù)盤。
實(shí)例云盤讀寫受限
磁盤IO出現(xiàn)延遲過長,或達(dá)到該云盤類型的IO上限。
檢查該實(shí)例系統(tǒng)盤的讀寫IO是否存在延遲,以及讀寫的IOPS是否超過了該云盤的IOPS上限。
如果云盤讀寫IOPS超過上限,則云盤讀寫將被限制,查看云盤指標(biāo)的操作,請(qǐng)參見查看云盤監(jiān)控信息。
為避免該情況再次發(fā)生,請(qǐng)您降低磁盤的讀寫頻率或升級(jí)為更高性能的云盤類型。各類云盤的讀寫性能指標(biāo),請(qǐng)參見塊存儲(chǔ)性能。
實(shí)例磁盤擴(kuò)縮容異常
磁盤擴(kuò)縮容后,操作系統(tǒng)調(diào)整文件系統(tǒng)的大小失敗。
檢查該實(shí)例的系統(tǒng)盤在擴(kuò)容后,云盤上的文件系統(tǒng)是否也調(diào)整成功。
如果文件系統(tǒng)未成功調(diào)整,表示云盤容量因資源不足或其他原因?qū)е聰U(kuò)容失敗,新擴(kuò)容的磁盤無法使用。請(qǐng)重新發(fā)起擴(kuò)容操作。不同操作系統(tǒng)的擴(kuò)容方法與限制,請(qǐng)參見云盤擴(kuò)容指引。
實(shí)例配置管理診斷
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
實(shí)例啟動(dòng)異常
實(shí)例無法被管控系統(tǒng)正常啟動(dòng)。
檢查該實(shí)例的boot操作是否能正常執(zhí)行加載。
如果實(shí)例無法正常啟動(dòng),您需要?jiǎng)?chuàng)建一個(gè)新的實(shí)例。
實(shí)例核心操作異常
您對(duì)實(shí)例進(jìn)行管理控制的操作執(zhí)行失敗。
檢查您對(duì)該實(shí)例最近執(zhí)行的管理操作,例如開機(jī)、關(guān)機(jī)、升配等是否執(zhí)行成功。
如果執(zhí)行失敗,您需要重新發(fā)起該操作。
實(shí)例鏡像加載異常
實(shí)例所使用的鏡像無法正常加載。
檢查該實(shí)例在啟動(dòng)時(shí)所使用的鏡像是否能正常加載。
鏡像可能因?yàn)橄到y(tǒng)原因、鏡像問題等加載失敗。您可以嘗試通過重啟實(shí)例進(jìn)行恢復(fù)。
安全控制健康診斷
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
安全組入方向常用端口未放開
對(duì)于Windows實(shí)例,檢查安全組的3389端口放開情況;對(duì)于Linux實(shí)例,檢查安全組的22端口放開情況。
檢查該實(shí)例關(guān)聯(lián)的安全組常見端口的放開狀態(tài)。
如果常見端口未放行,可能會(huì)導(dǎo)致部分服務(wù)無法正常運(yùn)行或?qū)嵗裏o法訪問。檢查放行的常見端口如下:
入方向SSH端口(22),需放行。
入方向RDP端口(3389),需放行。
費(fèi)用類診斷
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
檢查包年包月實(shí)例是否已到期
檢查以包年包月方式購買的實(shí)例是否已到期。
如果該實(shí)例是包年包月的計(jì)費(fèi)方式,檢查實(shí)例是否已到期。
到期后,實(shí)例將被關(guān)機(jī)停服,實(shí)例無法訪問。到期后資源狀態(tài)變化,請(qǐng)參見包年包月。您需要續(xù)費(fèi)來恢復(fù)服務(wù),更多信息,請(qǐng)參見續(xù)費(fèi)概述。
檢查按量實(shí)例是否因?yàn)榍焚M(fèi)導(dǎo)致停服
檢查以按量付費(fèi)方式購買的實(shí)例是否因欠費(fèi)被停止而無法使用。
如果該實(shí)例是按量付費(fèi)的計(jì)費(fèi)方式,檢查賬號(hào)是否欠費(fèi)。
欠費(fèi)后,實(shí)例將被關(guān)機(jī)停服,實(shí)例無法訪問。賬號(hào)欠費(fèi)后資源狀態(tài)變化,請(qǐng)參見按量付費(fèi)。您需要充值后重啟才能恢復(fù)實(shí)例。
檢查實(shí)例的組件是否已欠費(fèi)
檢查實(shí)例的云盤或網(wǎng)絡(luò)帶寬是否因賬號(hào)欠費(fèi)而無法正常使用。
檢查包年包月實(shí)例關(guān)聯(lián)的按量付費(fèi)云盤或網(wǎng)絡(luò)帶寬是否因賬號(hào)欠費(fèi)而無法正常使用。
實(shí)例組件欠費(fèi)被停服后,實(shí)例的訪問也將受到影響。您需要充值進(jìn)行恢復(fù)。
資源配額診斷
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
云盤容量配額不足
云盤容量即將達(dá)到限額。
如果當(dāng)前賬戶的云盤容量即將超過配額上限,您可以在ECS管理控制臺(tái)申請(qǐng)?zhí)嵘漕~,具體操作,請(qǐng)參見ECS配額管理。
鏡像數(shù)量配額不足
當(dāng)前賬戶鏡像數(shù)量即將達(dá)到限額。
如果當(dāng)前賬戶的鏡像總數(shù)即將達(dá)到配額上限,請(qǐng)您進(jìn)入云服務(wù)器ECS通用配額列表,單擊當(dāng)前賬戶保有自定義鏡像數(shù)量限額操作列的申請(qǐng),提升鏡像數(shù)量配額。
彈性網(wǎng)卡創(chuàng)建數(shù)達(dá)到上限
當(dāng)前賬戶擁有的彈性網(wǎng)卡(輔助網(wǎng)卡)即將達(dá)到限額。
如果當(dāng)前賬戶的彈性網(wǎng)卡數(shù)量即將超過配額上限,您可以在ECS管理控制臺(tái)申請(qǐng)?zhí)嵘漕~,具體操作,請(qǐng)參見ECS配額管理。
網(wǎng)卡總隊(duì)列數(shù)達(dá)到上限
當(dāng)前實(shí)例使用的網(wǎng)卡隊(duì)列數(shù)已達(dá)到上限。
如果您需要調(diào)整網(wǎng)卡隊(duì)列數(shù),請(qǐng)參見管理網(wǎng)卡多隊(duì)列。
如果實(shí)例的網(wǎng)卡隊(duì)列數(shù)不能滿足您的需求,請(qǐng)升配實(shí)例規(guī)格,更多信息,請(qǐng)參見實(shí)例規(guī)格族和升降配方式概述。
安全組總數(shù)達(dá)到上限
當(dāng)前賬戶創(chuàng)建的安全組數(shù)量即將達(dá)到限額。
如果您的安全組總數(shù)即將達(dá)到配額上限,請(qǐng)您進(jìn)入云服務(wù)器ECS通用配額列表,單擊安全組總數(shù)量上限操作列的申請(qǐng),提升安全組數(shù)量配額。
資源加入安全組達(dá)到上限
當(dāng)前網(wǎng)卡可加入的安全組即將達(dá)到限額。
如果網(wǎng)卡可加入的安全組即將達(dá)到配額上限,您可以在ECS管理控制臺(tái)申請(qǐng)?zhí)嵘漕~,具體操作,請(qǐng)參見ECS配額管理。
如果您調(diào)整了一臺(tái)ECS實(shí)例或彈性網(wǎng)卡可以加入的安全組數(shù)量限制,相應(yīng)的安全組最大規(guī)則數(shù)量也會(huì)發(fā)生變化。更多信息,請(qǐng)參見安全組使用限制。
安全組內(nèi)規(guī)則達(dá)到上限
當(dāng)前安全組內(nèi)的規(guī)則數(shù)即將達(dá)到限額。
如果安全組內(nèi)的規(guī)則數(shù)即將達(dá)到配額上限,您可以在ECS管理控制臺(tái)申請(qǐng)?zhí)嵘漕~,具體操作,請(qǐng)參見ECS配額管理。
如果您調(diào)整了安全組的最大規(guī)則數(shù),您的ECS實(shí)例或彈性網(wǎng)卡可加入的安全組數(shù)量也會(huì)發(fā)生變化。更多信息,請(qǐng)參見安全組使用限制。
實(shí)例操作系統(tǒng)內(nèi)相關(guān)配置診斷(Linux)
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
總CPU使用率過高
實(shí)例當(dāng)前CPU的使用率已經(jīng)超過80%(基于top命令返回的數(shù)據(jù))。
檢查該實(shí)例的總CPU使用率。
如果使用率過高,請(qǐng)您定位使用較多CPU資源的進(jìn)程并判斷是否正常。查詢CPU資源使用情況的操作,請(qǐng)參見Linux系統(tǒng)的ECS實(shí)例CPU使用率或CPU負(fù)載較高問題的排查及解決方案。
disk中inode檢查
檢查Disk中inode是否足夠。
檢查該實(shí)例磁盤的inode使用率。
如果使用率過高,可能會(huì)導(dǎo)致無法在磁盤上創(chuàng)建新的文件,請(qǐng)您根據(jù)需要擴(kuò)容磁盤。具體操作,請(qǐng)參見步驟一:擴(kuò)容云盤容量和離線擴(kuò)容云盤(Linux&Windows)。
DHCP服務(wù)檢查
檢測(cè)DHCP配置情況下,網(wǎng)絡(luò)相關(guān)進(jìn)程是否存在,不存在的情況下可能會(huì)導(dǎo)致網(wǎng)絡(luò)租約到期之后丟失。
檢查該實(shí)例eth0網(wǎng)卡的DHCP服務(wù)進(jìn)程。
如果DHCP服務(wù)進(jìn)程不存在,可能會(huì)導(dǎo)致實(shí)例的IP地址在租約到期后無法續(xù)租,進(jìn)而導(dǎo)致網(wǎng)絡(luò)中斷。開啟DHCP服務(wù)進(jìn)程的方法,請(qǐng)參見Linux實(shí)例中網(wǎng)絡(luò)進(jìn)程異?;虿淮嬖?,導(dǎo)致無法續(xù)租IP地址怎么辦?。
fstab中的設(shè)備檢查
檢查fstab中的設(shè)備是否存在。
檢查該實(shí)例的/etc/fstab文件。
如果/etc/fstab文件中配置了不存在的設(shè)備,可能會(huì)導(dǎo)致實(shí)例無法啟動(dòng)。移除/etc/fstab文件中不存在設(shè)備的方法,請(qǐng)參見如何移除Linux實(shí)例“/etc/fstab”文件中不存在的塊設(shè)備。
fstab中的設(shè)備掛載狀態(tài)檢查
檢查fstab設(shè)備是否正確掛載。
檢查該實(shí)例的/etc/fstab文件。
如果/etc/fstab文件中設(shè)備未配置自動(dòng)掛載,會(huì)導(dǎo)致實(shí)例啟動(dòng)后無法直接使用設(shè)備。請(qǐng)您執(zhí)行mount命令手動(dòng)掛載設(shè)備,或在/etc/fstab文件中配置自動(dòng)掛載。配置磁盤自動(dòng)掛載的方法,請(qǐng)參見Linux實(shí)例中存在未正確掛載的云盤,如何處理?。
fstab文件的格式檢查
檢查fstab內(nèi)容格式是否正確。
檢查該實(shí)例的/etc/fstab文件。
如果/etc/fstab文件中存在格式錯(cuò)誤,可能會(huì)導(dǎo)致實(shí)例無法啟動(dòng)。修改/etc/fstab文件格式的方法,請(qǐng)參見啟動(dòng)實(shí)例時(shí)提示Give root password for maintenance或Press xxx to continue該如何處理?。
系統(tǒng)防火墻狀態(tài)檢查
檢查系統(tǒng)防火墻是否打開。
檢查該實(shí)例的防火墻。
如果實(shí)例開啟了防火墻,并設(shè)置了屏蔽外界訪問的規(guī)則,可能會(huì)導(dǎo)致無法遠(yuǎn)程連接實(shí)例。開啟和關(guān)閉防火墻的方法,請(qǐng)參見開啟或關(guān)閉Linux實(shí)例中的系統(tǒng)防火墻
系統(tǒng)文件狀態(tài)檢查
檢查關(guān)鍵系統(tǒng)文件狀態(tài)。
fsck診斷發(fā)現(xiàn)實(shí)例的文件系統(tǒng)存在異常,可能會(huì)導(dǎo)致部分?jǐn)?shù)據(jù)丟失,進(jìn)而導(dǎo)致實(shí)例無法訪問等問題。
檢查并修復(fù)文件系統(tǒng)的方法,請(qǐng)參見Linux實(shí)例的文件系統(tǒng)檢查與修復(fù)。
limits設(shè)置檢查
檢查limits設(shè)置是否正確。
檢查該實(shí)例的/etc/security/limits.conf文件。
如果/etc/security/limits.conf文件中nofile的值過大,可能會(huì)導(dǎo)致無法遠(yuǎn)程連接實(shí)例。修改limits系統(tǒng)參數(shù)的方法,請(qǐng)參見Linux實(shí)例調(diào)整limits文件中nofile參數(shù)值的方法。
內(nèi)存設(shè)置檢查
檢查大頁內(nèi)存設(shè)置是否過大。
檢查該實(shí)例的/etc/sysctl.conf文件。
如果/etc/sysctl.conf文件中設(shè)置的大頁內(nèi)存數(shù)量和大頁內(nèi)存值過大,會(huì)導(dǎo)致大頁內(nèi)存(大頁內(nèi)存數(shù)量*大頁內(nèi)存值)超過總內(nèi)存。調(diào)整大頁內(nèi)存的方法,請(qǐng)參見調(diào)整Linux實(shí)例大頁內(nèi)存的方法。
常見業(yè)務(wù)端口監(jiān)聽狀態(tài)檢查
檢查常見業(yè)務(wù)端口(例如22和3389)是否處于監(jiān)聽狀態(tài)。
檢查該實(shí)例的常見業(yè)務(wù)端口。
如果端口未處于監(jiān)聽狀態(tài),可能會(huì)導(dǎo)致不能訪問實(shí)例上的應(yīng)用。檢查并修改常見業(yè)務(wù)端口的方法,請(qǐng)參見Linux實(shí)例啟動(dòng)常見服務(wù)并查詢端口監(jiān)聽狀態(tài)的方法。
CPU使用率超過50%的進(jìn)程
實(shí)例當(dāng)前CPU的使用率已經(jīng)超過50%(基于top命令返回的數(shù)據(jù))。
檢查該實(shí)例中進(jìn)程的CPU使用率。
如果一些進(jìn)程的CPU使用率過高,請(qǐng)您判斷進(jìn)程是否正常。檢查CPU使用率的方法,請(qǐng)參見Linux系統(tǒng)的ECS實(shí)例CPU使用率或CPU負(fù)載較高問題的排查及解決方案。
單個(gè)CPU使用率過高
單個(gè)CPU的使用率超過85%(基于top命令返回的數(shù)據(jù))。
檢查該實(shí)例的單個(gè)CPU在一段時(shí)間內(nèi)的使用率。
如果單個(gè)CPU的使用率過高,請(qǐng)您定位使用較多CPU資源的進(jìn)程并判斷是否正常。檢查CPU使用率的方法,請(qǐng)參見Linux系統(tǒng)的ECS實(shí)例CPU使用率或CPU負(fù)載較高問題的排查及解決方案。
系統(tǒng)關(guān)鍵進(jìn)程啟動(dòng)狀態(tài)檢查
檢查系統(tǒng)關(guān)鍵進(jìn)程是否啟動(dòng)。
檢查該實(shí)例的系統(tǒng)關(guān)鍵進(jìn)程。
如果系統(tǒng)關(guān)鍵進(jìn)程處于未運(yùn)行狀態(tài),可能會(huì)導(dǎo)致實(shí)例無法訪問。啟動(dòng)常見進(jìn)程的方法,請(qǐng)參見Linux實(shí)例啟動(dòng)常見服務(wù)并查詢端口監(jiān)聽狀態(tài)的方法。
NAT環(huán)境內(nèi)核參數(shù)檢查
檢查NAT環(huán)境內(nèi)核參數(shù)是否正確。
檢查該實(shí)例內(nèi)與NAT環(huán)境相關(guān)的內(nèi)核參數(shù)配置。
如果NAT環(huán)境相關(guān)的內(nèi)核參數(shù)配置存在異常,會(huì)導(dǎo)致無法通過SSH連接實(shí)例,以及訪問實(shí)例上的HTTP服務(wù)時(shí)出現(xiàn)異常。請(qǐng)您檢查并調(diào)整/etc/sysctl.conf中的net.ipv4.tcp_tw_recycle和net.ipv4.tcp_timestamps參數(shù)的取值。修復(fù)NAT環(huán)境內(nèi)核參數(shù)的方法,請(qǐng)參見Linux系統(tǒng)內(nèi)核配置問題導(dǎo)致NAT環(huán)境訪問實(shí)例出現(xiàn)異常。
TCP SACK設(shè)置檢查
檢查TCP SACK是否開啟。
檢查該實(shí)例是否開啟了TCP SACK。
如果未開啟TCP SACK,可能會(huì)影響實(shí)例的網(wǎng)絡(luò)性能。開啟TCP SACK的方法,請(qǐng)參見Linux實(shí)例開啟TCP SACK的方法。
檢查操作系統(tǒng)是否OOM
檢查操作系統(tǒng)是否OOM。
檢查該實(shí)例的操作系統(tǒng)是否發(fā)生了OOM(Out of Memory)問題。
如果發(fā)生了OOM問題,請(qǐng)您檢查實(shí)例當(dāng)前的可用內(nèi)存大小是否足以支撐實(shí)例上運(yùn)行的業(yè)務(wù),并在必要時(shí)升級(jí)配置提升實(shí)例內(nèi)存。分析OOM根因并解決OOM問題的方法,請(qǐng)參見如何處理Linux實(shí)例中的OOM問題?。
系統(tǒng)關(guān)鍵文件格式檢查
檢查系統(tǒng)關(guān)鍵文件格式。
檢查該實(shí)例的系統(tǒng)關(guān)鍵文件格式是否為Unix格式。
如果系統(tǒng)關(guān)鍵文件格式錯(cuò)誤(不是Unix格式),可能會(huì)導(dǎo)致無法遠(yuǎn)程連接實(shí)例。修改系統(tǒng)文件格式的方法,請(qǐng)參見Linux實(shí)例中修改文件為Unix格式的方法。
selinux狀態(tài)檢查
檢查SELinux是否開啟。
檢查該實(shí)例是否開啟了SELinux服務(wù)。
如果開啟了SELinux服務(wù),會(huì)導(dǎo)致SSH遠(yuǎn)程連接實(shí)例時(shí)報(bào)錯(cuò),請(qǐng)您視情況選擇臨時(shí)或永久關(guān)閉SELinux服務(wù)。關(guān)閉SELinux服務(wù)的方法,請(qǐng)參見Linux實(shí)例中由于SELinux服務(wù)開啟導(dǎo)致SSH遠(yuǎn)程連接異常。
系統(tǒng)關(guān)鍵用戶狀態(tài)和密碼設(shè)置檢查
檢查關(guān)鍵系統(tǒng)用戶(Linux系統(tǒng)檢查root賬號(hào)、Windows系統(tǒng)檢查Administrator賬號(hào))的密碼是否存在等。
檢查該實(shí)例操作系統(tǒng)的關(guān)鍵系統(tǒng)用戶。
如果不存在關(guān)鍵系統(tǒng)用戶,可能會(huì)導(dǎo)致無法登錄實(shí)例。請(qǐng)您檢查/etc/passwd中關(guān)鍵系統(tǒng)用戶的狀態(tài)和密碼設(shè)置情況。檢查關(guān)鍵系統(tǒng)用戶的方法,請(qǐng)參見Linux實(shí)例中關(guān)鍵的系統(tǒng)用戶不存在。
SSH訪問權(quán)限檢查
檢查SSH的訪問權(quán)限配置是否正確。
檢查該實(shí)例的SSH訪問權(quán)限配置。
如果SSH訪問權(quán)限配置不正確,可能會(huì)導(dǎo)致無法登錄實(shí)例。修改SSH訪問權(quán)限的方法,請(qǐng)參見SSH的訪問權(quán)限異常導(dǎo)致無法遠(yuǎn)程連接Linux實(shí)例。
SSH關(guān)鍵文件系統(tǒng)檢查
檢查SSH訪問所需要的關(guān)鍵文件或目錄是否存在。
檢查該實(shí)例中SSH服務(wù)所需的關(guān)鍵文件或目錄。
如果SSH服務(wù)所需的關(guān)鍵文件或目錄不存在,可能會(huì)導(dǎo)致無法SSH登錄實(shí)例。修復(fù)SSH服務(wù)所需的關(guān)鍵文件或目錄的方法,請(qǐng)參見檢查Linux實(shí)例是否存在SSH服務(wù)所需的必備文件或目錄。
SSH是否允許root用戶登錄檢查
檢查SSH配置是否允許root用戶連接。
檢查SSH配置是否允許root用戶連接。
如果禁止使用root用戶登錄實(shí)例,會(huì)導(dǎo)致使用root用戶登錄實(shí)例時(shí)返回Permission denied, please try again錯(cuò)誤。修復(fù)root用戶登錄實(shí)例報(bào)錯(cuò)的問題,請(qǐng)參見通過SSH客戶端登錄Linux實(shí)例時(shí)提示“Permission denied, please try again”錯(cuò)誤怎么辦?。
網(wǎng)卡多隊(duì)列開啟狀態(tài)檢查
網(wǎng)卡多隊(duì)列是否開啟。
檢查該實(shí)例的網(wǎng)卡是否開啟了網(wǎng)卡多隊(duì)列特性。
如果未開啟網(wǎng)卡多隊(duì)列特性,可能會(huì)影響實(shí)例網(wǎng)絡(luò)性能。開啟網(wǎng)卡多隊(duì)列的方法,請(qǐng)參見管理網(wǎng)卡多隊(duì)列。
實(shí)例操作系統(tǒng)內(nèi)相關(guān)配置診斷(Windows)
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
診斷項(xiàng)(控制臺(tái))
描述
診斷范圍及建議操作
Windows操作系統(tǒng)的版本檢查
微軟已經(jīng)不再維護(hù)Windows Server 2008及之前的版本。
檢查該實(shí)例的Windows系統(tǒng)版本。
阿里云和微軟不再維護(hù)Windows Server 2008及之前的版本,請(qǐng)您視情況重裝更高版本的Windows系統(tǒng)。實(shí)例重裝系統(tǒng)的方法,請(qǐng)參見更換操作系統(tǒng)(系統(tǒng)盤)。
總CPU的使用率過高
檢查Windows CPU使用率總體超過85%。
檢查該實(shí)例的CPU使用率。
如果CPU總使用率過高,請(qǐng)您定位使用較多CPU資源的進(jìn)程并判斷是否正常。檢查CPU使用率的方法,請(qǐng)參見Windows系統(tǒng)ECS實(shí)例中CPU使用率較高問題的排查及解決方案。
單CPU使用率過高
檢查單CPU使用率超過80%。
檢查該實(shí)例的CPU使用率。
如果單個(gè)CPU的使用率過高,請(qǐng)您定位使用較多CPU資源的進(jìn)程并判斷是否正常。檢查單個(gè)CPU使用率的方法,請(qǐng)參見Windows系統(tǒng)ECS實(shí)例中CPU使用率較高問題的排查及解決方案。
內(nèi)存使用率偏高
檢查Windows系統(tǒng)內(nèi)存使用率是否超過80%。
檢查內(nèi)存的使用率是否超過80%。
如果該實(shí)例當(dāng)前內(nèi)存的總使用率已經(jīng)超過80%,會(huì)列出內(nèi)存使用率排名前5的進(jìn)程,請(qǐng)檢查對(duì)應(yīng)進(jìn)程是否正常。分析Windows內(nèi)存使用率過高的具體操作,請(qǐng)參見Windows系統(tǒng)內(nèi)存分析工具的介紹。
Windows常用業(yè)務(wù)端口占用狀態(tài)檢查
檢查Windows系統(tǒng)的3389端口是否開放。
檢查該實(shí)例的3389端口。
如果未開啟3389端口,會(huì)導(dǎo)致無法使用遠(yuǎn)程桌面連接RDP服務(wù)訪問實(shí)例。開啟3389端口允許遠(yuǎn)程桌面連接的方法,請(qǐng)參見Windows實(shí)例如何啟動(dòng)遠(yuǎn)程桌面連接RDP服務(wù)。
Windows系統(tǒng)網(wǎng)卡狀態(tài)檢查
檢查Windows網(wǎng)卡是否打開。
檢查該實(shí)例的網(wǎng)卡。
如果網(wǎng)卡處于不可用狀態(tài),會(huì)導(dǎo)致無法遠(yuǎn)程連接實(shí)例。檢查并修復(fù)網(wǎng)卡狀態(tài)的方法,請(qǐng)參見Windows實(shí)例中系統(tǒng)網(wǎng)卡處于不可用狀態(tài)。
網(wǎng)卡IPv4地址檢查
檢查Windows系統(tǒng)網(wǎng)卡是否已獲得IPv4地址。
檢查網(wǎng)卡是否已經(jīng)獲取到IPv4地址。
如果網(wǎng)卡未獲取到IPv4地址,可能會(huì)導(dǎo)致服務(wù)無法訪問。請(qǐng)檢查該實(shí)例是否已啟用DHCP服務(wù)或配置靜態(tài)IP地址。開啟DHCP服務(wù)的具體操作,請(qǐng)參見如何在工作組中安裝和配置DHCP服務(wù)器。
系統(tǒng)網(wǎng)絡(luò)代理狀態(tài)檢查
檢查系統(tǒng)是否設(shè)置了網(wǎng)絡(luò)代理信息。
檢查系統(tǒng)是否設(shè)置了網(wǎng)絡(luò)代理。
如果設(shè)置了網(wǎng)絡(luò)代理,可能會(huì)導(dǎo)致服務(wù)無法正常訪問,請(qǐng)根據(jù)業(yè)務(wù)需要選擇是否關(guān)閉這些網(wǎng)絡(luò)代理。Windows系統(tǒng)關(guān)閉網(wǎng)絡(luò)代理的具體操作,請(qǐng)參見如何重置你的Internet Explorer代理設(shè)置。
DHCP配置狀態(tài)檢查
檢查Windows系統(tǒng)網(wǎng)卡的DHCP服務(wù)是否開啟
檢查網(wǎng)卡上DHCP服務(wù)的狀態(tài)。
如果網(wǎng)卡上的DHCP服務(wù)處于關(guān)閉狀態(tài),可能會(huì)導(dǎo)致服務(wù)無法訪問,請(qǐng)根據(jù)業(yè)務(wù)需要調(diào)整對(duì)應(yīng)網(wǎng)卡的DHCP配置。Windows配置DHCP服務(wù)的具體操作,請(qǐng)參見如何在工作組中安裝和配置 DHCP 服務(wù)器。
Windows虛擬磁盤驅(qū)動(dòng)狀態(tài)檢查
檢查VirtIO驅(qū)動(dòng)的版本。
檢查該實(shí)例的VirtIO驅(qū)動(dòng)版本。
如果VirtIO驅(qū)動(dòng)版本過低,會(huì)導(dǎo)致實(shí)例磁盤無法在線擴(kuò)容。升級(jí)VirtIO版本的方法,請(qǐng)參見更新Windows實(shí)例的virtio驅(qū)動(dòng)。
磁盤容量檢查
檢查系統(tǒng)C盤容量是否小于1 GB。
檢查該實(shí)例系統(tǒng)盤(C盤)的可用空間。
如果可用空間小于1 GB,可能會(huì)導(dǎo)致系統(tǒng)運(yùn)行緩慢,甚至實(shí)例無法啟動(dòng),請(qǐng)您根據(jù)需要擴(kuò)容磁盤。具體操作,請(qǐng)參見步驟一:擴(kuò)容云盤容量和離線擴(kuò)容云盤(Linux&Windows)。
Windows防火墻狀態(tài)檢查
檢查Windows防火墻的狀態(tài)是否為打開狀態(tài)。
檢查該實(shí)例的防火墻狀態(tài)。
如果防火墻處于開啟狀態(tài),可能會(huì)導(dǎo)致無法訪問實(shí)例上的服務(wù),請(qǐng)視情況調(diào)整防火墻的相關(guān)策略配置。配置防火墻策略的方法,請(qǐng)參見Windows Server系統(tǒng)的ECS實(shí)例防火墻策略的配置方法。
crash dump配置狀態(tài)檢查
檢查系統(tǒng)是否開啟了crash dump信息采集。
檢查是否開啟了采集crash dump信息。
如果未開啟采集crash dump信息,當(dāng)系統(tǒng)出現(xiàn)異常重啟或藍(lán)屏?xí)r,無法保存相關(guān)信息進(jìn)行故障排查,請(qǐng)根據(jù)業(yè)務(wù)需要選擇是否要開啟采集crash dump信息。Windows開啟采集crash dump信息的具體操作,請(qǐng)參見Windows系統(tǒng)異常重啟以及藍(lán)屏的處理方法。
Administrator賬號(hào)檢查
檢查Administrator賬號(hào)是否存在。
檢查是否存在Administrator賬號(hào)。
如果不存在Administrator賬號(hào),可能會(huì)導(dǎo)致服務(wù)無法正常訪問,請(qǐng)根據(jù)業(yè)務(wù)需要選擇是否要?jiǎng)?chuàng)建Administrator賬號(hào)。Windows系統(tǒng)創(chuàng)建賬號(hào)的具體操作,請(qǐng)參見如何使用管理控制臺(tái)添加或刪除管理員。
相關(guān)知識(shí)
產(chǎn)前診斷有哪些項(xiàng)目
產(chǎn)前診斷:檢查哪些項(xiàng)目?
哪些情況需要做羊水診斷
生活中人工智能的應(yīng)用實(shí)例有哪些?
健康體檢有哪些項(xiàng)目
狗狗健康檢查的項(xiàng)目有哪些
男性健康體檢有哪些項(xiàng)目
做好產(chǎn)前診斷 守護(hù)生命健康
遠(yuǎn)程問診有哪些實(shí)現(xiàn)方式?
健康體檢有哪些項(xiàng)目?
網(wǎng)址: 實(shí)例健康診斷項(xiàng)有哪些 http://www.u1s5d6.cn/newsview805896.html
推薦資訊
- 1發(fā)朋友圈對(duì)老公徹底失望的心情 12775
- 2BMI體重指數(shù)計(jì)算公式是什么 11235
- 3補(bǔ)腎吃什么 補(bǔ)腎最佳食物推薦 11199
- 4性生活姿勢(shì)有哪些 盤點(diǎn)夫妻性 10425
- 5BMI正常值范圍一般是多少? 10137
- 6在線基礎(chǔ)代謝率(BMR)計(jì)算 9652
- 7一邊做飯一邊躁狂怎么辦 9138
- 8從出汗看健康 出汗透露你的健 9063
- 9早上怎么喝水最健康? 8613
- 10五大原因危害女性健康 如何保 7826