DANG ?宕機,有些人讀成雷機,那么咱們必須知道是DANG機
一般指服務器死機,當然一般指計算機莫名其妙原因無法連接。
那么服務器宕機了怎么吧?
1:服務器宕機了,第一件事,就是看是不是藍屏或者死機了,這個時候,你趕快第一時間聯系機房值班幫你重啟服務器,
2:如果重啟還沒解決,那么就比較麻煩,需要密碼進入服務器看是IP問題還是服務器硬件或者軟件故障。
3:如果是硬件或者軟件故障,都是聯系機房幫你更換硬件,或者重啟服務器解決。
4:如果是機房原因,導致IP無法連接,這個也是需要聯系機房解決的。
013年,由于火災、洪水、電力以及軟件更新等熱門事件的發生,引起了眾多數據中心出現停機故障。故障主要覆蓋范圍包括云計算、企業、網絡支付、政府、 州以及相關地方。每起事件都給客戶和終端用戶帶來了不少麻煩。但這也促使我們吸取經驗教訓:完善數據中心和應用程序,使其變得更加可靠。以下分別列出了 2013年的十項重大停機事件:
1.Healthcare.gov:聯邦政府的在線保險網站已經成為IT領域出錯的一個典型事件。這次事件已經不單單是一次簡單的停機事件。該故障導致了一系列的硬中斷和軟中斷,最終使該網站的功能幾乎全部喪失。聯邦政府曾嘗試增加更多硬件設施來做彌補,但該網站在十二月初直到奧巴馬管理的“IT團隊”正確定位軟件和解決數據瓶頸時才恢復其功能。之后,又通過正式成立醫療改革法案以及政治審查,該網站的性能才趨于完備。恢復之后的網站在一些會導致系統崩潰的關鍵點上加強了防備。Healthcare.gov轉換Web站點性能這一這一事件應該是本年度的新聞頭條。
2.BlueHost、HostGator和HostMonster的重大停機事故:2013年8月2日,由位于美國猶他州的數據中心所支持的幾大全球知名品牌遭受停機事故,這也是2013年度波及范圍最廣的一次重大停機事故。該事故是由Endurance 國際集團在猶他州普羅沃的一個設施故障所引起,直接對其客戶BlueHost、HostGator和HostMonster造成了重大影響。此次事件歸因于Endurance服務器常規維護的硬件故障,但卻直接迅速波及整個網絡系統。
3.Visa停機事件橫跨整個加拿大:2013年1月28日當天,Visa卡暫停服務,促使加拿大人民無法進行網絡交易,給當地金融業帶來了巨大的損失。該事故歸因于TSS(Total System Services Inc.)的一個數據中心的崩潰,直接影響到加拿大商業銀行、加拿大皇家銀行以及道明加拿大信托銀行。
4.Xbox One產品艱難發行:2013年11月,Xbox One產品成功發行,這對于協助于權威Xbox Live的Windows Azure云計算服務來說是非常不易的。早前,該平臺一直被各種問題所困擾,其中包括存儲和網絡問題。但這并不是微軟云操作平臺的唯一一次瓶頸。2013年3月,某款軟件的更新失敗直接影響到其數據中心,最終使得微軟的基于Web的電子郵件服務系統中斷,Hotmail與Outlook.com同時離線長達16小時。
5.停機故障導致DreamHost客戶離線:2013年3月20日,虛擬主機提供商DreamHost歷經了一次長時間停機故障。該事故歸因于美國加利福利亞州爾灣的數據中心的電力系統故障。此次停機事故持續兩天,直接給DreamHost的35萬多客戶造成影響。
6.亞馬遜云計算服務未免其難:微軟并不是唯一一家遭受停機故障的云服務商。2013年,亞馬遜出現了幾次非常重大的停機故障,其中最嚴重的一次發生在8月份,這次事故對Amazon.com主頁和AWS雙方都造成了嚴重影響。9月份,連續的網絡問題已經引起了AWS的第十三次停機故障,繼而直接影響到由AWS提供服務的Heroku、Github以及其他網站。早在2012年圣誕前夕,亞馬遜由于一起重大停機故障導致其平臺關閉,這起事件甚至影響到Netflix。而亞馬遜在2013年度的表現相對于2012年來說已經具有顯著提高。
7.數據中心所引發的火災導致美國密歇根離線:2013年4月17日,一場火災直接摧毀了位于美國密歇根州馬科姆縣的數據中心,導致當地IT服務中斷。馬科姆縣位于底特律西部,擁有85萬居民人口。此前,馬克姆縣并沒有備份數據中心,當地官員只能采用筆、紙、復印本以及筆記本電腦試圖為網絡做臨時維護。目前該網絡仍然處于中斷狀態,但新的網絡運營中心有望在近期上線。該州政府和馬克姆社區學院也伸出了救援,幫助其恢復運營。
8.多倫多洪澇災害擊垮科斯數據中心:一場巨大的暴雨導致多倫多遭受洪澇和停電災害,這也給處于全市最大的數據樞紐中心的居民們帶來了不小的挑戰。而多倫多供電公司暫停供電時,位于151街道的一家酒店則采用發電機供電。然而,此次洪澇災害仍然導致了一系列問題,一些數據中心并不能幸免于難。
9.美國新澤西州數據中心停機故障:2013年9月,美國新澤西州的數據中心暫停為一些國家機構服務,包括美國機動車委員會和一些州的官方網站。新西澤為州和當地政府提供的服務記錄中已經存在一條最差記錄,而在2013年1月和8月又連續出現兩次長時間的中斷故障。
10.雅虎艱難度過12月:上周,雅虎郵箱連續四天出現一些功能性問題,而雅虎首席執行官 Marissa Mayer對此已做出道歉。Marissa Mayer說,“本次停機事故比我們想象中的要嚴重很多,我們花了好幾天的時間來恢復系統功能”。雅虎本次事件歸咎于存儲系統一個罕見的硬件故障。
**********6月15日的回答
查詢whois得知,知乎的DNS服務器是http://ns3.dnsv4.com和http://ns4.dnsv4.com(屬于DNSPOD)。
使用Nslookup查詢知乎的DNS解析發現,http://ns3.dnsv4.com沒有響應,http://ns4.dnsv4.com丟包75%,這大概是造成知乎出問題的直接原因。(用戶無法通過域名解析服務找到知乎的服務器)
但是上述兩個域名服務器其實是多地備份的,所以很可能是這兩個域名解析的域名掛了,或者配置數據亂了。
域名服務器: http://ns3.dnsv4.com的地址有:
182.140.167.169(成都電信)
221.204.186.6(太原聯通)
125.39.213.169(天津聯通)
180.153.10.166(上海電信)
119.167.195.8(青島聯通)
183.60.52.217(深圳電信)
115.236.151.140(杭州電信)
184.105.206.73(美國)
183.60.57.179(深圳電信)
上述數據來自網絡,有可能并不準確
知乎主站的地址是 60.28.215.70 / 71,下午一度ping不通,但是直接訪問備用的60.28.215.83可以訪問首頁,登錄后卻無法讀取內容。
同一個網段的知乎日報60.28.215.86 / 87,開始是可以訪問的,后來似乎也不行了。
手機客戶端對應的則是API.zhihu.com: 60.28.215.74 / 75 / 109 / 110 / 122 / 123也一度不能訪問,不過比主站修復的快。
聯系到上周知乎一直訪問不穩定,而且部分地址被解析到Amazon和AliKunlun(亞馬遜和阿里巴巴都有提供CDN以及相應的流量清洗服務),很有可能知乎在遭遇一次比較持久的DoS拒絕服務攻擊。
當然也不排除知乎自己的運維人員或者天津聯通機房的工作人員“誤操作”的可能性。
從架構角度來說,知乎把所有的雞蛋都放在了一個籃子里(同一個機房的同一個網段),其實是風險比較大的,大概是以前并沒有遭遇過成規模的攻擊的原因,以后還是要考慮異地備份。
此外,手機客戶端可以參考QQ的做法,預存IP地址在本地用于DNS出問題時的訪問,平時也減少了DNS解析的時延。
以上純屬猜測,請勿對號入座。