微軟 從昨天 (7/19)陸續出現服務不穩定情形,包含Microsoft 365、OneNote、OneDrive、SharePoint等服務,甚至不少使用Windows作業系統的PC、數位看板及結帳系統等設備也出現當機 、重啟情況,導致不少使用微軟服務的業者受到影響,而背後原因則是被歸咎在網路安全業者Crowdstrike的端點偵測及回應 (EDR)產品軟體更新所致。
此波影響成為今年目前為止最大網路事故,而CrowdStrike目前僅公告其工程團隊仍在解決問題,但尚未具體說明造成全球性當機的實際原因,以及後續如何解決與何時能將相關問題改善。
不少看法更認為,此波造成影響幾乎等同2000年的「千禧蟲危機」原先預想可能產生衝擊 (註)。
註:「千禧蟲危機」即早期電腦 系統的時間年份僅以後兩位紀錄,因此當時發現一旦進入2000年後,電腦系統年份將會出現被誤判為1900年的情況,當時推測將影響重要產業中的電腦設施執行程式,以及大量社會基礎設施運作,導致城市運作癱瘓,甚至可能造成核電廠發生事故、軍事系統失控等災難影響。最終是經歷規模龐大的修復調整,使得進入2000年時並未引發全球性的電腦系統大規模癱瘓。
而造成此次事故的CrowdStrike,總部位於美國加州,於2011年由George Kurtz、Dmitri Alperovitch與Gregg Marston共同創立,本身為網路安全公司,主要提供客戶端安全防護、威脅分析與事故回應等服務,並且以主動偵測及防禦技術聞名。
造成此次微軟服務全球規模影響,CrowdStrike聲明是其服務更新出錯,其中可能影響微軟Azure雲端服務平台工作負載配置,導致全球各地區的微軟服務、Windows裝置受影響。微軟方面則確認此次問題發生地點位於美國中部的Azure區域資料中心,同時已經著手進行搶修。
至於在此次影響之下,除了不少人反應其使用微軟相關服務均無法正常運作,許多Windows裝置也出現當機、重啟情形,而包含美國航空、聯合航空、台灣虎航、捷星、酷航等航空業者均受到影響,同時諸如台大醫院、台北榮總等醫院電腦系統也都受到影響,但部分情形已經在後續恢復正常運作。
以色列資訊安全公司CyberArk技術長Omer Grossman推估,此次CrowdStrike發生問題可能造成無法透過遠端更新,必須透過手動方式逐一恢復端點問題,因此可會需要幾天時間才能讓整個系統恢復正常,因此CrowdStrike未來幾天的問題分析結果與更新作法將會備受關注。
此次影響最主要是微軟旗下服務受到衝擊,因此並未影響使用Google Cloud、AWS等其他雲端服務,或是採用Mac、Linux等作業系統平台的業者,但由於目前有相當多業者均使用微軟服務,因此受到影響情況依然相當龐大。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》