Message from syslogd@localhost : kernel: CPU1: Temperature above threshold
09/12/07 20:00 Filed in: SysAdmin

ผมจึงจัดเอาเครื่องเก่าของลูกค้าอีกราย ซึ่งหมดสัญญาไปแล้ว มาใช้งานแทน
โดยเปลี่ยน HDD ให้ใหม่ และเพิ่มแรมไปเป็น 2GB
Spec เป็น 1U Rack mount
Power Supply 180W
M/B : Intel S875
CPU : P4 @ 3.0GHz
เครื่องนี้ เคยมีปัญหาตั้งแต่ซื้อมาใหม่ๆ คือเครื่องดับ ระหว่างที่ CPU ทำงานหนัก
ทาง ThaiBiz ก็ดำเนินการให้ Supplier ไปแก้ปัญหาให้ ซึ่งสิ่งที่เห็นจากการแก้ปัญหาคราวนั้นคือ
ย้าย Blower จากวางด้านข้าง ให้เป่าลมออกจากเครื่อง มาวางตรงกลาง เพื่อเป่าลมใส่ CPU ตรงๆ แทน
ปัญหานั้นก็หายไป ใช้งานมาเป็นปีๆ
เครื่องนี้นาย mike เคยให้ความเห็นว่า ไม่ชอบวิธีการวางสายไฟ เพราะขวางทางลม และไม่เป็นระเบียบ
ในภาพนี่ เป็นสภาพเมื่อวันรับเครื่อง
วันนี้ก็นำไปเปลี่ยนเสียให้เรียบร้อย
เข้าไปทำงานตั้งแต่ราวๆ บ่ายสอง ใช้เวลาชั่วโมงเศษๆ ก็เสร็จเรียบร้อย
โดยพัดลมตัวใหม่ที่สั่งมา เป็นแบบเป่าลมออกด้านข้าง
มีซิลิโคนแถมมาให้หลอดเล็กๆ หลอดนึง
พอติดตั้งเรียบร้อย ก็มา Monitor จนถึงค่ำ ก็ยังไม่พบ Message ดังกล่าวอีก ผมก็ว่าปัญหาคงจบแล้วล่ะ
พอมีเวลา ก็มานั่งเล็งเจ้าพัดลมของเก่า ว่าทำไมถึงเจ้าปัญหานัก เครื่องอื่นยังไม่รวนเลย
ผมก็เลยพบว่า ...
มันเป็นเพราะ Heat sink มันติดพัดลมกลับข้างครับ
ผมโทรถามนาย mike ว่า ปกติแล้ว เค้าติดพัดลมกันเนี่ย เพื่อ "ดูด" ลมออกใช่ไหม
เพื่อนก็ตอบมาค่อนข้างชัดเจนว่า มันแล้วแต่ Design แต่ส่วนใหญ่จะใช้ดูดออก
ซึ่งปกติแล้ว ถ้า Heat sink เป็นแผ่นทองแดง ไม่ได้เป็นเข็ม ก็จะเป็นการใช้พัดลมดูดความร้อนออก
และถ้าเป็นแบบเข็ม ก็อาจจะพบว่ามีเป่าลมลงอยู่บ้าง
แต่ที่สำคัญคือ มันเป่าปัญหาหายไปได้ ก็น่าจะเป็นการแก้ปัญหาถูกจุดแล้ว
ต่อไป ผมคงทำตามที่คุณเจษฎาแนะนำแน่นอน คือเลือกซื้อ Server Brand ไม่ใช้เครื่องประกอบแล้ว
เพราะชิ้นส่วนหลายชิ้นแล้ว ที่พบว่ามันไว้ใจไม่ได้
แล้วเป็นอีกจุด ที่ชี้ให้ผมเห็นชัดเจนครับ
ว่าผมเลือกใช้ Intel ต่อไปเรื่อยๆ แน่นอน เพราะลากใช้มันมาเป็นปีๆ ทั้งที่มีปัญหาแบบนี้ได้
เครื่องยังไม่พังเลย
ทาง ThaiBiz ก็ดำเนินการให้ Supplier ไปแก้ปัญหาให้ ซึ่งสิ่งที่เห็นจากการแก้ปัญหาคราวนั้นคือ
ย้าย Blower จากวางด้านข้าง ให้เป่าลมออกจากเครื่อง มาวางตรงกลาง เพื่อเป่าลมใส่ CPU ตรงๆ แทน
ปัญหานั้นก็หายไป ใช้งานมาเป็นปีๆ
เครื่องนี้นาย mike เคยให้ความเห็นว่า ไม่ชอบวิธีการวางสายไฟ เพราะขวางทางลม และไม่เป็นระเบียบ
ในภาพนี่ เป็นสภาพเมื่อวันรับเครื่อง

ล่าสุด ผมขุดมันกลับมาใช้ใหม่ โดยจัดระเบียบภายในเครื่องเสียใหม่ ดูทางลมให้ดีกว่าเดิม
ปรับพื้นที่ และจัดสายไฟให้เป็นระเบียบ
แล้วเอาไปวางที่ PI เมื่อสองสัปดาห์ก่อน

หลังจากวางไปได้แค่วันเดียว ก็มีปัญหา ระวางที่ SSH เข้าไปทำงานในเครื่อง ก็มี Message มาจาก OS ว่า
Message from syslogd@localhost : kernel: CPU1: Temperature above threshold
ผมก็เอ๊ะ ปัญหานี้ สงสัยจะเป็นเพราะพัดลม CPU เสื่อมสภาพ ก็ดำเนินการสั่งซื้อมาใหม่

เข้าไปทำงานตั้งแต่ราวๆ บ่ายสอง ใช้เวลาชั่วโมงเศษๆ ก็เสร็จเรียบร้อย
โดยพัดลมตัวใหม่ที่สั่งมา เป็นแบบเป่าลมออกด้านข้าง
มีซิลิโคนแถมมาให้หลอดเล็กๆ หลอดนึง
พอติดตั้งเรียบร้อย ก็มา Monitor จนถึงค่ำ ก็ยังไม่พบ Message ดังกล่าวอีก ผมก็ว่าปัญหาคงจบแล้วล่ะ
พอมีเวลา ก็มานั่งเล็งเจ้าพัดลมของเก่า ว่าทำไมถึงเจ้าปัญหานัก เครื่องอื่นยังไม่รวนเลย
ผมก็เลยพบว่า ...
มันเป็นเพราะ Heat sink มันติดพัดลมกลับข้างครับ

เพื่อนก็ตอบมาค่อนข้างชัดเจนว่า มันแล้วแต่ Design แต่ส่วนใหญ่จะใช้ดูดออก
ซึ่งปกติแล้ว ถ้า Heat sink เป็นแผ่นทองแดง ไม่ได้เป็นเข็ม ก็จะเป็นการใช้พัดลมดูดความร้อนออก
และถ้าเป็นแบบเข็ม ก็อาจจะพบว่ามีเป่าลมลงอยู่บ้าง
แต่ที่สำคัญคือ มันเป่าปัญหาหายไปได้ ก็น่าจะเป็นการแก้ปัญหาถูกจุดแล้ว
ต่อไป ผมคงทำตามที่คุณเจษฎาแนะนำแน่นอน คือเลือกซื้อ Server Brand ไม่ใช้เครื่องประกอบแล้ว
เพราะชิ้นส่วนหลายชิ้นแล้ว ที่พบว่ามันไว้ใจไม่ได้
แล้วเป็นอีกจุด ที่ชี้ให้ผมเห็นชัดเจนครับ
ว่าผมเลือกใช้ Intel ต่อไปเรื่อยๆ แน่นอน เพราะลากใช้มันมาเป็นปีๆ ทั้งที่มีปัญหาแบบนี้ได้
เครื่องยังไม่พังเลย