ความช่วยเหลือ MON เกี่ยวกับคำจำกัดความบริการ นี่เป็นขั้นตอนที่สองและสุดท้ายสำหรับการกำหนดค่า MON
ค่าเริ่มต้นจะปรากฏขึ้นสำหรับบริการที่บังคับ . ดูหัวข้อวิธีใช้ที่เกี่ยวข้องด้านล่างเพื่อรับความช่วยเหลือเพิ่มเติมเกี่ยวกับข้อกำหนดบริการ สำหรับ "mail.alert" ตรวจสอบให้แน่ใจว่า sendmail ได้รับการกำหนดค่าและ "sendmail" deamon เริ่มทำงานบน hostmachine
คำจำกัดความบริการ
- servicename บริการ
- คำจำกัดความของบริการเริ่มต้นด้วยคำสำคัญที่ ให้บริการ ตามด้วยคำที่เป็นแท็กสำหรับบริการนี้
ส่วนประกอบของบริการคือช่วงเวลาจอภาพและคำจำกัดความช่วงเวลาอย่างน้อยหนึ่งคำนิยามดังต่อไปนี้
หากมีการกำหนดชื่อบริการของ "ค่าเริ่มต้น" ภายในกลุ่มการเฝ้าดูที่เรียกว่า "dafault" (ดูด้านบน) การกำหนดค่าเริ่มต้น / ค่าเริ่มต้นจะใช้สำหรับการจัดการกับดักจันทร์ที่ไม่รู้จัก
- ช่วง timeval
- ช่วงเวลาของ คำหลักตามด้วยค่าเวลาระบุความถี่ที่สคริปต์การตรวจสอบจะถูกเรียกใช้ ค่าเวลาถูกกำหนดเป็น "30s", "5m", "1h" หรือ "1d", หมายถึง 30 วินาที, 5 นาที, 1 ชั่วโมงหรือ 1 วัน ส่วนที่เป็นตัวเลขอาจเป็นเศษส่วนเช่น "1.5h" หรือหนึ่งชั่วโมงครึ่ง รูปแบบของการกำหนดเวลานี้จะถูกเรียกว่า timeval
- traptimeout timeval
- คำหลักนี้ต้องใช้เวลาเดียวกันอาร์กิวเมนต์สเปคเป็นช่วงเวลาและทำให้การบริการคาดหวังกับดักจากแหล่งภายนอกอย่างน้อยที่มักจะล้มเหลวอื่นจะถูกลงทะเบียน สิ่งนี้ใช้สำหรับการบริการแบบ heartbeat
- trapduration timeval
- หากได้รับกับดักสถานะของบริการที่ส่งไปยังกับดักโดยปกติจะคงที่ หาก trapduration มีการระบุสถานะของบริการจะยังคงอยู่ในสถานะที่ล้มเหลวในช่วงระยะเวลาที่ระบุโดย timeval และจากนั้นมันจะถูกรีเซ็ตเป็น "ความสำเร็จ"
- timeval randskew
- แทนที่จะกำหนดเวลาสคริปต์การตรวจสอบเพื่อให้ทำงานในช่วงเริ่มต้นของแต่ละช่วงเวลาให้ปรับช่วงเวลาที่ระบุโดยพารามิเตอร์ ช่วงเวลา โดยการสุ่มบวกหรือลบ randskew ค่า skew ถูกระบุเป็นพารามิเตอร์ ช่วงเวลา : "30s", "5m", ฯลฯ ... ตัวอย่างเช่นถ้า ช่วงเวลา เป็น 1m และ randskew คือ "5s" จากนั้น จันทร์ จะกำหนดเวลาสคริปต์การตรวจสอบทุก ๆ 55 วินาทีและ 65 วินาที จุดประสงค์คือช่วยกระจายโหลดบนเซิร์ฟเวอร์เมื่อมีการกำหนดบริการหลายอย่างในช่วงเวลาเดียวกัน
- monitor monitor-name [หาเรื่อง ... ]
- การ ตรวจสอบ คำหลักที่ตามด้วยชื่อสคริปต์และข้อโต้แย้งระบุจอภาพที่จะทำงานเมื่อจับเวลาหมดอายุ ข้อตกลงการอ้างข้อความเหมือนเชลล์จะถูกติดตามเมื่อระบุอาร์กิวเมนต์ที่ส่งไปยังสคริปต์การตรวจสอบ สคริปต์ถูกเรียกใช้จากไดเร็กทอรีที่กำหนดด้วยอาร์กิวเมนต์ -s และคำต่อไปนี้ทั้งหมดจะถูกส่งเป็นอาร์กิวเมนต์ของโปรแกรมตรวจสอบตามด้วยรายการโฮสต์ในกลุ่มที่อ้างอิงโดยกลุ่มการเฝ้าดูปัจจุบัน ถ้าจอภาพสิ้นสุดลงด้วย ";;" เป็นคำแยกกลุ่มโฮสต์จะไม่ได้ผนวกเข้ากับรายการอาร์กิวเมนต์เมื่อมีการเรียกใช้โปรแกรม
- allow_empty_group
- ตัวเลือก allow_empty_group จะอนุญาตให้มีการเรียกใช้จอภาพแม้ในขณะที่กลุ่มโฮสต์สำหรับการเฝ้าดูนั้นว่างเปล่าเนื่องจากโฮสต์ที่ถูกปิดใช้งาน พฤติกรรมเริ่มต้นจะไม่เรียกใช้จอภาพเมื่อโฮสต์ทั้งหมดในกลุ่มโฮสต์ถูกปิดใช้งาน
- คำ อธิบาย
- คำอธิบาย ข้อความต่อไปนี้ถูกสอบถามโดยโปรแกรมไคลเอนต์ส่งผ่านไปยังการแจ้งเตือนและตรวจสอบผ่านตัวแปรสภาพแวดล้อม ควรมีคำอธิบายสั้น ๆ ของบริการเหมาะสำหรับการรวมไว้ในอีเมลหรือบนเว็บเพจ
- lude_hosts host [host ... ]
- โฮสต์ใด ๆ ที่อยู่ในรายการหลัง excluse_hosts จะถูกแยกออกจากการตรวจสอบบริการ
- ไม่รวมช่วง เวลาพิเศษ
- อย่าเรียกใช้จอภาพที่มีกำหนดการในช่วงเวลาที่ระบุโดย periodspec
- ขึ้นอยู่กับ แสดงออก
- คีย์เวิร์ดการ พึ่งพา ถูกใช้เพื่อระบุนิพจน์การพึ่งพาซึ่งประเมินว่าเป็นจริงของเท็จในความหมายบูลีน การอ้างอิงเป็นนิพจน์ Perl จริงและต้องปฏิบัติตามกฎการสร้างประโยคทั้งหมด นิพจน์จะถูกประเมินในพื้นที่แพ็กเกจของตนเองเพื่อไม่ให้เกิดผลข้างเคียงที่ไม่พึงประสงค์ หากพบข้อผิดพลาดทางไวยากรณ์เมื่อประเมินผลนิพจน์นั้นจะถูกบันทึกผ่าน syslog
ก่อนการประเมินผลการแทนที่ในการแสดงออกต่อไปนี้เกิดขึ้น: วลีที่มีลักษณะเหมือน "กลุ่ม: บริการ" จะถูกแทนที่ด้วยค่าสถานะการทำงานปัจจุบันของบริการที่ระบุนั้น การทดแทน opstatus เหล่านี้จะถูกคำนวณซ้ำดังนั้นหากบริการ A ขึ้นอยู่กับบริการ B และบริการ B ขึ้นอยู่กับบริการ C ดังนั้นบริการ A ขึ้นอยู่กับบริการ C. สถานะการดำเนินงานที่ประสบความสำเร็จ (ซึ่งประเมินเป็น "1") คือ "STAT_OK", "STAT_COLDSTART "," STAT_WARMSTART "และ" STAT_UNKNOWN " คำว่า "SELF" (ในตัวพิมพ์ใหญ่ทั้งหมด) สามารถใช้สำหรับกลุ่ม (เช่น "SELF: service") และเป็นตัวย่อสำหรับกลุ่มนาฬิกาปัจจุบัน
คุณลักษณะนี้สามารถใช้เพื่อควบคุมการแจ้งเตือนสำหรับบริการที่ขึ้นอยู่กับบริการอื่น ๆ เช่นการทดสอบ SMTP ซึ่งขึ้นอยู่กับเครื่องที่สามารถเข้าถึงการ ping ได้
- dep_behavior {a | m}
- การประเมินกราฟอ้างอิงสามารถควบคุมการปราบปรามของการแจ้งเตือนหรือตรวจสอบการร้องขอ
การแจ้งเตือนการปราบปราม หากตัวเลือกนี้ถูกตั้งค่าเป็น "a" การแสดงออกของการพึ่งพาจะถูกประเมินหลังจากที่จอภาพสำหรับบริการออกหรือหลังจากที่ได้รับกับดัก การแจ้งเตือนจะถูกส่งเมื่อการประเมินผลสำเร็จหมายความว่าไม่มีโหนดใดในกราฟที่ขึ้นต่อกันบ่งบอกถึงความล้มเหลว
การตรวจสอบการปราบปราม ถ้ามันถูกตั้งค่าเป็น "m" ดังนั้นนิพจน์การพึ่งพาจะหายไปก่อนที่จอภาพสำหรับบริการจะทำงาน หากการ evaulation สำเร็จแสดงว่าจอภาพจะทำงาน มิฉะนั้นจอภาพจะไม่ทำงานและสถานะของบริการจะยังคงเหมือนเดิม
นิยามระยะเวลา
ช่วงเวลาใช้เพื่อกำหนดเงื่อนไขที่ควรอนุญาตให้ส่งการแจ้งเตือน
- period [label:] periodspec
- ช่วงเวลาจะจัดกลุ่มการแจ้งเตือนและตัวแปรหนึ่งรายการขึ้นไปซึ่งควบคุมความถี่ที่จะเกิดการแจ้งเตือนเมื่อเกิดความล้มเหลว คำหลัก ระยะเวลา มีสองรูปแบบ ครั้งแรกที่จะโต้แย้งซึ่งเป็นข้อกำหนดระยะเวลาจากแพทริค Ryan's Time :: Period Perl 5 โมดูล อ้างถึง "perldoc Time :: Period" สำหรับข้อมูลเพิ่มเติม
แบบฟอร์มที่สองต้องใช้เลเบลตามด้วยข้อกำหนดระยะเวลาตามที่กำหนดไว้ด้านบน เลเบลคือแท็กที่ประกอบด้วยอักขระตัวอักษรหรือขีดล่างตามด้วยศูนย์หรือตัวอักษรและขีดล่างหรือเครื่องหมายขีดล่างและลงท้ายด้วยโคลอน แบบฟอร์มนี้อนุญาตให้มีหลายช่วงเวลาที่มีการกำหนดช่วงเวลาเดียวกัน หนึ่งใช้คือการมีความหมายระยะเวลาซึ่งไม่มี alertafter หรือพารามิเตอร์ alertevery สำหรับช่วงเวลาหนึ่งและอีกส่วนหนึ่งสำหรับช่วงเวลาเดียวกันกับชุดที่แตกต่างกันของการแจ้งเตือนว่าจะมีพารามิเตอร์เหล่านั้น
- alertevery timeval
- คำหลัก alertevery (ภายในนิยามของ รอบระยะเวลา ) ใช้อาร์กิวเมนต์ชนิดเดียวกันกับตัวแปร ช่วงเวลา และ จำกัด จำนวนครั้งที่การแจ้งเตือนจะถูกส่งเมื่อบริการยังคงล้มเหลว ตัวอย่างเช่นหากช่วงเวลาเป็น "1 ชั่วโมง" ดังนั้นเฉพาะการแจ้งเตือนในส่วนระยะเวลาจะถูกเรียกใช้เพียงครั้งเดียวทุก ๆ ชั่วโมง หากไม่ใช้คำหลัก Alertevery ในรายการช่วงเวลาการแจ้งเตือนจะถูกส่งออกทุกครั้งที่ตรวจพบความล้มเหลว ตามค่าดีฟอลต์หากเอาต์พุตของความล้มเหลวต่อเนื่องสองครั้งมีการเปลี่ยนแปลงช่วงเวลาการแจ้งเตือนจะถูกแทนที่ หากคำว่า "สรุป" เป็นอาร์กิวเมนต์สุดท้ายดังนั้นเฉพาะบรรทัดเอาต์พุตสรุปเท่านั้นที่จะถูกพิจารณาเมื่อเปรียบเทียบเอาต์พุตของความล้มเหลวต่อเนื่อง
- การแจ้งเตือนหลังจาก NUM
- alertafter NUM timeval
- คำหลัก alert ภายหลัง (ภายในส่วนของ รอบระยะเวลา ) มีสองรูปแบบ: เฉพาะกับอาร์กิวเมนต์ "num" หรือด้วยอาร์กิวเมนต์ "num timeval" ในรูปแบบแรกการแจ้งเตือนจะถูกเรียกใช้หลังจากความล้มเหลวติดต่อกันเป็น "NUM" เท่านั้น
ในรูปแบบที่สองข้อโต้แย้งเป็นจำนวนเต็มบวกตามด้วยช่วงเวลาตามที่อธิบายโดยตัวแปร ช่วงเวลา ด้านบน หากระบุพารามิเตอร์เหล่านี้การแจ้งเตือนสำหรับช่วงเวลานั้นจะถูกเรียกหลังจากความล้มเหลวจำนวนมากเกิดขึ้นภายในช่วงเวลานั้นเท่านั้น ตัวอย่างเช่นถ้า alertafter จะได้รับข้อโต้แย้ง "3 30m" จากนั้นการแจ้งเตือนจะถูกเรียกว่าถ้า 3 ความล้มเหลวที่เกิดขึ้นภายใน 30 นาที
- ตัวเลข NUM
ตัวแปรนี้จะบอกเซิร์ฟเวอร์ที่จะเรียกไม่เกินแจ้งเตือน NUM ระหว่างความล้มเหลว ตัวนับการแจ้งเตือนจะถูกเก็บไว้เป็นระยะ ๆ และจะถูกรีเซ็ตตามความสำเร็จแต่ละครั้ง
- comp_alerts
หากระบุตัวเลือกนี้จะมีการเรียกใช้ upalerts เฉพาะเมื่อมีการเรียกการแจ้งเตือน "down" ที่เกี่ยวข้อง
- การแจ้งเตือนการแจ้ง เตือน [หาเรื่อง ... ]
- ช่วงเวลาอาจมีการแจ้งเตือนหลายครั้งซึ่งจะถูกเรียกใช้เมื่อความล้มเหลวของการบริการ การแจ้งเตือนจะถูกระบุด้วยคำเตือนตามด้วยการออก parmeter ตัวเลือกและข้อโต้แย้งที่มีการตีความเช่นเดียวกับความละเอียดของจอภาพ แต่ไม่มี ";;" ข้อยกเว้น พารามิเตอร์ exit ใช้รูปแบบ exit = x หรือ exit = xy และมีผลกระทบที่การแจ้งเตือนจะถูกเรียกก็ต่อเมื่อสถานะการออกของสคริปต์การตรวจสอบอยู่ในช่วงของพารามิเตอร์ ทางออก ตัวอย่างเช่นหากบรรทัดการแจ้งเตือนคือการ แจ้งเตือน exit = 10-20 mail.alert mis การแจ้งเตือนเมล จะถูกเรียกใช้ด้วย mis เป็นอาร์กิวเมนต์เท่านั้นหากค่าการออกของโปรแกรมตรวจสอบอยู่ระหว่าง 10 ถึง 20 คุณลักษณะนี้ช่วยให้คุณสามารถทริกเกอร์ การแจ้งเตือนที่แตกต่างกันในระดับความรุนแรงที่แตกต่างกัน (เช่นเมื่อพื้นที่ว่างในดิสก์เพิ่มจาก 8% เป็น 3%)
ดูที่ส่วนของ โปรแกรม ALERT ด้านบนเพื่อดูรายการของ pramaeters จันทร์ที่จะผ่านโดยอัตโนมัติไปยังโปรแกรมการแจ้งเตือน
- การ แจ้งเตือน upalert [หาเรื่อง ... ]
- upalert คือคำชมเชยจากการ แจ้งเตือน upalert จะถูกเรียกเมื่อบริการทำให้การเปลี่ยนสถานะจากความล้มเหลวเป็นความสำเร็จ สคริปต์ upalert เรียกว่าการจัดหาพารามิเตอร์เดียวกันกับสคริปต์การ แจ้งเตือน ด้วยการเพิ่มพารามิเตอร์ -u ซึ่งใช้เพียงเพื่อให้สคริปต์การแจ้งเตือนทราบว่ามันถูกเรียกว่าเป็น upalert อาจมีการแสดงหลายรายการสำหรับแต่ละช่วงเวลา โปรดทราบว่าพฤติกรรมเริ่มต้นคือการ upalert จะถูกส่งโดยไม่คำนึงว่ามีการแจ้งเตือน "down" ใด ๆ ที่ส่งก่อนหน้านี้เนื่องจาก upalerts จะถูกทริกเกอร์ในการเปลี่ยนสถานะ ตั้งค่าตัวเลือก comp_alerts ต่องวดเพื่อจับคู่ upalerts กับการแจ้งเตือน "down"
- การ แจ้งเตือนการเริ่มต้นระบบ [arg ... ]
- startupalert ถูกเรียกใช้เฉพาะเมื่อเซิร์ฟเวอร์ mon เริ่มการทำงาน
- upalertafter timeval
- พารามิเตอร์ upalertafter ถูกระบุเป็นสตริงที่ตามด้วยไวยากรณ์ของพารามิเตอร์ ช่วงเวลา ("30s", "1m" ฯลฯ ) และควบคุมการทริกเกอร์ของ upalert หากบริการเกิดขึ้นหลังจากหยุดทำงานนานกว่าหรือเท่ากับมูลค่าของตัวเลือกนี้จะมีการเรียกใช้ upalert ใช้ตัวเลือกนี้เพื่อป้องกันไม่ให้มีการเรียกใช้ upalerts เนื่องจาก "blips" (ขัดข้องสั้น ๆ )