Систематичний аналіз першопричин для промислового обладнання: Порівняльний інженерний посібник

Technical analysis: Root cause analysis methods for industrial equipment: 5-Why, fishbone, fault tree comparison

Systematic Root Cause Analysis for Industrial Equipment: A Comparative Engineering Guide - UNITEC-D Industrial MRO
This engineering guide provides a comparative analysis of 5-Why, Fishbone Diagram, and Fault Tree Analysis methodologies for systematic Root Cause Analysis (RCA) in industrial environments. It outline

вступ

Відмови промислового обладнання є критичною проблемою для промисловості та переробної промисловості. Незаплановані простої, погіршення безпеки та збільшення операційних витрат (OpEx) безпосередньо впливають на прибутковість і конкурентоспроможність. Поверхневий ремонт усуває лише симптоми, що призводить до повторних несправностей. Таким чином, ефективний аналіз першопричини (RCA) є не просто інструментом діагностики, а важливим стратегічним імперативом для підтримки надійності установки, оптимізації життєвого циклу активів і забезпечення відповідності нормативним вимогам. У цій статті розглядаються три основні методології RCA — 5-Why, Fishbone Diagram і Fault Tree Analysis — надаючи порівняльний інженерний посібник для їх застосування в промислових середовищах.

Фундаментальні принципи аналізу першопричини

Аналіз першопричини — це систематичний процес, призначений для виявлення основної причини або причин небажаної події або відхилення в продуктивності. Його основний принцип полягає в розрізненні симптомів (те, що сталося), прямих причин (чому це сталося негайно) і корінних причин (основних причин, які, якщо їх виправити, запобіжать рецидиву). RCA виходить за рамки негайних виправлень і впроваджує стійкі коригувальні дії.

Збої часто відбуваються як ланцюг подій, де одна подія викликає наступну. Мета RCA полягає в тому, щоб простежити цей ланцюжок у зворотному напрямку від спостережуваного збою до початкових основних умов або дій, які ініціювали послідовність. Це дедуктивне міркування запобігає повторенню подібних інцидентів, підвищуючи загальну надійність системи та зменшуючи майбутні витрати, пов’язані з ремонтом і простоєм.

Технічні характеристики та стандарти для RCA

Хоча жоден стандарт не вимагає конкретного методу RCA, різні міжнародні та національні стандарти наголошують на необхідності систематичного вирішення проблем і розслідування інцидентів у системах управління якістю, ризиками та надійністю. Ці стандарти забезпечують рамки, які вимагають застосування надійних процесів RCA:

  • ISO 9001:2015 (Системи управління якістю): вимагає від організацій вживати заходів для контролю та виправлення невідповідностей, а також усувати їх наслідки. Це включає визначення першопричини (причин) невідповідності, щоб запобігти її повторенню.
  • ISO 31000:2018 (Управління ризиками – вказівки): надає принципи та загальні вказівки щодо управління ризиками, включаючи ідентифікацію й аналіз ризиків, які часто ґрунтуються на минулих інцидентах, розслідуваних за допомогою RCA.
  • IEC 60300-3-1:2009 (Управління надійністю – Частина 3-1: Посібник із застосування – Методи аналізу надійності – Посібник із методології): Пропонує вказівки щодо методологій аналізу надійності, включно з аналізом відмов, який узгоджується з цілями RCA.
  • ANSI/ASQ Z1.4-2003 (R2018) (Процедури відбору проб і таблиці для перевірки за ознаками): незважаючи на те, що основна увага приділяється відбору зразків для контролю якості, основні принципи виявлення дефектів і розуміння їх походження мають відношення до ширшого контексту RCA у якості виробництва.
  • NFPA 70E (Стандарт електробезпеки на робочому місці): розслідування інциденту має вирішальне значення для електробезпеки. Незважаючи на те, що метод RCA не призначає, він потребує виявлення причин, щоб запобігти майбутнім електричним інцидентам.

Дотримання цих стандартів, яке часто підтверджується такими сертифікатами, як UL, CSA або CE для компонентів, забезпечує структурований підхід не лише до виробництва, але й досконалості обслуговування та експлуатації. Впровадження RCA в цих структурах гарантує, що коригувальні дії керуються даними та ефективно вирішують системні проблеми, сприяючи загальній надійності промислових процесів і активів.

Керівництво з вибору та розміру: вибір правильного методу RCA

Вибір відповідного методу RCA має вирішальне значення для ефективності та дієвості. Складність проблеми, наявні ресурси та бажаний результат визначають оптимальний підхід. У наведеній нижче таблиці наведено матрицю рішень, яка допоможе інженерам у виборі методу.

Критерій 5. Аналіз чому Діаграма риб'ячої кістки (Ісікава). Аналіз дерева несправностей (FTA)
Складність проблеми Від простого до модерованого Від середнього до складного Дуже складний, важливий для безпеки
Необхідний досвід Низький (базова підготовка) Середній (Навички фасилітації) Високий (спеціальні знання, програмне забезпечення)
Зобов’язання щодо часу Низький (від хвилин до кількох годин) Середній (від годин до дня) Високий (від днів до тижнів)
Тип виводу Якісне (Лінійний ланцюг причин) Якісні (потенційні причини за категоріями) Кількісний (ймовірність відмови, критичні шляхи) або якісний
Типове застосування Експлуатаційні відхилення, незначні збої обладнання, помилки людини Дефекти якості, повторювані виробничі проблеми, вузькі місця процесу Атомна енергетика, аерокосмічна промисловість, складні хімічні процеси, дотримання нормативних вимог
Потрібні ресурси Дошка, маркери, команда Дошка/програмне забезпечення, команда, фасилітатор Спеціалізоване програмне забезпечення (наприклад, ReliaSoft, SAPHIRE), досвідчені аналітики
Вартість за аналіз Низький (час персоналу) Середній (Час персоналу, навчання) Високий (Ліцензії на ПЗ, консультації експертів, навчання)

5. Чому аналіз: поглиблення дослідження

Метод «5 чому», започаткований Сакічі Тойодою в Toyota, — це ітеративна методика опитування, яка використовується для дослідження причинно-наслідкових зв’язків, що лежать в основі певної проблеми. Мета полягає в тому, щоб багаторазово запитувати "Чому?" поки не буде виявлена ​​основна причина. Хоча назва передбачає п’ять ітерацій, фактична кількість може змінюватися, доки не буде виявлено контрольований процес або збій системи. Ефективність залежить від об'єктивних доказів і уникнення припущень.

Наприклад, розглянемо несправність гідравлічного насоса:

Проблема: Гідравлічний насос заблоковано, що призвело до зупинки виробничої лінії.

  1. Чому заклинило насос? Тому що вийшов з ладу підшипник.
  2. Чому підшипник вийшов з ладу? Через брак мастила.
  3. Чому не було змащення? Тому що отвір для змащення був забитий.
  4. Чому було засмічено мастильний отвір? Тому що мастило було забруднене твердими частинками.
  5. Чому мастило було забруднене? Оскільки мастильце зберігалося без кришки в запиленому середовищі, а процедура технічного обслуговування не вказувала на належне зберігання чи очищення портів перед змащуванням.

Основна причина: Невідповідна процедура технічного обслуговування для змащення та зберігання інструментів.

Діаграма «Риб’яча кістка» (Ісікава): класифікація сприяючих факторів

Діаграма «Риб’яча кістка», також відома як «Діаграма Ісікави» або «Діаграма причинно-наслідкових зв’язків», — це візуальний інструмент для класифікації потенційних причин проблеми з метою виявлення її першопричин. Він групує причини в основні категорії, зазвичай представлені у вигляді «кісток», що відгалужуються від центрального «хребта». Загальні категорії у виробництві включають:

  • Людина (персонал): помилка оператора, відсутність навчання, втома.
  • Машина (обладнання): зношеність, проблеми з калібруванням, недоліки конструкції.
  • Матеріал: дефектна сировина, неправильні характеристики, забруднення.
  • Метод (процес): неправильні процедури, відсутність стандартизованої роботи, поганий контроль.
  • Вимірювання: неточні датчики, несправні датчики, неправильний аналіз даних.
  • Навколишнє середовище: температура, вологість, вібрація, освітлення, чистота.

Діаграма полегшує мозковий штурм і надає комплексне уявлення про всі потенційні фактори, що впливають на проблему. Це якісно та найефективніше, коли команда може внести різні точки зору.

Аналіз дерева несправностей (FTA): дедуктивна логіка відмов

Аналіз дерева помилок (FTA) — це низхідна дедуктивна техніка аналізу помилок, у якій небажаний стан системи («головна подія») аналізується за допомогою логічної логіки для об’єднання серії подій нижчого рівня. Розроблений Bell Labs для ракетної системи Minuteman, FTA строго кількісно визначає ймовірність відмови системи. Дерево несправностей — це графічна модель різноманітних паралельних і послідовних комбінацій початкових подій, які повинні відбутися, щоб спричинити головну подію. Ворота (І, АБО) представляють логічні зв’язки між подіями.

  • AND Gate: усі вхідні події мають відбутися, щоб відбулася вихідна подія.
  • Ворота АБО: має відбутися принаймні одна вхідна подія, щоб відбулася вихідна подія.

Для FTA потрібні певні вхідні дані, наприклад частота відмов компонентів (наприклад, середній час напрацювання на відмову – MTBF), які можна отримати з MIL-HDBK-217F або специфікацій виробника. Наприклад, типове промислове реле тиску може мати MTBF 500 000 годин або частоту відмов (λ) 2 x 10-6 відмов на годину. Розрахунок FTA для системи блокування безпеки може мати на меті ймовірність відмови за запитом (PFD) нижче 10-3 (наприклад, IEC 61508/61511 рівень цілісності безпеки 1).

Рекомендації щодо встановлення та введення в експлуатацію для впровадження RCA

Реалізація успішної програми RCA в промисловому середовищі вимагає структурованого планування та постійної відданості. Розглядайте RCA як невід’ємну частину операційної стратегії вашого заводу, а не як спеціальну відповідь на кризу.

  • Визначте тригери: установіть чіткі критерії, коли потрібен RCA. Це може включати будь-який інцидент з безпекою, викид навколишнього середовища, час простою, що перевищує встановлений поріг (наприклад, >4 години для критичних активів), повторні відмови обладнання (наприклад, >3 відмови одного й того самого компонента протягом 6 місяців) або відхилення якості, що перевищують визначений відсоток (наприклад, рівень браку >0,5% для процесу).
  • Створюйте міжфункціональні команди: збирайте команди з різними знаннями, що стосуються інциденту. Зазвичай це включає персонал з експлуатації, технічного обслуговування, інженерно-технічного забезпечення, якості та безпеки. Мультидисциплінарний підхід забезпечує комплексне уявлення про потенційні причини.
  • Забезпечте цілісність і збір даних: запровадьте надійні системи для збору й архівування робочих даних, записів про технічне обслуговування, журналів подій і показань датчиків. Точні дані є основою будь-якого ефективного RCA. Стандартизувати форми та процедури збору даних. Наприклад, забезпечення архівації та легкодоступності всіх відповідних даних системи SCADA (температури, тиску, швидкості потоку, струму двигуна) за 24 години, що передували збою.
  • Навчання та компетентність персоналу: забезпечте безперервне навчання для всього персоналу, задіяного в RCA. Сюди входить навчання за конкретними методами (5-Why, Fishbone, FTA) і навички спілкування, як-от критичне мислення, методи інтерв’ю та пом’якшення упередженості. Сертифікати від таких організацій, як ASQ, або від акредитованих постачальників тренінгів можуть підтвердити компетентність.
  • Запровадження коригувальних і запобіжних дій (CAPA): RCA є цінним, лише якщо його результати ведуть до ефективного CAPA. Дії мають бути конкретними, вимірними, досяжними, релевантними та обмеженими у часі (SMART). Відстежуйте впровадження CAPA та перевіряйте його ефективність за допомогою моніторингу після впровадження, щоб переконатися, що першопричину усунено та проблема не повториться.
  • Підтримка керівництва та розподіл ресурсів: програма RCA потребує явної підтримки з боку вищого керівництва. Це включає в себе виділення достатнього часу, персоналу та фінансових ресурсів для навчання, інструментів і впровадження коригувальних дій.

Типи несправностей і приклади аналізу першопричини

Розуміння того, як кожен метод RCA застосовується до конкретних режимів відмови, підвищує його корисність. Наступні приклади ілюструють їх практичне застосування.

Приклад 1: повторюване відключення електродвигуна від перевантаження (5-чому)

Проблема: трифазний асинхронний двигун потужністю 15 кВт (20 к. с.), який відповідає стандартам NEMA MG 1 і має сертифікат CE, рухаючи конвеєрну стрічку, неодноразово спрацьовує захист від теплового перевантаження (встановлено на 1,15 робочого коефіцієнта, температура навколишнього середовища 40°C). Відключення відбувається приблизно через 3-4 години роботи, незважаючи на споживаний струм (30 A при 400 В) за нормального навантаження.

  1. Чому двигун спрацьовує через перевантаження? Двигун перегрівається всередині.
  2. Чому двигун перегрівається? Надмірне тертя підшипників, що збільшує механічні втрати та струм статора. Аналіз вібрації (ISO 10816-1 зона C) показує 12,5 мм/с RMS на непривідному кінці, що перевищує допустимі 7,1 мм/с.
  3. Чому надмірне тертя підшипника? Підшипник виходить з ладу через недостатнє змащення. Аналіз масла (ASTM D6440) показує високий рівень зносу частинок (Fe > 150 ppm) і знижену в'язкість (ISO VG 100 знижується до ISO VG 68).
  4. Чому змащення невідповідне? Автоматизована система змащення (ALS) для цього підшипника подає недостатню кількість мастила. Запрограмований цикл становить 1 грам кожні 24 години, але специфікація виробника (SKF LGHP 2) для цього підшипника (наприклад, 6210) при безперервній роботі передбачає 1,5 грама кожні 24 години при температурі 40°C.
  5. Чому ALS запрограмований неправильно? Помилка початкового введення даних про введення в експлуатацію під час налаштування контролера ALS (сумісного з IEC 60947-2) неправильно розписує інтервал змащування з посібника з обладнання. Технік з технічного обслуговування, який ввів систему в експлуатацію, не посилався на графік змащення виробника підшипників.

Основна причина: помилка введення даних під час введення в експлуатацію ALS, що призвело до недостатнього змащення підшипника, що призвело до передчасного виходу з ладу підшипника та перевантаження двигуна.

Приклад 2: Хронічний витік із фланцевого з’єднання труби (діаграма «риб’яча кістка»)

Проблема: фланцеве з’єднання DN 100 (NPS 4 дюйми), клас 150 за ANSI, неодноразово викликає незначні витоки технологічної рідини (наприклад, 50 мл/год). Рідина не є корозійною, 60°C (140°F), 5 бар (72 psi).

Категорії аналізу риб’ячої кістки та потенційні причини:

  • Людина (персонал):
    • Неправильна послідовність затягування під час встановлення (не відповідає ASME PCC-1).
    • Недостатнє навчання монтажу фланців.
    • Повторне використання старих прокладок/болтів.
    • Недостатнє змащення болтів.
  • Машина (обладнання):
    • Викривлення поверхні фланця (наприклад, відхилення паралельності >0,05 мм, що перевищує обмеження ASME B16.5).
    • Нерівна відстань між отворами для болтів (виробничий брак).
    • Зношений динамометричний ключ (не відкалібрований, ASME B107.14).
  • Матеріал:
    • Невідповідний матеріал прокладки для технологічної рідини/температури (наприклад, використання EPDM для обслуговування масла).
    • Пошкоджена прокладка (подряпини, порізи).
    • Болти/гайки низької якості (нижче специфікації ASTM A193/A194).
  • Метод (процес):
    • Відсутність стандартизованої процедури складання фланців.
    • Відсутність перевірки поверхонь фланців/прокладок перед встановленням.
    • Без перевірки крутного моменту після встановлення.
  • Вимірювання:
    • Застосовано неправильне значення крутного моменту.
    • Калібрований калібр для перевірки паралельності фланців.
  • Навколишнє середовище:
    • Вібрація навколишнього середовища (наприклад, швидкість >0,05 дюйма/с, ISO 20816).
    • Термоциклічні напруги.

Завдяки цьому процесу команда може виявити першопричину як поєднання недостатньої підготовки (людина) та відсутності стандартизованої процедури (метод) для складання фланців, що призводить до неправильного затягування болтів і встановлення прокладки.

Приклад 3: Ненавмисна активація аварійної зупинки (аналіз дерева несправностей)

Проблема: автоматизована лінія пакування, оснащена блокуванням безпеки, сумісним із ISO 13849-1 рівнем продуктивності «d» і UL 508переліченою панеллю керування, періодично ненавмисно спрацьовує кнопка аварійної зупинки (E-Stop). Це призводить до коротких, але дорогих зупинок виробництва (в середньому 15 хвилин простою, вартість 250 доларів США за інцидент).

Аналіз дерева несправностей (спрощений):

ГОЛОВНА ПОДІЯ: ненавмисна активація E-Stop |    |--АБО-- |      |-- Несправна кнопка E-Stop |      |      |--АБО-- |      |             |-- Механічна несправність (зависла кнопка, λ = 1e-7/год) |      |             |-- Електрична несправність (коротке замикання вимикача, λ = 5e-8 / год) |      |   |      |-- Випадкова активація оператора |      |      |--АБО-- |      |             |-- Ненавмисний контакт (наприклад, через переповнене робоче місце, P = 0,001/попит) |      |             |-- Неправильне тлумачення сигналу тривоги (P = 0,0005 /запит) |      |   |      |-- Збій системи керування |             |--АБО-- |                   |-- Помилка програмного забезпечення (P = 1e-4 /вимога) |                   |-- Помилка вхідного модуля ПЛК (λ = 2e-7/год) 

Це спрощене FTA показує, що головна подія (ненавмисна активація E-Stop) може статися, якщо виникне БУДЬ-ЯКА з трьох основних гілок (несправна кнопка, випадкова активація, збій системи керування). Кожна гілка далі розбивається на окремі збої компонентів або людські помилки. Потім кількісний аналіз може призначити ймовірності або показники відмов для кожної основної події, дозволяючи розрахувати загальну ймовірність Найвищої події. Наприклад, якщо механічна несправність має ймовірність 10-7 відмов/годину, а електрична несправність 5x10-8 відмов/годину, ймовірність несправності кнопки E-Stop (АБО ворота) буде приблизно (10-7 + 5x10-8) = 1,5 x 10-7 відмов/год. Цей підхід на основі даних допомагає визначити пріоритетність коригувальних дій на основі ризику.

Інтеграція прогнозованого технічного обслуговування та моніторингу стану

Прогнозне технічне обслуговування (PdM) і моніторинг стану (CM) є потужним доповненням до RCA. Дані, зібрані з систем PdM/CM, надають об’єктивні докази, які можуть підтверджувати гіпотези під час RCA, і в багатьох випадках дозволяють проактивному RCA запобігати збоям до того, як вони виникнуть.

  • Vibration Analysis (ISO 20816, ISO 10816-1): Detects bearing wear, imbalance, misalignment, and looseness in rotating machinery. Високі показники вібрації можуть бути прямою причиною в дереві несправностей або входом до категорії діаграми «риб’яча кістка».
  • Термографія (Інфрачервоне зображення, ASTM E1933): визначає компоненти, що перегріваються, в електричних системах (наприклад, ослаблені з’єднання, перевантажені ланцюги) або механічних системах (наприклад, тертя, витік рідини). Різниця температур на 50°C (90°F) вище температури навколишнього середовища в електричній панелі часто вказує на розвиток проблеми.
  • Аналіз мастила (ASTM D6440, ISO 4406): контролює стан мастила, аналіз частинок зносу та рівні забруднення. Критичний для гідравлічних систем і коробок передач. Основною причиною може бути кількість часток, яка перевищує стандарти чистоти виробника (наприклад, ISO 18/16/13 для гідравлічних систем).
  • Акустична емісія: виявляє несправності, що починаються, як-от поширення тріщин, протікання клапанів або кавітацію, часто надаючи попередження раніше, ніж аналіз вібрації.
  • Аналіз сигнатури струму двигуна (MCSA): виявляє проблеми з роторними шинами, несправності обмотки статора та погіршення якості підшипників в електродвигунах.

Використовуючи дані PdM/CM, інженери з надійності можуть перейти від чисто реактивного RCA до проактивного підходу, досліджуючи тенденції та аномалії, перш ніж вони переростуть у катастрофічні збої. Ця стратегія на основі даних скорочує незаплановані простої та подовжує термін служби активів, значно підвищуючи ефективність установки.

Матриця порівняння: методології RCA

Ця матриця забезпечує детальне порівняння, допомагаючи в остаточному виборі методології RCA на основі конкретних вимог проекту та організаційних можливостей.

Функція 5. Аналіз чому Діаграма риб'ячої кістки Аналіз дерева несправностей (FTA)
Мета Визначте єдину керовану першопричину. Визначте всі можливі сприяючі фактори. Визначити ймовірність відмови складних систем.
Механізм Ітеративне опитування (Чому?). Категорійний мозковий штурм (причинно-наслідковий). Дедуктивне логічне моделювання (булеві ворота).
Залучення команди Невелика команда, фасилітатор. Міжфункціональна команда, фасилітатор. Окремий експерт або невелика спеціалізована команда.
Вимоги до даних Подробиці інциденту, якісні докази. Деталі інциденту, якісний внесок команди. Конструкція системи, частота відмов компонентів (MTBF, відмова/потреба), ймовірності.
Найкраще для типів систем Прості збої операційного процесу, людські помилки. Складні взаємодії, проблеми з якістю, мінливість процесу. Критично важливі для безпеки системи, системи відповідності нормативним вимогам (наприклад, ASME B30.2, NFPA 85).
Типовий результат Позовна заява про першопричину. Візуальна карта потенційних причин для подальшого дослідження. Мінімальні набори розрізів, кількісна ймовірність верхньої події, критичні компоненти.
Плюси Простий, швидкий, дешевий, сприяє критичному мисленню. Візуальний, сприяє командній роботі, визначає численні причини, комплексний. Точний, кількісний, визначає критичні шляхи, ідеально підходить для нормативних потреб.
Мінуси Може бути поверхневим, обмежуватися однією причиною, покладатися на навички фасилітатора. Може бути захаращеним, суб’єктивним, не містить кількісної оцінки ризиків. Складний, ресурсомісткий, трудомісткий, потребує спеціалізованого програмного забезпечення/експертизи.

Висновок

Систематичне застосування аналізу першопричини є незамінним для досягнення операційної досконалості та зниження загальної вартості володіння (TCO) у промисловому виробництві. Кожна методологія — 5-Why, Fishbone і Fault Tree Analysis — пропонує різні переваги, що підходять для різних рівнів складності проблеми та доступності ресурсів. Розумно вибираючи та впроваджуючи ці інструменти, інженери з технічного обслуговування та надійності можуть перейти від реактивного усунення несправностей до проактивного усунення проблем, тим самим підвищуючи безпеку, покращуючи довговічність активів і максимізуючи час безвідмовної роботи установки.

Щоб отримати надійні промислові компоненти, які мінімізують потенційні точки відмови та забезпечують відповідність вимогам таких стандартів, як ANSI, ASME та IEEE, перегляньте повний електронний каталог UNITEC-D GmbH: https://www.unitecd.com/e-catalog/.

Список літератури

  1. ISO 9001:2015, Системи управління якістю – Вимоги. Міжнародна організація стандартизації, Женева, Швейцарія.
  2. ISO 31000:2018, Управління ризиками – рекомендації. Міжнародна організація стандартизації, Женева, Швейцарія.
  3. IEC 60300-3-1:2009, Керування надійністю – Частина 3-1: Посібник із застосування – Методи аналізу надійності – Посібник із методології. Міжнародна електротехнічна комісія, Женева, Швейцарія.
  4. ASME PCC-1-2019, Рекомендації щодо вузла фланцевого з’єднання, закріпленого граничними болтами. Американське товариство інженерів-механіків, Нью-Йорк, Нью-Йорк.
  5. Лі, Ф. (2005). Посібник з аналізу першопричини: посібник із ефективного розслідування інцидентів. McGraw-Hill Education, Нью-Йорк, Нью-Йорк.

Related Articles