Análise sistemática de causa raiz para equipamentos industriais: um guia de engenharia comparativa

Technical analysis: Root cause analysis methods for industrial equipment: 5-Why, fishbone, fault tree comparison

Systematic Root Cause Analysis for Industrial Equipment: A Comparative Engineering Guide - UNITEC-D Industrial MRO
This engineering guide provides a comparative analysis of 5-Why, Fishbone Diagram, and Fault Tree Analysis methodologies for systematic Root Cause Analysis (RCA) in industrial environments. It outline

Introdução

As falhas em equipamentos industriais representam um desafio crítico nas indústrias de manufatura e processamento. O tempo de inatividade não programado, a segurança comprometida e o aumento das despesas operacionais (OpEx) impactam diretamente a lucratividade e a posição competitiva. Um reparo superficial aborda apenas os sintomas, levando a falhas recorrentes. A Análise de Causa Raiz (RCA) eficaz não é, portanto, apenas uma ferramenta de diagnóstico, mas um imperativo estratégico essencial para manter a confiabilidade da planta, otimizar o ciclo de vida dos ativos e garantir a conformidade regulatória. Este artigo examina três metodologias principais de RCA – 5 porquês, diagrama em espinha de peixe e análise de árvore de falhas – fornecendo um guia de engenharia comparativo para sua aplicação em ambientes industriais.

Princípios Fundamentais da Análise de Causa Raiz

A Análise de Causa Raiz é um processo sistemático projetado para identificar a causa ou causas fundamentais de um evento indesejável ou desvio de desempenho. O seu princípio fundamental reside na distinção entre sintomas (o que aconteceu), causas diretas (por que aconteceu imediatamente) e causas profundas (as razões subjacentes que, se corrigidas, evitariam a recorrência). A RCA vai além das soluções imediatas para implementar ações corretivas sustentáveis.

As falhas geralmente ocorrem como uma cadeia de eventos, onde um evento desencadeia o próximo. O objetivo da RCA é rastrear esta cadeia desde a falha observada até as condições ou ações subjacentes iniciais que iniciaram a sequência. Este raciocínio dedutivo evita a recorrência de incidentes semelhantes, melhorando a fiabilidade global do sistema e reduzindo custos futuros associados a reparações e tempos de inatividade.

Especificações técnicas e padrões para RCA

Embora nenhuma norma exija um método específico de RCA, várias normas internacionais e nacionais enfatizam a necessidade de resolução sistemática de problemas e investigação de incidentes nos sistemas de gestão de qualidade, risco e confiabilidade. Esses padrões fornecem estruturas que exigem a aplicação de processos robustos de RCA:

  • ISO 9001:2015 (Sistemas de Gestão da Qualidade): Exige que as organizações tomem medidas para controlar e corrigir não conformidades e lidar com suas consequências. Isto inclui identificar a(s) causa(s) raiz da não conformidade para prevenir a recorrência.
  • ISO 31000:2018 (Gerenciamento de Riscos - Diretrizes): Fornece princípios e diretrizes genéricas sobre gerenciamento de riscos, incluindo identificação e análise de riscos, que geralmente são informados por incidentes anteriores investigados por meio de RCA.
  • IEC 60300-3-1:2009 (Gerenciamento de confiabilidade – Parte 3-1: Guia de aplicação – Técnicas de análise para confiabilidade – Guia sobre metodologia): Oferece orientação sobre metodologias para análise de confiabilidade, incluindo análise de falhas, que se alinha aos objetivos da RCA.
  • ANSI/ASQ Z1.4-2003 (R2018) (Procedimentos de amostragem e tabelas para inspeção por atributos): embora focados na amostragem de controle de qualidade, os princípios subjacentes de identificação de defeitos e compreensão de suas origens são relevantes para o contexto mais amplo da RCA na qualidade de fabricação.
  • NFPA 70E (Norma para Segurança Elétrica no Local de Trabalho): A investigação pós-incidente é fundamental para a segurança elétrica. Embora não prescreva métodos RCA, é necessário identificar as causas para prevenir futuros incidentes elétricos.

A adesão a esses padrões, muitas vezes apoiada por certificações como UL, CSA ou CE para componentes, fornece uma abordagem estruturada não apenas para a fabricação, mas também para a manutenção e a excelência operacional. A implementação da ACR dentro destes quadros garante que as ações corretivas sejam orientadas por dados e abordem eficazmente questões sistémicas, contribuindo para a fiabilidade geral dos processos e ativos industriais.

Guia de seleção e dimensionamento: escolhendo o método RCA correto

A seleção do método RCA apropriado é fundamental para a eficiência e eficácia. A complexidade do problema, os recursos disponíveis e o resultado desejado ditam a abordagem ideal. A tabela a seguir fornece uma matriz de decisão para orientar os engenheiros na seleção de métodos.

Critério 5-Por que Análise Diagrama de Espinha de Peixe (Ishikawa) Análise de Árvore de Falhas (FTA)
Complexidade do problema Simples a Moderado Moderado a Complexo Altamente Complexo, Crítico para a Segurança
Experiência necessária Baixo (treinamento básico) Médio (habilidades de facilitação) Alto (Conhecimento especializado, software)
Compromisso de tempo Baixo (minutos a algumas horas) Médio (horas a um dia) Alto (dias a semanas)
Tipo de saída Qualitativa (cadeia de causa linear) Qualitativa (causas potenciais categorizadas) Quantitativo (Probabilidade de falha, caminhos críticos) ou Qualitativo
Aplicativos típicos Desvios operacionais, pequenas falhas de equipamento, eventos de erro humano Defeitos de qualidade, problemas recorrentes de produção, gargalos de processo Energia nuclear, aeroespacial, processos químicos complexos, conformidade regulatória
Recursos necessários Quadro branco, marcadores, equipe Quadro branco/software, equipe, facilitador Software especializado (por exemplo, ReliaSoft, SAPHIRE), analistas experientes
Custo por análise Baixo (tempo de pessoal) Médio (tempo de pessoal, treinamento) Alto (licenças de software, consultoria especializada, treinamento)

Análise dos 5 Porquês: Aprofundando a Inquérito

O método dos 5 Porquês, iniciado por Sakichi Toyoda na Toyota, é uma técnica interrogativa iterativa usada para explorar as relações de causa e efeito subjacentes a um problema específico. O objetivo é perguntar repetidamente “Por quê?” até que a causa raiz fundamental seja identificada. Embora o nome sugira cinco iterações, o número real pode variar, continuando até que um processo controlável ou falha do sistema seja descoberto. A eficácia depende de evidências objetivas e de evitar suposições.

Por exemplo, considere uma falha na bomba hidráulica:

Problema: Bomba hidráulica emperrada, causando paralisação da linha de produção.

  1. Por que a bomba travou? Porque o rolamento falhou.
  2. Por que o rolamento falhou? Porque faltou lubrificação.
  3. Por que faltou lubrificação? Porque a porta de lubrificação estava entupida.
  4. Por que a porta de lubrificação estava entupida? Porque a graxa estava contaminada com material particulado.
  5. Por que a graxa foi contaminada? Porque a pistola de graxa foi armazenada descoberta em um ambiente empoeirado e o procedimento de manutenção não especificou o armazenamento adequado ou a limpeza da porta antes da lubrificação.

Causa raiz: Procedimento de manutenção inadequado para lubrificação e armazenamento de ferramentas.

Diagrama Espinha de Peixe (Ishikawa): Categorizando Fatores Contribuintes

O Diagrama Espinha de Peixe, também conhecido como Ishikawa ou Diagrama de Causa e Efeito, é uma ferramenta visual para categorizar as causas potenciais de um problema para identificar suas causas raízes. Ele agrupa as causas em categorias principais, normalmente representadas como “ossos” que se ramificam de uma “espinha” central. As categorias comuns na fabricação incluem:

  • Homem (Pessoal): Erro do operador, falta de treinamento, fadiga.
  • Máquina (equipamento): desgaste, problemas de calibração, falhas de projeto.
  • Material: matérias-primas defeituosas, especificações incorretas, contaminação.
  • Método (Processo): Procedimentos incorretos, falta de trabalho padronizado, supervisão deficiente.
  • Medição: medidores imprecisos, sensores defeituosos, análise de dados incorreta.
  • Ambiente: temperatura, umidade, vibração, iluminação, limpeza.

O diagrama facilita o brainstorming e fornece uma visão abrangente de todos os fatores potenciais que influenciam um problema. É qualitativo e mais eficaz quando uma equipe pode contribuir com diversas perspectivas.

Análise de Árvore de Falhas (FTA): Lógica Dedutiva de Falhas

Análise de árvore de falhas (FTA) é uma técnica de análise dedutiva de cima para baixo em que um estado indesejado de um sistema (o "evento principal") é analisado usando lógica booleana para combinar uma série de eventos de nível inferior. Desenvolvido pela Bell Labs para o sistema de mísseis Minuteman, o FTA quantifica rigorosamente a probabilidade de falha do sistema. A árvore de falhas é um modelo gráfico das diversas combinações paralelas e sequenciais de eventos iniciais que devem ocorrer para causar o evento principal. Gates (AND, OR) representam relacionamentos lógicos entre eventos.

  • AND Gate: todos os eventos de entrada devem ocorrer para que o evento de saída ocorra.
  • OR Gate: pelo menos um evento de entrada deve ocorrer para que o evento de saída ocorra.

O FTA requer entradas de dados específicas, como taxas de falha de componentes (por exemplo, Tempo Médio entre Falhas - MTBF), que podem ser obtidas no MIL-HDBK-217F ou nas especificações do fabricante. Por exemplo, um pressostato industrial típico pode ter um MTBF de 500.000 horas ou uma taxa de falhas (λ) de 2 x 10-6 falhas por hora. Um cálculo FTA para um sistema de intertravamento de segurança pode ter como objetivo uma probabilidade de falha sob demanda (PFD) abaixo de 10-3 (por exemplo, IEC 61508/61511 nível 1 de integridade de segurança).

Melhores práticas de instalação e comissionamento para implementação de RCA

A implementação de um programa de RCA bem-sucedido num ambiente industrial requer planeamento estruturado e compromisso contínuo. Trate a RCA como parte integrante da estratégia operacional da sua fábrica e não como uma resposta ad hoc a crises.

  • Definir gatilhos: estabeleça critérios claros para quando um RCA é necessário. Isso pode incluir qualquer incidente de segurança, liberação ambiental, tempo de inatividade que exceda um limite especificado (por exemplo, >4 horas para ativos críticos), falhas repetidas de equipamentos (por exemplo, >3 falhas do mesmo componente em 6 meses) ou desvios de qualidade que excedam uma porcentagem definida (por exemplo, >0,5% de taxa de descarte para um processo).
  • Formar equipes multifuncionais: reúna equipes com conhecimentos diversos e relevantes para o incidente. Isso normalmente inclui pessoal de operações, manutenção, engenharia, qualidade e segurança. Uma abordagem multidisciplinar fornece uma visão abrangente das causas potenciais.
  • Garantir integridade e coleta de dados: implemente sistemas robustos para coleta e arquivamento de dados operacionais, registros de manutenção, registros de eventos e leituras de sensores. Dados precisos são a base de qualquer RCA eficaz. Padronizar formulários e procedimentos de coleta de dados. Por exemplo, garantir que todos os dados relevantes do sistema SCADA (temperaturas, pressões, taxas de fluxo, correntes do motor) durante as 24 horas anteriores a uma falha sejam arquivados e prontamente acessíveis.
  • Treinamento e competência de pessoal: forneça treinamento contínuo para todo o pessoal envolvido em RCA. Isso inclui treinamento específico de métodos (5-Porquês, Espinha de peixe, FTA) e habilidades sociais como pensamento crítico, técnicas de entrevista e mitigação de preconceitos. Certificações de organizações como ASQ ou de provedores de treinamento credenciados podem validar a competência.
  • Implementar ações corretivas e preventivas (CAPA): a RCA só terá valor se suas descobertas levarem a uma CAPA eficaz. As ações devem ser específicas, mensuráveis, alcançáveis, relevantes e com prazo determinado (SMART). Acompanhar a implementação da CAPA e verificar a sua eficácia através da monitorização pós-implementação para garantir que a causa raiz foi eliminada e o problema não voltou a ocorrer.
  • Suporte de gerenciamento e alocação de recursos: um programa de RCA requer suporte visível da alta administração. Isto inclui a atribuição de tempo, pessoal e recursos financeiros adequados para formação, ferramentas e implementação de ações corretivas.

Exemplos de modos de falha e análise de causa raiz

Compreender como cada método RCA se aplica a modos de falha específicos aumenta sua utilidade. Os exemplos a seguir ilustram sua aplicação prática.

Exemplo 1: Desarme recorrente por sobrecarga do motor elétrico (5 porquês)

Problema: Um motor de indução trifásico de 15 kW (20 HP), em conformidade com os padrões NEMA MG 1 e com certificação CE, acionando uma correia transportadora, desarma repetidamente sua proteção contra sobrecarga térmica (definida para fator de serviço de 1,15, temperatura ambiente de 40°C). O desarme ocorre após aproximadamente 3-4 horas de operação, apesar do consumo de corrente da placa de identificação (30 A a 400 V) sob carga normal.

  1. Por que o motor está desarmando sua sobrecarga? O motor está superaquecendo internamente.
  2. Por que o motor está superaquecendo? O atrito do rolamento é excessivo, aumentando as perdas mecânicas e a corrente do estator. A análise de vibração (ISO 10816-1 Zona C) mostra 12,5 mm/s RMS na extremidade sem acionamento, excedendo os 7,1 mm/s aceitáveis.
  3. Por que o atrito do rolamento é excessivo? O rolamento está falhando devido à lubrificação inadequada. A análise do óleo (ASTM D6440) indica alto desgaste de partículas (Fe > 150 ppm) e viscosidade reduzida (ISO VG 100 caindo para ISO VG 68).
  4. Por que a lubrificação é inadequada? O sistema de lubrificação automatizado (ALS) deste rolamento está distribuindo graxa insuficiente. O ciclo programado é de 1 grama a cada 24 horas, mas a especificação do fabricante (SKF LGHP 2) para este rolamento (por exemplo, 6210) sob operação contínua sugere 1,5 gramas a cada 24 horas em um ambiente de 40°C.
  5. Por que o ALS está programado incorretamente? O erro inicial de entrada de dados de comissionamento durante a configuração do controlador ALS (compatível com IEC 60947-2) transcreveu incorretamente o intervalo de lubrificação do manual do equipamento. O técnico de manutenção que comissionou o sistema não cruzou o cronograma de lubrificação do fabricante do rolamento.

Causa raiz: erro de entrada de dados durante o comissionamento do ALS, resultando em lubrificação insuficiente para o rolamento, levando à falha prematura do rolamento e desarmes por sobrecarga do motor.

Exemplo 2: Vazamento Crônico de uma Conexão de Tubo Flangeado (Diagrama Espinha de Peixe)

Problema: Uma conexão flangeada DN 100 (NPS de 4 polegadas), classificada como ANSI Classe 150, desenvolve repetidamente pequenos vazamentos de fluido de processo (por exemplo, 50 ml/h). O fluido não é corrosivo, 60°C (140°F), 5 bar (72 psi).

Categorias de análise de espinha de peixe e possíveis causas:

  • Homem (Pessoal):
    • Sequência de torque inadequada durante a instalação (não seguindo ASME PCC-1).
    • Treinamento inadequado para montagem de flange.
    • Reutilização de juntas/parafusos antigos.
    • Lubrificação insuficiente dos parafusos.
  • Máquina (Equipamento):
    • Empenamento da face do flange (por exemplo, desvio de paralelismo >0,05 mm, excedendo os limites ASME B16.5).
    • Espaçamento irregular dos furos dos parafusos (defeito de fabricação).
    • Chave dinamométrica gasta (fora de calibração, ASME B107.14).
  • Material:
    • Material de junta incorreto para fluido/temperatura do processo (por exemplo, uso de EPDM para serviço de óleo).
    • Junta danificada (arranhões, cortes).
    • Parafusos/porcas de baixa qualidade (abaixo da especificação ASTM A193/A194).
  • Método (Processo):
    • Ausência de procedimento padronizado de montagem do flange.
    • Falta de inspeção pré-instalação das faces/juntas do flange.
    • Nenhuma auditoria de torque pós-instalação.
  • Medição:
    • Valor de torque incorreto aplicado.
    • Medidor para verificação do paralelismo do flange não calibrado.
  • Ambiente:
    • Vibração ambiente (por exemplo, velocidade >0,05 polegadas/seg, ISO 20816).
    • Tensões de ciclagem térmica.

Através deste processo, a equipe pode identificar a causa raiz como uma combinação de treinamento inadequado (Homem) e falta de um procedimento padronizado (Método) para montagem do flange, levando ao torque inadequado dos parafusos e à instalação inadequada da gaxeta.

Exemplo 3: Ativação não intencional de parada de emergência (análise de árvore de falhas)

Problema: uma linha de embalagem automatizada, equipada com travas de segurança compatíveis com ISO 13849-1 nível de desempenho ‘d’ e UL 508um painel de controle listado, apresenta ativações intermitentes e não intencionais de um botão de parada de emergência (parada de emergência). Isso resulta em paradas de produção breves, mas dispendiosas (tempo de inatividade médio de 15 minutos, custando US$ 250 por incidente).

Análise de árvore de falhas (simplificada):

EVENTO PRINCIPAL: Ativação de parada de emergência não intencional |    |--OU-- |      |-- Botão de parada de emergência com defeito |      |      |--OU-- |      |             |-- Falha mecânica (botão preso, λ = 1e-7 /h) |      |             |-- Falha Elétrica (Curto-circuito na chave, λ = 5e-8 /h) |      |   |      |-- Ativação Acidental do Operador |      |      |--OU-- |      |             |-- Contato Inadvertido (por exemplo, devido ao espaço de trabalho lotado, P = 0,001 /demanda) |      |             |-- Interpretação incorreta do Alarme (P = 0,0005 /demanda) |      |   |      |-- Falha no sistema de controle |             |--OU-- |                   |-- Erro de software (P = 1e-4 /demanda) |                   |-- Falha do módulo de entrada do PLC (λ = 2e-7 /hr) 

Este FTA simplificado mostra que o evento principal (ativação de parada de emergência não intencional) pode ocorrer se QUALQUER uma das três ramificações principais (botão com defeito, ativação acidental, falha no sistema de controle) ocorrer. Cada ramificação se divide em falhas de componentes específicos ou erros humanos. A análise quantitativa pode então atribuir probabilidades ou taxas de falha a cada evento básico, permitindo o cálculo da probabilidade geral do Evento Principal. Por exemplo, se a falha mecânica tem uma probabilidade de 10-7 falhas/hora e a falha elétrica 5x10-8 falhas/hora, a probabilidade de um botão de parada de emergência (porta OR) com defeito seria de aproximadamente (10-7 + 5x10-8) = 1,5 x 10-7 falhas/hora. Esta abordagem baseada em dados ajuda a priorizar ações corretivas com base no risco.

Integração de manutenção preditiva e monitoramento de condições

A Manutenção Preditiva (PdM) e o Monitoramento de Condições (CM) são complementos poderosos do RCA. Os dados coletados dos sistemas PdM/CM fornecem evidências objetivas que podem confirmar hipóteses durante uma RCA e, em muitos casos, permitem uma RCA proativa para evitar falhas antes que elas ocorram.

  • Análise de vibração (ISO 20816, ISO 10816-1): detecta desgaste, desequilíbrio, desalinhamento e frouxidão de rolamentos em máquinas rotativas. Leituras de alta vibração podem ser uma causa direta em uma árvore de falhas ou uma entrada para uma categoria de diagrama de espinha de peixe.
  • Termografia (imagem infravermelha, ASTM E1933): identifica componentes de superaquecimento em sistemas elétricos (por exemplo, conexões soltas, circuitos sobrecarregados) ou sistemas mecânicos (por exemplo, fricção, vazamentos de fluido). Um diferencial de temperatura de 50°C (90°F) acima da temperatura ambiente em um painel elétrico geralmente indica um problema em desenvolvimento.
  • Análise de óleo (ASTM D6440, ISO 4406): monitora a condição do lubrificante, análise de partículas de desgaste e níveis de contaminação. Crítico para sistemas hidráulicos e caixas de engrenagens. Uma contagem de partículas que exceda os códigos de limpeza do fabricante (por exemplo, ISO 18/16/13 para sistemas hidráulicos) pode ser a causa raiz.
  • Emissões acústicas: detecta falhas incipientes, como propagação de rachaduras, vazamento de válvulas ou cavitação, geralmente fornecendo avisos antes da análise de vibração.
  • Análise de assinatura de corrente do motor (MCSA): identifica problemas nas barras do rotor, falhas no enrolamento do estator e degradação dos rolamentos em motores elétricos.

Ao aproveitar os dados PdM/CM, os engenheiros de confiabilidade podem passar de RCA puramente reativo para uma abordagem proativa, investigando tendências e anomalias antes que elas se transformem em falhas catastróficas. Esta estratégia baseada em dados reduz o tempo de inatividade não planejado e prolonga a vida útil dos ativos, melhorando significativamente a eficiência da planta.

Matriz de Comparação: Metodologias RCA

Esta matriz fornece uma comparação detalhada, auxiliando na seleção final de uma metodologia RCA baseada em requisitos específicos do projeto e capacidades organizacionais.

Recurso 5-Por que Análise Diagrama de espinha de peixe Análise de Árvore de Falhas (FTA)
Objetivo Identifique uma causa raiz única e controlável. Identifique todos os possíveis fatores contribuintes. Quantifique a probabilidade de falha de sistemas complexos.
Mecanismo Questionamento iterativo (por quê?). Brainstorming categorizado (Causa e Efeito). Modelagem lógica dedutiva (portas booleanas).
Envolvimento da equipe Equipe pequena, facilitador. Equipe multifuncional, facilitador. Especialista individual ou pequena equipe especializada.
Requisito de dados Detalhes do incidente, evidências qualitativas. Detalhes do incidente, contribuição qualitativa da equipe. Projeto do sistema, taxas de falha de componentes (MTBF, falha/demanda), probabilidades.
Melhor para tipos de sistema Falhas simples de processos operacionais, erros humanos. Interações complexas, questões de qualidade, variabilidade de processos. Sistemas críticos de segurança, sistemas de conformidade regulatória (por exemplo, ASME B30.2, NFPA 85).
Saída típica Declaração acionável da causa raiz. Mapa visual de possíveis causas para investigação adicional. Conjuntos de corte mínimos, probabilidade quantitativa do evento principal, componentes críticos.
Prós Simples, rápido, de baixo custo, promove o pensamento crítico. Visual, promove o trabalho em equipe, identifica múltiplas causas, abrangente. Rigoroso, quantitativo, identifica caminhos críticos, ideais para necessidades regulatórias.
Contras Pode ser superficial, limitado a uma única causa, depende da habilidade do facilitador. Pode ser confuso, subjetivo, não quantifica riscos. Complexo, intensivo em recursos e demorado, requer software/conhecimento especializado.

Conclusão

A aplicação sistemática da Análise de Causa Raiz é indispensável para alcançar a excelência operacional e reduzir o custo total de propriedade (TCO) na fabricação industrial. Cada metodologia – análise de 5 porquês, espinha de peixe e árvore de falhas – oferece vantagens distintas, adequadas a diversos níveis de complexidade de problemas e disponibilidade de recursos. Ao selecionar e implementar criteriosamente essas ferramentas, os engenheiros de manutenção e confiabilidade podem fazer a transição da solução de problemas reativa para a eliminação proativa de problemas, aumentando assim a segurança, melhorando a longevidade dos ativos e maximizando o tempo de atividade da planta.

Para componentes industriais confiáveis ​​que minimizam possíveis pontos de falha e garantem a conformidade com padrões exigentes como ANSI, ASME e IEEE, explore o catálogo eletrônico abrangente da UNITEC-D GmbH: https://www.unitecd.com/e-catalog/.

Referências

  1. ISO 9001:2015, Sistemas de gestão de qualidade – Requisitos. Organização Internacional de Normalização, Genebra, Suíça.
  2. ISO 31000:2018, Gerenciamento de riscos – Diretrizes. Organização Internacional de Normalização, Genebra, Suíça.
  3. IEC 60300-3-1:2009, Gerenciamento de confiabilidade – Parte 3-1: Guia de aplicação – Técnicas de análise para confiabilidade – Guia sobre metodologia. Comissão Eletrotécnica Internacional, Genebra, Suíça.
  4. ASME PCC-1-2019, Diretrizes para montagem de junta de flange aparafusada com limite de pressão. Sociedade Americana de Engenheiros Mecânicos, Nova York, NY.
  5. Lee, F. (2005). Manual de análise de causa raiz: um guia para investigação eficaz de incidentes. McGraw-Hill Education, Nova York, NY.

Related Articles