Visit our site in English: ReliabilityWeb.com    RSS | Comuníquese

Cálculo de los Parámetros de la Distribución de Weibull

por Luis Hernando Palacio Palacio, Argos/ Planta Nare

El presente artículo presenta, paso a paso, el método de los Mínimos Cuadrados para calcular los parámetros de forma y escala de la distribución de Weibull. Para el cálculo del parámetro de localización se emplea el complemento Solver de Excel.

También se presentan dos ecuaciones para calcular el estimador Rango de mediana (ecuaciones 5 y 6), siendo esta última una forma aproximada y la que generalmente se usa en la literatura técnica. Ya que la ecuación (5) es más exacta, ésta es la que se emplea; para ello, y debido a su complejidad, se presenta el código fuente — en el lenguaje VBA (Visual Basic para Aplicaciones) —  para crear una función definida por el usuario en Excel. Igualmente se usan las funciones PENDIENTE e INTERSECCIÓN.EJE, de Excel, para calcular la pendiente y el intercepto de la línea de regresión.

1. INTRODUCCIÓN

La distribución de Weibull es una distribución continua y triparamétrica, es decir, está completamente definida por tres parámetros y es la más empleada en el campo de la confiabilidad.

A pesar de la popularidad de esta distribución, en la revisión bibliográfica efectuada, la mayoría de los artículos y literatura técnica consultados se remiten a una distribución biparamétrica y, más aún, los ejemplos allí desarrollados presentan como datos conocidos los dos parámetros, generándose, así, las siguientes preguntas: ¿Cómo se calculan los parámetros? y ¿por qué se omite el cálculo del tercer parámetro? El tercer parámetro es el parámetro de localización, es decir, el parámetro que localiza la abscisa a partir del cual se inicia la distribución.

El objetivo del presente artículo es responder a las dos preguntas anteriores, presentando una de las cinco metodologías — analíticas — existentes para el cálculo de los parámetros y algunos criterios para determinar si es necesario tener en cuenta el tercer parámetro.

El método que se presenta es el método de los Mínimos Cuadrados, por tres razones: la primera, es un método simple y expedito de aplicar; la segunda, la gráfica de los datos sirven como una prueba de bondad de ajuste de la distribución y, la tercera, da un indicio sobre si se debe calcular o no el parámetro de localización.

Para una metodología gráfica, la cual hace uso del papel especial llamado papel de probabilidad de Weibull, véanse las referencias [5], [6]

2. EXPRESIÓN MATEMÁTICA DE LA DISTRIBUCIÓN

La función de densidad de la distribución de Weibull para la variable aleatoria t está dada por la siguiente expresión:

calculo_1

Donde

t: Variable aleatoria que, para el caso de la confiabilidad, representa el tiempo entre fallas.

β: Parámetro de forma (0<β<∞)

θ: Parámetro de escala (0<θ<∞)

δ: Parámetro de localización (-∞δ<∞)

El parámetro beta, como su nombre indica, determina la forma — o perfil— de la distribución, la cual es función del valor de éste.

El parámetro theta indica la escala de la distribución, es decir, muestra que tan aguda o plana es la función.

El parámetro delta indica, en el tiempo, el momento a partir del cual se genera la distribución.

Una distribución biparamétrica está completamente definida por los parámetros de forma y de escala.

La función confiabilidad R (t) de Weibull se determina por la siguiente expresión:

 calculo_2

La función distribución acumulativa F (t) es el complemento de la función confiabilidad y se define de la siguiente manera:

calculo_3

De la expresión anterior, se concluye que la función distribución acumulativa se puede interpretar como la probabilidad de falla.La relación entre la función confiabilidad y la función probabilidad de falla se muestra en la figura 1.

calculo_4sm

Para ampliar la imagen haga clic sobre ella, regrese utilizando su navegador.

3. DETERMINACIÓN DE LOS PARÁMETROS POR EL MÉTODO DE LOS MÍNIMOS CUADRADOS

Como se mencionó en el numeral uno, existen cinco métodos para calcular los parámetros de la distribución de Weibull. Ellos son:

  • Mínimos cuadrados.
  • Gráfico de la función tasa de falla.
  • Máxima similitud.
  • Estimación de momentos.
  • Estimadores lineales.

Para ilustrar el método de los mínimos cuadrados, se desarrollará paso a paso un ejemplo.

El método de los mínimos cuadrados permite calcular los parámetros de forma y escala, mediante la transformación doble logarítmica de la función de distribución acumulativa (ecuación 3). El cálculo del parámetro de localización es más complejo, empleándose para ello rutinas de cálculo, como el programa Solver de Excel.

La transformación doble logarítmica permite transformar la función de distribución acumulativa en una ecuación lineal de regresión.

3.1 Deducción de la ecuación lineal de regresión

calculo_5Función acumulativa de Weibull.

calculo_6

calculo_7Aplicando logaritmos naturales.

calculo_8Propiedad exponencial de los logaritmos.

calculo_9Aplicando logaritmos naturales.

calculo_10

La expresión (*) representa una ecuación lineal de la forma

calculo_11

La cual es una recta de regresión, con:

calculo_12

De la expresión (**) se concluye que el parámetro de forma, β, es la pendiente de la recta de regresión.

De la expresión (***) se observa que el parámetro de escala, θ, está en función del intercepto b de la recta de regresión y del parámetro de escala; por lo tanto:

calculo_13(4) Definición de logaritmo.

3.2 Rango de mediana

Para poder trazar la recta de regresión, se debe calcular un estimador para la función de distribución acumulativa F(x). Este estimador, llamado Rango de mediana, es un estimador no paramétrico basado en el orden de las fallas. Este aspecto implica que la muestra de datos se debe organizar de menor a mayor (en forma ascendente).

La expresión matemática para este estimador es:

calculo_14

Donde:

Wα (i): Rango de mediana para un nivel de confianza (1-α), donde α es el nivel de significancia y toma el valor de 0.5 para este estimador.

i: Orden de la falla.

n: Número total de datos de la muestra.

Fα, v1, v2: Valor crítico de la distribución F, evaluada en el nivel de significancia α y con grados de libertad v1 y v2.

Dada la complejidad de la ecuación (5),  generalmente el rango de mediana se aproxima mediante la siguiente expresión, exacta dentro de 0.005 [1]:

calculo_15

Donde:

RM(xi): Rango de mediana.

i: Orden de falla.

n: Número total de datos de la muestra.

Dado que la ecuación (5) es más exacta, en los cálculos se empelará ésta. Para facilitar su empleo, a continuación se presenta el código fuente para crear una función definida por el usuario en Excel.

Para crear la función, síganse los siguientes pasos:

  • Abra Excel.
  • Hágase la combinación de teclas Alt +F11. Esta acción abrirá el editor de Visual Basic.
  • En el menú insertar de VB, selecciónese la opción Módulo.
  • En el panel derecho, cópiese el siguiente código fuente:

Public Function RangoMediana(alfa As Single, n As Long, i As Long) As Double

’*****************************************************************************

’*Esta función calcula el rango de mediana en función de la distribución F.  *

’*alfa representa el nivel de significancia con el que se calcula la dist. F.*

’*n es el número de puntos de la muestra.                        *

’*i es el orden de falla.                                  *

’*****************************************************************************

     Dim a As Double, f As Double

     On Error GoTo ManejarError

     a = i / (n - i + 1)

     f = Application.WorksheetFunction.FInv(alfa, 2 * (n - i + 1), 2 * i)

     RangoMediana = a / (f + a)

Salir:

     Exit Function

ManejarError:

     Select Case Err.Number

          Case 1004

               MsgBox “Los argumentos (n) o (i) no pueden ser cero.”, vbCritical + vbOKOnly

          Case Else

               MsgBox “Se ha generado el error ” & Err.Number & _

                     Err.Description, vbCritical + vbOKOnly

     End Select

     Resume Salir

End Function

  • Hágase clic en guardar del menú Archivo del editor de VB para guardar la función.
  • Hágase clic en Cerrar y volver a Excel del editor de VB. Esta acción cierra el editor de VB.
  • Para usar la función creada,  selecciónese Función del menú Insertar de Excel. Se abre la ventana Insertar función.
  • En la ventana Insertar función, en la lista desplegable O seleccionar una categoría, selecciónese la categoría Definidas por el usuario.
  • En el cuadro de lista Seleccionar una función, hágase clic en RangoMediana.
  • Hágase clic en el botón Aceptar.
  • En la ventana Argumentos de función, digítese los valores de los argumentos. Téngase en cuenta que el valor del argumento alfa siempre es 0.5.

3.3 Pasos

1.- A continuación se presenta la secuencia que se debe seguir en la aplicación del método de los Mínimos Cuadrados.1. Asuma  (parámetro de localización) igual cero y ordene los datos de menor a mayor. El criterio de ordenación debe ser el tiempo entre fallas. Véase la tabla 1.

calculo_16

2. Calcule el rango de mediana para cada observación usando la ecuación (5) ó (6).

En nuestro caso se usará la ecuación (5), empleando la función definida por el usuario RangoMediana. Véase la figura 2.

calculo_17

Los argumentos de la función RangoMediana toman los siguientes valores:

Alfa=0.5; n=140 (total de puntos de la muestra); i= toma el valor indicado en la columna A. Los valores calculados se muestran en la tabla 2.

 calculo_18

3. Calcule el logaritmo natural del tiempo entre fallas para cada observación.

Véase la figura 3.

 calculo_19

Obsérvese que en la función LN(número) de la columna D, el parámetro de localización, el cual se obtiene de la celda L8, vale cero. Esto es importante, ya que la celda que contiene el parámetro de localización será la celda cambiante de Solver, en el caso que sea necesario calcular este parámetro. Los valores de la abscisa x se muestran en la tabla 3.

calculo_20

4. Calcule el valor de la ordenada y, es decir, el logaritmo del logaritmo del inverso de uno menos el rango de mediana para cada uno de las observaciones de la muestra. Véase la figura 4.

calculo_21

Obsérvese la anidación de la función logaritmo. El valor del rango de mediana se obtiene de los datos calculados en la columna C. Los valores de la ordenada y se muestran en la tabla 4.

calculo_22

5. Genere un gráfico con los datos de las columna D y E.

Al trazar estos puntos, se genera la recta de regresión. Para ello selecciónese Gráfico del menú Insertar de Excel; aparece la ventana Asistente para gráficos. En ésta, escójase la opción XY (Dispersión) en la lista Tipo de gráfico y síganse las instrucciones en pantalla. Véase la figura 5

calculo_23

calculo_23b.

Para hallar la ecuación de la recta de regresión, empléense las funciones: PENDIENTE (conocido_y; conocido_x) donde: conocido_y son los valores dependientes (valores de la columna E) y conocido_x son los valores independientes (valores de la columna D) para estimar la pendiente de la recta; INTERSECCIÓN.EJE (conocido_y; conocido_x) para estimar el intercepto de la recta.  Para determinar el grado de correlación lineal de los puntos, empléense las funciones: PEARSON (matriz1; matriz2) donde matriz1 son los valores dependientes (columna E) y matriz2 son los valores independientes (columna D). Esta función devuelve el coeficiente de correlación r. COEFICIENTE.R2 (conocido_y; conocido_x) devuelve el cuadrado del coeficiente de correlación. Estos valores, en sí, representan una especie de prueba de bondad de ajuste de la recta de regresión. El coeficiente de correlación está indicando que tan fuerte o débil es la relación lineal entre los datos; si este valor es más cercano a uno, hay una fuerte dependencia lineal. Por otro lado, el coeficiente de determinación, r2, está indicando el porcentaje de los puntos que están relacionados linealmente.

Aplicando las anteriores funciones de Excel, se obtiene la siguiente recta de regresión:

y=0.6995x-1.9514          (7)

De donde:

calculo_24

El coeficiente de correlación, r, indica que hay una excelente relación (dependencia) lineal de los datos, ya que su valor está muy próximo a uno. El coeficiente de determinación, r2, indica que el 94.64% de los datos están relacionados linealmente. En conclusión, estos valores indican que la muestra se comporta conforme a la función de densidad de Weibull.

6. Estime el valor del parámetro de forma y de escala.

Dado que el parámetro de forma es la pendiente de la recta de regresión, de la ecuación (7) se obtiene:

 calculo_25

De la ecuación (4), numeral 3.1, se obtiene el valor del parámetro de escala:

calculo_26

3.4 Consideraciones sobre el parámetro de localización

Las siguientes consideraciones se deben tener en cuanta al momento de analizar un parámetro de localización diferente de cero. Véanse las referencias bibliográficas [1], [6]

a) Si al graficar los puntos de la muestra aparece una cola de puntos hacia arriba o hacia abajo, es un indicativo de que el parámetro de localización debe ser calculado.

b) Una cola hacia abajo o una reducción súbita de la pendiente son indicativos de que un parámetro de localización positivo está presente. Véase la figura 5.

c) Una cola hacia arriba o un incremento súbito de la pendiente son indicativos de que un parámetro de localización negativo está presente. Este punto está de acuerdo con el intervalo de validez de . Véase el numeral 2.

Un parámetro de localización negativo se presenta cuando hay unidades con fallas en servicio, o unidades en servicio con defectos que causarán fallas. Ejemplos:

  • Defectos originados durante el ensamble.
  • Defectos originados durante el transporte.
  • Defectos originados durante la instalación o montaje.
  • Defectos originados durante el almacenamiento.

d) Valores grandes del parámetro de forma (β>10) son otro indicativo de que el parámetro de localización debe ser calculado.

Teniendo en cuanta las consideraciones anteriores, y analizando la figura 5, se procederá a calcular el parámetro de localización.

3.5 Cálculo del parámetro de localización calculo_26b

Para el cálculo del parámetro calculo_26b se usará el complemento Solver de Excel, ya que debe ser determinado por ensayo y error.

Para empezar, se debe definir la celda cambiante que, como se mencionó en el paso 3 del numeral 3.3, debe ser la celda donde se asignó el valor cero. Esta celda debe estar involucrada en una función. Véase la figura 3.

El mejor estimador de calculo_26b es el valor de calculo_26b que proporcione el mejor ajuste de la línea de regresión de los datos muéstrales.  El coeficiente de determinación, r2, proporciona esta medida [1], ya que éste mide la cantidad de puntos que están relacionados linealmente y, por lo tanto, la celda que contenga este valor será la celda objetivo a maximizar — pues el objetivo es mejorar el ajuste de la recta de regresión—. Para iniciar el cálculo se debe indicar al programa un punto de inicio, o punto semilla, en la celda cambiante. El mejor valor de inicio de calculo_26b es un valor ligeramente inferior al valor más bajo del tiempo entre fallas de la muestra. Para el ejemplo, el punto semilla sería 0.166 (es ligeramente inferior al valor más bajo del tiempo entre fallas de la muestra, el cual corresponde al dato de orden uno —0.167—. Véase la tabla 1). Este constituye la restricción en Solver. Véase la figura 6.

 calculo_27

Es importante tener en cuenta que la celda objetivo debe contener una formula que relacione directa o indirectamente el valor de la celda cambiante. Para el ejemplo la formula sería COEFICIENTE.R2 (E3:E142, D3:D142). Obsérvese que el rango del segundo argumento involucra la celda cambiante L8. Véase la figura 3.

Al hacer clic en el botón Resolver de la ventana Parámetros de Solver, el programa genera la solución 0.161, siendo este el valor del parámetro de localización, y el coeficiente de correlación se maximiza a 0.9886; es decir, al tener en cuenta el parámetro de localización se mejora el ajuste de la recta de regresión. De igual manera, los parámetros de forma y escala, y los valores de las abscisas (Xi) y ordenadas (Yi) se actualizan. Véase la figura 7.

 calculo_28

Para que los valores se actualicen automáticamente, éstos deben estar relacionados por fórmulas, tal y como se muestra en la figura 8.

calculo_29

Nótese que el valor del parámetro de localización es positivo, corroborando lo dicho en la parte b) del numeral 3.4.  La figura 9 muestra el trazo de la nueva recta de regresión, siendo notable la agrupación de los puntos en forma de línea. Comparece esta figura con la figura 5.

En la figura 10 se muestra el gráfico de la función de densidad de Weibull para los parámetros calculados. Reemplazándolos en la ecuación (1) se obtiene la siguiente ecuación:

 calculo_30

calculo_31

calculo_31b

calculo_32

CONCLUSIONES

1. El método de los mínimos cuadrados facilita el cálculo de los parámetros de la distribución de Weibull cuando se emplean programas informáticos como Excel.

2. El análisis del gráfico de la recta de regresión sirve de criterio para determinar si es necesario calcular el parámetro de localización.

3. El parámetro de localización tiene un gran efecto en la recta de regresión; sin embargo, se debe analizar concienzudamente si un calculo_26b diferente de cero es necesario.

4. El coeficiente de correlación, r, y el coeficiente de determinación, r2, se constituyen en una prueba de bondad de ajuste para la recta de regresión.

REFERENCIAS BIBLIOGRÁFICAS

  1. Dodson, Bryan. The Weibull Analysis Handbook. 2da ed. Milwaukee, Wisconsin: ASQ Quality Press, 2006.
  2. Abernethy, Robert B. The New Weibull Handbook. 5ta ed. North Palm Beach, Florida.  2006
  3. Walpole, Ronald E y Raymond Meyers. Probabilidad y estadística para ingenieros. 3ra ed. México: Interamericana, 1990
  4. Céspedes Zapata, Lucas y Santiago Mejía Isaza. Implementación de un Sistema de Indicadores para la gestión de Mantenimiento de una empresa textilera.  Medellín, 2005,194p. Trabajo de grado Ingeniería Mecánica. Universidad EAFIT. Departamento de Ingeniería Mecánica. Área de mantenimiento.
  5. Tamborero del Pino, José María. NPT 331: Fiabilidad: La distribución de Weibull [En línea] Disponible en: http://www.insht.es/InshtWeb/Contenidos/Documentacion/FichasTecnicas/NTP/Ficheros/301a400/ntp_331.pdf [Consulta: 22 de julio de 2010]
  6. Estimation of the Weibull parameters [En línea] Disponible en: http://www.weibull.com/LifeDataWeb/lifedataweb.htm [Consulta. 26 de julio de 2010]
  7. Yáñez, Medardo; Perdomo, José L y Gómez de la Vega, Hernando. Ingeniería de Confiabilidad: Pilar fundamental del mantenimiento [En línea] Disponible en: http://confiabilidad.net/articulos/ingenieria-de-confiabilidad-pilar-fundamental-del-mantenimiento/#comment-list [Consulta: 28 de julio de 2010]
  8. Duarte Holguín, Juan Carlos. Mantenimiento centrado en confiabilidad usando métodos de simulación del ciclo de vida [En línea] Disponible en: http://www.noria.com/sp/rwla/conferencias/mem/Duarte-paper.pdf [Consulta: 28 de julio de 2010]
  9. García Palencia, Oliverio. Optimización estadística del mantenimiento industrial [En línea] Disponible en: http://www.aciem.org/bancoconocimiento/O/Optimizacionestadisticadelmantenimientoindustr/Optimizacionestadisticadelmantenimientoindustr.asp [Consulta: 28 de julio de 2010]
  10. Luna, Ana Eugenia. Teoría de la confiabilidad [En línea] Disponible en: http://focuslab.lfp.uba.ar/public/CursoTErrores2k4/Monografias2005/Ana_E_Luna.pdf [Consulta: 22 de julio de 2010]

 

 

 

 

Commentarios (9)

  • Creo que la planta Nare es en Colombia. Felicidades al autor por la presentación matemática. Me gustaría conocer un ejemplo sobre un caso real de la planta cementera.

    Muchas gracias.

    1) Escrito 10:11 am, 17 Agosto 2010 by Sandor Mercz

  • Hola:

    Muy magistral la presentación del tema muy complicado como es tema de Weibull.
    Estamos formando un Módulo de Mantenimiento dentro del SAP.
    Creo que nos ayudará enormemente.
    Saludos

    2) Escrito 5:41 pm, 05 Octubre 2010 by Francisco Inchicaque

  • MatLAb facilita la estimación de los parámetros Weibull, utilizando el método de los momentos, el cual es mas preciso que los otros. Solo requiere :
    1) poner los datos en un vector ejm: a= [ 12 23 45 18 ...]

    2) ordenar ajustar la weibull con:

    wblfit(a)

    y de inmediato tiene los parámetros weibull.

    Fernando Ibarra (San Cristóbal, Venezuela)

    3) Escrito 10:19 pm, 15 Noviembre 2010 by Fernando Ibarra

  • Bien interesante..... pero necesito ayuda con esto. porque trate de aplicar la formula en el lenguaje fuente codigo y no pude.. medice error solo copie y pegue tal cuel y no ---- ayuda porfa

    4) Escrito 1:32 pm, 04 Mayo 2011 by Paula Morao

  • EStimados, yo quisiera perdirles por favor plantear la evaluación de la velocidad del viento en función ewibull, comentar las curvas de distribución con la aplicación de modelos sistemas erogeneradores para los casos de comportamiento. Gracias.
    DONATO

    5) Escrito 11:30 am, 18 Julio 2011 by DONATO MITMA CHOQUE

  • como estimar el valor de teta

    6) Escrito 10:06 am, 09 Agosto 2011 by rojo

  • necesito 3 ejemplos relacionados con la industria en donde logres identificar un problema o alguna area de oportunidad, en el cual, veamos en tamaño de la población, muestra a tomar y las hipótesis a tratar.
    les agradeceria si me pudieran ayudar

    7) Escrito 11:48 am, 30 Septiembre 2011 by yuridia

  • Alicando wblfit de matlab es mas exacto, para hallar el parametro de escala y de forma de weibull.

    Muchas gracias Fernando ibarra, me ha servido de mucho tu sugerencia.

    Carlos Palacio (Colombia)

    8) Escrito 6:08 pm, 08 Febrero 2012 by Carlos Palacio

  • Donde puedo encontrar los datos originales

    9) Escrito 10:49 am, 23 Febrero 2012 by Enrique RAMOS

Deje su comentario

Los comentarios se moderan antes de publicar.
Favor de llenar la información siguiente.
Su correo electrónico no se publicará.

Parámetros de comentario

Se puede usar HTML básico (a, strong, em, blockquote).
Vínculos usan el atributo nofollow automáticamente.
Comentarios poco apropriados, o que no se tratan del tema seran editados.