Control de Calidad
a. Tema
Intensidad de los Vientos en Las Salinas, Baní.
Intensidad de los Vientos en Las Salinas, Baní.
Objetivos
• Generales
o Determinar el potencial eólico en la zona de Las Salinas, Baní.
• Específicos
o Determinar la distribución de probabilidad de la intensidad de los vientos.o Calcular los parámetros de la distribución de probabilidades.
o Determinar la densidad de la potencia de la energía eólica en la zona estudiada.
o Calcular la variación de la velocidad horizontal de los vientos con la altura.0
b. Introducción
La zona de Las Salinas, Baní, está ubicada en la costa sur de la República Dominicana en una especie de península que se encuentra bien expuesta a los vientos del mar que, por lo general, soplan del este. (Ver Atlas).
Ubicación Geográfica
La torre de medición con los tres anemómetros se encuentra localizada en el punto geográfico cuyas coordenadas escribimos a continuación:
18°, 13.620 N
70°, 32.901 W
30 m de altura sobre el nivel del mar
y a unos 10 m de la costa, en Las Salinas, Baní.
c. Estadística Descriptiva
• Muestras Aleatorias IID
Utilizamos un conjunto de muestras tomadas aleatoriamente, por un anemómetro, que representan las diferentes velocidades de los vientos en la zona de estudio: Las Salinas, Baní.
Tamaño de la muestra
n = 32, 027 datos
• Tabla de Frecuencias
La tabla de frecuencias es una técnica para estudiar los conjuntos numéricos en grupos o clases, especificando las características de interés.
A continuación se presenta la tabla de frecuencias para la muestra de velocidades:
Cálculo del Número de Clases:
N = 1 + 3.322 Log n, donde n es el tamaño de la muestra
N = 1 + 3.322 Log (32,027) = 15.97 = 16
Longitud de la Clase:
L = (Valor Mayor ‐ Valor Menor) / Numero de Clases.
L = (18.71 ‐ 0) / 16 = 1.17
• Medidas de Tendencia Central
• MediaLa media representa el promedio del conjunto de datos. Se define como la suma de los valores observados dividido entre el tamaño de la muestra. Para datos agrupados en clases se define como: |
• Moda
La moda es el valor de la variable que presenta mayor frecuencia absoluta. Puede haber más de una. Cuando los datos están agrupados en clases se puede tomar la marca de clase o utilizar la fórmula siguiente:
Donde:
Linf = límite inferior de la clase modal
= amplitud del intervalo
d1 = diferencia entre de la clase modal y la de la clase anterior
d2 = diferencia entre de la clase modal y la de la clase posterior
• Mediana
La mediana es el valor de la variable tal que el número de observaciones menores que él es igual al número de observaciones mayores que él.
Cuando los datos están agrupados, la mediana viene dada por el primer valor de la variable cuya excede a la mitad del número de datos. Si la mitad del número de datos coincide con se tomará la semisuma entre este valor y el siguiente.
Cuando los datos estén agrupados en clases se puede utilizar reglas de tres o la fórmula:
Donde:
Md = Mediana.
Li = Limite inferior o frontera inferior de donde se encuentra la mediana, la forma de calcularlo es a través de encontrar la . En ocasiones el intervalo donde se encuentra la mediana se conoce como intervalo mediano.
n = Número de observaciones o frecuencia total.
= Frecuencia acumulada anterior al intervalo mediano.
= Frecuencia del intervalo mediano.
A = Amplitud del intervalo en el que se encuentra la mediana.
• Medidas de Variabilidad / Disposición
• Varianza y Desviación Estándar
Varianza:
Es la sumatoria del margen de la clase al cuadrado por la frecuencia relativa, menos la media al cuadrado.
Desviación Estándar:
Es la raíz cuadrada positiva de la varianza.
• Recorrido Interdecil
Indica la dispersión de las observaciones con valores entre los percentiles de 0.9 menos el de 0.1.
Recorrido Interdecil |
= P0.9 - P0.1 |
• Recorrido Intercuartil
Refleja la variabilidad de las observaciones comprendida entre los percentiles 0.75 y 0.25.
Recorrido Intercuartil |
= P0.75- P0.25 |
• Gráficas
• Histograma
• Polígono de Frecuencia
• Diagrama de caja y extensión
Este gráfico resume información tanto de localización como de dispersión y utiliza, para ello los datos del mínimo, los tres cuartiles y el máximo.
Utilizando los cuartiles obtenidos de la muestra:
• Formulación de las Hipótesis
•Distribución de ProbabilidadesH0: X posee una distribución NormalH1: X no posee una distribución Normal
Parámetros
Si nuestra muestra de datos responde a una distribución de probabilidad Normal, los parámetros a estimar serán y .
• Distribución de Probabilidades
H0: X posee una distribución Weibull.
H1: X no posee una distribución Weibull. Parámetros
Parámetros
Si nuestra muestra de datos responden a una distribución de probabilidad Weibull, los parámetros a estimar serán y .
• Estadística Inferencial
Prueba de Hipótesis Chi‐Cuadrada
Esta prueba se utiliza para determinar si una población tiene una distribución teórica específica. Se basa en qué tan buen ajuste tenemos entre la frecuencia de ocurrencia de las observaciones de una muestra obtenida y las frecuencias esperadas que se obtienen a partir de la distribución hipotética.
• Hipótesis a probar:
H0: X posee una distribución Normal.H1: X no posee una distribución Normal
H1: X no posee una distribución Normal
Utilizando la tabla de frecuencias y aplicando el método Chi‐Cuadrado:
Según podemos observar, el valor de es 2,119.13, mientras que el percentil con un intervalo de confianza de 99% y con grado de libertad – 1 = 15, tenemos que 0.99, 15 es igual a 30.5780.
Conclusión: Se rechaza la hipótesis nula, ya que por lo tanto la muestra
• Hipótesis a probar:
H0: X posee una distribución Weibull.H1: X no posee una distribución Weibull
Utilizando la tabla de frecuencias y aplicando el método Chi‐Cuadrado:
Según podemos observar, el valor de es 1,524.42, mientras que el percentil con un intervalo de confianza de 99% y con grado de libertad k ‐ 1 = 15, tenemos que 2 0.99, 15 es igual a 30.5780.
Conclusión: Se rechaza la hipótesis nula, ya que por lo tanto la muestra no posee una distribución Weibull.
Distribución de la población
A pesar de los resultados arrojados por la prueba Chi‐Cuadrada, hemos decidido asumir que la población posee una Distribución Weibull, ya que de las dos pruebas realizadas es la que tiene el menor grado de error.
• Estimación de Parámetros
Dado que nuestra muestra corresponde a una población de distribución de probabilidad Weibull, los parámetros a estimar serán
• Método de Máxima Verosimilitud
La función de densidad correspondiente será:
PRIMER PASO:
SEGUNDO PASO:
Ya que necesitamos estimar dos parámetros, debemos derivar la expresión anterior respecto a cada parámetro, igualar a cero cada ecuación y resolver el sistema de ecuaciones para cada variable.
Debido a la complejidad de este sistema de ecuaciones, utilizamos el Solver de Microsoft Excel, el cual realiza una serie de iteraciones hasta encontrar los valores de y que satisfacen ambas ecuaciones; el resultado arrojado por el programa es que este sistema no es consistente, es decir, que no existen valores de los parámetros que simultáneamente hagan cero las ecuaciones. Por lo tanto, se descarta este método para estimar los parámetros de esta distribución.
• Método de los momentos
La función de densidad correspondiente será:
|
Estas son las ecuaciones resultantes:
Como podemos apreciar este sistema de ecuaciones presenta cierta complejidad, por esta razón utilizamos el Solver de Microsoft Excel, el cual realiza una serie de iteraciones hasta encontrar los valores de y que satisfacen ambas ecuaciones.
Los valores de los parámetros son:
• Intervalos de confianza
Esperanza matemática de Weibull E(x)
|
|
Varianza de Weibull Var (x)
Los intervalos de confianza para la varianza de Weibull no pueden ser determinados, ya que no existe una función que defina la varianza cuando los datos responden a tal distribución.
• Prueba de hipótesis a los parámetros
Método del valor crítico Gráfica
|
|
Conclusión: No se rechaza la hipótesis nula ya que , por lo tanto la esperanza matemática de Weibull puede ser considerada 7 m/s.
Potencia de prueba
Probabilidad de rechazar la hipótesis nula cuando es falsa.
Error tipo II
Probabilidad de no rechazar la hipótesis nula cuando es falsa.
Conclusiones:
Luego de analizar las muestras por los diferentes métodos, concluimos lo siguiente:
• Distribución de probabilidades: Asumimos que los datos pertenecen a una Distribución Weibull, porque es la que presenta menor grado de error y por lo tanto un mejor ajuste, a pesar de que la prueba Chi-Cuadrada arrojó como resultado que no respondían a tal distribución.
• Parámetros: Por otro lado, los cálculos aplicados a los parámetros de la función de densidad de Weibull arrojaron los siguientes resultados:
Ya que no se ha definido un procedimiento matemático para encontrar los intervalos de a y ., determinamos los intervalos de la esperanza matemática de Weibull:
Y por último, formulamos la siguiente hipótesis, respecto a la media de los datos:
Comprobamos que no se rechaza la hipótesis nula y que por tanto la media puede ser considerada 7m/s.
II. Regresión y Correlación
Tema
Relación Funcional entre la Intensidad de los Vientos y la Hora del Día en Las Salinas, Baní.
Objetivos
• Modelo Matemático
Evaluaremos los siguientes modelos matemáticos, para determinar cual es el que mejor se ajusta a los datos, y así obtener una expresión que nos permita predecir la velocidad de los vientos a una determinada hora del día:
• Modelo Lineal
• Modelo Potencial
• Modelo Exponencial
• Modelo Crecimiento saturado
• Modelo Polinomial
• Análisis de Correlación
Mediremos la intensidad de la relación que existe entre la velocidad de los vientos y la hora del día en Las Salinas, Baní, por medio del coeficiente de correlación.
• Prueba de Hipótesis de los parámetros
Se realizaran dos pruebas de hipótesis al coeficiente de correlación:
1. Prueba T de Student
2. Prueba Z
Estadística Descriptiva
• Muestras Aleatorias IID
Para realizar los cálculos referentes a la regresión, agrupamos y promediamos los datos por horas. De ésta forma, tenemos la media de la velocidad del viento para cada hora del día.
En la muestra tomamos como variable independiente al tiempo (X) y como variable dependiente (Y) a la velocidad de los vientos.
• Diagrama de Dispersión
• Formulación de Hipótesis
Estadística Inferencial
• Análisis de Regresión y Correlación
• Modelo de Regresión Lineal
Coeficiente de Regresión:Coeficiente Aditivo:Ecuación de Regresión: |
Coeficiente de Correlación:Coeficiente de Determinación:Error estándar |
Gráfica
• Modelo de Regresión Potencial
Coeficiente de Regresión:Coeficiente Aditivo:Ecuación de Regresión: |
Coeficiente de Correlación:Coeficiente de Determinación:Error estándar |
Gráfica
• Modelo de Regresión Exponencial
Coeficiente de Regresión:Coeficiente Aditivo:Ecuación de Regresión: |
Coeficiente de Correlación:Coeficiente de Determinación:Error estándar |
Gráfica
• Modelo de Regresión Crecimiento Saturado
Coeficiente de Regresión:Coeficiente Aditivo:Ecuación de Regresión: |
Coeficiente de Correlación:Coeficiente de Determinación:Error estándar |
• Modelo de Regresión Polinomial de Orden 6
• Método de los mínimos cuadrados
Polinomio de orden 6
La ecuación (1) se introdujo en la función , la cual representa el error. Luego, derivando a Q respecto a cada coeficiente y simplificando las ecuaciones obtuvimos los siguientes resultados:
Debido a la complejidad que presenta este sistema ecuaciones, utilizamos la herramienta Solver de Microsoft Excel para encontrar los valores de los coeficientes, los resultados son los siguientes:
Ecuación de Regresión:
Coeficiente de Correlación:Coeficiente de Determinación: |
Error estándar |
Seleccionamos el modelo polinomial de orden 6 porque es el que posee el menor error estándar . Y por tanto es el que logra el mejor ajuste de los datos.
• Prueba de Hipótesis al Coeficiente de Correlación
o Prueba t de student
(no hay correlación)
(hay correlación)
Método del Estadístico de Prueba:
Estadístico de Prueba: |
Percentil: |
Conclusión:
Se rechaza la hipótesis nula, ya que y por tanto concluimos que hay correlación entre las variables Hora (X) y Velocidad de los Vientos (Y).
o Prueba Z
|
|
Método del Estadístico de Prueba:
Estadístico de Prueba: |
Percentil: |
Conclusion:
No se rechaza la hipótesis nula, ya que y por tanto concluimos que el coeficiente de correlación es igual o menor que
Conclusiones
Después de efectuar los cálculos de regresión y correlación llegamos a las siguientes conclusiones:
• Modelo Matemático
El modelo matemático que más se ajusta a los datos es el modelo Polinomial de orden 6. Concluimos esto basándonos en el cálculo del error estándar.
•Intensidad de la Relación Funcional
Basándonos en las pruebas de hipótesis realizadas al coeficiente de correlación determinamos que existe una alta relación funcional entre las variables hora (X) y velocidad de los vientos (Y). Además, comprobamos que el coeficiente de correlación puede ser igual o menor que 0.95.
• Cálculo del Factor del Patrón de Energía
El factor del patrón de energía Ke, se puede calcular en función del parámetro de forma de la distribución de Weibull de la siguiente forma:
En donde n = 8760 es el número de horas en un año.
De la expresión:
se deriva lo siguiente:
y por tanto:
Estimación del Potencial de Energía Eólica
El tipo y la calidad de los datos de viento disponibles determinan el tipo de análisis a realizar y su precisión. Para obtener resultados con alrededor de un 95% de confiabilidad se requieren datos de velocidad, de presión atmosférica y de temperatura del aire.
Asumiendo que la velocidad del viento, la presión atmosférica y la temperatura del aire se miden simultáneamente para cada intervalo, la potencia por unidad de área perpendicular a la velocidad del viento se puede calcular según la fórmula siguiente:
En donde el cociente: P/A es el potencia de la energía del viento y es la densidad del aire. La densidad del aire se puede calcular utilizando la siguiente ecuación:
En donde Pr es la presión atmosférica en mm de Hg y T es la temperatuyra del aire en grados Kelvin.
Si la velocidad y la densidad del aire se conocen, el potencial promedio de la energía del viento se puede estimar, para cualquier período de tiempo conveniente utilizando la siguiente formulación:
En donde la sumatoria se efectúa a lo largo de todos los intervalos de tiempo N.
En el caso particular de los datos de que disponemos este cálculo resultó ser igual a:
Utilizando los valores de velocidad de la tabla que se muestra a continuación y considerando la densidad del aire constante e igual a 1.29 Kg/m.
Este potencial eólico se considera moderado y adecuado para aplicaciones rurales.
BIBLIOGRAFÍA
1. B.J. (1971), Statistical Principles in Experimental Design, 2nd Edition, McGraw‐Hill, New York.
2. Bucklew, J. A. (1990), Large Deviation Techniques in Decision, Simulation and Estimation, John Wiley & Sons, New York.
3. Canavos George E., (1987), Probabilidad y Estadística. Aplicaciones y Métodos, Mc Graw‐Hill, New York.
4. Elliot D.L, (1987), “Caribbean and Central American Wind Energy Assessment Proceedings”, Windpower ´87, American Wind Energy Association, October, 1987, pp. 160‐167.
5. Fergunson T.S., (1996), A course in Large Sample Theory, Chapman and Hall, London, New York.
6. Fishman G., (1996), Monte Carlo: concepts, algorithms and applications, Springer‐Verlag, New York.
7. Henessey J.P.Jr., “A Comparison of the Weibull and Rayleigh Distribution for Estimating Wind Power Potential”, Wind Engineering, Vol. 2, 1978, pp. 156‐164.
8. Justus C.G., Hargreaves W.R., Mikhail A., Graber D., (1978), “Methods for Estimating Wind Speed Frequency Distributions”, J. Appl. Met., Vol. 17, 1978, pp. 350‐353.
9. Neyman J., Scott E.L., (1948), “Consistent Estimates Based on Partially Consistent Obsevations”, Econometrica, 16, 1‐32
10. Sen P.K., Singer J.M., (1993), Large Sample Methods in Statistics, Chapman and Hall, London, New York.
11. Winer B.J., (1971), Statistical Principles in Experimental Design, 2nd Edition, Mc Graw‐Hill, New York.