viernes, 22 de mayo de 2009

DIAGRAMA DE CAJA O BLOXPLOT

Diagrama de Caja o Boxplot: Se le llama de caja prque es rectangular y la altura uno lo tiene que definir y encontrar.

PARA QUE SIRVE: Sirve para establecer datos atipicos.

DATO ATIPICO: Se sale de lo normal y se encuentran en los extremos inferior y superior mas alla de los bigotes.

BARRERA EXTERIOR E INTERIOR QUE EXISTE.
Cuando los datos se encuentran entre la barrera exterior e interior se llaman ATIPICOS, si se encuentran despues de la barrera exterior se les llama DATOS ATIPICOS EXTREMOS.

Otra definicion:
Es un gráfico representativo de las distribuciones de un conjunto de datos en cuya construcción se usan cinco medidas descriptivas de los mismos, a saber: mediana, primer cuartil, tercer cuartil, valor máximo y valor mínimo.

Las partes del Boxplot se identifican como sigue:

1.-Límite superior: Es el extremo superior del bigote. Las opiniones por encima de este límite se consideran atípicas. Para más detalles consulte sobre la construcción de los límites y los valores atípicos.

2.-Tercer cuartil (Q3): Por debajo de este valor se encentran como máximo el 75% de las opiniones de los estudiantes.

3.-Mediana: Coincide con el segundo cuartil. Divide a la distribución en dos partes iguales. De este modo, 50% de las observaciones están por debajo de la mediana y 50% está por encima.

4.-Primer cuartil (Q1): Por debajo de este valor se encuentra como máximo el 25% de las opiniones de los estudiantes

5.-Límite inferior: Es el extremo inferior del bigote. Las opiniones por debajo de este valor se consideran atípicas. Para más detalles consulte sobre la construcción de los límites y los valores atípicos.

6.-Valores atípicos: Opiniones que están apartadas del cuerpo principal de datos. Pueden representar efectos de causas extrañas, opiniones extremas o en el caso de la tabulación manual, errores de medición o registro.
Se colocan en la gráfica con asteriscos (*) o puntos (.) según se alejan menos o más del conjunto de datos. Se utiliza un superíndice numérico para indicar el número de veces que aparece ese dato como atípico.

7.-Media aritmética: Es lo que tradicionalmente se conoce como promedio. Originalmente no forma parte del boxplot, sin embargo, se consideró su inclusión para dar una idea del puntaje general obtenido por pregunta. Actualmente se trabaja en la elaboración de estadísticos más representativos que la media aritmética para describir el conjunto de datos.

· Sobre la construcción de los límites y los valores atípicos
Tukey (1997) sugiere una regla sencilla para determinar los límites de los bigotes. Tomando en cuenta que el Rango Intercuartílico (RI) es la diferencia entre el Tercer y el Primer Cuartil, tenemos que existen límites interiores y límites exteriores. Los primeros son barreras hasta las cuales se “permiten” datos de la muestra, por estar muy cerca del resto. Estos son los límites que definen los extremos de los bigotes. De sobrepasar esta barrera se le considera valor atípico. Los segundos límites indican cuándo un dato se aleja en exceso del resto y, siendo también atípico, se le considera fuera del límite exterior permitido y se dice que es aún más atípico.

Se construyen así:

Límite interior inferior = Límite del bigote inferior = Q1 - 1,5RI
Límite interior superior = Límite del bigote superior = Q3 + 1,5RI
Límite exterior inferior = Q1 - 3RI
Límite exterior superior = Q3 + 3RI

Graficas:





DATOS ATIPICOS(2do metodo):Estos se pueden analizar por medio de un diagrama de caja y tambien se le puede hacer una campana encima de la grafica.

domingo, 10 de mayo de 2009

ecuacion de regresion

ECUACION DE REGRESION:
Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno, indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en cualquier dirección. y sirve para hallar la prediccion de cierto numero.

Y SU FORMULA ES: ¨
Yn=a0+a1(n)

viernes, 8 de mayo de 2009

ERROR DE ESTIMA

ERROR DE ESTIMA:
Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza. Cuanta más precisión se desee en la estimación de un parámetro, más estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el error, más ocurrencias deberán incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, más error se comete al aumentar la precisión.


EJEMPLO:

jueves, 7 de mayo de 2009

COVARIANZA

LA COVARIANZA: es una técnica estadística que, utilizando un modelo de regresión lineal múltiple, busca comparar los resultados obtenidos en diferentes grupos de una variable cuantitativa pero corrigiendo las posibles diferencias existentes entre los grupos en otras variables que pudieran afectar también al resultado (covariantes).


PENDIENTE

PENDIENTE:
Es cuando esta inclinada o tiene inclinacion. La inclinacion se puede medir por medio de un angulo per se mide por numeros enteros.

FORMULA:
Y2-Y1=m(X2-X1)

EJEMPLO:

REGRESION CUADRATICA

La regresión cuadrática: es el proceso por el cuál encontramos los parámetros de una parábola que mejor se ajusten a una serie de datos que poseemos, ya sean mediciones hechas o de otro tipo. Bueno, pero por que habríamos de querer ajustar nuestros datos precisamente a una parábola y no a otra función?

DIAGRAMA DE DISPERSION:


Una función cuadrática o de segundo grado se puede representar de manera genérica como :
Y= a+bx+cx^

EJEMPLO:


sumatorias de la matriz:
Por lo tanto: a=9.6 b=1.76 c=2.02
la parábola de mejor ajuste es entonces:





REGRESION EXPONENCIAL

REGRESION EXPONENCIAL:

Será aquella en la que la función de ajuste será una función exponencial del tipo

y = a.bx

La regresión exponencial aunque no es lineal es linealizable tomando logaritmos ya que haciendo el cambio de variablev = log y tendremos que la función anterior nos generaría:

v = log y = log( a.bx) = log a + x log b
la solución de nuestro problema vendría de resolver la regresión lineal entre v ý x, y una vez obtenida supuesta ésta:v* = A + B x ; obviamente la solución final será:

a = antilog A y b = antilog B.


DIAGRAMA DE DISPERSION

Diagrama De Dispersión: la primera forma de describir una distribución bivariante es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.
Es una representación gráfica de la relación entre dos variables, muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos.


CORRELACION LINEAL Y RECTA DE REGRESION

Correlación Lineal Y Recta De Regresión:Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión.
Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.

Ejemplo 2:Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos realizados.Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y negativa (la recta es decreciente).




FORMULA:

y = A + Bx


CORRELACION

CORRELACION:Es frecuente que estudiemos sobre una misma población los valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas.
Medida De La CorrelaciónLa apreciación visual de la existencia de correlación no es suficiente. Usaremos un parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos permite valorar si ésta es fuerte o débil, positiva o negativa.

LINEA DE TENDENCIA

Linea De Tendencia: Es la herramienta básica más importante con la que cuenta el analista técnico. Es una línea o conjunto de líneas que se trazan en el gráfico uniendo con una misma pendiente series sucesivas de puntos mínimos (línea de tendencia alcista) o de puntos máximos (línea de tendencia bajista).Sirve para determinar en primer lugar la dirección del mercado y establecer sus objetivos de proyección. Marca los niveles de soporte o de resistencia que están proyectando los precios. Permite analizar en cada momento el nivel de Beneficio/Riesgo que se puede tomar al iniciar o cerrar una posición, tomando como referencia el precio actual respecto a línea de tendencia y su proyección. La ruptura de una línea de tendencia al alza o la baja es una de las señales que confirma un cambio en la dirección de los precios. Son la base para trazar los canales que encuadran el posible movimiento de los precios. Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras.









REGRESION

La regresión estadística o regresión a la media es la tendencia de una medición extrema a presentarse más cercana a la media en una segunda medición. La regresión se utiliza para predecir una medida basándonos en el conocimiento de otra, es una herramienta estadística que permite analizar y predecir o estimar observaciones futuras de dos o más variables relacionadas entre sí, es decir una herramienta útil para la planeación.
La regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.

SEGUNDO BIMESTRE

SEGUNDO BIMESTRE:



TABLA DE DOBLE ENTRADA

Tablas de doble entrada:
Los estudios estadísticos que se centran en el análisis de una sola variable se llaman unidimensionales. Sin embargo, en las situaciones reales es corriente que se tenga que investigar la combinación de dos variables estadísticas, en lo que se conoce por distribución bidimensional. En este campo, se utilizan presentaciones de los datos en tablas de doble entrada, con gráficas de nube de puntos que interrelacionan las variables.
También llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categorías o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o numero de elementos que reúnen a la vez las dos categorías o valores de las dos variables que se cruzan en cada casilla. Para la tabulación de un material agrupado de observaciones simultaneas de dos variables aleatorias necesitaremos una tabla descrita como anteriormente lo describimos, las reglas para agrupar son las mismas que en el caso de una sola variable.



EJEMPLO:



OTRO EJEMPLO:




tallo y hojas

TALLO Y HOJAS:
Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada observación a lo largo del eje horizontal.Un diagrama de tallo y hoja te permite analizar la probabilidad de que un suceso ocurra sin utilizar probabilidad y estadística concretamente.
Como construirlo??En un gráfico de tallo y hoja cada valor de datos es partido en "un tallo" "y una hoja". "La hoja" es por lo general el último dígito del número y los otros dígitos a la izquierda "de la hoja" forman "el tallo". Por ejemplo, el número 136 sería partido como:TALLO: 13HOJA: 6
EJEMPLO:


OTRO EJEMPLO: