lunes, 27 de julio de 2009

CONJUNTOS

Conjuntos:
La Un conjunto es una agrupación, clase o colección de objetos denominados elementos del conjunto teoría de conjuntos es una división de las matemáticas que estudia los conjuntos.

Sabemos que la palabra conjunto implica la idea de una colección de objetos que se caracterizan en algo común.
En matemática tiene el mismo significado, sólo que a estos objetos se les llama elementos o miembros del conjunto.Un conjunto es una colección bien definida de objetos de cualquier clase.

Subconjuntos:
Conjunto que forma parte de otro conjunto dado.
Por ejemplo, el conjunto de los números c, {1, 2, 3, 4, ...}, es un subconjunto de los enteros I, {..., -3, -2, -1, 0, 1, 2, 3, ...}, y se escribe como c I.


DIAGRAMA DEL ARBOL

Diagrama del árbol...
Un diagrama de árbol es una representación gráfica de un experimento que consta de r pasos, donde cada uno de los pasos tiene un número finito de maneras de ser llevado a cabo.
Un diagrama de árbol es una representación gráfica que muestra los resultados posibles de una serie de experimentos y sus respectivas probabilidades.
Es una representación gráfica que muestra el desglose progresivo de los
factores o medios que pueden contribuir a un efecto u objetivo determinado.
















PERMUTACIONES

Permutaciones:
Una permutación es una combinación en donde el orden es importante.

En matemáticas, dado un conjunto finito con todos sus elementos diferentes, llamamos perPara entender lo que son las permutaciones es necesario definir lo que es una combinación y lo que es una permutación para establecer su diferencia y de esta manera entender claramente cuando es posible utilizar una combinación y cuando utilizar una permutación al momento de querer cuantificar los elementos de algún evento.mutación a cada una de las posibles ordenaciones de los elementos de dicho conjunto.

COMBINACIONES

Combinaciones:-
En el caso de las combinaciones, lo importante es el número de agrupaciones diferentes de objetos que pueden incurrir sin importar su orden.
Por lo tanto en las combinaciones se busca el número se subgrupos diferentes que pueden tomarse a partir de n objetos.
El número de combinaciones de n objetos tomados r a la vez es igual a:

nCr = n!

r! (n-r)!


INTRODUCCION A LA PROBABILIDAD

Introducción a la probabilidad:

Cada vez que realizamos un cálculo matemático para resolver un problema físico, estamos aplicando un modelo matemático a un fenómeno de la realidad.Este fenómeno puede ser, por ejemplo, la caída de un objeto desde cierta altura, y en este caso utilizamos un modelo que es la Ley de Gravedad.

En la vida cotidiana aparecen muchas situaciones en las que los resultados observados son diferentes aunque las condiciones iniciales en las que se produce la experiencia sean las mismas.Debido al importante papel desempeñado por la probabilidad dentro de la estadística, es necesario familiarizarse con sus elementos básicos.






TERCER BIMESTRE...













viernes, 22 de mayo de 2009

DIAGRAMA DE CAJA O BLOXPLOT

Diagrama de Caja o Boxplot: Se le llama de caja prque es rectangular y la altura uno lo tiene que definir y encontrar.

PARA QUE SIRVE: Sirve para establecer datos atipicos.

DATO ATIPICO: Se sale de lo normal y se encuentran en los extremos inferior y superior mas alla de los bigotes.

BARRERA EXTERIOR E INTERIOR QUE EXISTE.
Cuando los datos se encuentran entre la barrera exterior e interior se llaman ATIPICOS, si se encuentran despues de la barrera exterior se les llama DATOS ATIPICOS EXTREMOS.

Otra definicion:
Es un gráfico representativo de las distribuciones de un conjunto de datos en cuya construcción se usan cinco medidas descriptivas de los mismos, a saber: mediana, primer cuartil, tercer cuartil, valor máximo y valor mínimo.

Las partes del Boxplot se identifican como sigue:

1.-Límite superior: Es el extremo superior del bigote. Las opiniones por encima de este límite se consideran atípicas. Para más detalles consulte sobre la construcción de los límites y los valores atípicos.

2.-Tercer cuartil (Q3): Por debajo de este valor se encentran como máximo el 75% de las opiniones de los estudiantes.

3.-Mediana: Coincide con el segundo cuartil. Divide a la distribución en dos partes iguales. De este modo, 50% de las observaciones están por debajo de la mediana y 50% está por encima.

4.-Primer cuartil (Q1): Por debajo de este valor se encuentra como máximo el 25% de las opiniones de los estudiantes

5.-Límite inferior: Es el extremo inferior del bigote. Las opiniones por debajo de este valor se consideran atípicas. Para más detalles consulte sobre la construcción de los límites y los valores atípicos.

6.-Valores atípicos: Opiniones que están apartadas del cuerpo principal de datos. Pueden representar efectos de causas extrañas, opiniones extremas o en el caso de la tabulación manual, errores de medición o registro.
Se colocan en la gráfica con asteriscos (*) o puntos (.) según se alejan menos o más del conjunto de datos. Se utiliza un superíndice numérico para indicar el número de veces que aparece ese dato como atípico.

7.-Media aritmética: Es lo que tradicionalmente se conoce como promedio. Originalmente no forma parte del boxplot, sin embargo, se consideró su inclusión para dar una idea del puntaje general obtenido por pregunta. Actualmente se trabaja en la elaboración de estadísticos más representativos que la media aritmética para describir el conjunto de datos.

· Sobre la construcción de los límites y los valores atípicos
Tukey (1997) sugiere una regla sencilla para determinar los límites de los bigotes. Tomando en cuenta que el Rango Intercuartílico (RI) es la diferencia entre el Tercer y el Primer Cuartil, tenemos que existen límites interiores y límites exteriores. Los primeros son barreras hasta las cuales se “permiten” datos de la muestra, por estar muy cerca del resto. Estos son los límites que definen los extremos de los bigotes. De sobrepasar esta barrera se le considera valor atípico. Los segundos límites indican cuándo un dato se aleja en exceso del resto y, siendo también atípico, se le considera fuera del límite exterior permitido y se dice que es aún más atípico.

Se construyen así:

Límite interior inferior = Límite del bigote inferior = Q1 - 1,5RI
Límite interior superior = Límite del bigote superior = Q3 + 1,5RI
Límite exterior inferior = Q1 - 3RI
Límite exterior superior = Q3 + 3RI

Graficas:





DATOS ATIPICOS(2do metodo):Estos se pueden analizar por medio de un diagrama de caja y tambien se le puede hacer una campana encima de la grafica.

domingo, 10 de mayo de 2009

ecuacion de regresion

ECUACION DE REGRESION:
Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno, indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en cualquier dirección. y sirve para hallar la prediccion de cierto numero.

Y SU FORMULA ES: ¨
Yn=a0+a1(n)

viernes, 8 de mayo de 2009

ERROR DE ESTIMA

ERROR DE ESTIMA:
Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza. Cuanta más precisión se desee en la estimación de un parámetro, más estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el error, más ocurrencias deberán incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, más error se comete al aumentar la precisión.


EJEMPLO:

jueves, 7 de mayo de 2009

COVARIANZA

LA COVARIANZA: es una técnica estadística que, utilizando un modelo de regresión lineal múltiple, busca comparar los resultados obtenidos en diferentes grupos de una variable cuantitativa pero corrigiendo las posibles diferencias existentes entre los grupos en otras variables que pudieran afectar también al resultado (covariantes).


PENDIENTE

PENDIENTE:
Es cuando esta inclinada o tiene inclinacion. La inclinacion se puede medir por medio de un angulo per se mide por numeros enteros.

FORMULA:
Y2-Y1=m(X2-X1)

EJEMPLO:

REGRESION CUADRATICA

La regresión cuadrática: es el proceso por el cuál encontramos los parámetros de una parábola que mejor se ajusten a una serie de datos que poseemos, ya sean mediciones hechas o de otro tipo. Bueno, pero por que habríamos de querer ajustar nuestros datos precisamente a una parábola y no a otra función?

DIAGRAMA DE DISPERSION:


Una función cuadrática o de segundo grado se puede representar de manera genérica como :
Y= a+bx+cx^

EJEMPLO:


sumatorias de la matriz:
Por lo tanto: a=9.6 b=1.76 c=2.02
la parábola de mejor ajuste es entonces:





REGRESION EXPONENCIAL

REGRESION EXPONENCIAL:

Será aquella en la que la función de ajuste será una función exponencial del tipo

y = a.bx

La regresión exponencial aunque no es lineal es linealizable tomando logaritmos ya que haciendo el cambio de variablev = log y tendremos que la función anterior nos generaría:

v = log y = log( a.bx) = log a + x log b
la solución de nuestro problema vendría de resolver la regresión lineal entre v ý x, y una vez obtenida supuesta ésta:v* = A + B x ; obviamente la solución final será:

a = antilog A y b = antilog B.


DIAGRAMA DE DISPERSION

Diagrama De Dispersión: la primera forma de describir una distribución bivariante es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.
Es una representación gráfica de la relación entre dos variables, muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos.


CORRELACION LINEAL Y RECTA DE REGRESION

Correlación Lineal Y Recta De Regresión:Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión.
Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.

Ejemplo 2:Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos realizados.Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y negativa (la recta es decreciente).




FORMULA:

y = A + Bx


CORRELACION

CORRELACION:Es frecuente que estudiemos sobre una misma población los valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas.
Medida De La CorrelaciónLa apreciación visual de la existencia de correlación no es suficiente. Usaremos un parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos permite valorar si ésta es fuerte o débil, positiva o negativa.

LINEA DE TENDENCIA

Linea De Tendencia: Es la herramienta básica más importante con la que cuenta el analista técnico. Es una línea o conjunto de líneas que se trazan en el gráfico uniendo con una misma pendiente series sucesivas de puntos mínimos (línea de tendencia alcista) o de puntos máximos (línea de tendencia bajista).Sirve para determinar en primer lugar la dirección del mercado y establecer sus objetivos de proyección. Marca los niveles de soporte o de resistencia que están proyectando los precios. Permite analizar en cada momento el nivel de Beneficio/Riesgo que se puede tomar al iniciar o cerrar una posición, tomando como referencia el precio actual respecto a línea de tendencia y su proyección. La ruptura de una línea de tendencia al alza o la baja es una de las señales que confirma un cambio en la dirección de los precios. Son la base para trazar los canales que encuadran el posible movimiento de los precios. Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras.









REGRESION

La regresión estadística o regresión a la media es la tendencia de una medición extrema a presentarse más cercana a la media en una segunda medición. La regresión se utiliza para predecir una medida basándonos en el conocimiento de otra, es una herramienta estadística que permite analizar y predecir o estimar observaciones futuras de dos o más variables relacionadas entre sí, es decir una herramienta útil para la planeación.
La regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.

SEGUNDO BIMESTRE

SEGUNDO BIMESTRE:



TABLA DE DOBLE ENTRADA

Tablas de doble entrada:
Los estudios estadísticos que se centran en el análisis de una sola variable se llaman unidimensionales. Sin embargo, en las situaciones reales es corriente que se tenga que investigar la combinación de dos variables estadísticas, en lo que se conoce por distribución bidimensional. En este campo, se utilizan presentaciones de los datos en tablas de doble entrada, con gráficas de nube de puntos que interrelacionan las variables.
También llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categorías o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o numero de elementos que reúnen a la vez las dos categorías o valores de las dos variables que se cruzan en cada casilla. Para la tabulación de un material agrupado de observaciones simultaneas de dos variables aleatorias necesitaremos una tabla descrita como anteriormente lo describimos, las reglas para agrupar son las mismas que en el caso de una sola variable.



EJEMPLO:



OTRO EJEMPLO:




tallo y hojas

TALLO Y HOJAS:
Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada observación a lo largo del eje horizontal.Un diagrama de tallo y hoja te permite analizar la probabilidad de que un suceso ocurra sin utilizar probabilidad y estadística concretamente.
Como construirlo??En un gráfico de tallo y hoja cada valor de datos es partido en "un tallo" "y una hoja". "La hoja" es por lo general el último dígito del número y los otros dígitos a la izquierda "de la hoja" forman "el tallo". Por ejemplo, el número 136 sería partido como:TALLO: 13HOJA: 6
EJEMPLO:


OTRO EJEMPLO:

martes, 21 de abril de 2009

MEDIDAS DE FORMA

Las medidas de forma:
Permiten comprobar si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución. Se divide en 2 opciones:

1.SESGO:
Propiedad de una muestra estadística que hace que los resultados no sean representativos de toda la población.





2. K-curtosis:
Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).



lunes, 20 de abril de 2009

MEDIDAS DE DISPERSION

La desviación estándar (o desviación típica):

Es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.


Varianza:

Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el número de observaciones que se tengan.


DECILES:
Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento académico



CUARTILES:
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.


CENTILES:
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99.
Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la fórmula:

NUBE DE PUNTOS

Nube de Puntos:
La representación gráfica se realiza mediante un dibujo realizado en un sistema bidimensional de coordenadas cartesianas. En este tipo de diagramas cada punto representa la puntuación que el sujeto obtiene en las dos variables, determinando su puntuación por la lectura de los valores que aparecen en la escala vertical y horizontal.
A continuación veremos un ejemplo real, donde la figura representada refleja la covariación entre la inteligencia (CI) y el rendimiento escolar (Nota) de los sujetos estudiados.


Estando claro a partir de la observación de los puntos que existe una tendencia general a que los sujetos en la medida que tengan más inteligencia obtendrán también mejor nota académica. A este tipo de relación se le conoce como directa o positiva. Si se observase un proceso contrario, es decir, a medida que aumenta la inteligencia disminuye el rendimiento académico, la correlación sería inversa o negativa.

DIAGRAMA DE BARRAS

Diagrama de barras:

Se asocia a una tabla de frecuencias ya sea absoluta o relativa.
Sobre un eje horizontal se representan los valores discretos que toman los datos y sobre cada uno de ellos se coloca una barra vertical (o un rectángulo) de longitud (altura) proporcional a la frecuencia.

En ocasiones se superponen dos o más diagramas para comparar datos:
Ejemplo 16: Producción y venta de automóviles en España:

HISTOGRAMA DE FRECUENCIAS

Histogramas de frecuencias:

Sobre el eje de abscisas se marcan los extremos de las sucesivas clases y con base en cada clase se dibuja un rectángulo de altura proporcional a la frecuencia (absoluta o relativa) observada en dicha clase[2].

Tipificacion

TIPIFICACIÓN:
Para comparar dos series datos estadísticos se normaliza (o tipifica) la variable,

Si X es una variable estadística la variable normalizada es:

Se dice que se ha tipificado la variable

Medidas de tendencia central...

En las medidas de tendencia central tambin podemos encontrar la MH, MC y MG.

Media Armonica(MH):
La media armónica es una fórmula usada en Estadística representada por H, de una cantidad finita de números es igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos números.
Así, dados los números a1,a2, ... , an, la media armónica será igual a:






La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños que el conjunto.
La media armónica no está definida en el caso de la existencia en el conjunto de valores nulos.Otras medias estadísticas son la media geométrica, la media aritmética y la media ponderada

Media cuadratica(MC):

La media cuadrática es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos:


La media armónica , representada H, de una cantidad finita de números es igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos números
Así, dados los números a1,a2, ... , an, la media armónica será igual a:







Media Geometrica(MG):

La media geométrica de una cantidad finita de números (digamos 'n' números) es la raíz n-ésima del producto de todos los números.

Sólo es relevante la media geométrica si todos los números son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un número negativo (o una cantidad impar de ellos) entonces la media geométrica es, o bien negativa o bien inexistente en los números reales.
En muchas ocasiones se utiliza su trasformación en el manejo estadístico de variables con distribución no normal.
La media geométrica es relevante cuando varias cantidades son multiplicadas para producir un total.


miércoles, 11 de marzo de 2009

Medidas de Tendencia Central.

Las medidas de tendencia central corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos. Entre éstas están la media aritmética, la moda y la mediana.



_
a) Media aritmética ( X ): corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos.

Ejemplo:
Cuando se tienen muchos datos es más conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmética. El siguiente cuadro lo ilustra.


Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta
3 10 5 . 10 = 50
6 15 6 . 15 = 90
7 20 7 . 20 = 140
8 12 8 . 12 = 96
9 6 9 . 6 = 54

Frecuencia total = 63 430


_
X= 430 = 6,825
63


^
b) Moda (X) :
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos, o sea, cual se repite más.

Ejemplo:
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3 ^
La edad que más se repite es 3, por lo tanto, la Moda es 3 (X = 3)
¨
c) Mediana (X):

la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados.
Según el número de valores que se tengan se pueden presentar dos casos:
- Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos.
- Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).

Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene:
1, 2, 4, 5 , 8, 9, 10
El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.



Ejemplo 2:



En el gráfico de barras (que tiene un número par de columnas) los valores centrales son 72 y 77, por lo tanto, la
Med = 72 + 77 = Med = 149= 74,5
2 2

lunes, 26 de enero de 2009

CODIFICACION

La codificacion:
nos sirve par facilitar los calculos o procesos estadisticos.
El objetivo de este procedimiento es agrupar numéricamente los datos que se expresen en forma verbal para poder luego operar con ellos como si se tratara, simplemente, de datos cuantitativos.
Para lograrlo se habrá de partir de un cúmulo de informaciones que tengan una mínima homogeneidad, lo cual es necesario para poder integrarlas.

tablas

hay tablas continuas y no continuas. LAS CONTINUAS es cuando los datos se representa con numeros decimales y las no continuas es cuando se trabaja con numeros enteros.

tablas

TABLA: a mi punto de vista una tabla es un conjunto de datos pero con cierto orden y DISTRIBUICION DE FRECUENCIAS: es muy simple porque la diferencia es que la distribuicion tiene frecuencia y no importa si son agrupadas o no son agrupadas.

sábado, 24 de enero de 2009

ESTADISTICA, TABLAS

Tablas:
Las tablas nos sirven para obtener una serie de datos con cierto orden., en las cuales podemos mencionar algunas como:

1. Tablas Agrupadas: Son todas aquellas que tienes mas de 15 datos distintos y no importa si son repetidas o si no son repetidas.

2. Tablas No Agrupadas: Son todas aquellas tablas que son menores de 15 datos distintos y si tienen que estar repetidas.

3. Tablas Simples: Son todas aquellas tablas menores de 15 datos distintos y no se pueden repetir.