Conceptos de estadistica

Conceptos
POBLACION: Una población estadística es un conjunto de sujetos o elementos que presentan características comunes. Sobre esta población se realiza el estudio estadístico con el fin de sacar conclusiones. El tamaño poblacional es el número de individuos que constituyen la población.

PARAMETRO: Un parámetro es una función de los datos de la población, el estadístico lo es de los datos de una muestra. De este modo pueden definirse la media muestral, la varianza muestral o cualquier otro parámetro de los vistos más arriba.

MUESTRA: Es un subconjunto de elementos de la población estadística. El mejor resultado para un proceso estadístico sería estudiar a toda la población. Pero esto generalmente resulta imposible, ya sea porque supone un coste económico alto o porque requiere demasiado tiempo.

ESTADISTICO: Es el elemento que describe una muestra y sirve como una estimación del parámetro de la población correspondiente. El estadístico sirve como una estimación del parámetro. Aunque en realidad el interés se fija en el valor del parámetro de la población, con frecuencia debe haber conformidad con solo calcularlo con un estadístico de la muestra que se ha seleccionado.

VARIABLE CONTINUA: Una variable continua es aquella que puede adoptar cualquier valor en el marco de un intervalo que ya está predeterminado. Entre dos de los valores, siempre puede existir otro valor intermedio, susceptible de ser tomado como valor por la variable continua.

VARIABLE DISCRETA: Una variable discreta es aquella que está en condiciones de adoptar valores de un conjunto numérico dado. Es decir: solo adquiere valores de un conjunto, no cualquier valor.

ESTADISTICA: La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilados a partir de otros datos numéricos.

ESTADISTICA DESCRIPTIVA: La estadística descriptiva es la rama de la estadística que recolecta, analiza y caracteriza un conjunto de datos con el objetivo de describir las características y comportamientos de este conjunto mediante medidas de resumen, tablas o gráficos.
Estadística inferencial.
La estadística inferencial es una parte de la estadística que comprende los métodos y procedimientos que por medio de la inducción determina propiedades de una población estadística, a partir de una parte de esta. Su objetivo es obtener conclusiones útiles para hacer deducciones sobre una totalidad, basándose en la información numérica de la muestra.
Error de muestreo.
El error de muestreo es la desviación de la muestra seleccionada de las verdaderas características, rasgos, comportamientos, cualidades o figuras de toda la población.
Escala de medida nominal.
Son variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia. Este tipo de variables sólo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la variable. La asignación de los valores se realiza en forma aleatoria por lo que NO cuenta con un orden lógico. Un ejemplo de este tipo de variables es el Género ya que nosotros podemos asignarles un valor a los hombres y otro diferente a las mujeres y por más machistas o feministas que seamos no podríamos establecer que uno es mayor que el otro.
Escala de medida ordinal
Son variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia contando con un orden lógico. Este tipo de variables nos permite establecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si una categoría es mayor o menor que otra. Un ejemplo de variable ordinal es el nivel de educación, ya que se puede establecer que una persona con título de Postgrado tiene un nivel de educación superior al de una persona con título de bachiller. En las variables ordinales no se puede determinar la distancia entre sus categorías, ya que no es cuantificable o medible.
Escala de medida de intervalo.
Son variables numéricas cuyos valores representan magnitudes y la distancia entre los números de su escala es igual. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala. Las variables de intervalo carecen de un cero absoluto, por lo que operaciones como la multiplicación y la división no son realizables. Un ejemplo de este tipo de variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es la misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.
Escala de medida de razón.
Las variables de razón poseen las mismas características de las variables de intervalo, con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta, Multiplicación y División) y Lógica (Comparación y ordenamiento). Este tipo de variables permiten el nivel más alto de medición. Las variables altura, peso, distancia o el salario, son algunos ejemplos de este tipo de escala de medida.
Debido a la similitud existente entre las escalas de intervalo y de razón, SPSS las ha reunido en un nuevo tipo de medida exclusivo del programa, al cual denomina Escala. Las variables de escala son para SPSS todas aquellas variables cuyos valores representan magnitudes, ya sea que cuenten con un cero (0) absoluto o no. Teniendo esto en cuenta discutiremos a continuación los diferentes procedimientos estadísticos que se pueden utilizar de acuerdo al tipo de medida de cada variable.
Frecuencia.
Número de veces que aparece, sucede o se realiza una cosa durante un período o un espacio determinados.
Frecuencia acumulada.
La frecuencia acumulada es diferente: es la suma (o total acumulado) de todas las frecuencias hasta el punto actual del conjunto de datos.
Frecuencia relativa.
Se dice que la frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por hi. La suma de las frecuencias relativas es igual a 1.
Tablas de contingencia.
La tabla de contingencia es un medio particular de representar simultáneamente dos caracteres observados en una misma población, si son discretos o continuos reagrupados en clases. Los dos caracteres son $ x$ e $ y$, el tamaño de la muestra es $ n$.
Histograma.
Gráfico de la representación de distribuciones de frecuencias, en el que se emplean rectángulos dentro de unas coordenadas.
Media.
n matemáticas y estadística, la media aritmética (también llamada promedio o media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos, objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestra siendo uno de los principales estadísticos muéstrales.
Mediana.
El valor de la variable que deja el mismo número de datos antes y después que él
Moda.
En estadística, la moda es el valor con mayor frecuencia en una distribución de datos.
Media geométrica:
 La media geométrica (MG) de un conjunto de números estrictamente positivos (X1, X2,…,XN) es la raíz N-ésima del producto de los N elementos. Todos los elementos del conjunto tienen que ser mayores que cero. Si algún elemento fuese cero (Xi=0), entonces la MG sería 0 aunque todos los demás valores estuviesen alejados del cero.
Rango:
En el campo de la estadística, el rango señala la amplitud de la variación de un fenómeno entre su límite menor y uno claramente mayor. El rango estadístico, por lo tanto, es el intervalo que contiene dichos datos y que puede calcularse a partir de restar el valor mínimo al valor máximo considerado.
Varianza:
La noción de varianza se suele emplear en el ámbito de la estadística. Se trata de una palabra impulsada por el matemático y científico inglés Ronald Fisher (1890–1962) y sirve para identificar a la media de las desviaciones cuadráticas de una variable de carácter aleatorio, considerando el valor medio de ésta.
Covarianza:
En probabilidad y estadística, la covarianza es un valor que indica el grado de variación conjunta de dos variables aleatorias respecto a sus medias. Es el dato básico para determinar si existe una dependencia entre ambas variables y además es el dato necesario para estimar otros parámetros básicos, como el coeficiente de correlación lineal o la recta de regresión.
Decil:
En estadística descriptiva, el concepto decil se refiere a cada uno de los 9 valores que dividen un grupo de datos (clasificados con una relación de orden) en diez partes iguales, y de manera que cada parte representa un décimo de la población. En resumen, los deciles son cada uno de los nueve valores que dividen un conjunto de datos en diez grupos con iguales efectivos. Son los nueve valores que dividen la serie de datos en diez partes
Percentil:
El percentil es una medida de posición usada en estadística que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo de observaciones. Por ejemplo, el percentil 20º es el valor bajo el cual se encuentran el 20 por ciento de las observaciones.
Se representan con la letra P. Para el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que él y el 100-i % restante son mayores.
Aparecen citados en la literatura científica por primera vez por Francis Galton en 1885
Coeficiente de variación:
En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la variable, se utiliza el coeficiente de variación.

Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. Por otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media dé, por tanto, un valor positivo. A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele representarse por medio de las siglas C.V.

Comentarios

Entradas populares