Conceptos de estadistica
Conceptos
POBLACION: Una
población estadística es un conjunto de sujetos o elementos que presentan
características comunes. Sobre esta población se realiza el estudio estadístico
con el fin de sacar conclusiones. El tamaño poblacional es el número de individuos
que constituyen la población.
PARAMETRO: Un
parámetro es una función de los datos de la población, el estadístico lo es de
los datos de una muestra. De este modo pueden definirse la media muestral, la
varianza muestral o cualquier otro parámetro de los vistos más arriba.
MUESTRA: Es
un subconjunto de elementos de la población estadística. El mejor resultado
para un proceso estadístico sería estudiar a toda la población. Pero esto
generalmente resulta imposible, ya sea porque supone un coste económico alto o
porque requiere demasiado tiempo.
ESTADISTICO: Es
el elemento que describe una muestra y sirve como una estimación del parámetro
de la población correspondiente. El estadístico sirve como una estimación del
parámetro. Aunque en realidad el interés se fija en el valor del parámetro de
la población, con frecuencia debe haber conformidad con solo calcularlo con un
estadístico de la muestra que se ha seleccionado.
VARIABLE
CONTINUA: Una variable continua es aquella que puede adoptar
cualquier valor en el marco de un intervalo que ya está predeterminado. Entre
dos de los valores, siempre puede existir otro valor intermedio, susceptible de
ser tomado como valor por la variable continua.
VARIABLE
DISCRETA: Una variable discreta es aquella que está en condiciones de
adoptar valores de un conjunto numérico dado. Es decir: solo adquiere valores
de un conjunto, no cualquier valor.
ESTADISTICA: La
estadística es comúnmente considerada como una colección de hechos numéricos
expresados en términos de una relación sumisa, y que han sido recopilados a
partir de otros datos numéricos.
ESTADISTICA DESCRIPTIVA: La estadística descriptiva
es la rama de la estadística que recolecta, analiza y caracteriza un conjunto
de datos con el objetivo de describir las características y comportamientos de
este conjunto mediante medidas de resumen, tablas o gráficos.
Estadística inferencial.
La estadística inferencial
es una parte de la estadística que comprende los métodos y procedimientos que
por medio de la inducción determina propiedades de una población estadística, a
partir de una parte de esta. Su objetivo es obtener conclusiones útiles para
hacer deducciones sobre una totalidad, basándose en la información numérica de
la muestra.
Error de muestreo.
El error de muestreo es la
desviación de la muestra seleccionada de las verdaderas características,
rasgos, comportamientos, cualidades o figuras de toda la población.
Escala de medida nominal.
Son variables numéricas
cuyos valores representan una categoría o identifican un grupo de pertenencia. Este
tipo de variables sólo nos permite establecer relaciones de
igualdad/desigualdad entre los elementos de la variable. La asignación de los
valores se realiza en forma aleatoria por lo que NO cuenta con un orden lógico.
Un ejemplo de este tipo de variables es el Género ya que nosotros podemos
asignarles un valor a los hombres y otro diferente a las mujeres y por más
machistas o feministas que seamos no podríamos establecer que uno es mayor que
el otro.
Escala de medida ordinal
Son variables numéricas cuyos
valores representan una categoría o identifican un grupo de pertenencia
contando con un orden lógico. Este tipo de variables nos permite establecer
relaciones de igualdad/desigualdad y a su vez, podemos identificar si una
categoría es mayor o menor que otra. Un ejemplo de variable ordinal es el nivel
de educación, ya que se puede establecer que una persona con título de
Postgrado tiene un nivel de educación superior al de una persona con título de
bachiller. En las variables ordinales no se puede determinar la distancia entre
sus categorías, ya que no es cuantificable o medible.
Escala de medida de intervalo.
Son variables numéricas
cuyos valores representan magnitudes y la distancia entre los números de su
escala es igual. Con este tipo de variables podemos realizar comparaciones de
igualdad/desigualdad, establecer un orden dentro de sus valores y medir la
distancia existente entre cada valor de la escala. Las variables de intervalo
carecen de un cero absoluto, por lo que operaciones como la multiplicación y la
división no son realizables. Un ejemplo de este tipo de variables es la
temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es la
misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es
que una temperatura de 10 grados equivale a la mitad de una temperatura de 20
grados.
Escala de medida de razón.
Las variables de razón
poseen las mismas características de las variables de intervalo, con la
diferencia que cuentan con un cero absoluto; es decir, el valor cero (0)
representa la ausencia total de medida, por lo que se puede realizar cualquier
operación Aritmética (Suma, Resta, Multiplicación y División) y Lógica
(Comparación y ordenamiento). Este tipo de variables permiten el nivel más alto
de medición. Las variables altura, peso, distancia o el salario, son algunos
ejemplos de este tipo de escala de medida.
Debido a la similitud
existente entre las escalas de intervalo y de razón, SPSS las ha reunido en un
nuevo tipo de medida exclusivo del programa, al cual denomina Escala. Las
variables de escala son para SPSS todas aquellas variables cuyos valores
representan magnitudes, ya sea que cuenten con un cero (0) absoluto o no.
Teniendo esto en cuenta discutiremos a continuación los diferentes procedimientos
estadísticos que se pueden utilizar de acuerdo al tipo de medida de cada
variable.
Frecuencia.
Número de veces que
aparece, sucede o se realiza una cosa durante un período o un espacio
determinados.
Frecuencia acumulada.
La frecuencia acumulada es
diferente: es la suma (o total acumulado) de todas las frecuencias hasta el
punto actual del conjunto de datos.
Frecuencia relativa.
Se dice que la frecuencia
relativa es el cociente entre la frecuencia absoluta de un determinado valor y
el número total de datos. Se puede expresar en tantos por ciento y se
representa por hi. La suma de las frecuencias relativas es igual a 1.
Tablas de contingencia.
La tabla de contingencia es
un medio particular de representar simultáneamente dos caracteres observados en
una misma población, si son discretos o continuos reagrupados en clases. Los
dos caracteres son $ x$ e $ y$, el tamaño de la muestra es $ n$.
Histograma.
Gráfico de la
representación de distribuciones de frecuencias, en el que se emplean
rectángulos dentro de unas coordenadas.
Media.
n matemáticas y
estadística, la media aritmética (también llamada promedio o media) de un
conjunto finito de números es el valor característico de una serie de datos
cuantitativos, objeto de estudio que parte del principio de la esperanza
matemática o valor esperado, se obtiene a partir de la suma de todos sus
valores dividida entre el número de sumandos. Cuando el conjunto es una muestra
aleatoria recibe el nombre de media muestra siendo uno de los principales
estadísticos muéstrales.
Mediana.
El valor de la variable que
deja el mismo número de datos antes y después que él
Moda.
En estadística, la moda es
el valor con mayor frecuencia en una distribución de datos.
Media
geométrica:
La media geométrica (MG) de
un conjunto de números estrictamente positivos (X1, X2,…,XN)
es la raíz N-ésima del producto de los N elementos. Todos los
elementos del conjunto tienen que ser mayores que cero. Si algún elemento fuese
cero (Xi=0), entonces la MG sería 0 aunque todos los demás valores
estuviesen alejados del cero.
Rango:
En el campo de la estadística, el rango señala la
amplitud de la variación de un fenómeno entre su límite menor y uno claramente
mayor. El rango estadístico,
por lo tanto, es el intervalo que contiene dichos datos y que puede calcularse
a partir de restar el valor mínimo al valor máximo considerado.
Varianza:
La noción de varianza se
suele emplear en el ámbito de la estadística. Se trata de una palabra
impulsada por el matemático y científico inglés Ronald Fisher (1890–1962) y sirve para identificar a la media de las desviaciones cuadráticas de una variable de carácter aleatorio, considerando
el valor medio de ésta.
Covarianza:
En probabilidad y estadística, la covarianza es un valor que indica el grado de variación conjunta de dos variables aleatorias respecto a sus medias. Es el dato básico para determinar si existe una dependencia entre ambas variables y además es el dato necesario para estimar otros parámetros básicos, como el coeficiente de correlación lineal o la recta de regresión.
En probabilidad y estadística, la covarianza es un valor que indica el grado de variación conjunta de dos variables aleatorias respecto a sus medias. Es el dato básico para determinar si existe una dependencia entre ambas variables y además es el dato necesario para estimar otros parámetros básicos, como el coeficiente de correlación lineal o la recta de regresión.
Decil:
En estadística descriptiva, el concepto decil se refiere a cada uno de
los 9 valores que dividen un grupo de datos (clasificados con una relación
de orden) en diez partes iguales, y de manera que cada parte representa un
décimo de la población. En resumen, los deciles son cada uno de los nueve
valores que dividen un conjunto de datos en diez grupos con iguales efectivos.
Son los nueve valores que dividen la serie de datos en diez partes
Percentil:
El percentil es
una medida de posición usada en estadística que indica, una vez ordenados los
datos de menor a mayor, el valor de la variable por debajo del cual se
encuentra un porcentaje dado de observaciones en un grupo de
observaciones. Por ejemplo, el percentil 20º es el valor bajo el cual se
encuentran el 20 por ciento de las observaciones.
Se representan con la letra P. Para el percentil i-ésimo,
donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que él y el 100-i % restante son mayores.
Aparecen citados en la literatura científica por primera
vez por Francis Galton en 1885
Coeficiente
de variación:
En estadística, cuando se desea hacer referencia a la
relación entre el tamaño de la media y la variabilidad de la variable, se
utiliza el coeficiente de
variación.
Su fórmula expresa la desviación estándar como porcentaje
de la media aritmética, mostrando una mejor interpretación porcentual del grado
de variabilidad que la desviación típica o estándar. Por otro lado presenta
problemas ya que a diferencia de la desviación típica este
coeficiente es variable ante cambios de origen. Por ello es importante que
todos los valores sean positivos y su media dé, por tanto, un valor positivo. A
mayor valor del coeficiente de variación mayor heterogeneidad de los valores de
la variable; y a menor C.V., mayor homogeneidad en los valores de la variable.
Suele representarse por medio de las siglas C.V.

Comentarios
Publicar un comentario