16 Ene

¿Por qué es necesario organizar un conjunto de datos recopilados?

Para ordenar y agrupar la información, de forma tal que ésta tenga mayor sentido para el usuario, de una manera que los datos en bruto no lo harían. Existen técnicas de agrupación de datos y preparación de tablas.

¿Cuál es la diferencia entre datos nominales y datos ordinales?

Datos nominales

Son aquellas que no tienen un orden o dimensión preferente o particular y contienen observaciones que solamente pueden clasificarse o contarse.

Datos ordinales

Las variables sí tienen un orden natural (de allí su nombre) y cada uno de los datos puede localizarse dentro de alguna de las categorías disponibles.

Ejemplo: algunas veces es más frecuente que nunca. Es decir, en las escalas de tipo ordinal se puede establecer una gradación u orden natural para las categorías.

Defina las características de una escala numérica, una escala de intervalo y una escala de razón.

Escalas numéricas

Estas escalas, dependiendo del manejo a las variables, pueden ser discretas o continuas.

Escalas de intervalo

Son aquellas en las que el cero es convencional o arbitrario.

Escalas de razón

Son aquellas en las que el cero absoluto sí existe.

¿Cuáles son los principales elementos para elaborar una tabla de distribución de frecuencias?

Los elementos principales que debe contener una tabla de distribución de frecuencias:

Elemento

Descripción

Marca de clase

Está constituida por el punto medio del intervalo de clase. Para calcularla es necesario sumar los dos límites del intervalo y dividirlos entre dos

Frecuencia acumulada de la clase

Se llama así al número resultante de sumar la frecuencia de la clase i con la frecuencia de las clases que la anteceden. Se denota generalmente como fi. La última clase o intervalo en la tabla contiene como frecuencia acumulada el total de los datos.

Frecuencia relativa de la clase

Es el cociente entre la frecuencia absoluta (fi) de la clase i y el número total de datos. Esta frecuencia muestra la proporción del número de casos que se han presentado en el intervalo i respecto al total de casos en la investigación.

Frecuencia acumulada relativa de la clase

Es el cociente entre la frecuencia acumulada de la clase i y el número total de datos. Esta frecuencia muestra la proporción del número de casos que se han acumulado hasta el intervalo i respecto al total de casos en la investigación

¿Cuáles son las principales diferencias entre un cuadro estadístico de trabajo y un cuadro estadístico de referencia?

Cuadros de trabajo

Los cuadros de trabajo contienen datos producto de una tabulación. En otras palabras, son cuadros depositarios de datos que son utilizados por el investigador para obtener las medidas estadísticas requeridas.

Cuadros de referencia

Los cuadros de referencia tienen como finalidad ayudar al investigador en el análisis formal de las interrelaciones que tienen las variables que están en estudio, es decir, contienen información ya procesada de cuadros de trabajo (proporciones, porcentajes, tasas, coeficientes, etc.)

Indique las diferencias entre un diagrama de barras, un histograma y un diagrama circular y sus aplicaciones más frecuentes.

Un dibujo vale más que diez mil palabras, dice el viejo proverbio chino, este principio es tan cierto con respecto a números como a dibujos.

HISTOGRAMA: es un gráfico de rectángulos que tiene su base en el eje de las abscisas (eje horizontal o eje de las equis), con anchura igual cuando se trata de representar el comportamiento de una variable discreta y anchura proporcional a la longitud del intervalo cuando se desea representar una variable continua.

DIAGRAMA DE BARRAS: Es la más sencilla de las gráficas y consiste en representar datos mediante una barra o columna simple, puede ser colocada horizontal o verticalmente. Se emplea para distribuciones tanto de variables estadísticas como de atributos.

DIAGRAMA CIRCULAR: Esta representación gráfica es especialmente adecuada en aquellos casos en que se desea que los datos estadísticos lleguen a todo tipo de persona. Es el más comúnmente utilizado para distribuciones de atributos.

¿Cuáles son las características más importantes de la media o promedio aritmético, la mediana y la moda de un conjunto de datos?

Media aritmética

La media aritmética es el promedio que todos conocemos desde nuestros años de infancia. Se obtiene sumando todos los datos y dividiendo el total entre el número de datos.

Mediana

Es el valor que divide la distribución en dos partes iguales y se le conoce como Md. Para obtenerla se deben ordenar los datos (puede ser de menor a mayor o viceversa) y se encuentra el dato medio.

Moda

Es el dato más frecuente de nuestro conjunto.

¿En qué consisten los cuartiles, deciles y percentiles en un conjunto de datos?

Para que los cuartiles, deciles y percentiles tengan algún sentido se requiere tener conjuntos grandes de datos.

Cuartiles

Existen medidas de posición llamadas cuartiles. Hay tres cuartiles en cada distribución de datos.

El primer cuartil o Q1 divide la distribución en dos partes: a la izquierda está la cuarta parte (de allí su nombre) o el 25% de los datos.

El segundo cuartil o Q2 se asimila a la mediana y divide la distribución de nuestros datos en dos partes iguales.

El tercer cuartil o Q3 hace la misma función, pues divide nuestra distribución de datos en dos partes, la parte izquierda agrupa al 75% de los datos más pequeños y la parte derecha el 25% de los datos más grandes.

Deciles y Percentiles

Son medidas que en lugar de separar los datos en grupos de 25% lo hacen en grupos de 10% y de 1% respectivamente

Explique qué es el rango y el recorrido intercuartílico.

Rango o Recorrido

Es la diferencia entre el dato mayor y el dato menor.

  • El rango se expresa frecuentemente con la siguiente fórmula:
  • R=XM- Xm
  • En esta fórmula R representa al rango; XM al dato mayor y Xm al dato menor.
  • El rango es una medida de dispersión que es muy fácil de obtener, pero es un tanto burda, pues solamente toma en cuenta los datos extremos y no considera los datos que están en medio.

Describa las fórmulas de la varianza, de la desviación estándar y del coeficiente de variación de un conjunto de datos, así como la interpretación de cada una y sus posibles aplicaciones.

La Varianza

Es la medida de dispersión que corresponde al promedio aritmético de las desviaciones cuadráticas de cada valor de la variable, con respecto a la media de los datos.

La expresión algebraica que corresponde a este concepto es la siguiente:

Desviación estándar o desviación típica

Es la raíz cuadrada de la varianza.

La fórmula para la desviación estándar es:

El Coeficiente de Variación

Dos poblaciones pueden tener la misma desviación estándar y, sin embargo, podemos percatarnos intuitivamente que la dispersión no es la misma para efectos de una toma de decisiones.

Es la desviación estándar entre la media y todo ello por cien. En fórmula lo expresamos de la siguiente manera:

Deja un comentario