Intervalo de clase
Como ya se ha comentado, existen dos medios principales para resumir un conjunto de números: las imágenes y los números resumen. Cada método tiene ventajas y desventajas y el uso de un método no tiene por qué excluir el uso del otro. En este capítulo se describe la elaboración de imágenes de datos, que se denominan distribuciones de frecuencias.
El primer paso para dibujar una distribución de frecuencias es construir una tabla de frecuencias. Una tabla de frecuencias es una forma de organizar los datos enumerando todas las puntuaciones posibles (incluidas las que no se han obtenido realmente en la muestra) como una columna de números y la frecuencia de aparición de cada puntuación como otra. El cálculo de la frecuencia de una puntuación es simplemente una cuestión de contar el número de veces que esa puntuación aparece en el conjunto de datos. Es necesario incluir las puntuaciones con frecuencia cero para dibujar correctamente los polígonos de frecuencia.
Tenga en cuenta que la suma de la columna de frecuencias es igual al número de puntuaciones o al tamaño de la muestra (N = 15). Esta es una propiedad necesaria, pero no suficiente, para asegurar que la tabla de frecuencias se ha calculado correctamente. No es suficiente porque se podrían haber cometido dos errores que se anulen mutuamente.
Ejemplo de límites de clase
La marca de clase en una distribución de frecuencias es el punto medio o el valor medio de una clase determinada. Por ejemplo, la marca de clase de 10-20 es 15, ya que 15 es el valor medio que se encuentra entre 10 y 20. En estadística, la marca de clase se utiliza en varios lugares, por ejemplo, al calcular la media, dibujar gráficos de líneas, encontrar la media de cada clase en una distribución de frecuencias, etc. Es muy fácil calcular la marca de clase utilizando una fórmula que aprenderás en la siguiente sección.
La fórmula para calcular la marca de clase en una distribución de frecuencias se da como (límite superior + límite inferior)/2 o (suma de los límites de clase)/2. Utilizando esta fórmula de marca de clase, puede encontrar fácilmente el punto medio de cualquier intervalo de clase dado.
Intervalo de clase: Se define como el tamaño de cada clase de datos numéricos en una gran distribución de frecuencias que sigue un ancho específico. Por ejemplo, si los datos brutos tienen demasiadas variaciones en los números, hacemos grupos de intervalos para organizar los datos como 0-10, 10-20, 20-30, etc. Estos se conocen como intervalos de clase.
Ancho de la clase
Paso 1El número de clases puede estimarse utilizando el resultado redondeado de la regla de Sturges, , donde es el número de clases y es el número de elementos en el conjunto de datos.Paso 2Seleccione las clases para este ejemplo.Paso 3Halle el rango de datos restando el valor mínimo de los datos del valor máximo de los datos. En este caso, el rango de datos es .Paso 4Encuentre el ancho de la clase dividiendo el rango de datos por el número deseado de grupos. En este caso, .Paso 5Redondee al número entero más cercano. Este será el tamaño de cada grupo.Paso 6Empiece con y cree grupos de tamaño.Paso 7Determine los límites de las clases restando del límite inferior de la clase y sumando al límite superior de la clase.Paso 8Dibuje una marca de conteo junto a cada clase para cada valor que esté contenido en esa clase.Paso 9Cuente las marcas de conteo para determinar la frecuencia de cada clase.Paso 10La frecuencia relativa de una clase de datos es el porcentaje de elementos de datos en esa clase. La frecuencia relativa puede calcularse mediante la fórmula , donde es la frecuencia absoluta y es la suma de todas las frecuencias.Paso 11 es la suma de todas las frecuencias. En este caso, .Paso 12La frecuencia relativa se puede calcular utilizando la fórmula .Paso 13Simplifique la columna de frecuencia relativa.
Frecuencia acumulada
¿escalonada a la derecha, en forma de campana, uniforme o no tiene ninguna forma especial? (Dado que los datos reales rara vez dan lugar a histogramas perfectamente uniformes, en forma de campana o simétricos, cualquier cosa que se acerque a estas formas puede clasificarse como tal).
¿dónde se encuentran? (Los picos son barras con barras más cortas a cada lado. Las primeras barras que son más altas que las segundas o las últimas que son más altas que la barra anterior también se llaman picos. Dos o más barras adyacentes de la misma altura con barras vecinas más cortas -una meseta- se considerarían un pico).
La letra junto a una respuesta no identifica la pregunta. Debes dar suficiente información en tu respuesta a una pregunta para que el lector no tenga que saber siquiera que había una pregunta. El objetivo final es que combines todas las respuestas a estas preguntas en un párrafo.