Estadísticas Descriptivas

- ¿Qué son las estadísticas descriptivas?
- Comprender las estadísticas descriptivas
- Tipos de estadísticas descriptivas
- Univariado vs Bivariado
- Estadística descriptiva vs inferencial
- ¿Qué son las estadísticas descriptivas?
- ¿Cuáles son ejemplos de estadísticas descriptivas?
- ¿Cuál es el objetivo principal de la estadística descriptiva?
- ¿Cuáles son los tipos de estadísticas descriptivas?
- ¿Se pueden hacer inferencias o predicciones utilizando estadísticas descriptivas?
- línea de fondo
¿Qué son las estadísticas descriptivas?
Las estadísticas descriptivas son breves coeficientes de información que resumen un conjunto de datos determinado, que puede ser una representación de toda la población o una muestra de la población. Las estadísticas descriptivas se dividen en medidas de tendencia central y medidas de variabilidad (spread). Las medidas de tendencia central incluyen la media, la mediana y la moda, mientras que las medidas de variabilidad incluyen la desviación estándar, la varianza, las variables mínima y máxima, la curtosis y la asimetría.
- Las estadísticas descriptivas resumen o describen las características de un conjunto de datos.
- Las estadísticas descriptivas incluyen tres categorías básicas de medidas: medidas de tendencia central, medidas de variabilidad (o distribución) y distribuciones de frecuencia.
- Una medida de tendencia central describe el centro de un conjunto de datos (media, mediana, moda).
- Las medidas de variabilidad describen la dispersión (varianza, desviación estándar) de un conjunto de datos.
- Una medida de distribución de frecuencias describe la aparición (recuento) de datos en un conjunto de datos.
1:36
¿Qué son las estadísticas descriptivas?
Comprender las estadísticas descriptivas
En resumen, las estadísticas descriptivas ayudan a describir y comprender las características de un conjunto de datos en particular al proporcionar un breve resumen de muestras de datos y mediciones. Los tipos de estadística descriptiva más reconocidos son las medidas de centralidad: media, mediana y moda, que se utilizan en casi todos los niveles de matemáticas y estadística. La media o promedio se calcula sumando todos los números del conjunto de datos y dividiendo por la cantidad de números del conjunto.
Por ejemplo, la suma del siguiente conjunto de datos es 20: (2, 3, 4, 5, 6). El promedio es 4 (20/5). La moda del conjunto de datos es el valor que ocurre con mayor frecuencia, y la mediana es el gráfico que se encuentra en el medio del conjunto de datos. Es el número que separa los números más altos de los números más bajos en el conjunto de datos. Sin embargo, hay algunos tipos menos comunes de estadísticas descriptivas que siguen siendo muy importantes.
Las personas usan estadísticas descriptivas para reutilizar conocimientos cuantitativos incomprensibles de grandes conjuntos de datos en descripciones del tamaño de un bocado. Por ejemplo, el promedio de calificaciones (GPA) de un estudiante es una buena comprensión de las estadísticas descriptivas. La idea de un GPA es que toma puntos de datos de varias pruebas, cursos y calificaciones y los promedia para brindar una imagen general del rendimiento académico general de un estudiante. Los GPA individuales de los estudiantes reflejan su desempeño académico promedio.
Las estadísticas descriptivas, especialmente en campos como la medicina, a menudo usan diagramas de dispersión, histogramas, gráficos de líneas o presentaciones de tallo y hojas para describir los datos visualmente. 1
Tipos de estadísticas descriptivas
Todas las estadísticas descriptivas son medidas de tendencia central o de variabilidad, también conocidas como medidas discretas.
tendencia central
Las medidas de tendencia central se enfocan en la media o mediana de un conjunto de datos, mientras que las medidas de variabilidad se enfocan en la dispersión de los datos. Estas dos medidas utilizan gráficos, tablas y debates generales para ayudar a las personas a comprender el significado de los datos analizados.
Una medida de tendencia central describe la centralidad de la distribución de un conjunto de datos. Uno analiza la frecuencia de cada punto de datos en la distribución y la describe utilizando la media, la mediana o la moda, que miden los patrones más comunes en el conjunto de datos analizado.
Medida de variabilidad
Las medidas de variabilidad (o medidas de dispersión) ayudan a analizar qué tan disperso está un conjunto de datos. Por ejemplo, mientras que una medida de tendencia central puede dar a una persona la media de un conjunto de datos, no describe cómo se distribuyen los datos en ese conjunto.
Entonces, si bien el promedio de los datos puede ser 65 de 100, aún puede haber puntos de datos en 1 y 100. Las medidas de variabilidad ayudan a transmitir esto al describir la forma y distribución del conjunto de datos. El rango, los cuartiles, la desviación absoluta y la varianza son ejemplos de medidas de variabilidad.
Considere los siguientes conjuntos de datos: 5, 19, 24, 62, 91, 100. El rango del conjunto de datos es 95, que se calcula restando el número más bajo (5) del conjunto de datos del número más alto (100).
distribuir
Una distribución (o distribución de frecuencia) se refiere al número de veces que ocurre un punto de datos. O bien, es la medición de un punto de datos que no se produjo. Considere un conjunto de datos: masculino, masculino, femenino, femenino, femenino, otro. La distribución de estos datos se puede dividir en:
- El número de hombres en el conjunto de datos es 2.
- El número de mujeres en el conjunto de datos es 3.
- El número de personas identificadas como otros es 1.
- El número de no hombres es 4.
Univariado vs Bivariado
En estadística descriptiva, los datos univariados analizan solo una variable. Se utiliza para identificar las características de un solo rasgo y no se utiliza para analizar ninguna relación o causalidad.
Por ejemplo, imagina una habitación llena de estudiantes de secundaria. Suponga que desea recopilar la edad promedio de las personas en una habitación. Este dato univariado depende de un solo factor: la edad de cada persona. Al recopilar esta información de cada persona y dividirla por el número total de personas, puede determinar la edad promedio.
Los datos bivariados, por otro lado, intentan vincular dos variables buscando correlaciones. Se recopilaron dos tipos de datos y se analizó la relación entre los dos tipos de información en conjunto. Debido a que se analizan múltiples variables, este método también puede llamarse multivariante.
Suponiendo que todos los estudiantes de secundaria en el ejemplo anterior tomaron una prueba de evaluación universitaria, queríamos ver si los estudiantes mayores obtuvieron mejores resultados en la prueba que los estudiantes más jóvenes. Además de recopilar la edad de los estudiantes, también necesitamos recopilar los puntajes de las pruebas de cada estudiante. Luego, mediante el análisis de datos, describimos matemática o gráficamente si existe una relación entre la edad del estudiante y los puntajes de las pruebas.
La preparación y reporte de estados financieros es un ejemplo de estadística descriptiva, el análisis de información financiera para tomar decisiones sobre el futuro es estadística inferencial.
Estadística descriptiva vs inferencial
Las estadísticas descriptivas tienen funciones diferentes a las estadísticas inferenciales, que son conjuntos de datos que se utilizan para tomar decisiones o aplicar características de un conjunto de datos a otro.
Imagine otra empresa que venda salsa picante. Los datos que recopila la empresa incluyen el número de ventas, la compra promedio por transacción y las ventas promedio por día de la semana. Toda esta información es descriptiva porque cuenta lo que realmente sucedió en el pasado. En este caso, no se utiliza más que para proporcionar información.
Supongamos que la misma empresa quiere lanzar una nueva salsa picante. Recopila los mismos datos de ventas anteriores, pero procesa esa información para predecir las ventas de nuevas salsas picantes. El acto de usar estadísticas descriptivas y aplicar características a diferentes conjuntos de datos hace que los conjuntos de datos sean estadísticas inferenciales. Ya no agregamos simplemente datos;Lo estamos usando para predecir lo que sucederá con un cuerpo de datos completamente diferente (un nuevo producto de salsa picante).
¿Qué son las estadísticas descriptivas?
La estadística descriptiva es un método para caracterizar conjuntos de datos mediante la generación de resúmenes sobre muestras de datos. A menudo se describe como un resumen de datos que explica el contenido de los datos. Por ejemplo, un censo podría incluir estadísticas descriptivas sobre la proporción de hombres y mujeres en una ciudad en particular.
¿Cuáles son ejemplos de estadísticas descriptivas?
Las estadísticas descriptivas son informativas y tienen como objetivo describir las características reales de un conjunto de datos. Al analizar datos sobre la última temporada de la MLB, las estadísticas descriptivas incluyen el promedio de bateo más alto para un jugador individual, la cantidad de carreras permitidas por equipo y la cantidad promedio de victorias por división.
¿Cuál es el objetivo principal de la estadística descriptiva?
El objetivo principal de las estadísticas descriptivas es proporcionar información sobre un conjunto de datos. En el ejemplo anterior, hay cientos de jugadores de béisbol que participan en miles de juegos. Las estadísticas descriptivas agregan grandes cantidades de datos en unos pocos bits útiles de información.
¿Cuáles son los tipos de estadísticas descriptivas?
Los tres tipos principales de estadísticas descriptivas son la distribución de frecuencia, la tendencia central y la variabilidad de los conjuntos de datos. La distribución de frecuencia registra la frecuencia de ocurrencia de los datos, la tendencia central registra el punto central de distribución de los datos y la variabilidad del conjunto de datos registra su grado de dispersión.
¿Se pueden hacer inferencias o predicciones utilizando estadísticas descriptivas?
No. Si bien estas descripciones son útiles para comprender las propiedades de los datos, se requieren técnicas estadísticas inferenciales (una rama separada de las estadísticas) para comprender cómo las variables se afectan entre sí en un conjunto de datos.
línea de fondo
Las estadísticas descriptivas se refieren al análisis, resumen y comunicación de hallazgos de conjuntos de datos descriptivos. Las estadísticas descriptivas generalmente no son útiles para la toma de decisiones, pero aún tienen valor para interpretar resúmenes de alto nivel de un conjunto de información, como la media, la mediana, la moda, la varianza, el rango y los recuentos de información.
Deja una respuesta
Entradas relacionadas