domingo, 26 de marzo de 2017

Chi cuadrado y Correlaciones estadísticas

UNIVERSIDAD AUTÓNOMA DE CHIAPAS

Facultad de Humanidades

Campus VI

Licenciatura en Pedagogía



Taller de Herramientas Informáticas para el Análisis de Datos
Mtro. Rogelio Tapia Aquino

JUXÍN ADYRAHI TRUJILLO CASTILLEJOS





PRUEBA CHI-CUADRADO
Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de la prueba Chi-cuadrado postula una distribución de probabilidad totalmente especificada como el modelo matemático de la población que ha generado la muestra.

Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada (Ei=n·pi , donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o intervalo de valores según la hipótesis nula). El estadístico de prueba se basa en las diferencias entre la Oi y Ei.

Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la práctica se tolera un máximo del 20% de frecuencias inferiores a 5.

Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el estadístico tomará un valor igual a 0; por el contrario, si existe una gran discrepancia entre estas frecuencias el estadístico tomará un valor grande y, en consecuencia, se rechazará la hipótesis nula. Así pues, la región crítica estará situada en el extremo superior de la distribución Chi-cuadrado con k-1 grados de libertad.

CORRELACIONES
La correlación es la forma numérica en la que la estadística ha podido evaluar la relación de dos o más variables, es decir, mide la dependencia de una variable con respecto de otra variable independiente.

La correlación estadística determina la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional.


Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas.

Agrupamiento de datos en SPSS

sábado, 28 de enero de 2017

Encuestas Likert

ENCUESTAS LIKERT


1.- Estoy satisfecho con la administración política en México:

 (1) Muy satisfecho           (2) No muy satisfecho            (3) Me da igual      

                   (4) Me molesta                        (5) Decepcionado


2.- ¿Qué tan de acuerdo estoy con el narcotráfico en México?

(1) Totalmente en desacuerdo       (2) En desacuerdo       (3) Ni de acuerdo ni en desacuerdo                                                     
                  (4) De acuerdo            (5) Totalmente de acuerdo


3.- ¿Cómo calificas la actitud de Donald Trump, ante los mexicanos?

(1) Irrespetuosa           (2) Desafiante            (3) Amable     
                                              
              (4) Sociable          (5) Grosera          (6) Me da igual


4.- ¿Cómo me hace sentir la construcción del muro fronterizo?

  (1) Muy feliz     (2) Contento        (3) Satisfecho    
                                             
      (4) Preocupado         (5) Triste       (6) Molesto         (7) Me da igual


5.- La Presidencia de Enrique Peña Nieto, me parece:

    (1) Muy buena          (2) Suficiente           (3) Decepcionante    
                                             
      (4) Deficiente            (5) Mala                      (7) Me da igual

Funciones en excel

FUNCIONES EN EXCEL


Función SUMA

La función suma es una de las más usadas, prueba de esto es que Excel tiene un icono especial para efectuar sumas rápidas, con esto quiero decir que no hace falta poner =SUMA( ) para efectuar la suma de un cierto rango, lo que por cierto ahorra tiempo y evita errores, este icono se llama auto suma y para usarlo basta con seleccionar el rango que queremos sumar hacer clic en y el resultado aparece en la celda inmediatamente inferior al rango, aunque si queremos el resultado en otro lado basta con seleccionar la celda, luego el rango que queremos sumar, Enter y listo.

Función PROMEDIO

La función PROMEDIO ( ) sirve para obtener el promedio o media aritmética de un conjunto de valores. Como argumentos puede tener celdas individuales y/o rangos de celdas que tengan valores numéricos.

Función CONTAR

La función CONTAR cuenta la cantidad de celdas que contienen números y cuenta los números dentro de la lista de argumentos. Use la función CONTAR para obtener la cantidad de entradas en un campo de número de un rango o matriz de números.

Esta función  es una combinación de las funciónes CONTAR y SI , tiene  dos argumentos, el primero es el rango cuyas celdas se desean contar y el segundo es el criterio que determina que celda sera contada o no.

Función MÍNIMO

MIN: Devuelve el valor mínimo de un conjunto de valores.
A considerar:
  • Los argumentos pueden ser números, o nombres, matrices o referencias que contengan números.
  • Se tienen en cuenta los valores lógicos y las representaciones textuales de números escritos directamente en la lista de argumentos.
  • Si el argumento es una matriz o una referencia, sólo se utilizarán los números contenidos en la matriz o en la referencia. Se pasarán por alto las celdas vacías, los valores lógicos o el texto contenidos en la matriz o en la referencia.
  • Si los argumentos no contienen números, MIN devuelve 0.
  • Los argumentos que sean valores de error o texto que no se pueda traducir a números provocan errores.

Función MÁXIMO

MAX: Devuelve el valor máximo de un conjunto de valores.
A considerar
  • Los argumentos pueden ser números, o nombres, matrices o referencias que contengan números.
  • Se tienen en cuenta los valores lógicos y las representaciones textuales de números escritos directamente en la lista de argumentos.
  • Si el argumento es una matriz o una referencia, sólo se utilizarán los números contenidos en la matriz o en la referencia. Se pasarán por alto las celdas vacías, los valores lógicos o el texto contenidos en la matriz o en la referencia.
  • Si el argumento no contiene números, MAX devuelve 0.
  • Los argumentos que sean valores de error o texto que no se pueda traducir a números provocan errores.

Función MÁXIMO

Obtiene la tendencia central, que no es nada más que la ubicación del centro de un grupo de números en una distribución estadística.  La mediana es el número que se encuentra en medio de un conjunto de valores.

Los argumentos de la función MEDIANA pueden ser números, rangos con valores numéricos, matrices o referencias de celdas. El máximo número de argumentos que se pueden colocar en la función MEDIANA depende de la versión de Excel que estés utilizando. En Excel 2007 se pueden ingresar hasta 255 argumentos.
Si el total de elementos del conjunto de datos es par, MEDIANA calcula el promedio de los números centrales. Si el total de elementos es un número impar entonces la MEDIANA tomara el valor ubicado en el centro de la lista.
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías, estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
Los argumentos que sean valores de error o texto que no se pueda traducir a números provocan errores. Si desea incluir valores lógicos o de texto utiliza la función MEDIANA.

Función DESVIACIÓN ESTÁNDAR (DESVESTA)

Calcula la desviación estándar de una muestra. La desviación estándar es la medida de la dispersión de los valores respecto a la media (valor promedio).

  • DESVESTA supone que los argumentos son una muestra de la población. Si los datos representan toda la población, debe calcular la desviación estándar con DESVESTPA.
  • La desviación estándar se calcula con el método "n-1".
  • Los argumentos pueden ser los siguientes: números; nombres, matrices o referencias que contienen números; representaciones textuales de números; o valores lógicos, como VERDADERO y FALSO, en una referencia.
  • Los argumentos que contienen VERDADERO se evalúan como 1; los que contienen texto o FALSO, se evalúan como 0 (cero).
  • Si el argumento es una matriz o una referencia, solo se usarán los valores de la matriz o de la referencia. Se pasarán por alto las celdas vacías y los valores de texto de la matriz o de la referencia.
  • Los argumentos que son valores de error o texto que no se pueden traducir a números provocan errores.
  • Si no desea incluir valores lógicos y representaciones textuales de números en una referencia como parte del cálculo, use la función DESVEST.

Estadísticas descriptivas

ESTADÍSTICAS DESCRIPTIVAS


Definición y clasificación

Es la rama de las Matemáticas que recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas características de ese conjunto.

Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable estadística.

Las variables pueden ser de dos tipos: 

  • Variables cualitativas o categóricas: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). 
  • Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales). 


Las variables también se pueden clasificar en: 

  • Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase). 
  • Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase). 
  • Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase). 


Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas: 

  • Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45). 
  • Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h...etc. 


Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: 

  • Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si se estudia el precio de la vivienda, cada vivienda es un individuo. 
  • Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si se estudia el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. 
  • Muestra: subconjunto que seleccionado de una población. Por ejemplo, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo. 


Las variables aleatorias son variables que son seleccionadas al azar o por procesos aleatorios.

martes, 17 de enero de 2017

Analítica del Aprendizaje (Video-Ensayo)




UNIVERSIDAD AUTÓNOMA DE CHIAPAS 
FACULTAD DE HUMANIDADES 
CAMPUS VI
Licenciatura en Pedagogía 

Taller de herramientas informáticas para el análisis de datos 

Juxín Adyrahi Trujillo Castillejos 
7° “B” 

 MAESTRO 
Rogelio Tapia Aquino 

Tuxtla Gutiérrez, Chiapas a 17 de enero de 2017 




Analítica del aprendizaje


¿QUÉ ES? 
Es un campo de investigación que busca utilizar el análisis de datos para la toma de decisiones informadas y pertinentes, en todos los niveles del sistema educativo. Se interesa en la información y datos que los estudiantes puedan proporcionar sobre sí mismos, sobre sus necesidades; para crear soluciones y mejorar las estrategias didácticas, así, poder centrarse en los estudiantes con problemas y evaluar sí los programas diseñados sirve para la mejora del aprendizaje de cada uno, generando importantes resultados para todo aquel que lo requiera (administradores, educadores, alumnos). La analítica del aprendizaje proporciona datos muy interesantes para educadores e investigadores, sobre el compromiso de los estudiantes tanto dentro como fuera de clase. También supone un beneficio para los estudiantes, gracias al desarrollo de software móvil y plataformas on-line que utilizan los datos específicos del estudiante para adaptar los sistemas de soporte a sus necesidades de aprendizaje. A grandes rasgos, la analítica del aprendizaje los datos importantes, pertinentes e interesantes, que puedan ser aplicados a la educación. 

HISTORIA-ANTECEDENTES 
El término debe sus orígenes a los esfuerzos de minería de datos del sector comercial, que utilizaban el análisis de datos de las actividades de los consumidores para identificar tendencias de consumo. El boom de Internet impulso una gigantesca transformación en el ámbito de la investigación y las métricas de mercado a medida que las herramientas de seguimiento web (web analytics) permitían a las empresas monitorizar a los consumidores y sus compras. Con la avalancha de datos derivados de los consumidores, las empresas comenzaron a contratar analistas capaces de descifrar el significado de enormes conjuntos de datos y desarrollar modelos y predicciones que dieran soporte a sus estrategias de marketing. De manera similar, las instituciones educativas se han embarcado en su propia exploración de grandes conjuntos de datos para mejorar la retención del estudiante y proporcionar una experiencia personalizada y de mayor calidad para los estudiantes. 

SU APLICACIÓN Y LAS TECNOLOGÍAS 
Para poder aplicar la analítica del aprendizaje dentro de un entorno educativo, primeramente, es necesario definir los objetivos de este, es decir qué queremos lograr con nuestros estudiantes, deberemos medir y recolectar datos suficientes para analizar cuáles son las necesidades estudiantiles, y cómo podemos llevarla a la marcha, para lo cual, el uso de las tecnologías llegan a ser muy pertinentes pero es necesario planificar su uso, de tal manera que se lleve un control y un manejo que facilite la atención individual de los estudiantes en todo momento y más allá de esto, busca optimizar el contexto educativo.