Facultad de Ciencias Económicas

Stata: análisis de información

Imagen tomada de: https://es.m.wikipedia.org/wiki/Archivo:Stata_2015_logo.gif

Con este proyecto de estudio aprenderás sobre el software STATA 12 con el fin de implementarlo en investigaciones que te permitan la implementación del Software al área de Mercados y futuros trabajos de estudio enfocados a implementar herramientas como mapas perceptuales, análisis clúster, factorial, no paramétrico, estadística descriptiva, etc.

, ,

¿Cómo configurar el proxy de STATA?

STATA es un software que trabaja con internet permanentemente, por lo cual se debe garantizar el acceso en línea del software  para que pueda ejecutar varias de sus funciones y para que, además, permita instalar comandos que permitirán realizar mejores análisis.

Para el caso de la Universidad Nacional de Colombia, se debe configurar el proxy asociado a un servidor, el cual permitirá tener acceso a internet mediante una contraseña y usuario, dado únicamente a personas que pertenecen a la universidad. Pero esto puede ser una situación que se presente en una organización que limite el acceso, por lo cual aquí se describe la ruta para la configuración del proxy, no obstante la configuración, el usuario y la contraseña varían según sea el caso.

Codificar la carpeta donde se guardarán los archivos de STATA.

Para guardar los archivos, procesos y demás elementos que sean generados por STATA, se debe víncular previamente la ruta de una carpeta (por ejemplo descargas) donde se quieran observar los archivos. Si lo que se quiere es consultar solamente en donde está actualmente STATA guardando la información, se puede escribir solamente el comando (en el cuadro command) cd.

Importar archivos CSV.

Las bases de datos que se pueden encontrar libremente en internet, se descargan generalmente en archivos con formatos libres, los cuales no implican costos asociados, por lo cual gran parte de la información la encontramos en formato CSV, que es un archivo de texto, que reconoce algún separador como delimitador de la columna. En STATA se pueden importar estos archivos, pero no es exclusivo, ya que se pueden importar archivos de excel (xls), txt, y otros. Para el ejemplo importamos un archivo csv.

Observar la base de datos.

Una vez importada la base de datos, se quiere observar de qué se compone la base de datos, por lo cual la podemos observar y editar en una hoja de cálculo parecida a la usada por excel. En este caso usaremos el comando list para realizar observaciones de los casos por variables seleccionadas (solo las que nos interesan) o para todo el documento.

Observar los primeros 10 casos.

Si solo se quieren hacer observaciones parciales de la información, podemos pedir a STATA que nos muestre solo la información referente a una cantidad dada de casos, en este caso, solo 10.

Realizar un análisis de frecuencias.

Una vez conocemos que la información importada a STATA es la que se requería, se buscará identificar cómo se distribuyen nuestros datos con un análisis de frecuencias. Para lograrlo seguiremos el procedimiento del siguiente video.

Colocar etiquetas a las variables.

Ya se pudo conocer información sobre cuáles son los datos que más se repiten, respecto a la variable que se quiere estudiar. No obstante, los nombres de las variables pueden ser confusos, ya que STATA como muchos otros softwares no permiten insertar espacios o carácteres extraños como tildes en los nombres de las variables, por lo cual se hace necesario colocarle una etiqueta que nos de luces de qué se preguntaba o de qué se trata la variable que estamos visualizando.

Etiquetas de valor a los casos.

Las etiquetas de valor describen a qué hace referencia una codificación dada en la base de datos, la cual se usa generalmente para facilitar el proceso de tabulación de la información recolectada con las encuestas, por lo cual un 1 puede significar un 1 o una descripción de algún atributo encontrada en los sujetos encuestados, por ejemplo el género, donde 1 puede ser femenino y 2 masculino.

Dar nuevos nombres a las variables y a los casos.

Debido a la necesidad de realizar un adecuado análisis o simplemente hacer una corrección a los datos suministrados, se puede dar el caso de que se quiera modificar el nombre de las variables o el nombre de los casos, como por ejemplo cambiar el nombre de una variable salario a ingresar o cambiar el código de un 1 a un 2 en las respuestas de todos los casos de la BD.

Resumen de las variables.

Si lo que se quiere es hacer una observación general de las variables descritas, en forma de resumen gracias a estadísticos básicos como promedio, desviación estándar, rango, tamaño de la muestra y percentiles, lo único que se debe hacer es usar el comando codebook.

Limpiar el espacio de trabajo.

Usando el comando clear se borra la base de datos que había sido cargada, es decir toda la información incluida en la ventana variables, para borrar los comandos usados (que se ven en la ventana command) se seleccionan y se da clic en suprimir o delete, si se quieren borrar varios, se selecciona uno y con shift sostenido más las teclas de desplazamiento (up o down) se seleccionan las demás requeridas. En cuanto a la ventana de resultados o espacio de trabajo de STATA, lo mejor es solo dar enter, hasta que no sea visible la información previamente trabajada.

Observación simple de la distribución de los datos.

El comando inspect permite conocer cuántos valores positivos, negativos y nulos hay por cada una de nuestras variables, cuántos son los datos perdidos y cuantos hay en total, así como el rango de opciones de respuestas y una vista previa de una distribución en una tabla sencilla.

Realizar un gráfico de barras.

El gráfico de barras es un elemento muy usado de la estadística descriptiva, por lo cual se considera debe estar contemplado en el presente trabajo.

Realizar un gráfico de tallo y hojas. 

Para realizar un gráfico de tallo y hojas, basta solamente con utilizar el comando stem más la variable que se quiere graficar.

Realizar un mapa perceptual.

Un mapa perceptual, permite ver de forma visual los resultados promedios de las percepciones de las personas con respecto a temas específicos; debido a que se quiere que sea entendible la información, generalmente se pueden trabajar máximo 3 variables: 2 de tipo likert que serán los ejes X y ejes Y y una variable de segmentación que hace referencia a subgrupos de la población como género, estado civil o estrato, en los análisis más avanzados se pueden usar como insumos posibles clusters hallados.

Créditos

NO HAY

Bibliografía

NO HAY



Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *