DISTRIBUCION DE FRECUENCIAS DE VARIABLE CUANTITATIVA DISCRETA
Se muestra el número de hijos de 36 familias de la ciudad de Cádiz. Elabore una distribución de frecuencias y grafique sus resultados con la gráfica circular.
Abrimos Rstudio y comenzamos
Primero tendremos que colocar todos los datos que nos dan al programa Rstudio, entonces comenzamos escribiendo una variable cualquiero, pero yo deseo llamarle datos
Por si no saben como crear esa flecha, primero aplastan la tecla siguiente que aparece en la imagen " "<"; y despues la tecla "shift"
Copiamos los datos que nos dá a el programa y lo pegamos en la función c( )
,,
Al copiar y pegar los datos, damos enter, ohh maravilla, el Rstudio nos ha aceptado sin ningun problema y vemos en la ventana Values nuestra variable que hemos escrito, esta ventanita no es tan importante hasta el momento, solo cumple la funcion de avisarnos las variables que hemos escrito y otras sencillas cosas.
Ahora como todo estadistico, necesito saber cuantos datos se repiten y ¿qué hago con esos datos repetidos?,esos datos repetidos me sirve para la Frecuencia Absoluta, bien, no te enriedo tanto y comenzamos escribiendo una variable cualquiera, yo escribiré repetidos dejo un espacio y escribo la flecha "<-" y llegamos a nuestro primer comando, que es factor( ) ,¿que hace factor?, los que hace un factor es codificar un vector a un factor , bueno la teoria pueda que te aburra pero la práctica creo que no
repetidos <- factor(datos)
Que he escrito aquí .Nada complicado he creado una variable repetidos seguido "<-" factor(datos) .EEEhh, un momento y lo que esta escrito dentro de factor?, muy buena ojeada, eh escrito la variable anterior que es datos,que pretendes hacer?, bueno lo que pretendo hacer es codificar todos los datos, si deseas ver lo que hay, escribe esto y pulsa enter, !!!que demonios es eso!!! ,eso son los datos que tenias ,pero resulta dificil entenderlo,y no necesito que le entiendas, en fin
una vez ecrito los datos procedo a presentarte a otro comando, que es,summary( ) summary es una función genérica usada para producir resultados resúmenes de los resultados de las diversas funciones de ajuste del modelo. La función invoca métodos particulares que dependen de la clase del primer argumento. Te la puse complicado, no te preocupes si por ejemplo colocas esto el rstudio "summary(datos)" y das enter, te va a salir lo siguiente, minimo,1er cuartil,mediana,media,3er cuartil y el máximo, eso quiere decir que si escribes dentro del paréntesis algun vector, te dá como resultado lo anterior,pero ¿que pasa si escribes un vector convertido a factor?, muy buena pregunta, te felicito, veo que estas activo.Si escribes un factor te da como resultado el orden, como ejemplo, si tus datos estan repetidos "1,1,1,2,2", te va a dar como resultado:
3 veces se repite 1 y 2 veces 2
Ahora que sabemos que efecto hace, entonces escribimos lo siguiente"summary(repetidos)"
Sorpresa, ya tenemos los datos que se repiten y ya tenemos la Frecuencia Absoluta
Ahora nos toca con la hoja de datos, comenzaremos con Numero de hijos, En Rstudio se escribe sin espacios y para no dejar espacios lo que hago es colocar guion bajo a cada espacio "numero_de_hijos" . Escribiremos lo siguiente: num_hijos <- c(0,1,2,3,4,5,"Total")
.Si ustedes observan he escrito Total, y le escrito entre comillas porque es un caracter y lo he escrito debido a que me he regido a la tabla de datos y creo que todos los datos que voy a construir son 7, por eso agrege "Total" para completar siete datos, ¿entendido?Frecuencia Absoluta
Para la frecuencia absoluta no hay problema, ya que son lon datos repetidos "3 8 10 7 4 4" , solamente lo copiamos, pero ¿yo veo 6 datos?, ooh pero que gran observador que eres, muy bien, para completarlo hay que recordad que el setimo dato esta alineado en la linea del Total, o sea que seria la suma de todos los datos y si hacemos esto, en rstudio lo sumamos de la siguiente manera "3+8+10+7+4+4", nos arrojara como resultado 36, entonces el septimo dato es 36 y quedaria de la siguiente manera"fi <- c(3,8,10,7,4,4,36)
)"Frecuencia Relativa
La frecuencia relativa es nada mas ni nada menos que la division de todos los datos de fi entre la suma Total de datos. O sea "fi/36", en pocas palabras escribirás esto en rstudio:
Si escribes ni te da como resultado:
Ohh no, hay muchos decimales, se parece a lo que sacaba en mate,"mentira". Resulta complicado trabajar con muchos decimales, pero te tengo una sorpresa, para evitarnos editarlo manualmente, yo utilizo round( ), como su nombre lo dice sirve para redondear, round nos da dos opciones "x,decimal a redondear" el x es la variable que bamos a escribir y no importa que hagamos ahi, ejemplo si divido 1/2, nos va a dar un solo dato, okey,entonces regresando al problema, esto seria "fi/36":
Ahora esta mucho mejor y si dan una ojeada, vemos que hay siete datos asi que ya lo tenemos
Frecuencias acumuladas
Frecuencia Absoluta Acumulada
Como su nombre lo dice, es la suma acumulativa de los datos de la frecuencia absoluta, entonces para hacerlo en Rstudio utilizaremos el comando cumsum( ), este comando tu lo conoces y dice todo lo que necesito,escribiremos esto en rstudio:Fi <- cumsum(frecuencia absoluta)
Si se dan cuenta el ultimo numero ha sido sumado y dá como resultado 72 lo cual es erroneo, asi que tenemos que editarlo manualmente,"no es que entrometa pero si lo editamos y borramos ese numero nos va a quedar 6 datos",Correcto muy bien, veo que has progresado y es correcto lo que dices, lo estuve pensando y para llenar ese dato agrege un caracter como este; " " ,lo que ves es unas comillas con un espacio y problema resuelto:
Frecuencia Relativa Acumulada
Como su nombre lo dice, es la suma acumulativa de los datos de la frecuencia relativa "ni", entonces para hacerlo en Rstudio utilizaremos el comando cumsum( ), este comando tu lo conoces y dice todo lo que necesito,escribiremos esto en rstudio:Ni <- cumsum(frecuencia relativa)
Al igual que el anterior tenemos que editarlo manualmente
No hay comentarios:
Publicar un comentario
Nota: solo los miembros de este blog pueden publicar comentarios.