Professional Documents
Culture Documents
FACULTAD DE CIENCIAS
DEPARTAMENTO DE ESTADSTICA E INVESTIGACIN OPERATIVA
ndice
ndice
ndice
80
70
60
50
40
30
20
10
0
2004
2005
2006
2007
2008
2009
2010
2011
Adems en los ltimos aos se ha extendido el uso de las redes sociales, prueba de ellos es que se
ha investigado por primera vez en esta encuesta. El 52,3% de los usuarios de Internet ha
participado en redes sociales en los ltimos tres meses, tales como Facebook o Twitter. Sin duda los
jvenes (de entre 16 a 24 aos) y los estudiantes son los ms participativos, con un 88,5% y un
90,2% de participacin respectivamente.
1.1
En este trabajo presentaremos herramienta Moodle como software para la creacin de cursos y
sitios Web.
Moodle, cuyas siglas significan Modular Object-Oriented Dynamic Learning Environment (Entorno
de Aprendizaje Dinmico Orientado a Objetos y Modular), es un proyecto dirigido por Martin
Dougiamas, que fue su creador y quien comenz con su desarrollo. Dado que se trata de un
software de cdigo abierto se mantiene en constante evolucin gracias a la aportacin de distintos
desarrolladores, y permite realizar cambios para adecuarlo a las necesidades de cada curso.
Se trata de un software libre que se distribuye de forma gratuita bajo la licencia pblica GNU, y que
puede funcionar en cualquier ordenador que permita ejecutar el lenguaje de programacin PHP. El
programa est disponible para su descarga en la pgina web moodle.org, donde adems podremos
encontrar multitud de informacin sobre la herramienta. La pgina web pretende ser un punto de
encuentro para los usuarios de Moodle, ya que dispone de diferentes foros de discusin donde
tanto administradores de sistemas, profesores, investigadores, diseadores de formacin y
desarrolladores participan aportando sus experiencias con el software y aportando soluciones a
otros usuarios, lo cual hace que la pgina web se encuentre en continuo desarrollo al igual que
Moodle.
Las principales ventajas que hacen que nos inclinemos hacia el uso de esta herramienta son las
siguientes:
Es fcil de instalar en casi cualquier plataforma que soporte PHP y su uso es muy intuitivo
con lo cual no necesitar formacin complementaria para mostrar a los usuarios finales su
manejo.
Moodle permite realizar un seguimiento exhaustivo de los usuarios, los que permite suplir
las carencias de la enseanza online respecto de la enseanza presencial. Se dispone de
informes de actividad para cada estudiante.
Aunque la mayor parte de comunidades de enseanza tendrn los recursos suficientes para hacer
la instalacin de la plataforma Moodle en sus propios servidores, existen diversos servidores
gratuitos que permiten alojar nuestra propia plataforma Moodle. Entre los servidores disponibles
se encuentran los siguientes:
Moodlefarm.socialminds
KeyToSchool
Para la plataforma que hemos creado como material adicional a este trabajo hemos usado este
ltimo, ya que adems de ofrecernos alojamiento gratuito, al registrarnos nos simplifica nuestro
trabajo realizando una instalacin bsica de Moodle en el servidor. Otra ventaja que ofrece
KeyToSchool es que nos ofrece la posibilidad de usar o bien dominios web propios que tengamos
registrados anteriormente o crear uno nuevo utilizando uno de los disponibles que nos ofrecen.
En ltimo apartado introduciremos la plataforma creada para este trabajo.
Mdulo Recurso
Este tipo de mdulo permite la presentacin de todo tipo de archivos como pueden ser archivos
tipo Word, Power Point, videos y sonidos Estos mdulos se podrn usar para subir los contenidos
propios del curso, por ejemplo un archivo pdf con el contenido terico del curso.
Adems permitir enlazar contenidos externos en web o incluirlos en la plataforma del curso.
Una vez hayamos elegido la opcin del recurso que quedamos visualizar, ste aparecer de la
siguiente manera:
Mdulo de Tareas
Utilizaremos este modulo para incluir tareas o ejercicios que deben realizar los alumnos del curso y
que ms tarde el profesor podr calificar. Una vez realizada la tarea por el alumno, ste podr subir
la tarea en cualquier formato de archivo.
El profesor o administrador del curso podr especificar una fecha final de entrega de la tarea, y
podr configurar la tarea tanto para que no se pueda entregar sta fuera de la fecha lmite o bien
se podr permitir el envo de tareas fuera de tiempo. En ambos casos se mostrar la fecha en la que
el alumno subi la tarea, permitiendo al profesor ver si est fue entregada dentro del lmite
establecido.
El profesor tiene la posibilidad de adjuntar observaciones a la tarea enviada por el alumno,
adjuntadas a la pgina de la tarea de cada estudiante, y se enviar una notificacin al alumno.
Adems se da la posibilidad al profesor de permitir al alumno el reenvo de las tareas despus de la
calificacin para volver a calificarla.
10
Mdulo Foro
Este tipo de mdulos permiten la forma ms clara de interactuacin de los usuarios dentro de la
plataforma, aunque estos no estn conectados al mismo tiempo. Permiten realizar al alumno
consultas, por ejemplo consultar dudas acerca de los cursos, y no solamente podr contestarle el
profesor, sino que podrn ser los otros alumnos del curso quienes puedan ofrecer la respuesta a la
consulta realizada. Esto permite crear adems debates sobre diferentes aspectos del curso.
Respecto a la configuracin de los foros del curso, el profesor podr realizar la suscripcin
obligatoria de todos los alumnos al foro o dar libertad a los alumnos para suscribirse a los foros que
les interesen, adems podrn elegir la opcin de que se les enven correos electrnicos con copias
de los mensajes del foro.
11
Mdulo de Chat
A diferencia de los foros, los chats requieren que los usuarios estn conectados al mismo tiempo.
Este mdulo puede ser utilizado para tutoras individuales entre el profesor y el alumno o bien para
tutoras colectivas, en ambos casos lo ms adecuado ser que el profesor establezca una fecha
concreta para el encuentro.
Adems en el caso de que un alumno no pudiera participar en el chat, podr consultar la sesin ya
que todas estas quedan registradas y podrn ser puestas a disposicin de los estudiantes.
Mdulo Cuestionario
Se podrn crear cuestionarios que podrn ser contestados por los alumnos que sern calificados
automticamente. Las preguntas podrn configurarse de diferente forma, entre otras opciones las
respuestas podrn ser de tipo respuesta corta (palabras o frases), de tipo verdadero o falso o de
tipo numrico.
12
http://www.tmfcursovirtualrkward.moodlehub.com/
A la cual se podr acceder mediante el usuario de prueba que se indica a continuacin o bien
mediante el acceso como invitado.
Usuario: estudiante
Password: Estudiante_1
13
14
2. Introduccin a RKWard
2. Introduccin a RKWard
Se presenta en este trabajo la herramienta computacional para la realizacin de anlisis
estadsticos denominada RKWard, una interfaz grfica para el entorno de programacin y
computacin estadstica R.
Aunque R resulta ser un potente lenguaje de programacin para desarrollos estadsticos, su manejo
requiere de un amplio conocimiento del leguaje de programacin que lo sustenta, lo que puede
complicar su uso a usuarios no avanzados. RKWard viene a cubrir esta desventaja, ya que permite
realizar desde los anlisis estadsticos ms simples hasta los ms complejos con tan solo navegar a
travs de los mens del interfaz. RKWard tambin permite generar anlisis mediante la forma
habitual de lneas de comando utilizada en R. Aunque R dispone de otros interfaces grficos de
caractersticas similares a RKWard, como es R Commander, un profundo anlisis de las
caractersticas de ambas libreras ha hecho que nos decantemos por la opcin que aqu
presentamos, RKWard, y que desarrollaremos a lo largo de los diferentes captulos del trabajo.
El interfaz RKWard se distribuye de forma gratuita, bajo licencia GPL de GNU, est programado en
C++ y PHP y utiliza las bibliotecas del entorno grfico KDE. Al igual que R, se trata de un software
que est en constante actualizacin, ya que se desarrolla a partir de las aportaciones de los
usuarios. Prueba de ello es que aunque originalmente se program para que funcionase sobre
Ubuntu, las versiones que actualmente se estn desarrollando y funcionan sobre Windows cada
vez estn ms completas y son ms estables.
En el Anexo I se da un pequeo manual de instalacin, ya que al contrario que R Commander que
se instala nicamente cargando la librera correspondiente, RKWard requiere otro tipo de
instalacin.
En las siguientes secciones del captulo procederemos a la presentacin de las diferentes partes y
opciones de RKWard.
15
2. Introduccin a RKWard
Si hacemos una vista general el interfaz del programa, esta se divide en diferentes partes.
En la parte superior aparece la barra de mens. A travs de ellos podemos cargar datos desde
diferentes tipos de archivos o ficheros de sesiones anteriores que hayamos salvado, se dispone de
opciones para editar tanto los ficheros de datos como las ventanas de resultados, opciones de
anlisis y de ayuda sobre RKWard.
En la columna de la izquierda e se muestra el navegador del rea de trabajo que permite ver y
manipular objetos de R, tales como datos, funciones, etc.
La parte central de la ventana de RKWard es la denominada rea de trabajo, en este espacio se
visualizarn los conjuntos de datos, scripts que programemos y se mostrarn los resultados. En la
parte superior del rea de trabajo irn apareciendo diferentes pestaas que nos permitirn pasar
de una ventana a otra.
Por ltimo, en la barra inferior, se nos da acceso al historial de comandos (Command log), la lista
de trabajos pendientes, la consola de R y un buscador de ayuda.
16
2. Introduccin a RKWard
Si en algn momento quisiramos recuperar alguno de los anlisis o cargar datos utilizados
anteriormente, simplemente deberemos pulsar el enlace Run again y se abrir de nuevo el
cuadro de dilogo donde podremos hacer las modificaciones que deseemos y volver a ejecutar,
generando otra nueva salida.
Una de las grandes ventajas que tiene RKWard respecto de otros interfaces de R o de la consola de
R es la forma de presentacin de los resultados, como ya hemos indicado estos se van mostrando
en la ventana Output rk out.html de forma separada de la sintaxis, pero lo que realmente
17
2. Introduccin a RKWard
diferencia a RKWard es que los resultados son generados en formato HTML, lo que hace ms
agradable su presentacin.
En las siguientes ilustraciones mostramos dos ejemplos para su comparacin, el primero est
realizado con RKWard mientras que el segundo se ha realizado con R Commander.
2.3. Sintaxis
Aunque como hemos dicho ya en innumerables ocasiones la principal ventaja de la utilizacin de
este interfaz es que no necesitamos conocer el lenguaje de programacin usado por R, en
ocasiones nos ser til tener el cdigo que hay detrs de las operaciones que estamos realizando,
como puede ser crear procesos automatizados o simplemente ir familiarizndonos con dicho
18
2. Introduccin a RKWard
cdigo. RKWard realiza las operaciones con cdigo abierto y ofrece distintas posibilidades para
examinarlo:
El procedimiento ms elemental para obtener el cdigo asociado a cada una de las rdenes que se
estn ejecutanto es la utilizacin del botn Code. En cada uno de los cuadros de dilogo asociados
a las diferentes opciones de la barra de mens de RKWard aparecer un botn identificado como
Code, si pulsamos sobre l, la ventana del cuadro de dilogo se expandir y en el recuadro
inferior aparecer el cdigo para generar tanto el resultado como la presentacin del resultado.
Por otra parte, si en lugar de ir copiando cada uno de los cdigos generados queremos obtener el
cdigo de varias funciones a la vez, o bien se nos olvid copiar el cdigo antes de darle a ejecutar,
19
2. Introduccin a RKWard
20
2. Introduccin a RKWard
diferentes opciones que nos da el men Run, como son ejecutar el cdigo seleccionado, ejecutar
todo el cdigo
Entre las ventajas ms destacables que ofrece tanto el editor de scripts como la consola que incluye
RKWard se incluyen:
21
2. Introduccin a RKWard
Bsqueda rpida. Podremos buscar ayuda sobre una funcin u objeto de R si mientras
mantenemos el cursor sobre este presionamos F2. Tambin tenemos disponible el men
Help.
2.5. Ayuda
RKWard dispone de multitud de documentacin de ayuda. RKWard ofrece acceso a la
documentacin de R de diferentes formas adems de las habituales en R de escribir el nombre de la
funcin u objeto que se quiere consulta entre parntesis precedido de la orden help o bien sin
parntesis y con un signo de interrogacin delante.
En RKWard podremos acceder a la ayuda disponible de R tambin a travs del men Help, en el que
encontramos diferentes opciones. La opcin Help on R que nos lleva a la pgina principal de R
donde podemos encontrar diferente informacin sobre R, sus paquetes, funciones, etc. Otra opcin
para la bsqueda de ayuda es Search R Help, a la que se podr acceder mediante el men Help o
bien desde la barra inferior pulsando el botn Help search. Si bien pulsamos el botn Help
search o elegimos el camino del men se nos mostrar la siguiente ventana en la parte inferior del
interfaz:
22
2. Introduccin a RKWard
En esta ventana podremos introducir bien el nombre completo de la funcin de R que queremos
buscar, bien algunas de las letras de la funcin a partir de las cuales se desplegar una lista de
funciones que contengan la palabra o letras introducidas. Una vez hayamos elegido de la lista
mostrada la funcin deseada, se abrir en el espacio de trabajo una nueva pestaa con la ayuda de
la funcin solicitada.
Como bien hemos indicado en varias ocasiones la principal ventaja de RKWard es que se pueden
realizar anlisis desde las funciones contenidas en el men. En la mayora de estas habr que
introducir ciertos parmetros, o modificar los que vengan por defecto, para que la funcin se ajuste
al anlisis que queremos hacer. En la mayora de los casos en cada funcin podremos acceder a
una ayuda donde se nos indicar adems de para qu sirve la funcin escogida, las diferentes
opciones y parmetros a introducir. Para acceder a esta ayuda pulsaremos el botn Help en la
ventana de la funcin.
23
2. Introduccin a RKWard
24
2. Introduccin a RKWard
2.6.
Instalacin de libreras
25
2. Introduccin a RKWard
En esta primera pestaa podremos ver las libreras que tenemos instaladas, que aparecen en la lista
de la izquierda, y en la derecha aparecern aquellas que tenemos en estos momentos cargadas y
listas para usar. Podremos cargar las libreras que se encuentran ya instaladas seleccionndolas de
la lista de la izquierda y pulsando el botn Load y al contrario descargarlas, seleccionndolas de
la lista de la derecha y pulsar Unload.
En las dos pestaas siguientes se nos da la opcin de actualizar e instalar nuevas libreras.
26
2. Introduccin a RKWard
Para instalar cualquier librera deberemos primeramente pulsar el botn Fetch list que abrir la
lista de repositorios disponibles, nosotros elegiremos el ms cercano, que en este caso es Spain
(Madrid). Una vez que nos hayamos conectado al repositorio que nos corresponde, en la ventana
que mostrbamos anteriormente aparecer la lista de libreras disponibles tal y como se muestra
en la siguiente imagen:
27
2. Introduccin a RKWard
2.7.1. Analysis
Este control incluye las funciones para realizar diferentes anlisis, desde los ms simples como un
simple anlisis descriptivo hasta test ms complejos como contrastes de hiptesis paramtricos y
no paramtricos.
28
2. Introduccin a RKWard
Basic Statistics /Descriptive Statistics: Estas dos funciones nos ofrecen la posibilidad de
realizar diferentes estadsticos del anlisis descriptivo, como puede ser el clculo de la
media, mediana, desviacin tpica,
Correlation /Crosstab: Con estas dos opciones podemos estudiar la relacin entre
variables, tanto variables cuantitativas como cualitativas, calculando la matriz de
correlaciones y tablas de contingencia respectivamente.
Item Response Theory: Incluye diferentes test y funciones para el anlisis de encuestas.
Outlier Tests: Permite realizar diferentes tests para localizar datos atpicos.
Regression: Esta funcin permite realizar modelos de regresin, esta funcin en estos
momentos est poco desarrollada y permite nicamente ejecutar la funcin lm.
Time Series: Permite realizar diferentes tests para el anlisis de series temporales.
2.7.2. Plots
En este apartado se nos ofrecer la posibilidad de realizar multitud de grficos, desde los ms
habituales como histogramas y diagrama de sectores entre otros, a grficos ms especficos como
el grfico de Pareto o los grficos usados para el anlisis de encuestas.
29
2. Introduccin a RKWard
Como ya veremos en el captulo que dedicaremos a los grficos, la principal ventaja que tiene
RKWard a la hora de generar los grficos es que nos ofrece la posibilidad de visualizar los grficos
mientras los estamos generando, de esta forma podremos dar el formato que deseemos e ir
cambiando las diferentes opciones hasta conseguir el grfico deseado.
30
2. Introduccin a RKWard
2.7.3. Distributions
Este apartado incluye los diferentes test de normalidad, adems para las diferentes distribuciones
podremos calcular la funcin de distribucin, funcin de cuantiles, grficos de la funcin de
distribucin y de densidad, y podremos comparar la suma de variables de la misma distribucin
con la distribucin normal a partir de sus histogramas y su funcin de distribucin.
31
2. Introduccin a RKWard
o
o
o
o
o
Normal
t de Student
Tukey
Distribucin uniforme
Weibull
32
33
3.2.
34
3.3.
A continuacin, veremos cmo cargar un archivo con formato CSV o de texto. Al elegir la opcin
Import Text / CSV data nos aparecer la ventana mostrada a continuacin:
35
Primeramente, en el apartado File name cargaremos el archivo deseado. Para ello pulsando en el
botn de la parte derecha de la caja roja que aparece debajo de File name, se abrir la ventana
habitual del sistema operativo que nos permitir navegar entre las carpetas de nuestro ordenador
para buscar el archivo deseado.
Una vez cargado el archivo se nos indica que el conjunto de datos se va a cargar bajo el objeto
padre .GlobalEnv, en caso de querer cargarlo bajo otro, slo tendremos que pulsar el botn
Change y seleccionar el nuevo objeto bajo el cual se guardar el conjunto de datos. A
continuacin nos da la opcin de nombrar nuestro conjunto de datos.
En el apartado Quick mode podemos especificar el tipo de archivo que estamos cargando,
usando una de la cuatro opciones distintas a la primera (None) se marcarn en los apartados de la
derecha las opciones correspondientes a cada uno de los distintos tipos de archivos, sin posibilidad
de cambiar dichas opciones manualmente. En cambio, si dejamos la opcin por defecto, podremos
sealar las opciones que mejor se adapten a nuestro fichero de datos.
Si optamos por esta ltima opcin, primeramente debemos de indicar si el archivo cargado
contiene los nombre de las variable en la primera fila, para lo que marcaremos la opcin Column
36
names in first row, la forma en que son indicados los decimales y por ltimo mediante que
carcter estn separados los campos en el fichero.
En la siguiente pestaa de la ventana Rows and Columns podemos realizar diferentes ajustes
relativos a las especificaciones de las filas y las columnas.
En la parte izquierda de la pantalla podemos modificar el nombre de las columnas. Por defecto
aparecer marcada la forma automtica, que nombrar las filas numricamente, tal y como hace la
segunda opcin Numeric row names, la siguiente opcin, As specified in column x, activar la
primera de las cajas que aparece en la parte inferior izquierda donde deberemos de introducir o
bien el nombre de la columna donde se encuentran los nombres de las filas. En la ltima opcin,
como en la anterior, tambin se pueden nombrar las filas, en este caso deberemos de introducir los
nombres en un vector. Estas dos ltimas opciones son muy tiles cuando tenemos una variable
identificador, al renombrar las filas con los valores de este campo podemos facilitar el acceso a filas
concretas del conjunto de datos.
En la parte derecha podemos elegir la forma de nombrar las columnas. Si elegimos la opcin por
defecto (Default), en el caso de que la primera fila contenga los nombres de las variables estos
sern los que aparecern, en caso de no indicar esto, los nombres por defecto usados por RKWard
son V1, V2, V3, Al igual que ocurra en el caso de las filas se pueden nombrar las filas mediante un
vector.
37
En el ltimo apartado podemos indicar que tipo de datos contiene cada variable indicando stos
mediante un vector o bien dejar la opcin por defecto que tratar de reconocer los tipos de datos.
Cualquiera que sea la opcin que elijamos ms tarde podremos editar los datos y cambiar
cmodamente el tipo de datos entre otras opciones.
La ltima pestaa de la ventana de importacin contiene diferentes opciones para la configuracin
de los datos.
Las opciones disponibles son entre otras, que caracteres se admiten para delimitar las cadenas de
caracteres, como se denotarn los valores faltantes, el nmero mximo de lneas que se quieren
importar,
Para concluir basta con pulsar el botn Submit.
38
O bien el cualquier momento, una vez iniciada la sesin, en la segunda lnea en la barra de men de
herramientas en el botn Create eligiendo la opcin Dataset.
39
Una vez nombrado el conjuto de datos aparecer la siguiente ventana, donde iremos introduciendo
los nombres de las variables, asignaremos el tipo de dato correspondiente a cada variable, e iremos
introduciendo los valores de cada una de las variables.
40
Por defecto aparecern 5 variables, cuyos nombres por defecto son, var, var1, var2, var3 y var4,
pero como se aprecia en la ilustracin 2.4 se pueden incluir nuevas variables, para ello
simplemente hay que introducir algn valor en alguno de los campos a rellenar en la parte superior,
o bien introducir valores de la variable en la parte inferior, con lo cual inmediatamente se crear
una nueva variable. Al igual que se pueden crear nuevas variables fcilmente, tambin se pueden
eliminar si lo deseamos, para ello simplemente deberemos pulsar el botn derecho de nuestro
ratn sobre la variable a eliminar y pulsar la siguiente opcin Delete this variable.
Es recomendable definir el tipo de variables valores a tomar antes de introducir nuestros valores,
ya que si lo hacemos de este modo, no se nos permitir introducir valores no vlidos. Las diferentes
opciones disponibles para los formatos de variables las explicaremos en el siguiente apartado, ya
que se puede aplicar tanto cuando se exportan los datos desde un fichero como cuando se
introducen los datos de manera manual.
Para concluir, se introducen los datos en las casillas de la parte inferior, segn vayamos
introduciendo valores irn apareciendo nuevos registros.
41
Como se muestra en la ilustracin 2.5, si en una variable se introducen datos de un tipo diferente al
de dicha variable, aparecern marcados en rojo para avisarnos de que no es un valor vlido.
Name: es el nombre de la variable. Conviene que sea un nombre claro y conciso, ya que
este ser el nombre con el que se referir el programa a la variable en el resto de
ventanas del programa.
Label: en este apartado se puede escribir una breve descripcin de la variable.
42
El tipo numrico, Number, se refiere a las variables numricas, stas son las
variables que nos encontraremos ms frecuentemente. Un ejemplo de este
tipo de variables podra ser la variable Edad, que contiene las edades de los
diferentes individuos de una base de datos.
Las variables de tipo Factor, son las tambin conocidas como variables
categricas, tomaran una serie de valores que pueden ser numricos o de
cadenas de caracteres que constituirn un conjunto de categoras. Por
ejemplo, la variable Sexo, tomar los dos nicos valores H (Hombre), M
(Mujer).
Format: Permite definir el formato de los valores de las variables. Se puede elegir la
alineacin de los valores entre izquierda o derecha, as como para las variables
numricas podremos elegir el nmero de cifras decimales a mostrar.
43
Como se muestra en la imagen anterior se han definido para una variable que define el
grado de la enfermedad en cada uno de los pacientes, se han clasificado en cuatro
fases distintas, Inicial, Intermedio, Avanzado y Terminal. A la hora de introducir
44
los valores de la variable se podra hacer o bien escribiendo los literales anteriores o
ms fcilmente introduciendo los valores numricos asociados a cada fase de la
enfermedad, que son los nmeros que aparecen junto a cada estado.
Cuando los datos se han cargado desde un archivo externo, RKWard detectar cuales
son estas categoras de manera automtica, an as, estas categoras se pueden editar
e introducir valores nuevos.
Finalmente, despus de seguir estos pasos tendremos nuestro conjunto de datos listo para
empezar a trabajar.
45
46
Captulo 4.Grficos
4. Grficos
Las representaciones grficas son una herramienta muy til y usada habitualmente en la mayor
parte de los anlisis estadsticos. Los grficos resultan muy tiles para mostrar la informacin de
forma clara y llamar la atencin de los lectores, adems de, en algunos casos, ser tiles para
encontrar datos atpicos, o ver tendencias en los datos.
RKWard dispone de un amplio abanico de grficos para realizar mediante el men de grficos Plot.
47
Captulo 4.Grficos
Una ventaja importante que ofrece RKWard frente a otros programas, es que nos permite la
previsualizacin de los grficos mientras los estamos generando.
A continuacin presentamos algunos los grficos utilizados ms habitualmente, indicando algunas
de las principales opciones y ejemplos de cada uno de ellos:
4.1.
Los diagramas de barras son representaciones grficas en un eje cartesiano de las frecuencias de
una variable cualitativa o discreta.
Para realizar el diagrama de barras, accedemos mediante Plot->BarPlot lo que har aparecer la
siguiente ventana.
Mediante las opciones de la primera pestaa podremos aadir etiquetas a las barras. Adems la
opcin Preview que nos permitir ir viendo una vista preliminar del grfico que se va creando al ir
eligiendo las distintas opciones.
48
Captulo 4.Grficos
En la siguiente nos encontraremos una lista de opciones ms extensa, podremos hacer que
aparezca la leyenda en el grfico y definir los colores de relleno de las barras entre otras opciones.
49
Captulo 4.Grficos
En estas pestaas podremos aadir los ttulos y se muestran diferentes opciones los ejes del
grfico (aadir nombres, modificar la escala de los ejes).
Una vez hayamos seleccionado todas las opciones no tenemos ms que pulsar Close y
volveremos a la ventana inicial donde pulsando Submit, se ejecutar y mostrar el grfico
obtenido en la ventana de Output.
Si necesitamos exportar el grfico a algn documento, la mejor opcin ser pulsar el botn derecho
sobre la ventana de previsualizacin y pedir que se salve o bien copiar y pegarlo en el documento.
Si hemos mandado el grfico a la ventana de output podremos recuperar el grfico en cualquier
momento pulsando Run again.
50
Captulo 4.Grficos
4.2.
Con este tipo de grfico podremos obtener informacin sobre la distribucin de una o varias
variables cuantitativas.
Si seleccionamos la opcin Box Plot del men grficos, tendremos la siguiente pantalla (ilustracin
2.1) donde podemos seleccionar las variables que se van a representar en el grfico. RKWard
permite representar ms de una variable simultneamente. Se dispone de varias opciones para
etiquetar los grficos.
51
Captulo 4.Grficos
Pulsando el botn Plot Options se nos abrir otra ventana que nos dar la posibilidad de realizar
cambios en la apariencia del grfico, como es incluir ttulos en el grfico o nombrar los ejes del
grfico entre otras opciones.
52
Captulo 4.Grficos
20
40
60
80
100
120
Peso
Edad
4.3.
Histograma
Utilizaremos este tipo de grficos para la representacin de variables continuas, como puede ser la
edad de un grupo de individuos, su altura Este tipo de grfico nos dar una idea de la distribucin
de la variable.
Eligiendo la opcin Histogram del men de grficos, se abrir la ventana donde elegiremos la
variable que queremos representar y podremos configurar las opciones relativas a los ttulos, ejes y
cuadrcula pulsando el botn Generic Plot.
En la siguiente pestaa se nos muestran diferentes opciones como son representar las frecuencias
absolutas y relativas en el eje vertical y opciones para el trazado y color de las lneas y el relleno de
las barras. Cabe destacar que podemos elegir entre varios mtodos para elegir el nmero de clases
a representar.
53
Captulo 4.Grficos
Si hemos elegido la opcin por defecto de representar las proporciones, se activar la siguiente
pestaa, que da la opcin de dibujar la curva de densidad que mejor se ajusta al histograma.
Adems se dan diferentes opciones, como son quitar valores nulos que pueden ser causantes de
errores, elegir el nmero de puntos estimados para la curva, y el mtodo para la estimacin de la
banda que contiene la curva.
54
Captulo 4.Grficos
0.020
0.015
0.000
0.005
0.010
Proporcin
0.025
0.030
0.035
40
60
80
100
120
Peso
4.4.
Los diagramas de sectores permiten hacer una representacin circular de las frecuencias relativas
de una variable cualitativa o discreta, lo que nos permitir comparar las categoras de una forma
rpida y fcil.
Para acceder a este tipo de grficos tendremos que elegir en el men Plot->Piechart.
Ya que no hay ninguna caracterstica destacable para este tipo de grficos, mostramos
directamente un ejemplo:
55
Captulo 4.Grficos
Situacin Laboral
Estudiante
Desempleado
Ocupado
Inactivo
Ilustracin 4.4.1 Ejemplo de diagrama de sectores.
4.5.
Grfico de Pareto
Usaremos el grfico de Pareto para identificar y dar un orden de prioridad de los datos. En el eje
horizontal se representan las categoras de la variable que se quiere estudiar, representando una
barra vertical proporcional a la frecuencia por cada una de las categoras, ordenando ests de
manera descendente, y mostrando en el eje vertical derecho la escala de porcentajes.
Adicionalmente, se representa mediante una lnea el porcentaje acumulado de dichas frecuencias.
Accederemos al grfico mediante Plot->Pareto chart :
56
Captulo 4.Grficos
Para realizar un grfico de Pareto la variable a representar puede estar construida de dos maneras
diferentes:
Si los valores que toma la variable corresponden a las frecuencias de cada una de las
categoras. En el siguiente ejemplo se representan el importe de las exportaciones de
Espaa a los diferentes pases de la Unin Europea. La variable est construida de la
siguiente forma:
Pas
Cantidad exportada en
miles de euros
Austria
Blgica
Bulgaria
Repblica Checa
Alemania
Dinamarca
Estonia
1358064.8
4396711.9
367158.4
1277012.1
17699580.9
885329.3
65852.1
57
Captulo 4.Grficos
75%
50%
25%
Francia
Alemania
Portugal
Italia
Reino Unido
Pases Bajos
Blgica
Polonia
Grecia
Austria
Repblica Checa
Suecia
Dinamarca
Hungra
Rumania
Irlanda
Finlandia
Eslovaquia
Eslovenia
Bulgaria
Chipre
Luxemburgo
Malta
Lituania
Letonia
Estonia
0%
2e+07
0e+00
Cumulative Percentage
6e+07
4e+07
Frequency
8e+07
1e+08
100%
Cuando tenemos las observaciones puras, es decir, tenemos un registro por individuo con
el valor que toma para la variable a estudiar. Por ejemplo, en el siguiente archivo de datos
tenemos las ausencias de los trabajadores de una empresa. La estructura de los datos sera
la siguiente:
Ausencia
1
2
3
4
5
6
Motivo
Gripe
Gripe
Gripe
Indisposicin estomacal
Gripe
Visita mdico
58
Captulo 4.Grficos
Cuando nos encontramos ante este caso, para generar el grfico tendremos que pulsar el botn
Tabulate que realizar internamente la tabla de frecuencias para luego representar el grfico.
Accidente laboral
Trmites oficiales
Formacin
Examen
Estrs
Asuntos Familiares
Visita mdico
Indisposicin estomacal
Gripe
0%
25%
Cumulative Percentage
50%
100
50
Frequency
75%
150
100%
Motivos de ausencias
al puesto de trabajo
4.6.
Diagrama de dispersin
Este tipo de grfico nos servir para conocer la relacin existente entre dos variables. Para ello se
representar cada variable en un eje. Observando la nube de puntos podremos ver si existe algn
tipo de relacin funcional entre las variables.
En el siguiente grfico se representa el conjunto de datos cars de los conjuntos de datos
implementados en R, donde se representa la velocidad de un grupo de coches y la distancia que
han tardado en frenar. En el grfico se observa que a una mayor velocidad inicial la distancia de
frenado es mayor.
59
80
60
0
20
40
Distancia de frenado
100
120
Captulo 4.Grficos
10
15
20
25
Velocidad
4.7.
Esta opcin permite representar de forma simultnea los diagramas de dispersin para las distintas
combinaciones posibles de ms de dos variables. Adems, tambin se podrn mostrar grficos
univariantes relativos a las variables introducidas (grfico de densidad, diagrama de cajas,
histograma o QQ-plot).
Despus de elegir en la primera pestaa las variables que queremos representar, en la siguiente se
nos da la opcin de elegir el tipo de grfico univariante que queremos representar o de no
representar ninguno. Por otra parte, podemos pedir que no se dibujen los puntos del diagrama de
dispersin (opcin por defecto), pintar las lneas de suavizado y las elipses de concentracin de
datos.
60
Captulo 4.Grficos
En el siguiente ejemplo tenemos una muestra de mujeres para las que tenemos su peso, altura y
edad. En la diagonal se han representado los diagramas de cajas para cada una de las variables y
por encima y por debajo de la diagonal se han representado los diagramas de dispersin para cada
uno de los pares de las variables, con la recta de regresin que mejor se ajustan en cada caso.
32
34
36
38
75
30
38
55
60
65
70
Mujeres...Peso...
150
160
170
Mujeres...Altura...
180
30
32
34
36
Mujeres...Edad...
55
60
65
70
75
150
160
170
180
61
Captulo 4.Grficos
62
Captulo 5.Anlisis
5. Anlisis
Siempre que nos encontramos ante un conjunto de datos lo primero que debemos hacer es realizar
un anlisis descriptivo de los mismos. Con ello podremos observar las caractersticas de las distintas
variables que forman el conjunto de datos, y adems podremos identificar tanto datos anmalos
como datos faltantes.
63
Captulo 5.Anlisis
Sexo, Edad, Peso y Enfermedad que se trata de una variable dicotmica que contiene si el
paciente tiene una determinada enfermedad o no.
Para ello elegimos:
Analysis->Basic Statistics
Se mostrar la siguiente ventana:
Select variables
En la primera pestaa tenemos que seleccionar las variables sobre las cuales queremos calcular los
estadsticos. En este caso seleccionaremos las variables de tipo numrico, el programa no nos
permite seleccionar las de tipo factor o de tipo cadena y para las de tipo lgico no tiene sentido
calcular los estadsticos bsicos.
En la siguiente pestaa de la ventana podemos elegir entre una serie de estadsticos:
64
Captulo 5.Anlisis
Statistics
Los estadsticos bsicos que se pueden elegir son:
General: eligiendo la opcin Length and NAs se nos muestra el nmero de registros y de
registros nulos.
extrema: en este apartado podemos pedir que se muestren los valores extremos de las
variables elegidas, se mostrar el mnimo y mximo eligiendo las opciones de Minimum y
Maximum respectivamente. Adems en las casillas Number of minimum values
displayed y Number of maximum displayed podemos pedir que se muestre el nmero
de valores extremos que indiquemos.
Quantile: para mostrar los estadsticos de posicin podemos seleccionar entre la mediana
(Median), rango intercuartlico (Interquartile Range) y los cuartiles (Quartile).
Adems de estos estadsticos de posicin podemos elegir otros, introduciendo para ello el
nmero de particiones que queremos hacer.
65
Captulo 5.Anlisis
Robust statistics
En la siguiente pestaa se muestran los estadsticos robustos:
Entre ellos, quizs el que ms nos puede interesar es del apartado Robust mean que contiene la
media truncada (Trimmed Mean), que al activarla se activa la casilla para hacer la eleccin del
porcentaje de las colas que se quiere eliminar. Este estadstico nos ser muy til cuando nos
encontremos ante un conjunto de datos con valores extremos, as podremos calcular la media sin
que se vea afectado por estos valores extremos.
Options
La pestaa Options nos da la opcin de omitir los valores nulos as como de almacenar el anlisis
descriptivo generado en un objeto de R.
66
Captulo 5.Anlisis
Para finalizar el anlisis descriptivo bastar pulsar el botn Submit de la parte derecha y se
generar el resultado.
Salida de RKWard
Una clara ventaja que ofrece RKWard respecto a R ejecutado desde su consola u otros interfaces
como R Commander es la forma en la que devuelve los resultados. Estos aparecern en la pgina
del Output con formato HTML, en lugar de aparecer en la consolada mezclndose entre el cdigo
de R, lo que puede resultarnos mucho ms cmodo. En el caso que nos encontramos ahora el
anlisis descriptivo, el resultado aparecer en una tabla con formato HTML, visualmente ms
agradable que los resultados obtenidos con el interfaz habitual de R.
La siguiente tabla que se muestra es la resultante del anlisis descriptivo realizado de las variables
Edad y Peso de la base de datos descrita anteriormente.
67
Captulo 5.Anlisis
La salida muestra en primer lugar, en el texto que precede a la tabla, si se han omitido los valores
nulos en el anlisis o no, as como que porcentaje de colas se han quitado para el clculo de la
media truncada que en este caso es del 1%.
En la tabla se muestra en la primera columna, la variable para la que se muestran los estadsticos. A
continuacin se muestra el nmero de observaciones de cada variable y el nmero observaciones
nulas que hay en cada variable. Los estadsticos mostrados a continuacin son la media (Mean),
varianza (Variance) y desviacin estndar (Sd).
En las siguientes columnas se muestran los valores extremos, el valor mnimo (Minimum) y el
valor mximo (Maximum), adems le hemos pedido que se muestren los 5 valores inferiores
(Minimum values) y los 5 valores superiores (Maximum values) de cada una de las variables.
Las siguientes columnas mostradas son las correspondientes a los estadsticos de posicin, aparece
la mediana (Median), el rango intercuartlico (Inter Quartile Range), los cuartiles (Quartile) y
como le hemos pedido los deciles (Quantiles).
En ltimo lugar aparece la media truncada (Trimmed Mean), con las colas cortadas al valor que le
hemos indicado y que es mostrado en la leyenda anterior a la tabla.
Si hemos elegido almacenar los resultados como un objeto de R, estos son almacenados en forma
de data.frame. Esto puede ser muy til ya que podremos operar con estos valores como si se
tratase de una variable ms.
68
Captulo 5.Anlisis
5.2. Correlacin
Adems de analizar las variables de forma independiente, tambin debemos de realizar cierto
anlisis si existe correlacin entre las variables.
Para ello elegiremos tenemos dos opciones dentro del men de anlisis:
69
Captulo 5.Anlisis
70
Captulo 5.Anlisis
71
Captulo 5.Anlisis
En la imagen superior podemos observar la salida del anlisis de correlaciones de las variables de
conjunto de datos trees. La salida muestra primeramente bajo que mtodo se ha calculado el
coeficiente de correlacin, en este caso se eligi el coeficiente de correlacin de Pearson, adems
tambin se mostrar la opcin elegida para el tratamiento de datos.
La primera tabla que se muestra es la correspondiente a la matriz de correlaciones y en la tabla
inferior se muestra el nmero de observaciones que han entrado en el clculo del coeficiente y p
valor del coeficiente de correlacin de Pearson para cada par de variables.
72
Captulo 5.Anlisis
Method: pearson
Exclusion: pairwise.complete.obs
Precision: 4 digits
Scale text: TRUE
Legend: ***: p < 0.001 -- **: p < 0.01 -- *: p < 0.05 -- .: p < 0.1
Ilustracin 5.0.2.1 Grfico de matriz de correlaciones
En el grfico podemos observar en la parte inferior de la diagonal estn representados los grficos
de dispersin para cada una de las combinaciones de variables, en la parte superior se muestran los
coeficientes de correlacin y el nmero de estrellas indica la significacin del p-valor.
73
Captulo 5.Anlisis
74
Captulo 5.Anlisis
En la primera pestaa seleccionaremos las variables, una como dependiente y el resto como
independientes. Si adems deseamos realizar la prueba
de independencia, marcaremos la
opcin Chisquare, lo que activar la pestaa Chisquare Options, donde podremos elegir el
mtodo por el cual estimar el p-valor, eligiendo entre el mtodo asinttico o el de Monte Carlo.
Tambin se ofrece la posibilidad de realizar un diagrama de barras marcando la opcin Draw
Barplot, est opcin a su vez activar la pestaa Barplot Options, donde podremos configurar
el diagrama de barras como ya ocurra al realizar el diagrama de barras mediante el men Plot,
que podremos previsualizar marcando Preview ( for barplot).
A continuacin se muestra la salida resultante del anlisis de la independencia de las variables
Sexo y Opinin del archivo Encuesta que contiene las opiniones recogidas mediante una
encuesta sobre un determinado acontecimiento para un grupo de personas de las que se conoce el
sexo, edad y clase social.
75
Captulo 5.Anlisis
Como podemos observar, en primer lugar se nos muestra que variable hemos definido como
variable dependiente y cual como variable de independiente, para a continuacin mostrar la tabla
de contingencia.
En cuanto al test de independencia, se muestra el mtodo utilizado para el estadstico, y en la tabla
de la parte inferior se muestra el estadstico (Statistic), los grados de libertad (df) y el p-valor
(p).
Por ltimo el grfico que se ha generado es el siguiente:
Opinin
Desfavorable
Favorable
5
Hombre
Mujer
76
6.Inferencia
6. Inferencia
Mediante la inferencia estadstica trataremos de generalizar los resultados obtenidos para una
muestra a la poblacin completa con cierto grado de fiabilidad. RKward nos ofrece una extensa lista
de contrastes, tanto paramtricos como no paramtricos, alguno de los cuales RCommander no los
tiene disponibles.
Entre los contrastes paramtricos tenemos los siguientes:
Los contrastes no paramtricos que nos ofrece RKWard son los siguientes:
Test de Mood para dos muestras para contrastar la diferencia de escala en los parmetros.
Test de Wilcoxon que realiza tanto el contraste de la suma de rangos y el de los rangos de
signos que es equivalente al test de Mann-Whitney.
Para las pruebas de normalidad RKWard nos da a elegir entre siete test diferentes, a diferencia de R
Commander que solo dispone del test de normalidad de Shapiro-Wilk. Los test disponibles son los
siguientes:
77
6.Inferencia
En algunos anlisis y grficos se da la opcin de utilizar un asistente para guiarnos a travs de las
diferentes opciones que se nos presentan. En esta ocasin utilizaremos dicho asistente, para ello
78
6.Inferencia
En esta primera ventana debemos elegir las variables a comparar. A continuacin deberemos de
definir la hiptesis alternativa (H1) del contraste:
Bilateral (Two-sided):
Unilateral:
First is greater
Second is greater
Por ltimo deberemos indicar si las muestras son o no pareadas, marcando en el caso de que s lo
sean la opcin Paired sample.
79
6.Inferencia
En la siguiente ventana se nos dan otras opciones ms avanzadas, como son asumir que las
varianzas son iguales (esta opcin solo estar disponible cuando las muestras no son pareadas), o
mostrar el intervalo de confianza, para el cual podremos elegir el nivel de confianza.
Por ltimo si estamos utilizando el asistente, antes de mostrar los resultados, aparecer una ltima
ventana con el cdigo generado, en caso de no usar el asistente obtendremos este cdigo pulsando
el botn Code.
80
6.Inferencia
Grupo 1
Grupo 2
100
104
102
88
96
100
106
98
110
102
110
92
120
96
112
100
112
96
90
96
Queremos contrastar la igualdad de medias al nivel de confianza del 95%, suponiendo que las dos
poblaciones son normales de varianzas iguales y desconocidas.
Una vez hemos introducidos los datos y marcado las opciones correspondientes la salida ser la
siguiente:
81
6.Inferencia
Como podemos observamos en la ilustracin 5.1.1.6, en primer se muestra las dos variables que se
estn comparando y se define la hiptesis alternativa que en este caso es que las medias de las
variables no sean iguales, o lo que es lo mismo la diferencia entre las dos medias no sea igual a 0.
Adems se indica que se ha asumido la igualdad de varianzas.
En la tabla que se muestra a continuacin podemos ver nuevamente cuales son las variables que se
estn comparando y las medias estimadas para cada una de ellas.
En las dos siguientes columnas aparecen los grados de libertad para el estadstico t que aparece a
continuacin cuyo valor es 2.706 y seguido aparece el p-valor, nivel de confianza y el intervalo de
confianza.
A la vista de los resultados anteriores podemos decir que se rechaza la hiptesis nula de igualdad
de medias.
Una vez ms debemos destacar la facilidad que nos da RKWard a la hora de realizar los contrastes,
tanto a la hora de obtener el resultado, ya que debemos conocer el nombre de la funcin a emplear
y los parmetros que debemos introducir a la funcin, como a la hora de presentar los resultados
de una forma clara. El cdigo que se muestra a continuacin sirve para realizar el mismo anlisis
que hemos realizado anteriormente:
t.test(Recipientes[["Grupo.1"]],Recipientes[["Grupo.2"]],alternative="two.sided", var.equal=TRUE)
Y el resultado tendr la forma:
Two Sample t-test
data: Recipientes[["Grupo.1"]] and Recipientes[["Grupo.2"]]
t = 2.7058, df = 18, p-value = 0.01447
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
1.922431 15.277569
sample estimates:
mean of x mean of y
105.8 97.2
82
6.Inferencia
nicamente deberemos introducir las variables que contienen cada una de las muestras que
queremos contrastar.
En el ejemplo que se muestra a continuacin, se han utilizado 6 sprays insecticidas diferentes para
tratar un total 72 unidades agrcolas experimentales. En la siguiente tabla se muestran los
recuentos de insectos tratados, as como el insecticida utilizado en cada una de ellas:
A
B
C
D
E
F
10
11
0
3
3
11
7
17
1
5
5
9
20
21
7
12
3
15
14
11
2
6
5
22
14
16
3
4
3
15
12
14
1
3
6
16
10
17
2
5
1
13
23
17
1
5
1
10
17
19
3
5
3
26
20
21
0
5
2
26
14
7
1
2
6
24
13
13
4
4
4
13
Utilizaremos el test de Bartlett para contrastar las varianzas. Si aplicamos el test a los datos
anteriores obtenemos la siguiente salida:
83
6.Inferencia
El valor de estadstico de prueba es 25.446 con 5 grados de libertad y el p-valor es igual a 0.00011,
por lo que se rechaza la homogeneidad de varianzas.
6.1.3. Test F
Mediante el test F podemos comparar las varianzas de dos muestras extradas de poblaciones
normales. Mediante Analysis-> Variances/Scale-> Parametric tests-> F test accederemos a la
siguiente pantalla:
84
6.Inferencia
En primer lugar debemos de elegir el par de variables sobre las que queremos hacer el contraste y a
continuacin deberemos de definir el contraste a realizar entre los siguientes:
Bilateral (Two-sided):
Unilateral:
First is greater
Second is greater
En la siguiente pestaa podremos elegir el valor de , por defecto ser 1, y el nivel de confianza.
85
6.Inferencia
En el siguiente ejemplo se han tomado dos muestras de cierto material para el que se ha medido
su resistencia en Kg/cm2, supondremos normalidad. Si realizamos el test F correspondiente,
tendremos la siguiente salida de RKWard.
En primer lugar se indica el nivel de confianza y la hiptesis alternativa que hemos seleccionado. En
la tabla que se muestra a continuacin, aparece el estadstico de prueba, los grados de libertad del
numerador y denominador respectivamente y su p-valor. Por ltimo se muestra la regin crtica y el
cociente de las varianzas.
A la vista de los resultados podemos aceptar la hiptesis nula de igualdad de varianzas.
86
6.Inferencia
Para realizar el test de suma de rangos seleccionaremos las dos variables que contienen las
muestras que queremos contrastar. En el caso que el contraste que queremos hacer sea el
contraste de los rangos de los signos seleccionaremos una nica variable, o bien en el caso que
queramos realizar el test sobre dos muestras indicaremos que se trata de un test de datos
emparejados (marcaremos la pestana paired test).
Por ltimo deberemos de elegir la hiptesis alternativa del test.
87
6.Inferencia
En la siguiente pestaa, mostrada en la ilustracin 6.2.1.1, podemos elegir que se nos muestre el
intervalo de confianza, para lo que deberemos de elegir el nivel de significacin.
Adems podemos cambiar el parmetro de localizacin a la hora de construir la hiptesis del
contraste, tambin debemos indicar en qu condiciones queremos calcular el p-valor y si queremos
aplicar correccin para el clculo del p-valor.
88
6.Inferencia
En primer lugar en la cabecera de la salida se indica el contraste que se ha realizado segn las
opciones que elegidas. En el apartado de los parmetros que hemos definido para el clculo del
contraste, entre los que se encuentra la hiptesis alternativa que hemos definido para el contraste.
En la tabla que se muestra aparecen las variables que se quieren contrastar, el valor del estadstico
y en las dos columnas siguientes aparecen los parmetros por los que se define la hiptesis del
contraste. En las siguientes columnas se muestran el p-valor, el nivel de significacin y el intervalo
de confianza para la diferencia de las poblaciones. Por ltimo aparece la diferencia de posicin
entre las dos muestras.
A la vista de los resultados podemos decir que existen evidencias para afirmar que los fumadores
tardan ms tiempo en quedarse dormidos.
89
6.Inferencia
Todos los contraste que realiza RKWard, exceptuando el caso de test de normalidad chi-cuadrado
de Pearson, se ejecutan de manera similar, por lo que los explicaremos de forma conjunta. Una vez
seleccionado en el men el contraste que se desea realizar, aparecer la siguiente ventana donde
podremos seleccionar las variables para las que se quieren realizar el contraste de normalidad:
90
6.Inferencia
En cada uno de los test se fijaran un nmero mnimo de valores de la variable para realizar el
contraste.
En siguiente pestaa podremos pedir que se nos muestre el nmero de valores de la variable y el
nmero de nulos que contiene la variable.
91
6.Inferencia
Una vez hemos introducido la variable en el test, la salida generada por RKWard es la siguiente:
92
6.Inferencia
En est ocasin adems de indicar si queremos que se nos muestren el nmero de observaciones
de la variable y el nmero de nulos, deberemos de indicar el nmero de grados de libertad, siendo
estos:
7
-9.1
12
7.2
-1.6
15.7
-11
-3.3
3.2
-16.6
12
5.8
-3.9
-15.4
12
16.6
3.8
-7.6
93
6.Inferencia
En primer lugar en el apartado donde se muestran los parmetros podemos ver que hemos
realizado un contraste donde los parmetros y 2 han sido estimados, por lo que el estadstico
tendr n-3 grados de libertad.
En la tabla se nos muestra el nmero de observaciones y de nulos de la variable. A continuacin, se
da el valor para el estadstico de prueba y su p-valor. Por ltimo se muestra el nmero de clases en
los que se ha dividido la muestra al realizar el contraste de normalidad y los grados de libertad
resultantes.
Finalmente ya que el p-valor=0.541>0.05, podemos aceptar la hiptesis nula de que la variable se
distribuye de forma normal.
94
7. Anlisis de Distribuciones
7. Anlisis de Distribuciones
En este captulo nos ocuparemos de los modelos de distribucin de probabilidad univariantes.
RKWard nos ofrece las distribuciones tanto continuas como discretas, para las que podremos
estudiar la funcin de distribucin y dibujar el grfico de las funciones de densidad y distribucin.
Por otra parte, por el teorema central del lmite sabemos que bajo ciertas condiciones puede
usarse la funcin de distribucin normal para aproximar otras funciones de distribucin (como por
ejemplo la distribucin binomial, la distribucin de Poisson). RKWard nos permite comparar la
suma de las variables aleatorias de cierta distribucin con la distribucin normal, mediante
histogramas y la funcin de probabilidad.
Las distribuciones disponibles son las siguientes:
95
7. Anlisis de Distribuciones
En el siguiente ejemplo mostraremos como calcular valores para la funcin de distribucin para una
variable con distribucin Binomial, para el resto de distribuciones se har de forma anloga,
nicamente habr variaciones en los parmetros que se pedirn para definir la distribucin.
96
7. Anlisis de Distribuciones
En primer lugar deberemos de introducir un vector con los cuantiles para los que queremos calcular
la funcin de distribucin. A continuacin introduciremos los parmetros que definen la
distribucin, (n,p).
Por ltimo deberemos introducir si las probabilidades son de la cola inferior, P [Xx], o de la cola
superior P [X>x] y si queremos mostrar los valores de la probabilidad como log(p) o no.
La salida que nos devuelve RKWard es la siguiente:
97
7. Anlisis de Distribuciones
7.2
Funcin cuantil
En primer lugar deberemos introducir un valor o bien un vector de valores de probabilidades para
los cuales queremos calcular la funcin cuantil. A continuacin, introduciremos los parmetros de
la variable F de Snedecor, que en este caso son los grados de libertad para el numerador y el
denominador respectivamente. En la celda inferior introduciremos el parmetro de no-centralidad
. Tendremos que elegir si la probabilidad la queremos de la cola inferior o superior. Y por ltimo
elegiremos como si queremos mostrar la probabilidad o el logaritmo de la probabilidad.
98
7. Anlisis de Distribuciones
En primer lugar se muestra la probabilidad para la que se quiere calcular la funcin cuantil. A
continuacin se muestran los grados de libertad del numerador y del denominador, y el parmetro
de no-centralidad. Por ltimo se muestra que se quiere mostrar la probabilidad de la cola inferior y
se mostrar la probabilidad sin aplicar el logaritmo.
Al final de la salida se muestra el valor para la funcin cuantil.
7.3. Grficos
RKWard permite representar los grficos de la funcin de densidad y de la funcin de distribucin
para cada una de las variables, tanto discretas como continuas.
Accederemos una vez ms mediante el men Distributions, eligiendo la variable a representar y la
opcin Plot probabilies. Ya que la forma de dibujar los grficos es similar para todas las
funcione, mostraremos como ejemplo los grficos de la distribucin normal.
99
7. Anlisis de Distribuciones
En primer lugar elegiremos el nmero de observaciones o puntos para construir el grfico, as como
el intervalo para el que se mostrar el grfico.
En el caso de la distribucin normal tendremos que introducir los parmetros de media y desviacin
tpica.
En esta ventana se nos da la opcin de dibujar tanto el grfico para la funcin de densidad como la
funcin de distribucin, adems podremos representar el logaritmo de los valores. Adems para la
funcin de distribucin podemos representar tanto la cola superior como la inferior.
Como vimos en el captulo que dedicamos a los grficos RKWard nos permite ver los grficos
mientras los estamos generando, en este caso tambin podremos elegir est opcin, al igual que
podremos modificar las opciones del grfico pulsando en Plot Options.
Los grficos mostrados a continuacin representan la funcin de densidad y de distribucin
respectivamente para la distribucin de una variable normal con los parmetros indicados en la
salida:
100
7. Anlisis de Distribuciones
101
7. Anlisis de Distribuciones
102
7. Anlisis de Distribuciones
103
7. Anlisis de Distribuciones
En primer lugar deberemos el nmero de muestras para el promedio y para la distribucin a partir
de la cual se construye el histograma o el grfico de la funcin de distribucin. Adems, deberemos
de introducir los parmetros de las distribuciones binomiales que se quieren aproximar mediante la
normal.
Por otra parte, debemos de elegir el grfico que queremos usar para realizar la comparacin con la
distribucin normal, entre un histograma o el grfico de la funcin de distribucin. Una vez elegido
el tipo de grfico podemos pedir que la variable aleatoria que estamos representando sea
normalizada.
El resto de opciones que se dan, son las que ya se vieron en el apartado de grfico y que configuran
la apariencia del grfico.
A continuacin se muestran los grficos generados, tanto para el histograma como para el grfico
de la funcin de distribucin.
Binomial
1.0
0.8
0.6
Density
0.4
0.2
0.0
4.5
5.0
5.5
6.0
6.5
7.0
Sample Averages
104
7. Anlisis de Distribuciones
0.0
0.2
0.4
Fn(x)
0.6
0.8
1.0
Binomial
5.0
5.5
6.0
6.5
7.0
Sample Averages
105
7. Anlisis de Distribuciones
106
En este anexo se tratar de dar una pequea gua de instalacin de la interfaz grfica para RKWard,
aunque si bien no es complicada, no se trata solamente de la descarga de la librera e instalacin
mediante la instruccin library, como ocurre en el caso de R Commander.
Para la descarga del software deberemos acceder a la siguiente direccin web:
http://rkward.sourceforge.net
Una vez en la pgina deberemos dirigirnos al men Downloads y en el caso que queramos
instalarlo en el sistema operativo Windows, buscar el enlace que nos lleva al apartado de dicho
sistema operativo.
RKWard funciona con las libreras KDE que emulan Linux, si bien podemos instalar dicha librera y R
por separado, la opcin ms rpida y fcil es elegir la opcin que instalar las dos herramientas en
un solo asistente. En recomendable que si tenemos instalada alguna versin de R anteriormente en
nuestro equipo la desinstalemos previamente para evitar posibles incompatibilidades.
Pincharemos en el enlace que se muestra en la imagen superior que har que comience la
descarga.
Una vez que tengamos el archivo descargado haremos click en l para comenzar con la instalacin.
Primeramente nos aparecer la siguiente pantalla donde se muestran los trminos del uso del
programa y que deberemos aceptar:
107
Una vez hayamos aceptado los trminos de uso se mostrar una ventana donde deberemos elegir
la ubicacin del programa en nuestro equipo:
Tras unos minutos en los que se ir mostrando la evolucin en la instalacin, se mostrar una
ventana que nos indicar que se ha realizado correctamente la instalacin.
108
Ya que este software no crea ningn acceso directo en el escritorio como habitualmente realizan
otros programas, tendremos que crernoslo nosotros mismo. Para ello vamos a la carpeta donde se
ha ubicado el programa ( en este caso , C: \Program Files \RKWard) , y entramos en la carpeta
KDE\bin, donde deberemos buscar el archivo que nos da acceso al programa, este es el llamado
rkward. Podemos generar un acceso directo en el escritorio para que nos resulte ms rpico su
acceso.
Una vez hemos localizado el archivo bastar clickar sobre el para acceder al programa. Antes de
aparecernos la ventana principal de la interfaz aparecer la siguiente ventana, que deberemos
mantener abierta durante toda la sesin de RKWard, ya que si la cerramos dejar de funcionar el
programa.
Es normal que la primera vez que iniciemos el programa se tome unos segundo en iniciarse el
programa, este tiempo se reducir en las sucesivas cargas del programa.
109
110
Bibliografa
Bibliografa
Enlace de inters
http://moodle.org
http://doc.moodle.org
http://cran.r-project.org
http://rkward.sourceforge.net
http://www.keytoschool.com
111