Empezando en R con RStudio

En la actualidad existen diferentes opciones de software a la hora de analizar datos. Podemos encontrar programas con pestañas y ventanas, fáciles de usar pero con bastantes limitaciones. Otros son lenguajes de programación que permiten hacer casi cualquier cosa que se te pase por la cabeza. Algunos son de pago (y bastante caros) y otros son totalmente gratuitos y de código abierto. En definitiva, que no es fácil decidirse por uno… aunque yo siempre lo he tenido bastante claro. Para mí la alternativa es R, un lenguaje de programación gratuito, de código abierto y colaborativo que tiene implementada, de base, prácticamente toda la estadística.

Pero ¿por dónde puedes empezar si quieres usarlo? ¿Qué interfaz es la más apropiada para programar en él?

¿Me dejas que te cuente?

Empecemos por el principio

Como siempre, el principio es tener aquello que vamos a utilizar, pero antes de eso dejadme que os comente un par de cosas para situarnos.

En primer lugar, esta entrada será, si no pasa nada, la primera de una serie en la que trataremos de ir a lo más básico de R para empezar a usarlo. Mi idea es dar truquillos que a mi me funcionan y que aprendí después de darme de bruces con algo muchas veces. No pretendo que sea una guía definitiva para programar en R ni que acabéis siendo expertos/as en nada, porque yo no me considero tal. Solo espero quitaros el miedo y que os lancéis a la piscina.

Una vez dicho esto, ten en cuenta algo que repetiré muchas muchas veces a lo largo de este tutorial: R se aprende copiando. Sí, se aprende copiando del código de otras personas que seguro que puedes encontrar al preguntar en google porque, déjame que te diga algo… Si tú tienes una duda, casi seguro que alguien la tuvo antes que tú y la preguntó en uno de los múltiples foros colaborativos como Stack Overflow.

Y ahora sí, vamos al lío.

Instalar R y RStudio

–¿Para poder usar R debemos instalar R? ¡Qué novedad!

Pues sí quizás te parezca una obviedad pero, lo cierto es que como el único programa que acabaremos abriendo es RStudio, alguien podría pensar que basta con instalar éste, y no. Piénsalo así, R es el motor y RStudio su cara visible, la que nos permite interactuar con él. Aclarado esto, vayamos a las instrucciones:

  • Para instalar R hay que bajar un fichero ejecutable de la página web del proyecto R http://www.r-project.org/
  • En esta página debemos hacer clic en download CRAN, escoger a continuación uno de los servidores (CRAN Mirrors) y después seguir los pasos según el sistema operativo.
Instalación de R
  • Actualmente (noviembre 2022), la versión más reciente de R es la 4.2.2 (aunque yo no la puedo instalar por mi sistema operativo y tengo la 4.2.1, ya me lo perdonaréis).

En el caso de RStudio basta con ir a su página que ahora se llama Posit (https://posit.co) y buscar la versión disponible según el sistema operativo.

Quizás te estés preguntando por qué RStudio y no otro. Te doy algunas razones:

  • R-Studio es un editor gratuito, diseñado originalmente para R, que también sirve para compilar otros lenguajes como C, Latex, HTML, Sweave y Markdown (de este último te hablaré explícitamente en alguna entrada porque es extremadamente útil).
  • Su principal ventaja es que lo engloba todo en una única pantalla y contiene múltiples atajos para facilitar el manejo de datos, archivos y figuras.

Una vez descargados en instalados ambos vamos a abrir RStudio y a hacer un tour por lo que vemos

RStudio: ¿Qué vemos?

Nada más abrir R-Studio encontrarás desplegados tres paneles, cada uno de ellos con varias pestañas. Algo como lo que vemos en la imagen.

Imagen de RStudio abierto por primera vez con tres paneles desplegados.
RStudio por defecto

En la primera y más grande, puedes ver la versión de R que tienes instalada. Si tu has seguido los pasos anteriores y has podido instalar la 4.2.2, esa sería la que debería aparecer.

Antes de hacer nada más, vamos a abrir un cuarto panel que nos resultará fundamental. Para ello ve al a la parte superior izquierda y busca un folio en blanco con un símbolo + en verde. Pulsa sobre él y elige el primer tipo de archivo que aparece, un R Script.

Abrimos un script

Ahora ya tenemos cuatro paneles cuyas principales pestañas son:

  • Documentos de trabajo (Scripts)
  • Consola
  • Enviroment/History
  • Files/Plot/Packages/Help/Viewer

Algunas cosillas a saber de los paneles

El tamaño de los paneles puede cambiarse situándote en las lineas separadoras o bien con el botón correspondiente sobre cada panel. Así:

Cambiando el tamaño

El orden que aparece por defecto lo puedes cambiar en Tools > Global options. Se te abrirá una ventana donde puedes ir cambiando un montón de opciones. Si vas a Pane Layout puedes decidir dónde va cada panel.

Ventana de R donde se pueden ver las opciones de configuración para los paneles.
Ventana de opciones de configuración

Al final de la entrada te dejo mi configuración favorita pero ahora, vamos a por ellos, uno por uno de arriba abajo y de izquierda a derecha en el orden por defecto:

Documento de trabajo:

En esta parte de RStudio podremos abrir documentos de diferentes tipos, habitualmente de texto plano, que nos permiten guardar el código que queremos ejecutar. A estos documentos solemos denominarlos scripts y son fundamentales a la hora de que tú o alguien diferente a ti pueda volver a ejecutar exactamente el mismo trabajo. Para entender la importancia de esto puedes volver a la entrada de Ciencia se escribe con R. Pero… quizás te estás preguntando:

¿Qué es un script?

Un script es un archivo de texto plano (que en R tiene la extensión .R) donde se escriben las órdenes que queremos ejecutar.

Como ejemplo de script te dejo el archivo empecemos.R que sirve para empezar a ejecutar algo de código y experimentar lo que te cuento. Así a bote pronto, para abrirlo, hazle clic con el botón derecho y dile que te lo abra en RStudio. Luego ya te enseño como hacerlo más elegante.

¿Qué se escribe en un Script?

Al escribir en un script podemos incluir:

  • Código de R, incluyendo formulas, funciones, asignaciones y otras cosas que iremos viendo en próximas entradas
  • Comentarios que se marcan usando la almohadilla #. Estos son muy útiles para marcar notas sobre lo que estamos haciendo, poner títulos a las distintas partes del código o incluso indicar la fecha en la que modificaste algo.

Algunas cosillas útiles sobre los scripts.

Para hacernos la vida más fácil con los scripts Rstudio incorpora algunas funcionalidades que merece la pena comentar.

  • Al ser texto plano, las lineas de un script pueden ser tan largas como se quiera pero claro, eso dificulta su lectura si te tienes que mover de izquierda a derecha. Para evitarlo, ves a la configuración, Tools > Global Options y en Code marca la opción SoftWrap R Source files
  • Si estás escribiendo una orden, sobre todo cuando empieces a usar funciones, puedes pulsar el tabulador para que aparezcan opciones de autocompletar.
  • Si pones una o varias almohadillas seguidas de guiones medios un texto y luego varios guiones medios o almohadillas RStudio entenderá que estás abriendo una nueva sección. En el margen izquierdo aparecerá entonces un triangulito que te permite «plegar» todo el código que haya entre esa sección y la siguiente dejando visible solo el texto que hayas puesto entre los guiones o las almohadillas.

Una cosa importante es que todo ese código, por muy bonito que esté, no va a servir de nada si no lo pasamos al segundo de los paneles que nos ocupa. Vayamos a la consola.

Del script a la consola

Podríamos decir que la consola es R propiamente dicho. Allí es donde ocurre la magia, donde el código se convierte en resultados ;-p.

Puedes escribir código directamente sobre ella. Prueba a poner log(10) y darle a enter. ¿Qué ha pasado? Efectivamente, te ha devuelto el resultado de calcular el logaritmo neperiano de 10.

Sin embargo, escribir todo sobre la consola no es útil puesto que una vez cierres R-Studio, todo se borrará. Lo mejor es dejarlo escrito en un Script y pasarlo a la consola. Para ello tienes varias opciones.

  • El rudimentario copiar y pegar
  • Ponerte en una linea o seleccionar el trozo de código que quieres ejecutar y darle al botoncito «run» que aparece sobre el Script (hacia la derecha del panel)
  • Hacer lo mismo que antes pero presionar control + enter.

Verás que si pones el cursor sobre una linea y ejecutas con alguna de las dos últimas opciones, el cursor baja automáticamente a la siguiente. Así puedes ir ejecutando el código linea a linea. ¿Qué pasa si una de esas lineas es un comentario, es decir, empieza por #? Fíjate que escribe el texto del comentario en la consola y, automáticamente ejecuta la siguiente linea con código.

Algunos detalles sobre la consola

Algunas cosillas de la consola que te puede resultar útil saber son:

  • Cada linea aparece encabezada con un símbolo >. A este se le llama promt y es la señal de que la consola está lista para recibir nuevo código. Si te aparece un + es que te has dejado algo de código a medias y lo siguiente, si no completa ese código, puede darte error. Para volver al promt pulsa la tecla esc.
  • Puedes revisitar ordenes que ya has dado subiendo y bajando con las flechas del ordenador
  • Puedes limpiar la pantalla con control + l (l de Lugo).

Environment / History

Este es el lugar al que van a parar todos los objetos que creamos mediante código.

¡Uy! ¡Espera! ¿Un objeto? ¿Eso qué es?

R es un lenguaje basado en objeto, es decir, para poder trabajar con él iremos creando diferentes objetos que pueden ir desde guardar algo con un único valor numérico, a un banco de datos completo o una función entre otros.

Por probar lo más sencillo, ejecuta en la consola

 y <- 3

Ves que ahora la consola no te ha devuelto nada pero el objeto aparece en environment. Si en la consola escribes y, te devolverá su valor.

Fíjate que usamos el símbolo < seguido de un guión medio – para crear una flecha de asignación. También podrías usar un = pero yo no lo recomiendo porque el = en R suele tener otros usos.

¿Lo complicamos un poco?

  • Podemos crear objetos que tengan varios datos en forma de vector. Para ello solo tienes que escribir una c, abrimos paréntesis y empezamos a escribir los valores separados por comas. Al terminar, cerramos paréntesis. Algo así:
    • x <- c(1,2,3,4)
  • También puedes cargar bancos de datos que tengas guardados en formatos tales como texto plano, excel o SPSS entre otros utilizando el «botón» Import Dataset. Estos bancos de datos aparecerán también en el environment.
    • Puedes probar su funcionamiento cargando el conjunto de datos ambiente.sav que contiene los datos de contaminación de diversos aparatos de medida situados en localizaciones valencianas.
    • Observad el código que se genera en la consola: ¿qué es library y read_sav?

History

La pestaña history es sencilla de explicar, solo contiene el histórico de lo que has ido ejecutado y que puede ser muy útiles para recuperar ordenes antiguas o pasar texto al script si se trata de algo que se ha ejecutado directamente en la consola (como las ordenes que genera Import Dataset).

Respecto a estas últimas te he preguntado que significaba library y read_sav… te invito a que escribas en consola

help(read_sav) 

¿Qué ha pasado? ¿Has obtenido algo de ayuda? ¿Dónde se ha abierto esta ayuda?

Efectivamente, vayamos al último panel:

Files/Plot/Packages/Help/Viewer

Help

Ya que tenemos abierta la ayuda anterior, aprovechemos para empezar por ahí, por el help.

Una de las mejores cosas de R es su sistema de ayuda. Para saber cómo funciona cualquier función solo necesitamos escribir la orden help con el nombre de la función correspondiente entre paréntesis. En próximas entradas iremos estudiando mejor como leer esta ayuda pero, de momento, déjame que te diga que las funciones tienen un nombre y entre paréntesis suelen llevar lo que denominamos «argumentos». Estos argumentos concretarán cómo o sobre qué debe actuar la función.

También podéis usar la ayuda como:

?read_sav

o como:

help.search(read_sav) 
??read_sav

Si lo que queréis buscar es una función incluso aunque no la tengáis instalada en R porque… hay algo que debes saber, no podrás acceder a la ayuda de una función si está no está disponible. Entramos ahora en el mundo de los paquetes y su pestaña.

Packages

Otra de las cosas que hace a R muy atractivo es que hay miles de personas trabajando con él y generando funciones que guardan en algo que denominamos paquetes. Suena como muy natural, yo hago unas funciones muy útiles, las empaqueto, las envuelvo y las subo a la nube para ti. Si quieres usarlas, solo tienes que descargar el paquete y cargarlo en tu sesión de R.

Desde la pestaña Packages puedes descargar en instalar estos paquetes o cargarlos una vez los tengas instalados.

Ojo porque la acción de instalar y la de cargar son diferentes. Instalar supone que tienes el paquete en tu ordenador dispuesto a actuar pero, hasta que no lo cargues este no será plenamente funcional.

Si actuamos desde la pestaña, lo primero lo hacemos mediante el botón Install escribiendo el nombre del paquete en la ventana que nos aparece. Debes recordar siempre marcar que instale las dependencias para evitar problemas. Una vez instalado, el paquete aparecerá en el listado y solo hay que marcarlo para que se cargue.

Ventana que aparece al pulsar en la función Install y donde puede escribirse el nombre del paquete buscado
ventana que aparece al pulsar sobre Install

Veréis que la primera parte ha generado en consola la orden Install.packages(«nombre del paquete») mientras que la segunda ha generado library(«nombre del paquete»). Una buena opción es copiar estas ordenes en el script para poder usarlas la próxima vez (sobre todo la de library) sin tener que ir clicando aquí y allá.

Si quieres probar, intenta instalar y cargar el paquete «faraway».

Un detalle importante es que en el proceso de instalación de un paquete puede que se generen mensajes y te pida si quieres instalar tal o cual cosa desde código fuente… prueba dando a sí y si no funciona, repite todo dando a no… no hay forma (al menos que yo sepa) de saber cuál es la opción buena en tu ordenador.

Files

Desde la pestaña Files podemos navegar por nuestros archivos. Cuando abrimos R se abrirá un directorio por defecto pero puedes usar los tres puntitos que aparecen a la derecha para ir a la carpeta que te plazca (ojo, al navegar por tus archivos solo veras las carpetas, no los archivos que contienen).

Una vez hayas localizado tu directorio favorito, puedes establecerlo como directorio de trabajo. Esto es muy útil porque si guardas un script o un gráfico (como veremos a continuación) estos irán, por defecto, al directorio de trabajo establecido. Para hacerlo, clica sobre la rueda de ajuste con la palabra More al lado y dale a Set as working directory

El comando setwd() tiene la misma función. De hecho verás que aparece directamente en la consola al seguir los pasos anteriores. El único pero es que, para usarlo tienes que estar familiarizado con las direcciones dentro de tu ordenador, pero bueno, si eres una persona observadora, con dos veces que lo hagas lo tendrás claro.

Plot

Acabamos por último en la pestaña Plots, en ella se visualizarán todos los gráficos que ejecutemos. Prueba esto:

hist(rnorm(1000,35,1))

¿Qué ha pasado? Si todo fue bien estarás viendo esta imagen

Puedes usar help para ir tratando de entender qué funciones hemos usado para llegar ahí. Pero si no te apetece, no te preocupes, llegaremos a ellas en otras entradas. Lo importante ahora es que en el botón Export puedes cambiar el tamaño o el formato, guardarla, copiarla etc. Y eso será así siempre que visualices una gráfica en esa pantalla pero, ojo! Uno de los problemitas (pocos) que tiene RStudio es que si cuando vas a hacer la gráfica, los márgenes de esta ventana son pequeños (recuerda que puedes moverlos a tu antojo), la consola te dará una señal de error… prueba a darle otro tamaño a la ventana y vuelve a ejecutar el código.

Además de todo esto.

Déjame que, antes de terminar por hoy, te de algunos tips más:

  • En la pestaña help tenéis Cheat Sheets que son muy útiles para refrescar cosillas que se nos vayan olvidando (o que no nos haya dado tiempo a ver)
  • Si no te gusta la versión con fondo blanco, lo puedes cambiar en Tools > Global options «Appearance» mi favorito es Dracula.
  • En la imagen también veras que la consola aparece al lado del script. Esta es mi forma de trabajar porque me gusta extender la consola y el script y tener visibles solo esos dos paneles.

Y hasta aquí lo que quería contaros hoy. Próximamente más.

Si te ha gustado, recuerda compartir en redes sociales para llegar a todo el que pueda necesitarlo. 🥰

Indice del curso

  18 Replies to “Empezando en R con RStudio”

  1. 16/12/2022 at 14:44

    un favor a la comunidad, actualice R a la versión mas reciente 4.2.2, ejecuta todo bien de los que tenia abiertos, pero al cargar otros, no lee las líneas de códigos de los scripts, recupera todo vacío sin condigo, favor alguna solución?

    • 17/12/2022 at 18:53

      Asegurate de que no sea un problema de codificación. Para eso, ve a file > Reopen with encoding y prueba, por ejemplo, utf8, por si fuese eso.
      Un saludo

  2. Axel
    28/11/2022 at 06:47

    Muy buena introducción. Antes trabajaba con varios software estadísticos, pero siempre les faltaba algo. Desde que uso R todo es lo máximo. Además, no es sólo estadísticas, tiene mil funciones más.
    Estaré al tanto de su próxima entrega.

  3. 21/11/2022 at 08:20

    Muchas gracias Anabel.
    Empecé con R hace unos pocos meses. Estoy escalando la curva de aprendizaje, en esa región en donde la pendiente aún es muy alta.
    Te he conocido a través de «Raíz de 5».
    Tengo tu web en los favoritos de mi navegador y ahora, además de tus PoeMaths, te R-seguiré .
    Saludos

    • 29/11/2022 at 11:21

      ¡Gracias!
      Me ha encantado lo de te R-seguiré…jeje. Espero que las entradas te resulten útiles.
      ¡Un saludo!

  4. Rafael Borges
    20/11/2022 at 22:04

    Soy usuario de R desde la versión 1.0, que fue liberada hace unos 21 años (y antes usé S-Plus) y esta introducción me parece excelente y muy completa, o como dicen en España, está muy guay.

  5. Hernan
    20/11/2022 at 20:24

    Lo instalé en windows pero no me aparecen las 3 ventanas del principio

  6. 20/11/2022 at 13:23

    Buena introducción a R y RStudio. Cada día mejora más este lenguaje y me resulta mas sencillo que Python, personalmente. Un saludo!!!

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

A %d blogueros les gusta esto: