Lenguaje estadístico matemático R

R un sistema para análisis estadísticos y gráficos creado por Ross Ihaka y Robert Gentleman . R tiene una naturaleza doble de programa y lenguaje de programación y es considerado como un dialecto del lenguaje S creado por los Laboratorios AT&T Bell. S esta disponible como el programa S-PLUS comercializado por Insightful2 .

Un software de análisis estadístico hace alusión a todos aquellos programas informáticos que disponen de módulos orientados a la tabulación, gestión, modificación, análisis y representación gráfica de datos.

Es un lenguaje de programación empleado primordialmente para efectuar análisis estadístico de datos y construcción de gráficos.

R es considerado la lengua franca de la Estadística (Mizumoto y Plonsky, 2015) debido a algunas de sus características que lo sitúan muy por encima de prácticamente todos sus “competidores”: R es gratuito y libre, es muy versátil, permite realizar una cantidad insospechable de procedimientos estadísticos y gráficos, permite construir gráficos de calidad inmejorable, etc.

La consola de R

R interfaz

La interfaz principal de R, es un recuadro en el cual se van escribiendo los comandos que quieras llevar al cabo. Este software  es comúnmente utilizado para la computación estadística y gráfica, ya que dispone de una amplia variedad de técnicas estadísticas (modelos lineales y no lineales, pruebas estadísticas clásicas, análisis de series de tiempo, clasificación, agrupamiento, etc.) y gráficas.

Funciona en plataformas UNIX y sistemas similares (incluidos FreeBSD y Linux), Windows y MacOS.

Actualmente R es ampliamente usado en áreas como la bioestadística, el data mining, la econometría, la visualización de datos, etc. Como ya se ha planteado, R se utiliza primordialmente para efectuar análisis estadístico de datos y construir gráficos, tal como lo hacen muchos software de análisis estadístico, pero la potencia  reside en su calidad de lenguaje.

En este sentido, con R se pueden realizar muchas cosas más, como por ejemplo: (1) Analizar y/o editar imágenes. (2) Realizar análisis de sonido. (3) Analizar textos (cuantitativa y cualitativamente). (4) Generar mapas y realizar análisis espacial. (5) Realizar análisis de redes sociales (ARS).

Características

  • Manejo y almacenamiento efectivo de los datos.
  •  Un conjunto de operadores para la realización de cálculos con matrices.
  • Una gran colección de herramientas para el análisis de datos.
  • Utilidades gráficas para la visualización de datos.
  • Un lenguaje de programación bien desarrollado que incluye saltos condicionales, bucles, funciones recursivas, utilidades para la entrada y salida de datos, etc.
  • Tiene un formato de documentación basado en LaTeX, que se utiliza para proporcionar documentación completa tanto en formato físico como digital.

Pros y contras de usar este software

Pros

Contras

  • Es gratuito.
  • Es libre. Cualquier usuario puede “desarrollar una nueva aplicación del mismo, puede modificar lo ya existente, puede compartirlo y usarlo libremente” (Ruiz-Ruano y Puga, 2016, p. 76).
  • Es multiplataforma:  puede operar en Windows, Macintosh y Unix.
  • Es muy versátil y potente.
  • Gracias a los “paquetes” se pueden realizar una cantidad insospechable de procedimientos estadísticos y creaciones gráficas. Asimismo, se pueden construir gráficos de calidad inmejorable.
  • Desde el software fácilmente se pueden leer archivos previamente generados en otros programas, como Excel, SPSS, SAS, Stata, Minitab, etc.

El hecho que haya que escribir líneas de código hace que al principio sea (más o menos) arduo trabajar con R. Puede ser mitigado por  herramientas que sirven para hacer más llevadero el trabajo en R, como por ejemplo la IDE “RStudio” (RStudio Team, 2016)o la interfaz gráfica “R commander (Rcmdr)” (Fox, 2017).

RStudio

  • RStudio es una IDE (siglas en inglés de Integrated Development Environment), es decir, un “Entorno de DesarrolloIntegrado” exclusivamente diseñado para el software. En palabras sencillas: RStudio es una herramienta que nos permite interactuar de forma más “amigable”. Lo anterior se expresa en cosas concretas, como el auto completado de código o el resaltado de sintaxis.

Cursos y archivos para aprender conceptos básicos del software

Curso para incursionar en el mundo de la programación con R: https://www.udemy.com/course/comienza-con-r-curso-de-r/

Paper de introducción a conceptos básicos de R: http://scielo.iics.una.py/pdf/ucsa/v7n2/2409-8752-ucsa-7-02-97.pdf

Si quieres más información sobre Big data y programación  haz click en el siguiente botón.

Visita los otros artículos sobre temáticas relacionadas aquí.

© 2017