Python vs R para Data Science

Entre 2016 y 2018 el volumen de datos que gestionaban las empresas al año se incrementó en un 569%, según la empresa experta en análisis y visualización de datos Toucan Toco. Esta gran cantidad de datos, además de hacer entrar en juego el concepto de Big Data, pone sobre la mesa cuál es el lenguaje de programación más adecuado para el análisis y procesamiento de toda esta información.

Los más populares hasta ahora son Python y R mediante técnicas de data mining y business intelligence pero, ¿conocemos las ventajas de cada uno de ellos? ¿Cuál nos conviene más?

Ventajas de Python en el análisis de datos

  1. Simplicidad: Python consigue que los programas funcionen con el menor número de líneas de código posible.
  2. Independiente: puede calcular datos en cualquier tipo de entorno y equipo.
  3. Numerosas librerías creadas para el análisis de datos concretamente, como Numpy o Pandas, que implementan funciones para cálculos matemáticos y estadísticos.
  4. Compatibilidad: Hadoop es la plataforma de Big Data de código abierto más popular y Python es 100% compatible con ella.
  5. Fácil aprendizaje: es un lenguaje muy sencillo incluso para el programador más inexperto.
  6. Cuenta con una amplia comunidad que ayuda a resolver cualquier problema.
  7. Rápida integración con aplicaciones con bases de datos no relacional como MongoDB.
  8. Visualización de datos: actualmente ha trabajado en mejorar este aspecto con APIs concretas.
  9. Está integrado en la nube.
  10. Es un lenguaje Open Source.

Ventajas de R en el análisis de datos

  1. Manejo y almacenamiento efectivo de datos.
  2. Cuenta con una gran colección de herramientas para el análisis de datos.
  3. Su formato de documentación está basado en LaTeX, que se utiliza para proporcionar documentación completa tanto en formato físico como digital.
  4. Visualización de datos muy profesional: presenta gráficos muy sofisticados gracias a paquetes como ggplot2.
  5. Gran actualización: R es el lenguaje más actualizado en cuanto a técnicas estadísticas.
  6. Integrado en la nube.
  7. Lenguaje Open Source.
  8. Cuenta con una comunidad online muy activa.
  9. Independiente: se puede utilizar en cualquier sistema operativo.

¿Con cuál me quedo?

Ahora viene la decisión final, ¿cuál es el mejor lenguaje de programación para mi proyecto? La realidad es que ambos nos van a ofrecer resultados óptimos, pero si queremos argumentar más nuestra elección podemos hacernos una serie de preguntas:

  • ¿Qué tipo de trabajo vamos a desarrollar? Según el objetivo de nuestro proyecto nos convendrá más un lenguaje u otro. Por ejemplo, R está pensado más para un análisis estadístico exhaustivo o un análisis independiente a realizar por una máquina, mientras que Python es recomendable cuando los datos provienen de distintas plataformas que debemos integrar a nuestro proyecto.
  • ¿Qué profesional va a trabajar con este lenguaje? Los desarrolladores especializados en R suelen tener conocimientos matemáticos y estadísticos, mientras que Python es utilizado comúnmente por informáticos o profesionales de la programación.
  • ¿Qué plataformas de Business Intelligence o Big Data utilizamos? Sin duda un factor de vital importancia es elegir el lenguaje de programación que mejor integración tenga con nuestra plataforma de Big Data. La buena noticia es que ambos códigos son abiertos y se encuentran en constante evolución.

¿Python o R?

La web de preguntas y respuestas para desarrolladores Stack Overflow ha realizado una nueva encuesta anual para conocer algunos datos relevantes como el lenguaje de programación más popular, el más odiado o el rango salarial que actualmente ostentan los profesionales del sector.

Uno de los datos más relevantes es que Python se sitúa en el tercer puesto como lenguaje preferido por aquellos programadores que lo están usando con un 66,7%, solo por detrás de Rust y TypeScript. También debemos tener en cuenta su primera posición en cuanto a lenguaje más deseado para programar, por aquellos que no lo están usando todavía. Este primer puesto es significativo por el aumento y expansión que está teniendo Python en estos últimos años.

Por el contrario, R se encuentra en la 16ª posición (de 25) de los lenguajes de programación preferidos por los programadores que lo usan y en una 14ª posición de los lenguajes más deseados para programar por aquellos que no lo están trabajando.

Con estos datos podemos entender que Python es una herramienta bastante más agradable y funcional para trabajar, según la opinión de los más de 65.000 programadores encuestados por Stack Overflow.

Salarios y empleabilidad

Hasta aquí la popularidad de unos y otros, pero, ¿qué hay de la empleabilidad o el salario según el lenguaje en el que estos profesionales se han especializado?

Según esta misma encuesta a nivel global, Python ocuparía la 10ª posición con una media de 59.000$ anuales frente a los 57.000$ anuales de media con R, por lo que la diferencia no es muy significativa.

En nuestro país según datos de Glassdoor el sueldo medio de un desarrollador Python está entorno los 29.000€ teniendo un rango aproximado entre los 21k y 39k dependiendo de su experiencia. Según los indicadores de Linkedin Salary también podemos ver que la media se encuentra en los 30k€, pero la orquilla es mayor contemplando un rango entre los 17k€ y 42k€.

Con respecto a los datos de salario sobre R, solamente podemos disponer, además de los ofrecidos anteriormente, de los datos de la encuesta de Hacker Rank 2020 donde nos ofrece un sueldo medio global de unos 54.000$ de un programador de R frente a los 50.000$ de Python. Teniendo perspectiva global, hemos de atender a que, según esta misma encuesta, el salario medio de un programador en Estados Unidos estaría en torno los 109K$ frente a los 44K$ (37K€) en España.

Así podemos concluir, que en cuanto a los salarios, no existe gran diferencia entre ambos lenguajes, que sin embargo si pueden darse dependiendo del nivel de experiencia.

En cuanto a la empleabilidad, según los datos que nos puede ofrecer el portal Linkedin.com existen en la actualidad un total de 72 empleos en España donde se requiere conocimientos de R frente a los más de 800 en los que se piden conocimientos de Python.

En resumen, y viendo todos los datos enunciados anteriormente se puede comprobar que a pesar de tener salarios más o menos similares, Python parece ser un lenguaje mucho más atractivo para los desarrolladores y que ofrece una mayor demanda en el mercado, en detrimento de R que parece que todavía está por expandirse un poco más en el sector de las aplicaciones.

2020-10-08T14:29:20+02:008 octubre, 2020|

¡Compártelo en tus redes sociales!

Ir a Arriba