Quiero aprender Ciencia de Datos - Ahora que?
publicado: 2017-02-11

Cuando me preguntan como aprender Ciencia de Datos, siempre me cuesta un poco encontrar la respuesta. No hay una sola respuesta porque la ruta de aprendizaje ideal es diferente para cada persona. Aquí trato de resumir lo que recuerdo haber dado en respuesta. Hay tantos campos dentro de ciencia de datos que la clave está en encontrar lo que te hace feliz hacer, y lo que logras absorber y hacer relativamente bien y rápido.


Parallel R in Docker Containers
publicado: 2016-08-20

At our R User Group the question came up how to use Docker to set up parallel computing of R code on a cluster of Docker containers. And in setting up an example as a proof of concepts I run into more trouble than I had expected. Most of them were networking issues, and these notes may be use to you if you try to set up something similar. I did not find nearly as much recipes to set up a cluster of docker containers for parallel computing with R as I had expected.


Acceder Datos Abiertos a Través del API de Junar
publicado: 2016-03-28

El API de Junar es la base para varias iniciativas de Datos Abiertos en Latino América y los EEUU. El paquete junr facilita el acceso a estos datos desde R. El objetivo es fomentar el uso de los datos disponibles haciendo el acceso lo mas fácil. Algunos ejemplos de implementaciones son: el Portal de Datos Abiertos del Gobierno de Costa Rica y la Ciudad de Córdoba (Argentina) entre otros. Otros se pueden encontrar en el sitio web de Junar.


Access Open Data Through the Junar API
publicado: 2016-03-28

The Junar API is the basis for a number of Open Data initiatives in Latin America and the USA. The junr package is a wrapper to make it easier to access data made public through the Junar API. Some examples of implementations are: the City of Pasadena, and the City of San Jose. Others are listed on the Junar website.


Como Acceder Bases de Datos con R
publicado: 2016-01-24

Para que un proyecto sea manejable, es importante tener una gestión no solo del código R, pero también de los datos. A lo largo de cualquier proyecto de análisis van a ocurrir correcciones, modificaciones y actualizaciones. Es posible manejar datos en archivos, pero con un poco de complejidad en los datos o en los cambios, rápidamente se vuelve inmanejable.


Guía de estilo para R
publicado: 2015-08-24

Hay muchas formas de escribir código en R. Entre mas código escribes, y sobretodo entre mas código tienes que leer, más apreciaras un estilo uniforme. Te permitirá leer tu propio código y volver a entenderlo mas fácilmente después de un largo tiempo sin haberlo visto. Ademas, un estilo uniforme te permitirá trabajar mas efectivamente con otros.


Allow for more than 16 RMySQL connections in R
publicado: 2015-07-08

If you have ever used RMySQL directly or as the back-end to dplyr you are very likely to have encountered the error: "Cannot allocate a new connection: 16 connections already opened". The first thing to consider is whether you would need to have more than 16 connections. In many cases you would will not need more than 16 connections for the sript that you bring to production.


Fossil-SCM: Sistema de Control de Versiones con todo incluido
publicado: 2013-08-24

Sistemas para control (o gestión o manejo) de versiones tienen utilidad mucho mas allá que solo para la programación. Y en cualquier circunstancia donde estas usando muchos archivos para realizar un proyecto (como por ejemplo una tesis de grado) es indispensable manejar las versiones en las cuales están los archivos. También cuando no estás trabajando en un equipos, y eres el único que contribuye.


Fossil-SCM: the one-stop versioning and ticket management system
publicado: 2013-08-03

Version control and incident management (tickets) are ubiquitous in development environments. Even for solitary developers who need to keep track of their code. For users who are less technically inclined it often does not even register on their radar that it is among the possibilities. So people who are writing tend to end up with long list of files with dates and other comments appended, without knowing after a while which file was which.


Interactive Presentations with Open-Sankore
publicado: 2013-05-03

If you only look at the the status of the documentation (especially in English), you would never guess how hard the people at Open Sankoré have been working. They have just released version 2.1 and after playing around with it for a bit, I have decided to give it a first try in a real course setting.