Software

Mi definición de "big data"

No sin descaro, me atrevo a aportar una definición alternativa a eso que llaman big data y que yo traduzco en ocasiones como grandes datos.

No obstante, para comprenderla, considero necesaria una pequeña digresión de dos párrafos —con la que muchos, espero, no aprenderán nada que no traigan ya sabido— sobre los lenguajes de programación declarativos e imperativos.

En los primeros, programar consiste esencialmente en escribir con cierta notación aquello que quieres: la suma de los elementos de un vector, el promedio de los valores de una columna de una tabla, la suma de los saldos de los clientes de Soria, etc. El intérprete se encarga de servirte los resultados en la proverbial bandeja.

BI Survey 13: el veredicto del cliente

Un cliente esporádico mío, BARC, me ha pedido que le ayude a divulgar su encuesta periódica de evaluación de herramientas de lo que llaman business intelligence.

He accedido en parte, sí, porque hay que estar bien con los clientes. Sobre todo los esporádicos.

Pero también porque el mundo del BI es sumamente opaco e impera la información asimétrica. Quienes compran herramientas como SAP, Cognos, SAS, Microstrategy, etc. están a dos velas de lo que ocurre en el edificio de al lado, de los problemas que van a encontrar en su implementación, de su rendimiento en producción. Están casi totalmente a expensas de los cantos de sirena de los vendedores.

Liberado BioStatFLOSS, una colección de recursos libres para la bioestadística y la epidemiología

Quiero publicitar hoy BioStatFLOSS, una recopilación de software (libre, como el propio nombre indica) para Windows, especialmente indicado a la hora de realizar trabajos en el campo de la bioestadística y la epidemiología (pero que también se puede utilizar para la realización de estudios estadísticos más generales).

El software (que incluye R como programa estrella) ha sido portabilizado —si no existía ya una versión portable, es decir, que no necesite instalación— y se ha creado un lanzador común desde donde se puedan llamar a todos esos programas (véase la captura adjunta). Este lanzador está programado en Lazarus (Free Pascal) y, en breve, se liberará el código fuente.

El cuadrante mágico de Gartner y sus contradicciones internas

A la gente de Gartner le encanta su (impropiamente denominado) cuadrante mágico, que es una cosa tal como

Dispone Gartner sobre él los productos de diversos proveedores (de informática de gestión) en función de dos variables, ability to execute y completeness of vision. El cuadrante está partido en cuatro sectores en los que se ubican:

  • Los líderes (leaders), que son los que obtienen buena calificación en ambas dimensiones.
  • Los aspirantes (challengers), a los que falta visión.
  • Los visionarios (visionaries): mucho abarcan, poco aprietan.
  • Los nichos específicos (niche players): dizque están especializados en algunos mercados concretos.

Pero siempre que lo veo me surge la siguiente pregunta: ¿son verdaderamente relevantes las dos variables mágicas? Veamos… IBM supera en ambas variables a SAS y SAP (y a muchos otros proveedores). Eso puede significar dos cosas mutuamente opuestas:

Sobre la cuota de mercado mundial de las herramientas analíticas de negocio

R

Hace poco, IDC —una empresa que hace estudios de mercado a nivel global de distintas herramientas de sofware y hardware — hizo público su informe periódico Worldwide Business Intelligence Tools 2009 Vendor Shares. En su página 8, la más jugosa del informe, aparece la tabla que reproduzco a continuación:

Puede apreciarse cómo en el segmento de la minería de datos (que viene a ser a lo que se refieren con lo de advanced analytics) es SAS el claro dominador con IBM/SPSS en una débil segunda posición.

Más sobre el caso WPS vs. SAS

Ayer quise publicar un comentario a este artículo sobre el reciente veredicto del caso SAS vs. WPS. Aunque ya hablé de eso el otro día, como no me lo publicaron (por ingnotas razones), hago constancia de mi comentario aquí:

The article is misleading in the sense that computer languages (and there exists such a thing as a SAS computer language) are not subject to copyright.

I am free to write my own interpreter/compiler of Java, C, Python, PL/SQL or Logo. And many companies do: Microsoft has implemented their own interpreter of Python, IronPython, etc. Anybody is entitled to write yet another interpreter of SAS code. And, in fact, SAS did not sue WPS for that reason.

¿Ya has considerado pasarte a WPS?

Ya no recuerdo si he hablado antes de WPS en este blog. Puede que lo haya hecho en algún otro. No estoy muy contento con esa empresa (con la que he tratado de manera inexplicablemente infructuosa de realizar algún tipo de negocio en el pasado) pero no está de más que los lectores de este blog tengan noticia de su existencia y naturaleza.

WPS es una pequeña compañía inglesa que comercializa un clon de SAS. Es decir, un intérprete alternativo de código SAS.

Qué hacer (y no hacer) con los bichitos que uno encuentra

No sé si es porque gano agudeza visual, porque me vuelvo cascarrabias o, simplemente, porque tengo mala suerte. Pero cada vez me tropiezo con más bichitos de esos que en inglés se llaman bugs. Y me refiero a esos que son consustanciales a todo proyecto de software.

Antes, antaño, simplemente los toleraba y, creo, vivía más feliz. Formaban parte del paisaje, como los mosquitos nocturnos en la jungla tailandesa. De un tiempo acá, sin embargo, tengo una relación más compleja con ellos.