Hace unos 10 años estaba cursando un seminario de Doctorado con el Dr Agustín Salvia.
Sucedía en el Instituto Gino Germani, no precisamente un lugar para plantear cosas disparatadas, al menos en un curso serio y con nota.
Sin embargo yo acababa de leer un artículo de Chris Anderson en la revista Wired, en el que se decía algo así como que de ahora en adelante los datos crearían información solos, sin la necesidad de un sujeto cognoscente.
La idea publicada era mucho más fuerte que le de Long Tail, otra del mismo autor que fue la que a la larga lo llevó a cierta fama y sin embargo para mi fue conmocionante, en parte, supongo, por mi condición de psiquiatra.
El asunto es que tuve la mala idea de plantear, en medio de una clase en la que justamente se discutían las las condiciones de producción y de validación del conocimiento científico, esta idea según la cual sería posible que los datos buscaran patrones de datos que pudiéramos considerar como ciencia.
No voy a contar acá la respuesta de Salvia, porque posiblemente en aquella época tenía razón, pero casi una década después creo que yo tampoco estaba tan equivocado.
Porque hoy podemos tener novias o novios virtuales, o hasta podemos alquilar amigos reales por hora que nos eligen algoritmos posthumanos y si enviamos un whastapp preguntando por las lombrices es posible que facebook inmediatamente nos ofrezca anzuelos y todo tipo de artículos de pesca. Cosas así. Decenas, cientos, miles de artefactos digitales hacen cosas. Cosas que nos hacen a nosotros. En pocos años no podremos distinguir ya lo humano.
De alguna manera todo el comportamiento humano, desde la medicina a la publicidad está siendo atravesada por esta lógica de procesos que no solo reconocen patrones en bancos de datos, sino que aprenden de sus propios resultados.
Aprendizaje automático
El Machine Learning es un método de análisis de datos que automatiza la construcción de modelos lo que a su vez permite a los ordenadores encontrar ideas ocultas, no habiendo sido programadas de forma explícita para encontrar un patrón particular.
Machine Learning es un proceso iterativo, por lo que, cuanto más datos que el sistema consigue, mejores predicciones puede hacer. Sin embargo el truco consiste en encontrar que cantidad de datos es suficiente. Se puede aplicar para ayudar a las empresas a encontrar rápidamente grupos de objetos similares (por ejemplo, identificar segmentos de clientes) y para predecir sus comportamientos.
Todos los algoritmos de ML consisten en las siguientes tres cosas:
- Un conjunto de modelos posibles (ej. cantinas casi infinitas en una ciudad) para detectar la mejor cantina.
- Una manera de probar si un modelo es bueno (ir a comer a cada una) o mejor que otro.
- Una forma inteligente de encontrar ese buen modelo con sólo unos pocos pasos (menú, el edificio, el barrio, la cantidad de comensales, etc)
Los programas de ML también están diseñados para aprender y mejorar con el tiempo, a medida que se los a los nuevos datos generados a partir de sus propias predicciones y ha estado en el centro de muchos avances tecnológicos en los últimos años, como los automóviles con auto-conducción, la visión artificial y los sistemas de reconocimiento de voz entre otros.
Algoritmos sociales
En diciembre de 2009, Google comenzó la personalización automática de sus resultados de búsqueda para todos los usuarios, lo que se está llevando a cabo en todos los sitios web más importantes como Facebook, Twitter o empresas basadas en información como Apple o Microsoft que cierran su negocio básicamente con la venta de información a sus anunciantes. El resultado es que cada vez vamos a ver nuestro propio universo informacional depurado por algoritmos.
De lo que estamos hablando es de cierta banda de moebius en la que somos un poco máquinas, pero los artefactos son casihumanos.
Requiere una gran cantidad de potencia de cálculo aunque gracias a la computación en nube Machine Learning en más asequible: Microsoft lanzó su servicio de AZURE de Machine Learning comercial en febrero del año pasado.
Por ejemplo Fujitsu ha construido un sistema que utiliza Azure para ayudar a los agricultores japoneses a predecir mejor momento para inseminar vacas lecheras, mejorando el rendimientos de cada animal.
Cada vaca está equipada con un sensor en una de sus piernas que registra cuántos pasos da por día: los datos del sensor se transmiten a Azure, que puede identificar las vacas en celo.
El método clásico para detectar una vaca inseminable acierta en un 33 %, pero el procedimiento ML puede alcanzar hasta un 95 %.
Bien, saque una vaca, ponga un humano frente a Facebook y se entenderá de que hablamos cuando decimos algoritmos sociales y machine learning.
Juegos cuasihumanos
Por ultimo una reflexión sobre el reciente triunfo de los artefactos contra el campeón del GO, un juego del Go chino milenario que se basa en unas reglas del juego bien simples: Los jugadores se turnan para colocar fichas negras o blancas en un tablero, tratando de capturar las piedras del oponente o rodear el espacio vacío para hacer puntos del territorio.Es un juego de profunda complejidad y dicen que hay más posiciones posibles en GO que átomos en el universo.
Go se juega principalmente a través de la intuición y debido a su belleza, sutileza y profundidad intelectual que ha capturado la imaginación humana por siglos. En marzo de este año AlphaGo le ganó 4-1 a Lee Sedol, el mejor jugador de GO en el mundo durante la última década, mediante un procedimiento que se detalla en un artículo de Nature.
El programa fue desarrollado por un equipo liderado por un neurocientífico. Es un híbrido de redes neuronales y machine learning, que leen el juego mediante redes de valoración y redes acción que en definitiva lo que hacen es aprender mediante el procedimiento del ensayo, error y corrección.
El abanico de posibilidades que abre la metáfora de esta partida aun no parece estar al alcance de la agenda pública, lo que no deja de sorprenderme, especialmente por el efecto que tendrá sobre tantas habilidades humanas.
Por último lo descrito hasta acá nos ubica en el punto en el que comienzan los tremes, tema que trataremos en un próximos posteo.
Espero que el Dr Salvia no lea este post!