En el posteo anterior mencionaba que me dedicaría a navegar sobre los datos de la API de Foursquare.
Los siguientes datos que presento se corresponden a los de la ciudad de Buenos Aires, relevados de la API de Foursquare durante los primeros meses de 2014 mediante el principio de bola de nieve a partir de Mariano Amartino como nodo semilla.
Se recolectaron mediante la lectura vía programa específico 44619 usuarios (nodos) y 131836 relaciones de amistad (aristas). 4SQ permite recolectar de a diez usuarios por ronda, de las cuales se hicieron 7, captándose usuarios de todas las ciudades importantes del mundo. Se seleccionaron luego solamente los usuarios de Buenos Aires y volcaron en una matriz con la que se generó un grafo (no dirigido ya que en Foursquare la amistad es bidireccional como en Facebook).
Como se ve en la visualización es difícil sacar conclusiones de tal cantidad de elementos, porque hay que considerar la sumatoria de nodos y enlaces, pero ademas las configuraciones que adoptan en su interacción pero algunas características obtenidas con Gephi de la red son:
Grado medio: 5
Diámetro de la red: 34
Coeficiente de clusterización: 0,078
Sobre este material se realizó un filtrado por grado (17,63), seleccionando de eso modo al 3,17 % de los nodos mas conectados, lo que representa un 2,05 % de las aristas,siendo un total de 1415 nodos y 2691 aristas.
La elección de los nodos con mayor grado se basa en que los usuarios con mas amistades serían los mas activos, dado que un dato aún a descubrir es que porcentaje de usuarios se inscriben, hacen algunos enlaces pero luego no utilizan la aplicación.
Algunos características de esta red filtrada pueden visualizarse en la tabla de abajo:
[table id=5 /]
Dicho esto, que se puede decir de esta selección de red?
Una característica que llama la atención es la alta modularidad que es la fracción de los enlaces dentro de de los grupos en relación a los enlaces esperables por azar. El valor de la modularidad se ubica entre -.5 y 1. Mide cuan dividida está una red en módulos. Las redes con alta modularidad tienen conexiones sólidas entre los nodos dentro de los módulos, pero escasas conexiones entre nodos en diferentes módulos, como parece ser en este caso.
En relación a esto aparecen 134 comunidades para 1415 usuarios, es decir que una lectura rápida nos llevaría a pensar que cada comunidad tiene unos 10 miembros. Sin embargo si vemos con mas detalle vamos a encontrar que un ranking de esos grupos encontrará que pocas comunidades se quedan con la mayoría de los usuarios.
Lo mismo puede pensarse respecto a un grado medio cercano a 4. La red filtrada tiene un diámetro de 14, los que significa que habría que recorrer esa cantidad de nodos para distribuir una novedad (por ejemplo un nuevo restaurante recomendable).
Sin embargo si observamos a los nodos mas conectados dentro de esta red ya de por sí muy recortada encontramos algunas sorpresas. Seleccionamos mediante un segundo filtrado los 165 nodos mas conectados de los mas de 40 mil iniciales y vemos tal como aparecen conectados entre si, relacionados por 171 enlaces.
Descartados los nodos no-conectados dentro de la cúspide nos encontramos conque no existe relación entre la conectividad general (tomada en la primera red no filtrada) y el conexionado dentro de la elite mas conectada.
La topología de los nodos mas conectados nos deja ver que algunas cuestiones a resaltar, a saber: A) es el usuario de mayor grado general, pero está pobremente conectado con la cúspide de mas conectados, B) en cambio tiene una posición central y figuraría en una especie de segunda linea respecto al grado, en tanto que C) está muy conectado en la elite, pero su grado general es bastante menor.
Estas observaciones son claves para detectar sobre qué usuarios deberían hacerse intervenciones meméticas para distribuir información.
Es evidente que nodos como A) nos llevarán rápidamente a grandes cantidades de nodos de baja calificación, sin embargo C), a pesar de su menor popularidad general, nos daría acceso rápidamente a los de la elite mas conectada entre si.
Por otro lado hay que considerar los restos flotantes de nodos aislados que se recolectan cuando se seleccionan los nodos mas conectados. Muchas veces aparecen nodos con alto grado y en otros islotes de usuarios que deben ser mesurados, porque son usuarios que van a difundir información a vastos sectores de la red.
Hasta acá podemos ver cierta autoorganización esperable en las redes en las que predomina la interacción entre los nodos, de modo que cada uno actúa según sus expectativas y las de los otros nodos. ¿Pero como evolucionan estas redes? ¿Como establecer la dirección general de un red de este tipo y como realizar intervenciones en ella?
Si quisiéramos producir cambios en esta estructura deberíamos estimular algunos nodos o modificar las relaciones entre ellos, creando nuevas (por ejemplo integrando a la elite al nodo poco conectado en la cúspide) o destruyendo otras, por ejemplo aislando a nodos de baja calidad.
El análisis del cambio estructural, entonces, es mucho mas rico visto así quemediante los estudios ortodoxos basados en promedios, ya que se pueden hacer acciones a nivel local y predecir la consecuencia de esas acciones con modelado computacional.
Tom Snijders ha propuesto que los individuos (nodos), están encorsetados por reglas compartidas, que proporcionan sistemas de elección que definen como crear o romper sus relaciones sociales.
Ahora bien, los individuos pueden, ademas de evaluar su posición en la red, tratar de obtener una configuración de relaciones que consideren mas favorable para sí, es decir juegan el juego habilitado en cada red para aumentar sus oportunidades y minimizar sus restricciones.
Algunas personas actúan de un modo “miope”, es decir sin conciencia de las consecuencias de sus acciones y sus eventuales amplificaciones a largo plazo, sino viendo la inmediatez y localidad de sus actos. Sin embargo estas personas son las que producen cambios lineales graduales en la estructura general de la red.
La idea es discutible respecto a si la conciencia del funcionamiento y estado de la red se corresponde al módulo mas próximo, porque mas allá de su evidente fractalidad en redes de gran escala como 4SQ, TWT o FB con cientos de millones de usuarios no parece posible realizar capturas de sentido global.
En algunas ocasiones los efectos pueden ser logarítmicos y no lineales, ya sea por la difusión mas rápida (viralización de video en youtube) como por la destrucción de red a gran escala (disolución de ICQ). Duncan Watts ha llamado “transición de fase” a ese punto de salto geométrico en la difusión de innovaciones y ha encontrado que en determinadas condiciones las acciones a nivel modular, cuando existe una gran disminución de la modularidad (por aumento de conectividad) las unidades de información pueden propagarse rápidamente a través de la red. La idea de Duncan es que es muy difícil predecir que un tweet se volverá viral, pero si decir en que condiciones podría serlo.
¿Que es lo que regula el hecho de que pocos memes se distribuyan exponencialmente? Posiblemente porque la información que contienen algunos módulos son diferenciadores de identidad tan importantes que dan sentido al grupo y su des-encriptación amenaza la posición de los nodos miembros de esos clusters. Al mismo tiempo, como la velocidad de distribución dentro de la red es un factor clave, si un meme se propaga demasiado rápido pierde pierde todas sus ventajas (ej. moda).
Volviendo a Foursquare de la lectura topológica podemos hipotetizar que la red es relativamente estable y modular, permitiendo que grupos de amigos distribuyan novedades respecto a lugares visitables donde hacer checkins. Sin embargo hay un grupo de nodos claves capaces de propagar rápidamente alguna novedad a grandes paquetes de módulos.
Al mismo tiempo, si quisiéramos utilizar la red con fines publicitarios, sería imprescindible que los usuarios mejor conectados sean intervenidos, de hecho hemos podido, en este ejemplo, seleccionar un pequeño grupo de nodos con uno clave (A) con capacidad de reducir en muy pocos pasos la modularidad de la red y consecuentemente distribuir exponencialmente información.
En el próximo posteo de esta saga continuaré reflexionando a partir de los elementos estructurales acá descriptos, respecto a observables sociológicos y especialmente sobre la cuestión de los DDHH.