Documento 1c
Para presentar en Secretaría Académica e iniciar el trámite de defensa de la tesis doctoral.
INFORME Y AUTORIZACIÓN DEL DIRECTOR PARA PRESENTAR LA TESIS DOCTORAL
(Planteamiento, objetivos, medios utilizados y aportaciones originales)
ESCUELA DE DOCTORADO E INVESTIGACIÓN
DE LA UNIVERSIDAD EUROPEA DE MADRID Es habitual que en los sistemas complejos, altamente distribuidos y en los que se producen fenómenos de retroalimentación, el caos irrumpa como una de sus señas de identidad características. En las redes sociales confluyen todas estas circunstancias, por lo que cuando desde la perspectiva del marketing viral tratamos de cuantificar, entender y maximizar los rendimientos de las dinámicas de propagación, nos encontramos en un terreno incierto carente de instrumentos de análisis. Este trabajo pretende aportar un nuevo planteamiento metodológico basado en la combinación de métodos neuronales y algoritmos genéticos, que permita mejorar la capacidad de predicción, simulación y optimización de los profesionales del Marketing.
Parte de esta investigación ha sido publicada en los siguientes medios: ”Del Big Data Analytics al beneficio” : José Luis Florez Fernández, Isaac González Díaz. Harvard Deusto Marketing y Ventas, ISSN 1133-7672, Nº. 118, 2013, págs. 68-73
“Ciencia y arte en la toma de decisiones”: José Luis Florez Fernández. Harvard Deusto Business Review, ISSN 0210-900X, Nº 215, 2012, pág. 50-59
“Análisis de redes sociales: el poder de la influencia”: José Luis Florez Fernández. Harvard Deusto Marketing y Ventas, ISSN 1133-7672, Nº. 86, 2008, págs. 62-71
“La Economía de la Inteligencia, la Innovación y las Interacciones”: José Luis Flórez, co-Director del Curso de Verano de la UIMP, agosto de 2011
“Big Data Analytics: la industrialización de la inteligencia”: José Luis Flórez, co-Director del Curso de Verano de la UIMP, julio de 2013“Influencia en Redes Sociales: nuevos métodos de medición”: conferencia impartida por José Luis Flórez en la VI Conferencia Internacional de Álgebra No Asociativa y sus Aplicaciones; Zaragoza, noviembre de 2011.
Por todo lo anteriormente expuesto, consideramos que el trabajo desarrollado reúne los requisitos necesarios en cuanto a la originalidad y rigor académico para su defensa.
La Dra. Dña. Verónica Baena, y el Dr. D. Santos González, Directores de la Tesis, de la que es autor D. José Luis Flórez Fernández.
AUTORIZAN la presentación de la referida Tesis para su defensa en cumplimiento del Real Decreto 99/2011, de 28 de enero, por el que se regulan las Enseñanzas Oficiales de Doctorado, y de acuerdo al Reglamento de Enseñanzas Universitarias Oficiales de Doctorado de la Universidad Europea de Madrid RD 1393/2007 y RD99/2011.
En Madrid a veintisiete de enero de 2014
Agradecimientos
Quiero dar las gracias en primer lugar a mis directores de tesis, la Dra.
Verónica Baena y el Dr. Santos González, por su apoyo, comprensión e
indicaciones y especialmente por su apertura multidisciplinar que ha permitido
reunir en una investigación puntos de vista muy diversos y dotar a unas
innovaciones provenientes del mundo empresarial de la estructura, el método
y el rigor propios del ámbito académico. Esta integración entre universidad y
empresa ha sido uno de los elementos más valiosos y enriquecedores de mi
carrera profesional y me siento muy en deuda con el Dr. González por
haberme ayudado durante los últimos veinte años a conciliar ambos mundos.
También quiero mencionar a Jesús Figueres, uno de los científicos de datos
más imaginativos y brillantes que conozco, muchas gracias Jesús por tus ideas,
por todas las horas que me has dedicado desinteresadamente en esta
investigación, probando conceptos, programando algoritmos y buscando
siempre formas innovadoras para mejorar. No puedo dejar de mencionar mi
gratitud hacia Fausto Morales y David Flórez, por su ardua labor de revisión y
sus indicaciones.
Por último doy las gracias a mis padres por su cariño y por la libertad que
siempre me concedieron y tanto valoro. Y debo un agradecimiento especial a
ÍNDICE
ÍNDICE
RESUMEN 15
ABSTRACT 17
1. INTRODUCCIÓN 1
1.1 Justificación de la investigación ... 23
1.2 Preguntas de la investigación ... 25
1.3 Objetivos de la investigación ... 26
1.4 Fundamentos ... 27
1.4.1 Relevancia 27 1.4.2 Originalidad 28 1.4.3 No trivialidad 29 2. REVISIÓN DE LITERATURA E HIPÓTESIS DE LA INVESTIGACIÓN 33 2.1 Marco conceptual ... 34
2.1.1. Modelos de centralidad 34
2.1.2. Modelo de Domingos y Richardson (2001) 37
2.1.3. Modelo de Kempe, Kleinberg y Tardos (2003) 43
2.1.4. Modelo de Leskovec et al. (2007) 56
ÍNDICE
2.1.5.1. El modelo de heurísticas de descuento de grados 66
2.1.6. Modelo de Goyal, Bonchi y Lakshmanan (2011) 70
2.1.7. Resumen y conclusiones de los modelos históricos 77
2.2 Hipótesis de la investigación ... 78
2.2.1. Justificación y formalización de las hipótesis 80
3. METODOLOGÍA Y DISEÑO DE EXPERIMENTOS 93
3.1. Metodología de contraste de hipótesis ... 94
3.1.1. Contraste de la submodularidad (HB1) 94
3.1.1.1. Método Bass 94
3.1.1.2. Métricas de sinergias grupales 98
3.1.2. Contraste del efecto de las probabilidades de activación (HB2) 101
3.1.3. Contraste del modelo de propagación (HB3) 103
3.1.3.1. Método t 104
3.1.4. Contraste de la hipótesis de maximización de eficiencia (HB4) 106
3.1.4.1. Método para la determinación empírica del modelo de
propagación mediante técnicas de machine learning 106
3.1.4.2. Método para la maximización de la propagación 116
3.1.4.3. Método para el contraste de la mejora aportada por el modelo
empírico 125
3.2. Diseño de experimentos ... 126
ÍNDICE
3.2.1.1. Influencia en Twitter 128
3.2.1.2. Influencia en la calificación de películas (Flixster) 132
3.2.1.3. Influencia en telecomunicaciones 134
3.2.2. Experimentos para el contraste del efecto de probabilidades de
activación (HB2) 137
3.2.2.1. Recogida de información 138
3.2.2.2. Descripción de experimento 139
3.2.3. Experimentos para el contraste del modelo de propagación (HB3) 140
3.2.4. Experimentos para el contraste de la hipótesis de maximización de
eficiencia (HB4) 140
3.2.4.1. Definición del experimento en Twitter 141
3.2.4.2. Definición del experimento en Flixster 143
3.2.4.3. Definición del experimento en telecomunicaciones 147
4. RESULTADOS 151
4.1 Resultados del contraste de la submodularidad (HB1) ... 151
4.1.1. Influencia en Twitter 151
4.1.1.1. Conclusiones específicas del experimento 154
4.1.2. Influencia en Flixster 155
4.1.2.1. Conclusiones específicas del experimento 162
4.1.3. Influencia en telecomunicaciones 163
ÍNDICE
4.1.4. Resumen de los resultados 169
4.2. Resultados del contraste del efecto de las probabilidades de
activación (HB2) ... 173
4.3. Resultados del contraste del modelo de propagación (HB3) ... 174
4.4. Resultados del contraste de la hipótesis de maximización de
eficiencia (HB4) ... 176
4.4.1. Descripción del modelo de propagación empírica en Twitter 177
4.4.2. Descripción del modelo de propagación empírica en Flixster 185
4.4.3. Descripción del modelo de propagación empírica en
telecomunicaciones 193
4.4.4. Comparativa de la eficiencia del marketing viral en Twitter entre el
método empírico y los teóricos 201
4.4.5. Comparativa de la eficiencia del marketing viral en Flixster entre el
método empírico y los teóricos 209
4.4.6. Comparativa de la eficiencia del marketing viral en
telecomunicaciones entre el método empírico y los teóricos 215
5. CONCLUSIONES Y FUTURAS LÍNEAS DE INVESTIGACIÓN 227
5.1. Conclusiones ... 227
5.2. Futuras líneas de investigación ... 252
6. BIBLIOGRAFÍA 257
ÍNDICE
ANEXO 1. ÍNDICE DE TABLAS 269
RESUMEN / ABSTRACT
RESUMEN
La propagación en redes sociales de contenidos, comportamientos u opiniones
siguiendo pautas virales es el objetivo de las acciones de marketing viral, una
variedad del marketing que está teniendo una amplia profusión debido a la
creciente capacidad de comunicación entre las personas derivada del uso de las
nuevas tecnologías, especialmente de Internet y de la telefonía móvil, así como de la
decadencia de la publicidad tradicional en dos aspectos: la confianza que genera en
los consumidores y una atención cada vez más fragmentada entre innumerables
estímulos a través de un número creciente de puntos de contacto. En este contexto
de saturación, el consumidor presta su atención, confía y modifica su
comportamiento de forma más significativa cuando los estímulos de cambio
proceden de su entorno cercano, de su esfera de influencia social más inmediata.
Se han desarrollado numerosas teorías para comprender las dinámicas virales desde
distintos puntos de vista de carácter cualitativo: psicológico, sociológico, económico,
teorías de la comunicación y en los últimos años se han incorporado también
perspectivas más cuantitativas basadas en la teoría de redes y grafos.
Las teorías cualitativas han puesto su foco en la identificación de las causas
subyacentes en los fenómenos de propagación, mientras que las cuantitativas se
han dedicado a la descripción de la estructura y las dinámicas de las redes sociales a
través de modelos numéricos. Sin embargo es importante destacar la poca sintonía
que existe actualmente entre ambos enfoques en el sentido de que muchos de los
factores que han sido identificados como claves a la hora de explicar la propagación
RESUMEN/ABSTRACT
ningún reflejo en las formulaciones cuantitativas debido al empeño por definir
modelos mucho más simples que permitan la realización de simulaciones y la
optimización de decisiones en un contexto que por sustentarse en redes sociales,
conlleva una gran complejidad computacional.
La búsqueda de una mayor conciliación entre las teorías cualitativas y cuantitativas
constituye el principal objetivo de esta investigación, tratando de aprehender las
propiedades básicas de las propagaciones en redes sociales e incorporándolas a los
modelos cuantitativos, con el fin de dotar al marketing viral de herramientas más
RESUMEN / ABSTRACT
ABSTRACT
The spread of content, behaviors and opinions on social networks following
viral patterns is the goal of viral marketing, a variety of marketing now
enjoying wide profusion, mostly due to increased capabilities in interpersonal
communication arising from the use of new technologies -especially the
Internet and mobile telephony- and the decline of traditional advertising in
two fundamental ways: generation of higher confidence levels among
consumers and their increasingly fragmented attention among countless
stimuli received through a growing number of contact points.
In this context of saturation, consumers pay attention, trust and modify their
behaviors more significantly when change stimuli emerge from their
immediate environments, i.e. from their closest social spheres of influence.
Numerous theories have been put forth in order to understand viral dynamics
from diverse, qualitatively different points of view, such as psychological,
sociological, economic, and communication theories as well as, in recent years,
more quantitative perspectives that have also been incorporated, chiefly
network theory and mathematics.
Qualitative theories have placed their focus on identifying the underlying
causes of propagation phenomena, while quantitative theories have been
devoted to describing the structure and dynamics of social networks by means
of numerical models. However, it is important to note that these two
approaches are currently out of synch, in the sense that many of the factors
RESUMEN/ABSTRACT
dynamics -herd effect, synergies, saturation- have not translated into
quantitative formulations, mainly due to traditional efforts and practices
insisting on defining much simpler models allowing to perform simulations and
optimization decisions in a context where social network underpinning entails
high levels of computational complexity.
The search for a better balance between qualitative and quantitative theories
is the main thrust of this research, attempting to grasp the fundamentals of
propagation in social networks and incorporating those properties into
quantitative models, for the purpose of providing viral marketing with more
INTRODUCCIÓN
1
1. INTRODUCCIÓN
Tú (You en el inglés original) has sido elegido como persona del año por la
revista estadounidense Time en un homenaje a los millones de ciudadanos
anónimos que por su influencia en la era global de la información están
permitiendo "fundar y estructurar la nueva democracia digital" (Time
Magazine, 2006). Este reconocimiento simbólico es el reflejo de un profundo
cambio social, sustentado en la tecnología y que sitúa al ciudadano como
centro, entre otros, de los ecosistemas sociales, políticos, económicos y
publicitarios.
En este contexto, las marcas se han visto en la necesidad de buscar nuevas
formas de comunicarse, influir y mantener la credibilidad sobre sus clientes, en
un momento en el que los ciudadanos se mostrarían indiferentes ante la
desaparición de 7 de cada 10 marcas (Havas Research, 2012), indiferencia que
supone que una parte mayoritaria de la inversión en comunicación y
publicidad se ha convertido en intrascendente.
La irrupción del marketing viral a mediados de los noventa está relacionada
precisamente con esta evolución social que incrementa el poder de cada
consumidor para crear o modificar contenidos y transmitirlos de forma rápida
a través de su esfera social de influencia, de modo que cuando se dan las
condiciones adecuadas, se pueden llegar a desencadenar poderosas
INTRODUCCIÓN
2
Hay que buscar el origen del término “viral” en la literatura médica, y es una
metáfora de una actividad de marketing que aprovecha la capacidad de los
individuos de propagar mensajes y como consecuencia comportamientos, a
través de su red social de forma similar a las dinámicas de infestación de un
virus que han sido estudiadas ampliamente desde el punto de vista
epidemiológico.
Está comúnmente aceptado que el origen del concepto está en el artículo
“Viral Marketing” (Jurvetson y Draper, 1997), pese a que anteriormente ya se
habían descrito los comportamientos víricos que podrían modificar las
prácticas más habituales en el campo del comercio electrónico (Rayport, 1996).
El poder del marketing viral reside en que es el propio individuo el que
selecciona a quién le puede interesar un contenido teniendo en cuenta
innumerables elementos de juicio, relacionados con las características de su
interlocutor y las circunstancias en las que se produce la comunicación, lo que
en ciertos casos puede conducir a la modificación del propio contenido para
hacerlo más atractivo y oportuno. Esta es una característica especialmente
relevante cuando nos encontramos con mercados muy fragmentados y
saturados (Anderson, 2006), en los que el marketing viral puede convertirse en
un instrumento muy eficaz para atraer el interés de los consumidores y hacer
frente a su inmunidad creciente frente a la publicidad convencional (Sivera,
2013).
La definición más empleada de marketing viral lo describe como “toda
estrategia que estimula a los individuos a pasar un mensaje a otros ampliando
INTRODUCCIÓN
3 aprovechan de la rápida multiplicación para extender el mensaje” (Wilson,
2000). El marketing viral es, por tanto, un marketing dirigido por el consumidor,
en contraposición al marketing tradicional de interrupción que está dirigido y
controlado por las firmas. Es una iniciativa planificada donde el publicista o la
agencia creativa, desarrollan y difunden mensajes de marketing (agentes
virales) que tienen características que motivan al receptor a convertirse en un
emisor. Es la modalidad de marketing centrada y dirigida por el consumidor en
el contexto de sus redes sociales.
Las redes sociales, por tanto, sean tecnológicas o más convencionales, son el
sustrato en el que se difunden y prosperan los fenómenos virales (Domingo,
2001) y esta es una idea central en la presente investigación.
Sobre la entidad que se transmite viralmente, se ha impuesto en la última
década la denominación de “meme”, organismo cultural o idea que se replica y
que se transmite como los genes en el mundo biológico (Rosen, 2002), y de
una forma similar también se emplea la denominación de “ideavirus” (Godin,
2001).
Si pretendemos definir cuál es el marco teórico que da sustento al marketing
viral debemos tener en cuenta que esta disciplina tiene un carácter
eminentemente multidisciplinar y guarda relación con teorías procedentes de
diversos campos: sociología, psicología, economía, comunicación y teoría de
redes, sustentada esta última en una importante formulación matemática
(Sivera, 2013). Así pues, desde un punto de vista sociológico, son muy
oportunos los estudios acerca de la importancia de los vínculos débiles para la
INTRODUCCIÓN
4
1973); desde la psicología, la teoría del contagio (Travers y Milgram, 1969) es
muy relevante para comprender las circunstancias que pueden provocar la
propagación del mensaje; en el campo de la economía la llamada “economía
de la atención” es empleada recurrentemente para justificar las bondades y
eficacia del marketing viral; en el ámbito de la comunicación guarda relación
con el modelo de flujo de dos escalones de Katz y Lazarsfeld (1955), en el cual
los mensajes publicitarios masivos son transmitidos a través de los líderes de
opinión mientras que los efectos de esa comunicación sólo aparecen tras un
proceso de difusión boca-oreja.
El enfoque planteado por Katz y Lazarsfeld (1955) aporta mucho sentido a la
incorporación de la perspectiva del análisis de las redes sociales, por cuanto
saber identificar y activar a los líderes es un factor clave en una estrategia de
marketing viral, pero dado que éstos actúan sobre redes sociales su análisis es
parte esencial para la comprensión de las dinámicas víricas.
A continuación vamos a enumerar los aspectos más destacables de las
aproximaciones matemáticas y sociológicas a las cuestiones de la influencia y
la propagación, dos conceptos que resultan básicos (Domingos, 2001) a la hora
de entender las dinámicas que dan sentido a los fenómenos de marketing viral
y que serán esenciales en el discurrir de la presente investigación.
Marketing viral: perspectiva matemática
Como hemos indicado, el marketing viral se caracteriza por la difusión de
INTRODUCCIÓN
5 tipo de información a través de una red social, y por ello pondremos nuestra
atención sobre aquellas formulaciones matemáticas que nos permitan
entender de forma más precisa las dinámicas de contagio y propagación
inherentes a las redes sociales.
Tradicionalmente los modelos de redes sociales han tenido un carácter
descriptivo más que predictivo, de modo que el análisis se ha sustentado
habitualmente en el cálculo de ciertas métricas acerca de la estructura de la
red y de sus componentes que no permitían hacer predicciones acerca del
futuro comportamiento de la red. Esto se ha debido en muchos casos a la falta
de datos, ya que las redes de las que se disponía hasta la pasada década eran
escasas y pequeñas y contenían información muy escueta de cada individuo. La
irrupción de Internet ha cambiado absolutamente esta situación y ahora
disponemos de ingentes cantidades de datos, de muchas y extensas redes
sociales. (Domingos, 2001)
No es extraño que en las redes sociales a las que actualmente tenemos acceso
dispongamos de millones de nodos, con información muy detallada acerca de
cada uno de ellos, por lo que definitivamente, la situación actual es la inversa a
la que padecíamos anteriormente, y ahora el reto no está en la explotación de
lo exiguo sino en cómo convertir un exceso abrumador de datos en
información útil que permita tomar decisiones.
De la comprensión de las dinámicas sociales debe emerger un mayor
entendimiento de lo que sucede de forma general en la red social, debemos
poder definir hipótesis y contrastarlas, hacer predicciones, comprender qué
INTRODUCCIÓN
6
instancia, y es objeto central de este estudio, debemos poder optimizar estas
dinámicas de propagación de forma que la relación coste y retorno -entendido
en este caso como número de individuos “infectados”- sea la más eficiente
posible.
El estudio de las redes, incluyendo las redes de computadoras, redes sociales,
redes biológicas, entre otros ejemplos, ha concitado un gran interés durante
los últimos años. Internet y el acceso a gran cantidad de recursos
computacionales con un bajo coste ha hecho posible poder recopilar y analizar
información proveniente de las redes de una forma sin precedentes lo que ha
permitido el desarrollo de nuevas herramientas de análisis y teorías orientadas
a la búsqueda de una mejor comprensión de su estructura y su dinámica.
El estudio de las redes es ampliamente multidisciplinar y ha producido
aportaciones muy relevantes en el estudio de sistemas complejos en física, la
comprensión de las interacciones proteínicas en biología, la mejora de la
gestión y monitorización del tráfico en ingeniería y por supuesto, nuevos
campos de estudio en el terreno de la economía, la sociología y la matemática.
Es precisamente en la intersección entre estas tres disciplinas donde se
produce esta investigación, por cuanto plantea nuevos modelos matemáticos
más eficaces a la hora de entender la dinámica que rige la propagación de
ciertos comportamientos en una red, en especial cuando existen
condicionantes sociológicos o psicológicos que, como trataremos de demostrar,
INTRODUCCIÓN
7 De forma muy simple, consideramos una red como un conjunto de entidades
unidas en pares mediante unas líneas. A estas entidades las llamamos vértices
o nodos y a las líneas aristas. Por tanto una red aporta una descripción acerca
de cómo ciertas entidades se relacionan con otras, tanto desde un punto de
vista estructural -cuáles están relacionado con cuáles- como dinámico -qué
información fluye por la red, cómo modifica el estado o alguna propiedad de
las entidades o de sus conexiones-.
El tipo de entidad así como el concepto de relación entre dos entidades, es
decir, el criterio que permite definir que dos nodos están conectados por una
arista da lugar una infinidad de redes con propiedades y aplicaciones muy
diversas en diferentes campos de la ciencia.
Newman (2010) divide las redes en cuatro clases generales: redes tecnológicas,
redes de información, redes biológicas y redes sociales. En todo caso no existe
una definición rigurosa y pueden encontrarse ejemplos de redes que podrían
estar en más de una de estas categorías. No obstante es una clasificación
habitualmente aceptada en la literatura.
En la primera categoría, de redes tecnológicas tendríamos Internet, y el
estudio del flujo de información entre computadoras y routers; la red
telefónica, con una estructura mucho más jerárquica y menos interrelacionada
que la primera; la red eléctrica, muy vinculada en su estructura a factores
geográficos.
Las redes de información son aquellas en las que las entidades conectadas son
INTRODUCCIÓN
8
vértices tenemos páginas Web que contienen contenidos informativos en
formatos multimedia que se conectan mediante hipervínculos con otros
contenidos. En este caso y como los hipervínculos nos llevan de un contenido a
otro en sólo una dirección decimos que la Web es una red dirigida. Otro
ejemplo notable de red de información lo constituyen las redes de citación
derivadas de las menciones en los artículos de investigación, en las que
nuevamente el contenido lleva a otro contenido.
Bajo esta categoría también se consideran las redes de recomendación. Estas
redes tienen en cuenta las preferencias de las personas por ciertos ítems, en
este caso la relación entre dos ítems se producirá cuando exista una frecuencia
significativa en la que ambos hayan sido seleccionados por los mismos
individuos.
En cuanto a las redes biológicas, éstas incluyen las redes metabólicas, en este
caso los elementos relacionados son moléculas y la relación consiste en que la
transición entre una molécula a otra se produzca en un solo paso en la cadena
de reacciones metabólicas que sucede dentro de cada célula. También se han
estudiado profusamente las redes de interacciones proteínicas, en cuyo caso
más simple dos proteínas están conectadas si entre ellas es posible que exista
algún tipo de interacción bioquímica.
No obstante esta investigación se centrará en las redes sociales, aquellas en las
cuales se produce una interacción directa entre personas, y de forma más
concreta en el estudio de las dinámicas de difusión que se producen en estas
INTRODUCCIÓN
9 Una vez enumerada la clasificación de redes de Newman prestaremos nuestra
atención a un concepto central, la difusión, un fenómeno por el cual cierta
característica de un nodo puede extenderse a otros nodos por razón de la
existencia de un cierto grado de conexión entre ellos en un tiempo
determinado.
Durante las últimas décadas la investigación sobre difusión en redes sociales se
ha referido principalmente a estudios epidemiológicos relacionados con la
propagación de enfermedades infecciosas tratando de satisfacer dos objetivos:
desarrollar modelos de simulación dinámica para predecir la difusión de la
enfermedad en función de sus focos y la estructura de red y, análogamente,
identificar qué puntos de monitorización y control en la red podrían alertar de
forma temprana y con mayor eficiencia de la propagación de un agente
infeccioso y en función de esto cómo establecer medidas preventivas (Berger,
Borgs, Chayes y Saberi, 2005), (Durrett, 1988), (Durrett y Jung, 2006) (Liggett,
1985 y 1999), (Morris, 2004).
Sin embargo es mucho más reciente el interés por sus aplicaciones en los
campos de la sociología y la economía, en los que la Web y de forma más
amplia todos los medios de interacción multidireccional y personalizada (a
diferencia de los medios de masas tradicionales que son unidireccionales) han
supuesto un flujo inagotable de información acerca de cómo las personas
interactúan.
Es precisamente en este ámbito donde se sitúa el marketing viral, que tiene
como objetivo tratar de generar contenidos promocionales que tengan una
INTRODUCCIÓN
10
indispensable entender los condicionamientos, intereses y preferencias
personales y también el tipo de relaciones con otros consumidores para crear
reacciones sucesivas de difusión del mensaje.
Las redes sociales se han desarrollado profusamente en los últimos años
porque representan la forma más eficiente para compartir y descubrir
experiencias, opiniones y conocimiento. Su naturaleza redundante,
normalmente no jerárquica y muy distribuida permite crear mensajes
coherentes a partir de informaciones parciales e incluso sesgadas, por lo que
suponen un medio como ningún otro para la generación de conocimiento y
también para la aceleración de la transmisión de las corrientes de opinión, este
es un efecto derivado de su capacidad de provocar reacciones en cadena, en el
que una sola persona puede transmitir información a varias, éstas a otras, y así
sucesivamente, provocando que en poco tiempo la difusión de un mensaje
tenga un efecto multiplicativo.
Precisamente es el papel de las redes sociales como instrumento diseminador
de información y comportamientos el que pretendemos analizar con mayor
profundidad, tratando de comprender qué es lo que hace que ciertos mensajes
tengan la capacidad de tener efectos significativos en una comunidad.
Comprender los mecanismos de influencia tiene aplicaciones prácticas
evidentes, consideremos el caso de una compañía que quiere publicitar su
producto a través de una red social, para lo cual crea un contenido viral que
promueve que las personas que reciben el contenido tengan algún tipo de
INTRODUCCIÓN
11 Obviamente esta compañía no puede dirigirse a toda la red social,
fundamentalmente por dos motivos, uno relacionado con las restricciones
presupuestarias y otro con la no disposición de los datos de contacto de todos
los usuarios. En este contexto, muy habitual por otra parte, la compañía debe
seleccionar un público objetivo (target) de destinatarios de su comunicación,
que será por tanto un subconjunto de la red.
La pregunta que pretendemos responder es: en función de la estructura de
relaciones que da forma a la red social, de la naturaleza de estas relaciones,
del tipo de usuario, el mensaje, y dado que por restricciones presupuestarias
sólo nos podemos dirigir a K individuos, ¿cuál es el grupo de K usuarios al que
me debo dirigir inicialmente de modo que se maximice la propagación de la
propuesta en un tiempo t?
Como se verá a lo largo de la investigación el fenómeno de la difusión en un
contexto epidemiológico, poco o nada tiene que ver con la difusión que se
produce en contextos sociológicos. Y esto representa un cambio radical con
respecto a la literatura existente hasta la fecha sobre el análisis de la difusión
en redes por cuanto, y como veremos, la actual literatura no establece una
diferencia metodológica entre fenómenos de uno y otro tipo.
La necesidad de crear algoritmos eficientes y con una formulación matemática
sólida ha provocado la adopción de hipótesis muy ventajosas desde el punto
de vista computacional pero que, desde un punto de vista sociológico, se
alejan de la realidad empírica pudiendo condicionar seriamente su validez y su
INTRODUCCIÓN
12
Estas hipótesis han sido replicadas en sucesivos trabajos durante la última
década dando lugar a un cuerpo teórico que pretendiendo tener un carácter
muy aplicado ha obviado aspectos básicos que diferencian la difusión social de
la difusión epidemiológica, y en concreto el más relevante de estos aspectos
no considerado adecuadamente tiene que ver con los fenómenos sinérgicos.
Para ilustrarlo emplearemos el siguiente ejemplo: si una persona sana entra en
contacto con una persona portadora del virus de la gripe tendrá cierta
probabilidad de contagiarse, esta probabilidad razonablemente aumentará si
en lugar de con una entra en contacto con dos personas portadoras, y
aumentará hasta cierto valor asintótico si lo hace con tres, cuatro, etc.
Ahora bien, el mecanismo subyacente en el contagio es de carácter
estrictamente fisiológico y tiene en última instancia una base bioquímica, es
decir, el virus es igual lo porte quien lo porte, de manera que lo que afecta a la
probabilidad de infección de un individuo es esencialmente el número de
infectados con los que interactúa, no importa quienes sean, en todo caso
habrá personas con más facilidad para contagiar y otras con más facilidad de
ser contagiadas pero siempre hablamos de una propiedad del nodo inductor,
una propiedad del nodo inducido o bien una propiedad derivada de la arista
que les une (cómo es la relación entre portador y potencial contagiado). Tal y
como se verá a lo largo de esta investigación, el modelo matemático derivado
de esta situación, caracterizada por la independencia probabilística en relación
a los inductores y por la falta de comportamientos sinérgicos posee unas
INTRODUCCIÓN
13 La diferencia cuando se difunde una idea, conocimiento o comportamiento en
un contexto sociológico radica en que en este caso no sólo importa el número
de inductores y su capacidad individual de influencia, sino también quiénes
son, qué relación hay entre los inductores y entre éstos y el inducido. A
continuación vamos a introducir la formulación matemática necesaria para
continuar avanzando. La formulación original del problema se basa en la
propuesta por Kempe, Kleinberg y Tardos (2003), enfoque al que dedicaremos
un análisis más minucioso más adelante y consiste en lo siguiente:
Dado un grafo dirigido G= (V, E, p) donde los nodos (V) son usuarios y las
aristas (E) están etiquetadas con una probabilidad de influencia entre los
usuarios (p), el problema consiste en la elección de K semillas iniciales (nodos)
que maximicen la difusión esperada en la red social bajo un determinado
modelo de propagación al cabo de un tiempo t.
Los modelos de propagación juegan por tanto un rol central, ya que
condicionan cuál es la dinámica por la que se produce la influencia a través de
la red social. Normalmente cuando nos refiramos a difusión querremos
denominar el efecto activación/contagio que se produce entre nodos vecinos,
es decir tiene un carácter más local, mientras que cuando hablamos de
propagación nos estamos refiriendo a toda la concatenación de activaciones
entre vecinos, lo cual se produce a nivel de toda la red y por tanto podemos
decir que se trata de una característica global.
En un tiempo discreto t el estado de un nodo puede ser activo o inactivo y si
está inactivo la probabilidad de que se active dependerá de la activación que
INTRODUCCIÓN
14
La determinación de qué nodos influyen a otros y cómo lo hacen, cuál es el
tiempo de vigencia de esa influencia, si un nodo activo se puede desactivar o
no y, en definitiva, cualquier criterio que afecte a la variación del estado de los
nodos, configura lo que denominamos modelo de propagación.
Una vez se define el modelo de propagación podemos predecir cuántos nodos
se activarán en un tiempo determinado, ese número dependerá del propio
modelo de propagación m y del conjunto de K nodos que se ha activado
inicialmente al que llamaremos S⊆V. A la influencia esperada a partir de S
debida al modelo de propagación m la representamos como σm (S). De tal
manera que el problema de optimización se plantea como se indica a
continuación:
Dado un grafo dirigido con aristas ponderadas G= (V,E,p), un modelo de
propagación m, y un número K<|V|, encontrar un conjunto S⊆V con |S|=K, de
modo que σm (S) sea máxima en un tiempo t.
Marketing viral: perspectiva sociológica
Desde el momento que el marketing viral tiene como vehículo de transmisión
las redes sociales -no necesariamente de base tecnológica- la dimensión
sociológica es fundamental a la hora de entender los retos a los que nos
debemos enfrentar para ofrecer soluciones al problema de maximización
original que no sólo sean matemáticamente consistentes sino que sean
coherentes con el mundo real y por ello vamos a presentar las corrientes de
INTRODUCCIÓN
15 En primer lugar debemos poner de manifiesto que existen autores reputados
que ponen en entredicho la existencia de la influencia social ya que la
existencia de correlaciones entre las características y comportamientos de los
individuos que pertenecen a un mismo grupo no tienen por qué deberse a la
influencia sino a que los grupos tienen tendencia a conformarse con individuos
con características y comportamientos similares. En esta línea de pensamiento
se sitúa Duncan Watts (2007) investigador que revitalizó en los últimos años el
concepto Small World (vinculado a la comprobación experimental de los seis
grados de separación entre dos personas elegidas aleatoriamente en cualquier
parte del mundo).
A la homogeneidad intrínseca de los grupos derivada de que las personas
buscan relacionarse con personas similares a ellas se la denomina “homofilia”
en la literatura sociológica y no es tarea sencilla discernir cuándo un
comportamiento que se difunde en cascada a través de un grupo social lo hace
por influencia o por “homofilia”.
En este sentido diferentes autores han obtenido conclusiones diversas al tratar
de distinguir las dos causas en el estudio de diferentes fenómenos sociales. Así
Anagnostopoulos, Kumar y Mahdian (2008) llegan a determinar que el
comportamiento de etiquetado (tagging) de fotos en Flickr (plataforma Web
para compartir fotografías), cuando un usuario añade cierto atributo vinculado
al contenido de una fotografía (nombre de las personas retratadas, escenario
en el que se produce la foto, acción que refleja, etc.), tiene una alta correlación
entre miembros de un mismo grupo que no puede ser atribuida a la influencia.
Sin embargo Christakis y Fowler (2007) llegan a la conclusión de que el efecto
INTRODUCCIÓN
16
obesidad, el consumo de tabaco, alcohol y otros hábitos de naturaleza no
saludable.
En un punto intermedio se sitúan Crandall et al. (2008) que proponen un
marco de análisis que considera que “homofilia” e influencia son dos factores
mutuamente retroalimentados que producen un efecto conjunto en el
comportamiento de los grupos y demuestran en varios experimentos que el
empleo combinado de características basadas en las conexiones sociales junto
con características que permiten cuantificar la similitud entre individuos es
mucho más preciso para predecir comportamientos futuros que el empleo
separado de cada uno de esos dos tipos de características.
Los resultados obtenidos en la presente investigación se alinean con esta
última línea de pensamiento. Es cierto que existe una propensión significativa
a que individuos similares en cuanto a condición socio-económica e incluso en
cuanto a sus características físicas, se vinculen a través de grupos sociales
(Lazarsfeld y Merton, 1954), este fenómeno sucede especialmente, aunque no
exclusivamente, durante la adolescencia y tiene que ver con una necesidad de
aceptación dentro de un grupo social y en consecuencia la búsqueda de la
homogeneidad es un comportamiento habitual.
En este sentido es frecuente encontrar grupos conformados por individuos con
una estatura más o análogamente menos elevada que la media, y como caso
particular de esto los autores demuestran la existencia de fuertes
correlaciones en la conformación de las parejas. Obviamente una característica
como la estatura no se ha contagiado entre individuos, por lo que es un rasgo
INTRODUCCIÓN
17 adolescentes presentan también los mismos hábitos en cuanto a consumo de
alcohol, tabaco y forma de vestir, hábitos que cuando los comparamos con los
de otros individuos de similares características físicas y socioeconómicas, pero
en grupos sociales distintos, presentan una mucha mayor variabilidad.
La diferencia entre la variabilidad de estas características entre estos grupos
sociales y la que se produce en el seno de cada grupo social es un buen índice
para medir cuál es la parte de ese comportamiento que tiene su origen en la
influencia del grupo.
Suponiendo que existe la influencia la siguiente pregunta que concita un gran
debate es si existen o no los “influenciadores” (influentials), personas con una
capacidad de influir cambios en su entorno muy superior a la del resto. En su
célebre libro titulado “The Tipping Point”, Gladwell (2000) describe la “Ley de
los Pocos” que dice que si en una sociedad se identifica y se convence a una
minoría de personas, aquellas con mayor capacidad de influencia, se
conseguirá propagar esta influencia a través de cientos, miles e incluso
millones de otras personas.
Gran parte del marketing viral desarrollado durante los últimos diez años se ha
basado en esta premisa de buscar y sembrar mensajes, propuestas e
incentivos en los “influenciadores”. No obstante esta forma de pensar no
parece sustentarse en las nuevas evidencias empíricas que estamos
obteniendo y que nos llevan a considerar como un fenómeno
extraordinariamente raro que un solo individuo sea capaz de modificar el
INTRODUCCIÓN
18
El marketing está evolucionando en los últimos años de esa visión de los
grandes “influenciadores” a otra mucho más cercana a la realidad cotidiana de
las personas, su integración en grupos y sus temas de conversación, poniendo
su foco en el análisis de cómo son las dinámicas de comportamiento dentro de
los pequeños grupos sociales conformados por familias, amigos cercanos,
compañeros de trabajo, etc.
Es importante destacar que en esta investigación no nos referiremos al análisis
de los líderes de masas, que en un contexto determinado pueden tener un
efecto catalizador de movimientos sociales o políticos sino de los
comportamientos cotidianos relacionados con la toma de miles de pequeñas
decisiones en el día a día y que conforman la realidad de las interacciones
sociales salvo raras excepciones.
Algo indiscutible es que las personas vivimos en redes desde siempre, sin
embargo, durante mucho tiempo hemos considerado que las personas eran
individuos aislados, actores independientes, de modo que los modelos de
comportamiento se sustentaban en el estudio de las características
individuales (sexo, edad, ingresos, ubicación, etc.) para determinar su
propensión a distintos tipos de comportamientos. Sin embargo por primera
vez tenemos la capacidad de registrar con un gran nivel de detalle las
comunicaciones, vínculos y actuaciones que se producen simultáneamente
entre personas en millones pequeñas comunidades sociales.
En adelante en lugar de hablar de grupos pequeños, lo cual se refiere al
número de personas que pertenecen al grupo y que en efecto, para que den
INTRODUCCIÓN
19 cercanos, conformados por aquellas personas con las que tenemos una
relación más estrecha. Una pregunta relevante llegados a este punto es: ¿cuál
es el elemento que genera cohesión e influencia en estos grupos sociales
cercanos? Ese elemento es, según Robin Dunbar (1998 y 2010) el habla, las
conversaciones.
Las agencias creativas de todo el mundo buscan la manera de crear contenidos
que la gente difunda, sin embargo una amplia mayoría de las campañas
publicitarias virales fracasan en su intento de crear reacciones en cadena, es
muy posible que el fracaso se deba a que los contenidos que se crean son de
carácter factual mientras que muchos estudios demuestran que las personas
tienden a difundir más las emociones que los hechos.
Berger y Milkman (2012) estudiaron qué artículos del New York Times habían
sido más frecuentemente reenviados por correo electrónico de unas personas
a otras durante un periodo de seis meses, lo que suponía el análisis de unos
7.500 artículos. Pensaban que aquellos que contenían lo que denominaban
información factual, como dietas, características de un dispositivo, etc. serían
los más difundidos, sin embargo encontraron que las personas comparten el
contenido que desencadena emociones positivas como la admiración o
negativas como la ira y la ansiedad. Otras emociones más íntimas como la
tristeza, sin embargo, tampoco activaban un intercambio de contenidos. Es por
todo esto que el marketing actual se dirige a impactar en esas emociones y no
a la enumeración de hechos acerca de las características de su producto.
En el mismo sentido la compañía de investigación Keller Fey (2011) estimó que
INTRODUCCIÓN
20
las conversaciones no son acerca de las características, pros y contras de los
productos sino sólo menciones superficiales, de pasada y en el contexto de
otras temáticas principales. Crear contenidos de carácter emocional que
generen un vínculo de complicidad con las personas y tengan la relevancia
suficiente para su propagación es la clave del marketing viral.
Otra cuestión de gran importancia para entender la estructura de las redes
sociales cercanas, aquellas en las que los fenómenos de influencia son más
significativos e incluso medibles, tiene que ver con quién hablamos. En este
sentido tendemos a pensar que hablamos con mucha gente diversa pero la
realidad es que hablamos al mismo pequeño grupo de gente cercana una y
otra vez. Las investigaciones demuestran de forma consistente que tenemos
una comunicación regular con entre siete y quince personas, pero que la
mayoría de nuestras conversaciones se producen con las cinco personas más
cercanas. Nos comunicamos con las mismas cinco personas el 80% de las veces
(Dunbar, 2011). De hecho Keller Fey (2011) cuantifica las conversaciones en un
27% con la pareja, un 25% con otro miembro de la familia y un 10% con el
amigo más próximo. Sólo el 5% de las conversaciones son con conocidos y un
reducido 2% con extraños. El resto es con las demás personas en nuestra red
social y suele tener un carácter más accidental.
En el mundo online de las redes sociales ocurre algo similar, ya que por
ejemplo el empleo de Facebook según estos autores tiene como propósito
primario el fortalecimiento de la relaciones con los grupos cercanos y sólo
como objetivo secundario la construcción de relaciones con aquellas
INTRODUCCIÓN
21 mensajes personales que se produce en Facebook es de sólo cuatro personas,
y seis en un mes.
Estas descripciones acerca de lo limitado que es el número de componentes de
los grupos sociales en los que estamos inmersos proceden de la investigación
de Paul Adams (2011) en la que analiza cómo los pequeños grupos de amigos
generan influencia en la Web social. También sostiene que el esquema de
conexión social más habitual es el que corresponde a la progresión
5-15-50-150-500. De este modo las cinco personas en el centro de esta jerarquía de
relaciones son las más cercanas, las que más nos importan, el núcleo. A estas
personas les pedimos consejo y apoyo emocional cuando hay problemas. Más
allá hay un grupo de entre 12 y 15 personas, al que los psicólogos denominan
grupo de simpatía. Se trata de aquellas personas cuyo fallecimiento nos
abatiría. Después hay un grupo de unas 50 personas con las que nos
comunicamos de forma semi-regular, este es el último grupo en el que
podríamos decir que sabemos qué hechos le han ocurrido a la persona
recientemente y sentimos genuino interés por conocer cómo está. Más lejos
del núcleo hay un grupo de unas 150 personas con quienes mantenemos una
relación social estable, conocemos a estas personas y sabemos además
quiénes de ellos conocen a qué otros. A partir de las 150 personas se empiezan
a producir fenómenos anti-sociales, con personas que no siempre actúan de
forma beneficiosa para el grupo (Dunbar, 2010).
Un fenómeno que puede guardar relación con esto es que los poblados
neolíticos solían escindirse cuando superaban los 150 individuos, porque el
poder de la camaradería y la colaboración dentro del grupo se veía superado
INTRODUCCIÓN
22
distintos criterios en la toma de decisiones (Christakis y Fowler, 2010). Los
otros 500 son amigos de amigos y personas a las que encontramos
ocasionalmente, de las que no nos sentimos próximos ni tenemos un interés
especial por sus vidas. Más lejos de esos 500 tenemos dificultades incluso para
recordar los nombres.
La conclusión para Adams (2011) es que la influencia se extiende de manera
que atravesar cada uno de estos círculos concéntricos es muy difícil y costoso.
Como además las características de los grupos sociales van siendo más
heterogéneas a medida que nos separamos del centro, ya que al haber menor
cohesión (grado de relación entre los individuos) hay menor “homofilia”, si
queremos lograr una propagación significativa deberemos diseñar acciones
variadas en su formato, lenguaje y apariencia para acercarlas a los intereses de
distintos tipos de grupos cercanos, y después asegurar la “viralidad” en el
entorno social de esos grupos, siendo un objetivo razonable tener un impacto
local y no tanto el lograr la detonación de una reacción en cadena en círculos
más externos.
Muchos de los planteamientos sociológicos enumerados hasta ahora han
podido ser confirmados durante esta investigación, no obstante los matices
que la sociología e incluso la psicología, aportan al entendimiento de las
dinámicas de influencia social no tienen su reflejo en las formulaciones
cuantitativas como se podrá comprobar en la revisión de la literatura. Es
precisamente este divorcio entre los planteamientos cuantitativos y los
sociológicos, el que da sentido a esta investigación que trata de incorporar los
INTRODUCCIÓN
23 permiten comprender en detalle la dinámica del marketing viral, hacer
predicciones y en última instancia optimizar su eficiencia.
1.1 Justificación de la investigación
Esta investigación se justifica por dos motivos: por un lado la importancia
creciente que desde un punto de vista económico está adquiriendo el
marketing viral como vehículo no invasivo que permite tener un impacto más
efectivo en el comportamiento de los consumidores y por otro la facilidad de
acceso que tenemos actualmente a la información contenida en las redes
sociales -bien sean redes sociales en Internet, redes derivadas del uso de la
telefonía (Priede y Martín de Bernardo, 2007) o cualquier otra manifestación
de la interacción entre individuos- lo que nos permite adquirir un grado de
conocimiento más profundo y exacto de las interacciones sociales.
En relación a la importancia creciente del marketing viral cabría destacar que
según la “Nielsen Global Survey of Trust in Advertising”, llevada a cabo en 2013
sobre más de 29.000 consumidores de 58 países, y que permite comparar los
resultados con los obtenidos en 2007 por una encuesta similar, también
promovida por Nielsen, las recomendaciones por parte de conocidos son la
fuente más fiable de información de carácter publicitario con un 84% de
confianza en 2013, cuando su nivel en 2007, siendo también el medio de
comunicación más fiable, era de un 78%, por comparación la publicidad en
televisión arroja un índice de confianza del 62% en 2013 y ningún medio llega
INTRODUCCIÓN
24
La recomendación por parte de conocidos también es la más efectiva forma
para provocar un comportamiento en el consumidor, es decir, no sólo se
genera una mayor confianza sino un impacto concreto y medible en relación a
las decisiones de compra. El mismo estudio cuantifica la proporción de
consumidores que actúan condicionados por la recomendación de un conocido
en un 84% en 2013, muy por encima de los otros medios, que en el mejor de
los casos alcanzan un 70%. No es extraño, por tanto, que según la encuesta
conducida por Michael Stelzner para Social Media Examiner sobre una
población de 200.000 profesionales del marketing durante 2013 se concluya
que el 86% de ellos consideran prioritario el desarrollo de estrategias virales a
través de los medios sociales.
En cuanto al análisis de las dinámicas de propagación de las redes sociales, son
clásicos los enfoques de carácter eminentemente descriptivo, aplicados sobre
redes compuestas por unas pocas centenas de individuos (Wasserman, 1994).
Mucho más reciente es el análisis de grandes redes sociales partiendo de la
caracterización y estudio de las relaciones uno a uno, con el objetivo de
predecir comportamientos futuros e incluso de maximizar la difusión de
ciertos comportamientos a partir de una adecuada selección de las semillas
-individuos inicialmente activados- (Kempe, Kleinberg y Tardos, 2003). Este
enfoque más moderno, por una cuestión de simplificación de los complejos
cálculos necesarios para determinar la dinámica no lineal inherente a la
propagación de mensajes, comportamientos o cualquier otra característica en
una red social, se sustenta en unas hipótesis de partida que consideramos
altamente restrictivas y alejadas de una realidad en la que se producen efectos
sinérgicos (Granovetter, 1973) (Travers y Milgram, 1969) que pueden poner en
INTRODUCCIÓN
25 habitualmente en el campo de la maximización de la propagación e influencia
en redes sociales.
1.2 Preguntas de la investigación
La cuestión central de esta investigación consiste en determinar en qué
medida y de qué modo es posible maximizar el impacto de una acción de
marketing viral a través del análisis de la estructura de las relaciones y del
seguimiento de sus dinámicas históricas de propagación e influencia. De forma
más concreta trataremos de dar respuesta a las preguntas siguientes:
¿Es observable y medible de forma objetiva el factor de influencia del
entorno en el contexto del marketing viral?
¿Existen fenómenos sinérgicos de tal manera que la influencia
conjunta de ciertos individuos concretos tenga un efecto multiplicador
en la propagación de sus mensajes a otros?
¿Condiciona la existencia de tales sinergias el modo en que podemos
maximizar la influencia en el contexto del marketing viral?
¿De qué modo podemos definir un procedimiento empírico para la
maximización de la influencia?
¿Aporta este nuevo enfoque una mejora en nuestra capacidad de
lograr mayor eficiencia en una campaña de marketing viral?
¿En qué medida la forma en la que se difunde un fenómeno viral
INTRODUCCIÓN
26
1.3 Objetivos de la investigación
A la luz de lo indicado anteriormente, el objetivo general de la presente
investigación consiste en optimizar la eficiencia de una campaña de marketing
viral a través de la selección adecuada de una población inicial de individuos
(semillas) que deberán propagar el mensaje de manera que se obtenga un
retorno máximo de la inversión en comunicación. Dicho de otro modo,
responder a la pregunta ¿a quién debo estimular para lograr un efecto de
propagación viral que haga mi inversión de marketing más eficiente? En
términos más técnicos se pretende maximizar la propagación sobre redes
sociales.
Para la consecución del objetivo general señalado anteriormente, se ha
generado una lista de objetivos de índole instrumental y específicos, entre los
que destacan:
Determinar la robustez y fiabilidad de los métodos actuales de
maximización de la influencia sobre redes sociales.
Evaluar el grado de cumplimiento de las hipótesis en las que se
sustentan los métodos actuales de maximización de la influencia sobre
redes sociales.
Evaluar alternativas a la formulación de métodos cuantitativos para la
INTRODUCCIÓN
27 Evaluar el impacto de los métodos de maximización sugeridos en
distintos tipos de redes sociales según el tipo de relaciones y los
eventos propagados.
1.4 Fundamentos
A continuación se describen los aspectos vinculados a la relevancia,
originalidad y no trivialidad que dan sentido a esta investigación, la cual aporta
nuevos métodos para comprender las dinámicas virales que son de aplicación
directa para la mejora de las decisiones en el contexto del marketing viral.
1.4.1 Relevancia
Desde la pasada década han sido muchos los esfuerzos y aportaciones por
tener un marco metodológico y algorítmico que permitiera tratar la
propagación en redes sociales, como la que se produce en el caso del
marketing viral, de una forma científica. Este enfoque algorítmico tiene su
origen en los trabajos de Domingos (2001) y Kempe, Kleinberg y Tardos (2003).
No obstante y por contraste con las teorías sociológicas y de comunicación
más extendidas en la actualidad, los enfoques cuantitativos corren el peligro
de ser incompletos y están alejados de las dinámicas reales que rigen los
fenómenos de influencia en el contexto del marketing viral, por lo que pueden
INTRODUCCIÓN
28
Creemos por consiguiente muy relevante conciliar las formulaciones teóricas
de carácter cualitativo propias de la investigación psicológica y sociológica, con
aquellas de carácter numérico más vinculadas a la teoría de redes de base
matemática.
1.4.2 Originalidad
El estado del arte, tal y como se describirá en la revisión de literatura, nos
permite concluir que existe un amplio margen de mejora en el estudio
cuantitativo de los fenómenos de propagación que se producen en el contexto
del marketing viral. En particular, el empleo de una aproximación
eminentemente empírica, en la que las dinámicas de activación y contagio de
esta activación se deriven de los datos directamente observables a partir del
estudio de la estructura y procesos de comunicación de las redes sociales,
constituye una aportación de esta investigación.
Del mismo modo, hemos aportado un conjunto de nuevas métricas y
estadísticos de contraste que permiten de una forma sencilla hacer una
evaluación de las propiedades inherentes al par red-evento (la red hace
referencia a la estructura y el evento al tipo de acción propagada y su
dinámica), para determinar hasta qué punto verifican las hipótesis que exigen
los modelos teóricos creados hasta la fecha.
Por último hemos propuesto un método para el cálculo de los modelos de
propagación empíricos mediante el uso de redes neuronales que incorpora
INTRODUCCIÓN
29 también un método de optimización para maximizar la influencia a partir de la
selección de los individuos iniciales adecuados.
Todo ello supone un nuevo conjunto de metodologías y herramientas de
análisis para que los investigadores sociales y los responsables de las funciones
de marketing viral puedan disponer de mejores medios de diagnóstico,
predicción y optimización de decisiones.
1.4.3 No trivialidad
La no trivialidad de la siguiente investigación guarda relación con el campo
multidisciplinar en el que se desarrolla, lo que implica la necesidad de conocer
las teorías sociológicas sobre transmisión viral de eventos y también las
formulaciones matemáticas desarrolladas hasta la fecha.
La necesidad de comprender las dinámicas de relación uno a uno que se
producen en redes que pueden tener potencialmente millones de individuos y
cientos de millones de relaciones hace necesario el empleo de métodos
avanzados de análisis numérico, conocidos actualmente en la literatura como
machine learning.
En este caso hemos aportado métodos de machine learning basados en el uso
de perceptrones multicapa, un tipo particular de red neuronal, para la
estimación de las dinámicas de propagación, junto con algoritmos genéticos
para la optimización de la selección de semillas. No obstante no es el objetivo
INTRODUCCIÓN
30
es el más adecuado para resolver el problema de maximización de la influencia,
y por tanto de la eficiencia, sobre una red social en un contexto de marketing
viral, sino demostrar cómo el trascender de planteamientos teóricos basados
en hipótesis preconcebidas, y basarse estrictamente en la realidad observada,
supone una gran mejora en cuanto a capacidad de entender y sacar beneficio
REVISIÓN DE LITERATURA E HIPÓTESIS DE LA INVESTIGACIÓN
33
2. REVISIÓN DE LITERATURA E HIPÓTESIS DE LA INVESTIGACIÓN
La formulación original del problema de maximización de la influencia se debe
a Kempe, Kleinberg y Tardos (2003), enfoque al que dedicaremos un análisis
más minucioso más adelante y que consiste en lo siguiente:
Dado un grafo dirigido G= (V, E, p) donde los nodos (V) son usuarios y las
aristas (E) están etiquetadas con una probabilidad de influencia entre los
usuarios (p), el problema consiste en la elección de K semillas iniciales (nodos)
que maximicen la difusión esperada en la red social bajo un determinado
modelo de propagación al cabo de un tiempo t.
Los modelos de propagación juegan por tanto un rol central, ya que
condicionan cuál es la dinámica por la que se produce la influencia a lo largo
del grafo. Normalmente cuando hablamos de influencia nos estamos
refiriendo a toda la concatenación de activación entre vecinos, lo cual se
produce a nivel de toda la red y por tanto podemos decir que se trata de una
característica global. En un tiempo discreto t el estado de un nodo puede ser
activo o inactivo y si está inactivo la probabilidad de que se active dependerá
de la activación que otros nodos presentaban en el tiempo t-1.
La determinación de qué nodos influyen y cómo lo hacen, de cuál es el tiempo
de vigencia de esa influencia, de si un nodo activo se puede desactivar o no y,
en definitiva, cualquier criterio que afecte a la variación del estado de los
REVISIÓN DE LITERATURA E HIPÓTESIS DE LA INVESTIGACIÓN
34
Una vez se define el modelo de propagación podemos estimar cuántos nodos
se activarán en un tiempo determinado, ese número dependerá del propio
modelo de propagación m y del conjunto de K nodos que se ha activado
inicialmente al que llamaremos . A la influencia esperada a partir de S
debida al modelo de propagación m la representamos como . De tal
manera que el problema de optimización se plantea como sigue:
Dado un grafo dirigido con aristas ponderadas G=(V,E,p), un modelo de
propagación m, y un número K<| |, encontrar un conjunto con | |=K,
de modo que sea máxima en un tiempo t.
2.1 Marco conceptual
2.1.1. Modelos de centralidad
Los primeros intentos por tratar de maximizar la influencia se basaron en el
cálculo de métricas de centralidad de los nodos que cuantifican su importancia
relativa dentro del grafo en función del número de conexiones que tiene
(centralidad de grado) o de manera más sofisticada y con una definición
recurrente, en función de la importancia de los otros nodos con los que tiene
relación.
Poder conocer la centralidad de un nodo puede ayudar a determinar la
capacidad de influencia de una persona involucrada en una red social. Este