CAPITULO 5 LA TEORÍA DE JUEGOS

La teoría microeconómica tradicional toma como punto de partida los individuos aislados cuyo proceder no tiene en cuenta, evidentemente, a “los otros”. Este tipo de comportamiento se mantiene en el modelo de competencia perfecta, que supone la existencia de un “gran coordinador-organizador”, el subastador.

Sin embargo, cuando se sale del cuadro muy particular de este modelo, se está obligado a considerar comportamientos de tipo “estratégico”, es decir, una situación en la cual los individuos o la menos algunos de ellos son conscientes de la existencia de otros y tienen en cuenta el establecimiento de sus planes. Nos hemos encontrado por lo demás con tales comportamientos en el capítulo anterior donde pasamos del caso simple del monopolio el único “consciente “ frente a demandantes “pasivos” a uno de mucho mas complejo, de relación bilateral sin intermediario, pasando por el caso intermedio del duopolio en donde se presenta también la intermediación.

Ahora, desde la década del cuarenta, bajo el impulso de un cierto número de matemáticos, con John von Neumann (1903-1957) a la cabeza, y economistas, entre los cuales se encontraba Oskar Morgenstern (1909-1977), se constituyó una nueva teoría cuya ambición es modelar las interacciones entre las elecciones de los individuos, que eran conscientes de tales interacciones, al contrario de lo que sucede con la competencia perfecta, que es pues un caso muy particular.

Los juegos de sociedad constituyen un ejemplo tipo y depurado de las elecciones conscientes interactivas; tal teoría se denominó teoría de juegos, nombre que se ha mantenido a pesar de que se aborda todo tipo de situaciones, a tal punto que para algunos, la teoría de juegos tiene por meta dar cuenta del conjunto de temas tratados por las ciencias humanas, o al menos los que tienen que ver con comportamientos racionales. En este capítulo vamos a dar un vistazo a esta teoría, los problemas que examina y la forma como la microeconomía la emplea.

1. LAS SITUACIONES DE JUEGO.

Existe una situación de juego cuando dos o más individuos buscan relacionarse. Evidentemente tal situación puede tomar las formas más diversas, y para avanzar en la reflexión es necesario ser más precisos, especialmente en lo referido al marco en el cual los individuos interactúan las reglas del juego, la información disponible por los jugadores y sus tipos de comportamiento, que puede ser mas o menos cooperativo.

a) Juegos y cooperación.

Todo juego supone reglas y, evidentemente, su aceptación por los participantes situación postulada y no verdaderamente explicada lo que impone una restricción a priori a la elección hecha por los jugadores. Dicho de otra manera, todo juego supone un consenso mínimo de los participantes. Esta observación es particularmente cierta en el caso de los modelos microeconómicos donde el énfasis se coloca sobre las relaciones de intercambio, con beneficio mínimo, excluyendo todo tipo de violencia. De esta manera, en competencia perfecta, existe un consenso de los agentes para aceptar la mediación del subastador.

Todo juego, y todo modelo microeconómico, supone pues un nivel mínimo de cooperación, necesario para la vida en sociedad. Evidentemente la cooperación puede perderse y no estar presente al momento de tomar decisiones los individuos. Es así como estos pueden procurar entenderse o buscar la conformación de coaliciones, de manera que se impongan las soluciones que se consideren preferidas para todos sí se compara con el resultado de la ausencia de entendimiento.

Sin embargo, las soluciones de tipo cooperativo presentan problemas esenciales al microeconomista:

Son generalmente indeterminadas es decir, no únicas ya que se deja abierta la cuestión del reparto de los frutos de la cooperación entre los jugadores;

Con frecuencia no son “estables” en la medida en que ciertos jugadores si no todos tienen interés en apartarse de la solución.

Por lo demás ya hemos mencionado estos problemas en el capítulo anterior cuando tratamos el duopolio de Cournot; ahora, lo volveremos a encontrar mas adelante cuando se mencione el “dilema del prisionero” y el asunto de los juegos repetidos.

Frente a tales dificultades, el microeconomista privilegia las soluciones no cooperativas, que resultan de la aplicación estricta del principio de cada uno para sí mismo. Tal principio corresponde, después de todo, a su procedimiento usual según el cual supone que cada hogar maximiza su utilidad y cada empresa buscar obtener el mayor beneficio posible.

En consecuencia en este capítulo vamos a tratar exclusivamente el caso no cooperativo; ahora, de todos modos tendremos con frecuencia la ocasión de constar que el problema de la cooperación es de alguna manera inevitable; el microeconomista, y más generalmente el teórico de juegos no puede economizar pues una reflexión sobre el asunto.

b) Juegos e información.

Como el estudio de los modelos en competencia perfecta e imperfecta nos lo ha mostrado, la información disponible por los individuos juega un papel esencial en el momento de tomar sus decisiones. En la medida en que se suponga que cada uno es consciente de la existencia de los otros, esta información puede referirse no sólo sobre las diversas salidas del “juego” y de sus ganancias asociadas sino también sobre el comportamiento con sus funciones de utilidad del conjunto de participantes. Si este es el caso, se dice que se está en presencia de un juego con información completa. En tal juego, en donde cada participante se puede colocar en lugar del modelador, siempre sabiendo que los otros harán lo mismo, se dice que las salidas, las ganancias y las características de los jugadores son conocimiento común. Hemos ya mencionado una situación similar en el capítulo anterior, cuando tratamos las conjeturas racionales.

Al contrario, en los modelos de competencia perfecta o del duopolio de Cournot, los individuos no procuran saber mas los unos sobre los otros; existe entonces, mas que una información incompleta, una restricción al nivel de su racionalidad, que se traduce en una especie de pasividad de su parte.

Sea lo que sea, la hipótesis sobre información completa representa un papel esencial en teoría de juegos; Veremos, además, al final del capítulo, los delicados problemas que surgen cuando esta hipótesis es subestimada así sea ligeramente.

c) Sobre la importancia del orden de los golpes.

Entre las reglas del juego existe la del número y la del orden de los “golpes”. Estos pueden ser anuncios del precio, ofertas o demandas de cantidades, decisiones de producción, etc. y darse simultáneamente en el tiempo o sucesivamente. Todo depende del problema estudiado, pero también de la decisión que tome el modelador; la decisión es importante ya que tiene una gran influencia en el “resultado” del juego. Un ejemplo simple permite comprender porqué.

Consideremos el caso de dos compañías A y B que se lanzan en la producción de televisores con imagen de alta definición, después de haber diseñado normas técnicas diferentes; los dos tienen interés en que exista sólo una norma, y cada uno prefiere evidentemente la suya, aún si pudiera producir aparatos de acuerdo con las normas del competidor. En tales condiciones si se supone que A “juega primero”, pues su producción tomó la delantera sobre la de B, entonces B sólo puede adoptar la norma de A las ventas y los programas disponibles no son suficientes para que coexistan con utilidades aparatos con las normas A y B. La “solución” del juego es que las dos empresas producen según la norma desarrollada por A.

Esta solución es, evidentemente, muy sensible a la hipótesis sobre el orden de los golpes; si se hubiera adoptado el supuesto de que B tomaba la delantera, entonces nos enfrentaríamos a una solución diametralmente opuesta en donde es B quien impone la norma y A tiene que adoptarla también. Notemos que este modelo, bastante simple, describe una solución “a la Steckelberg” (cf. 4.2) en la cual la empresa que produce primero juega el papel de director y el otro tiene que seguirlo.

Queda por examinar el caso de los golpes simultáneos en el cual ninguna empresa logra una ventaja sobre la otra; no hay acá “solución” que se imponga de manera evidente ya que si A y B deciden producir según su propia norma, las dos van a la quiebra por ventas insuficientes; por que una habría de plegarse a las condiciones de la otra? Se podría vislumbrar que las dos empresas lleguen a un acuerdo del siguiente tipo: A acepta producir según la norma de B, si esta se compromete a entregarle una parte de los beneficios que resulten de la existencia de una norma común. Ahora, si esta fuera la determinación aparece un problema de credibilidad: ¿por qué B cumpliría su compromiso si no hay nada que la obligue? Sabiendo esto A no puede aceptar el acuerdo. Evidentemente siempre es posible apelar a un sistema de sanciones, pero en tal caso la naturaleza del juego cambia porque no puede mantener esta solución sin un tercer agente encargado de vigilar la ejecución de los contratos y de aplicar sanciones si fuera necesario. Cuáles serían las motivaciones de este nuevo “jugador”? Cómo evitar que no sea corrompido por una u otra empresa, con todas las posibilidades de sobre-ofertas que ello supone? Frente a tales cuestiones, insolubles en el marco fijado, los teóricos de juegos adoptan por lo general una posición prudente vislumbrando apenas acuerdos que sean “auto-ejecutorios”, es decir, tales que ningún participante tenga interés en no respetar, bajo el peligro de ver disminuir sus ganancias.

Esta forma de mirar el asunto presenta la ventaja de la simplicidad; ahora, tiene el inconveniente de dejar sin “solución” evidente juegos como el que mencionamos antes, en donde dos empresas deben decidir simultáneamente sobre la norma a emplear.

d) Acciones y estrategias.

Todo modelo de juego necesita que se precise el dominio de elección de cada uno de los participantes, es decir, del conjunto de acciones a su disposición, pues la solución de un juego puede cambiar radicalmente según el tipo de acción vislumbrada, como lo prueba el caso del duopolio en su versión Cournot donde las acciones se toman sobre las cantidades y en su versión Bertrand donde las acciones se toman por los precios.

En tanto conozcan las acciones que se les “permite”, lo mismo que las reglas del juego y el orden de los golpes, los jugadores pueden establecer planes de acción, denominados estrategias, que consideran todas las eventualidades posibles. Evidentemente, si el juego tiene un solo golpe, con decisiones simultáneas, las acciones y las estrategias se confunden.

Por fuera de tal caso, las estrategias son condicionales, en tanto deben considerar todas las acciones posibles en diversas oportunidades. Así, en nuestro ejemplo sobre la producción con la selección de una norma, donde la empresa A actúe primero y B sea la segunda, las estrategias de esta última son:

  • Si A adopta su norma, adopto también esta norma
  • Si A adopta su norma, adopto mi propia norma
  • Si A adopta mi norma, adopto también mi norma
  • Si A adopta mi norma, adopto su norma.

Las estrategias de B son pues 22 = 4; de manera más general, se puede mostrar que el número de estrategias aumenta de manera exponencial con el número de golpes, la base del exponencial está dada por el número de acciones a disposición de los jugadores. Ahora, como en el caso de información completa, la racionalidad exige que cada jugador establezca la lista de todas las estrategias a su disposición, con el fin de escoger la “mejor” de ellas; si el número de golpes o de jugadores o de estrategias supera algunas unidades, las situaciones se tornan extremamente complejas, en razón de la diversidad de interacciones posibles, sobre todo si los participantes son conscientes del asunto. Es una de las limitaciones de la teoría de juegos, lo que explica por que esta se reduce en la mayoría de las ocasiones, al estudio de modelos con uno o dos golpes, con un número restringido de estrategias incluso si los tipos de situaciones posibles lo mismos que las “soluciones” que se les puede asociar son muy diversos.

2. EL EQUILIBRIO DE NASH.

A cada conjunto de estrategias denominado con frecuencia combinación de estrategias, que es una por jugador, se le asocia una salida del juego, caracterizada por las ganancias expresadas en forma de números que le toca a cada uno. Entre estas salidas puede haber unas más “interesantes” que otras, por ejemplo las que “reportan más”. Sin embargo, cono regla general, la mayoría de las salidas, si no la totalidad, no son comparables entre ellas en el sentido que el paso de una a otra se traduce en un aumento de ganancias para unos y una baja para otros. No se puede pues aplicar el criterio de Pareto y, con mayor razón, no se puede decir que una de ellas es “superior” a todas las otras, según este criterio, salvo un caso muy particular.

Frente a la ausencia de una clasificación de las salidas que logre la unanimidad de los participantes, los teóricos de juegos adoptan un punto de vista mas limitado, que se puede calificar de “local” en el sentido de estudiar separadamente cada una de las salidas y las combinaciones de estrategias de las cuales ellas son el resultado; se le acuerda un estatuto privilegiado a las que son de “equilibrio”, esto es a las que los individuos, tomados uno a uno no tienen interés en desechar -es típico de una situación en la cual “nada se mueve”-. Porque el matemático John Nash estableció un importante resultado en 1950 sobre la existencia de situaciones de este tipo, se habla entonces de la existencia de equilibrios de Nash.

Así, por definición, se dice de una combinación de estrategias (una por jugador) que está en equilibrio de Nash si ningún jugador puede aumentar sus ganancias por un cambio unilateral de estrategia. Con frecuencia se identifica, por abuso del lenguaje y sin que ello tenga consecuencias, un equilibrio de Nash con la salida que le corresponde.

En la definición del equilibrio de Nash el adjetivo “unilateral” ocupa un lugar esencial, en tanto ello traduce el carácter no cooperativo de las elecciones individuales (el “cada cual para sí mismo”). Así es bastante posible que en un equilibrio de Nash la situación se puede mejorar para todos por medio de un cambio simultáneo de estrategia por parte de varios jugadores. Volveremos sobre este importante punto cuando nos referimos a la eficiencia del equilibrio de Nash.

a) Importancia y límites del equilibrio de Nash.

El equilibrio de Nash ocupa un lugar central en la teoría de juegos; constituye de alguna manera una condición mínima de racionalidad individual ya que, si una combinación de estrategias no es un equilibrio de Nash, existe al menos un jugador que puede aumentar sus ganancias cambiando de estrategia, y en consecuencia, ésta se puede considerar difícilmente como una “solución” del modelo en la medida en que el jugador interesado en cambiar descarta su elección, después de conocer la de los otros.

Ahora, el recíproco de esta proposición no es generalmente verdad: si un juego admite un equilibrio de Nash no existe una razón a priori para que éste aparezca como la “solución” evidente, que se impone a los ojos de todos los jugadores. Ello al menos por una razón: con frecuencia los juegos admiten varios equilibrios de Nash, como se constata en el ejemplo de dos que han diseñado normas diferentes de emisión para la televisión. En efecto, la pareja de estrategias:

(A adopta la norma A, B adopta la norma A)

es un equilibrio de Nash del modelo en tanto A evidentemente no tiene interés de cambiar de estrategia habida cuenta la elección de B; este tampoco ya que la coexistencia de dos normas diferentes es el caso más desfavorable para las dos empresas.

Ahora, la pareja de estrategias:

(A adopta la norma B, B adopta la norma B)

es de igual manera un equilibrio de Nash, como se puede verificar de manera inmediata. Ninguno de estos dos equilibrios aparece como una solución evidente porque A prefiere la primera ya que impone su norma y B la segunda, por iguala motivo. Se deduce la posibilidad de que cada uno escoja producir según su propia norma, pensando que el otro lo seguirá, con el resultado de una salida que no es de equilibrio, pues es mala para todos. Se encuentra la cuestión central para el microeconomista, la coordinación, propuesta en el marco de juegos, pero igualmente no resuelta por éste mismo marco.

b) Equilibrios de Nash ante condiciones mas restrictivas.

El problema de la multiplicidad de equilibrios de Nash, en un juego dado, es indudablemente la principal fuente de preocupación para los teóricos de los juegos, que han buscado su solución considerando, por ejemplo, que ciertas elecciones no son completamente “razonables” o “creíbles”. De tal manera, si retomamos nuestro ejemplo, pero con un orden preestablecido en los golpes (digamos, A “juega” primero y B después), entonces nos encontramos en presencia de los dos mismos equilibrios, pero ahora uno de ellos es poco “creíble”, el que A y B adopten la norma de B. En efecto, no se ve por que A tomaría tal decisión ya que tomó la delantera; es cierto que B puede esgrimir una amenaza: “pase lo que pase, produciré con mi propia norma” y que, si tal es el caso A tendría interés en producir según la norma B por ello hay un equilibrio. Pero, será que A tomará en serio la amenaza de B?

Se puede dudar porque, si A decide producir según su propia norma sería suicida por parte de B poner en ejecución su amenaza, lo que provocaría la ruina de A, pero también la suya. Sabiendo eso, A actuará de distinta manera. En consecuencia, existen un de los equilibrios de Nash que se impone como solución:

(A produce según la norma A, B según la norma A).

Se dice de tal solución, en donde el orden de los golpes estipulado con antelación juega un papel importante, que es un equilibrio perfecto; esta solución comporta elementos de los equilibrios de Nash, haciendo intervenir elementos suplementarios.

Notemos, además, que la hipótesis de información completa juega un papel esencial; A debe estar “seguro” que B actuará como se previó ya que, si existe el más mínimo riesgo de que no fuera así y que B cumple con su amenaza, entonces la decisión no es tan evidente. Por ello el interés de B de forjarse una reputación del tipo que “no cede jamás”; no obstante, hay que entrever por ello opciones sucesivas y, en consecuencia, juegos repetidos, como lo veremos mas adelante. En el caso donde se presenten varios equilibrios con decisiones simultáneas, donde ninguna de ellas sea superior a la otra según el criterio de Pareto, ciertos teóricos de los juegos han propuesto la siguiente solución: los participantes se ponen de acuerdo para la selección a la suerte de uno de los equilibrios, lo cual se evita la indeterminación y se elude también la realización de salidas “peores”, como aquella de cada uno producir según su propia norma.

Esta solución, que es todavía un equilibrio de Nash, se denomina un equilibrio correlacionado. Notemos que esta solución supone una cierta forma de colaboración, que es el acuerdo previo sobre el principio de tirar a la suerte los equilibrios y sobre el procedimiento de azar empleado hay que darle la misma probabilidad a todos los equilibrios o hay que atribuirles probabilidades diferentes?. A pesar de existir un cierto acuerdo sobre el procedimiento a emplear, de todas maneras se está en presencia de una solución no cooperativa, en el sentido en que nadie tiene interés en apartarse unilateralmente, porque la salida retenida es un equilibrio de Nash.

c) Equilibrio de Nash y optimalidad.

Otro de los límites esenciales del equilibrio de Nash en tanto “solución” de un juego, reside en el hecho que tal equilibrio es con frecuencia subóptimo, en el sentido de Pareto. Ya hemos constatado con el equilibrio de Cournot -denominado de Cournot-Nash por los microeconomistas-, donde la filosofía del “cada uno para sí mismo” conduce a una salida en la cual los beneficios son menores que si hubiera acuerdo entre los duopolistas. Sin embargo, tal acuerdo no es de equilibrio en la medida en que cada cual tiene interés de no respetarlo si el otro lo respeta. Este tipo de situación es muy corriente: pensemos en el agricultor que enfrenta cuotas de producción que le son impuestas a él y a todos los agricultores con el fin de evitar el desplome de precios y que, además, busca sobrepasarlas para beneficiarse de los precios favorables originados en la existencia misma de estas cuotas; pensemos también en los bienes colectivos infraestructuras, ambiente y condiciones de vida que todo el mundo desea aprovechar, pero escapando a su financiación, en el caso de existir una cotización voluntaria. Es el mismo caso de las barreras proteccionistas con las cuales cada país desea rodearse, pero buscando exportar el máximo. Existen tantos ejemplos de este tipo, que se podría decir que ocultarían la mayoría de las relaciones sociales si estas se redujeran a la filosofía de “cada uno para sí mismo”.

Se ha tomado la costumbre por parte de los teóricos de juegos, lo mismo que por parte de sociólogos, economistas etc. de ilustrar este tipo de situación empleando una “pequeña historia” propuesta por A.W. Tucker y que llamó el dilema del prisionero que se puede resumir de la siguiente manera.

Dos individuos sospechosos de haber cometido un robo son detenidos por al policía que los lleva ante el juez, el cual los interroga separadamente. Cada uno puede callar o denunciar a su cómplice; los dos se encuentran ante las siguientes posibilidades:

  • Callar y salir libre si el otro hace lo mismo
  • Callar y ser condenado si el otro escoge denunciarlo
  • Denunciar al otro y salir libre, ganándose una recompensa si el otro se calla
  • Denunciar al otro y quedarse en prisión por un tiempo si el otro decide de la misma manera la delación.

Se constata fácilmente que el único equilibrio de Nash consiste en una denuncia mutua, lo que evidentemente es subóptimo ya que los dos sufren una condena, en tanto que si se hubieran callado habrían sido liberados. No obstante este equilibrio es “robusto” en el sentido en que la estrategia de acusar al otro es dominante cualquiera que sea la elección del otro, la denuncia le procura una ganancia superior.

Notemos que acá hay un dilema porque cada cual toma su decisión sólo considerando sus propios intereses y sabiendo que el otro actúa de la misma manera. Incluso, aceptando que los dos individuos se puedan comunicar previamente, no cambia nada la cosa, ya que al momento de escoger la estrategia dominante, “denunciar al otro” se impone. El problema no está pues en la posibilidad de comunicarse o no antes de tomar una decisión, sino más bien en la existencia de acuerdos obligatorios cuyo incumplimiento implica sanciones y de instituciones que velen por su aplicación, las cuales son difíciles de introducir en el ejemplo que nos ocupa.

El dilema del prisionero, o más exactamente las situaciones que representa, crean un problema fundamental al microeconomista, porque queda claro el hecho de las decisiones racionales por parte de individuos puede conducir a una “solución” -equilibrio- poco satisfactoria, es decir, subóptima por tanto “colectivamente irracional”. De ahí las numerosas tentativas de los teóricos de los juegos para salir de este “dilema”, pero siempre preservando el principio según el cual cada cual sólo busca su propio beneficio, es decir, maximizar sus ganancias. Entre estas tentativas, el recurso a los juegos repetidos, ocupa un lugar importante.

3. JUEGOS REPETIDOS

Los juegos empleados hasta ahora son “resueltos” de la siguiente manera: cada uno anuncia la estrategia que ha seleccionado, de tal manera que se impone una de las salidas, con la correspondiente distribución de ganancias; acá termina el asunto. Si ninguno de los jugadores rechaza su elección, después de constatar la de los otros, entonces existe un equilibrio de Nash.

El hecho de que “todo se arregla en una sola oportunidad” es evidente incómodo, sobre todo si la salida retenida es sub-óptima. De acá se desprende la idea de juegos repetidos, que permitiría evitar semejantes salidas, para el bien de todos. Cómo no pensar en un proceso de ajuste, con una corrección progresiva de los errores, hasta lograr una salida “óptima”? En efecto, y como es frecuente cuando se desea traducir a una forma matemática lo que parece tener un “buen sentido”, la modelación de tal proceso no es evidente, particularmente en el marco de la teoría de juegos. Efectivamente, para que la modelación pueda determinar cuales son las preferencias racionales, debe precisar la información que tiene cada uno sobre las salidas del juego y también sobre el comportamiento de los otros y las reglas del juego por ejemplo, orden y número de los golpes.

Ahora, puede no existir problemas de aprendizaje en el marco de una información completa empleado hasta el presente, en tanto los jugadores tienen una “visión de conjunto” del juego repetido y de todas sus etapas posibles y se encuentra, por tanto, en una situación parecida a la del juego simple en el cual éstos sólo tienen que determinar su estrategia “óptima”. De la misma manera existe un equilibrio de Nash si es cierto que las estrategias retenidas para un juego repetido, en ocasiones denominado superjuego, no hacen arrepentir a ningún jugador de la decisión tomada.

Sin embargo, incluso si en una situación con información completa, ningún juego repetido difiere fundamentalmente de juego normal, conviene subrayar que presenta ciertas características propias: de un lado, su número de estrategias aumenta exponencialmente con el número de veces que se repita el juego y permite vislumbrar una gran diversidad de situaciones; por otro lado tal salida conduce a la situación de introducir el concepto de amenaza, que de hecho resalta muy bien el carácter condicional de las estrategias “si él hace esto, yo respondo con aquello”, pero también condiciona la idea básica del equilibrio de Nash: toda desviación unilateral por parte de un jugador implica una sanción por parte de los otros, o de algunos de ellos, sin que se tenga que recurrir a una instancia externa.

a) Horizonte finito o infinito.

Por sorprendente que pudiera parecer, el hecho de que un juego se pueda repetir dos o tres veces, o dos o tres mil veces, no modifica fundamentalmente su naturaleza; pero no sería así si se repite indefinidamente. El ejemplo del dilema del prisionero permite comprender por qué.

Consideremos el caso más simple, el del juego repetido por una sola vez. Una estrategia posible podría ser “me callo en un primer interrogatorio; si el otro me ha denunciado, entonces lo denuncio en el segundo interrogatorio”. Se ve claramente que cada jugador puede escoger entre 8 estrategias distintas, incluso si algunas no fueran adoptadas por ejemplo “me callo, si el otro me denuncia sigo callado. Tal juego repetido no presenta sino un equilibrio de Nash, donde sólo se presenta la denuncia mutua en cada ocasión. Efectivamente, si un jugador adopta tal estrategia, el otro sólo puede hacer lo mismo ya que si se calla enfrentaría la pena máxima, y ello sin consideración del número de veces que se repita el juego al menos si el número es finito; Veremos, además, mas adelante que es el único equilibrio de tal juego repetido.

Es claro que repetir el juego no cambia para nada el problema establecido sub-optimalidad del equilibrio de Nash. Al contrario, tal problema se acentúa porque la “sub-optimalidad” aparece de manera más flagrante ya que las “pérdidas de bienestar” se multiplican por el número de veces que se repita el juego. Se puede decir, evidentemente, que el asunto no tiene importancia dado el caso mas bien anecdótico del “dilema del prisionero”. No obstante, no se puede olvidar que se ha ideado una forma divertida de traducir a la forma de un modelo simple, situaciones frecuentes de la vida en sociedad, tanto en el ámbito de los hogares y de las empresas como a nivel de toda la colectividad.

Los teóricos de los juegos han buscado resolver este dilema, con el riesgo de modificar las hipótesis del modelo. Así, han imaginado el caso en el cual el juego se repite indefinidamente; de esta manera si alguien adopta la estrategia: me callo, salvo si el otro me denuncia en un momento cualquiera; si él me denuncia, lo denuncio indefinidamente a partir de ese momento, acá hay un equilibrio de Nash. En efecto, tales “estrategias de amenaza” son entonces creíbles ya que quien se desvíe en cualquier momento, haciendo la denuncia del otro, obtiene una ganancia suplementaria, la “prima”, pero pasajera, cuyos efectos son anulados por las pérdidas inmediatas. Notemos que el hecho del juego no tener fecha final es muy importante, ya que si no fuera así pudiera darse una denuncia mutua en el último golpe y después, a causa de ello en el penúltimo golpe y así sucesivamente, hasta el primer golpe. De acá se deduce la unicidad del equilibrio de Nash repetido un número finito de veces.

b) Juego repetido y reputación

Si el hecho de repetir indefinidamente juegos, como el dilema del prisionero, permite llegar a soluciones mas conformes “al buen sentido”, ello sólo es posible apelando a una hipótesis difícil de defender el horizonte infinito, a no ser de que los jugadores no sepan que no son inmortales.

Para evitar tal hipótesis, los teóricos han buscado resolver las paradojas o los dilemas que ellos mismos han contribuido a crear, modificando sus modelos de la manera más ligera posible. Para ello han introducido una “brizna de irracionalidad” o, mas bien, la creencia por parte de un jugador que el otro o los otros puede(n) ser irracional(es). Por ejemplo, en el dilema del prisionero, esta creencia se traduce en una probabilidad , que puede ser muy pequeña, pero no cero, de que el “otro” se va a callar; la incertidumbre generada de esta manera hace posible la solución consistente de no denunciarse mutamente, al menos si el juego se repite un número suficiente de veces un número de veces mayor en tanto la probabilidad sea pequeña. En efecto, los dos jugadores proceden a un cálculo de la esperanza de ganancia, donde interviene . Aunque tal esperanza sea pequeña, las ventajas que resultan de la no-denuncia en cada momento del juego son mejores que las que pueden surgir de la “prima” obtenida por la denuncia, habida cuenta las represalias consiguientes.

Este resultado se explica mejor adoptando directamente un punto de vista secuencial, que permite construir la categoría de reputación. En efecto, si en la primera aparición de un jugador, decide, de manera aparentemente “irracional”, no denunciar su cómplice, entonces este puede decidir actuar de manera parecida, sugiriendo que también puede tener un comportamiento irracional, de manera tal que en el siguiente golpe se presente una situación de no-denuncia mutua y así sucesivamente. Actuando así cada uno se forja una reputación de tener el “cuero duro”, de no ser un flojo, reputación que se refuerza a medida que el juego se repite.

De esta manera, el hecho de introducir la incertidumbre, incluso de manera muy limitada, sobre la racionalidad del comportamiento de los otros, puede conducir a una salida mucho más favorable para todos, que en el caso donde no se presenta la incertidumbre. Se emplean nociones como la reputación, considerada irrelevante en el dominio de la racionalidad. Se puede concluir que es completamente racional hacer creer que se puede actuar de manera irracional, para incitar a los otros a proceder en un cierto sentido.

c) Sobre la importancia de las creencias.

Se puede ver, por el anterior ejemplo, que interesa no lo que son los jugadores los unos con relación a los otros sino sus creencias sobre el asunto. El asunto de las creencias (que ya ha sido examinado cuando tratamos el tema de las conjeturas) está en el centro de la teoría de juegos. Incluso el equilibrio de Nash está fundado en la creencia de cada uno que “los otros” van a escoger una estrategia de equilibrio, de manera tal que todos los jugadores han de actuar con esa racionalidad; por tal razón sus creencias se cumplen existen, recordemos, profecías autorealizadas.

Surge una pregunta de manera inmediata: cómo se originan las creencias, en particular, como se forja una reputación? Tal pregunta, no puede en verdad ser resuelta por la teoría de juegos. Es cierto que la teoría puede entrever modelos ampliados, de aprendizaje por ejemplo, formándose así ciertas creencias; ahora bien, tales modelos se apoyan forzosamente en una u otra forma de creencia o, al menos, en alguna regla de conducta postulada a priori, esto es, no explicada o desprendida del principio de racionalidad.

En efecto, el papel esencial de las creencias aparece de manera incuestionable cuando uno se interesa en los juegos con información incompleta; el ejemplo que hemos tratado corresponde a esta categoría y allí los participantes no están completamente informados sobre sus racionalidades respectivas.

4. LOS JUEGOS CON INFORMACIÓN INCOMPLETA.

Hasta ahora, hemos supuesto que había información completa, y cada jugador sabía todas las salidas y ganancias posibles, pero también conoce todo sobre los otros, en particular sobre su tipo de comportamiento. Además, incluso bajo esta hipótesis extremadamente fuerte, se llega a resultados claros y definidos.

Sin embargo, y a pesar de ello, la hipótesis de información completa, impide distinguir situaciones que interesan muy particularmente al microeconomista, como las que se mencionaron al final del capítulo anterior, a propósito de la relación entre el principal y el agente. La necesidad de aliviar esta hipótesis se hace sentir más y más.

Ahora, es evidente, que si hay “demasiadas” lagunas a nivel de la información disponible, los jugadores no podrán efectuar una selección razonable, habida cuenta la limitada base de cálculo de que disponen o al menos para un tratamiento matemático sistemático. Por tal razón los teóricos de juegos han procurado introducir en sus modelos dosis limitadas de incertidumbre, para poder preservar el capital teórico - procedimiento, representaciones, conceptos - del enfoque con información completa.

a) El recurso al jugador ficticio: la Naturaleza.

Los juegos con información incompleta se presentan generalmente de la siguiente manera: los jugadores se suponen ser de un “tipo” o de otro (por ejemplo hábil o torpe o incluso “de costos bajos” o de “costos altos”). Así, cada uno conoce su tipo exacto, pero sólo el conjunto de tipos posibles de los otros; se deduce la necesidad de atribuir una probabilidad de ocurrencia a cada uno de los diversos tipos. Es a causa del desconocimiento por parte de los jugadores - o de algunos de ellos - del tipo de los otros - o de algunos de ellos - donde reside la insuficiencia de la información; tal insuficiencia es, sin embargo, limitada, en tanto se supone que las soluciones y las ganancias son conocidas por todos, independientemente de las eventualidades posibles, es decir, cualquiera que sean las formas tomadas por los diversos tipos de jugadores.

Formalmente los teóricos de juegos introducen en sus modelos un personaje ficticio denominado Naturaleza y cuya única “actividad” es atribuir un tipo a cada uno de los jugadores, con una cierta probabilidad. De tal manera que un juego con información incompleta aparece como uno con información completa en el cual se confrontan todos los tipos que son los jugadores de un juego ampliado y en el cual la Naturaleza interviene primero. De esta manera un juego con dos participantes, en el cual puede haber tres tipos para uno y dos para otro, tendrá 3*2=6 tableros que representan las ganancias posibles, según las estrategias escogidas -en un juego con información completa sólo hay un tablero-. Esto deja entrever la complejidad de los cálculos necesarios para determinar las estrategias óptimas.

b) El equilibrio bayesiano.

Existe en teoría de probabilidades una regla, denominada de Bayes que consiste en atribuir probabilidades a priori a las ocurrencias de un evento aleatorio, después en revisar tales probabilidades mediante la observación del resultado de un experimento relativo a tal evento; finalmente las probabilidades revisadas se denominan a posteriori.

Ahora, en un juego con información incompleta, se presenta inevitablemente el cálculo de probabilidades, con relación a la ocurrencia de los diversos tipos, pero también a las reacciones posibles de los jugadores de los cuales ellos son la expresión. Tales cálculos son sometidos, evidentemente a revisión, en función de los comportamientos observados: se retoma la idea bayesiana de probabilidades a priori y a posteriori. Se observa como se va a caracterizar un equilibrio; en efecto, en la medida en que la idea del equilibrio es inseparable a la de invariabilidad esto es “nada se mueve”, para que exista un equilibrio es necesario que haya concordancia entre las probabilidades a priori y a posteriori de tal manera que los jugadores no sean incitados a revisar sus planes. Un equilibrio que tenga esta propiedad se denomina en teoría de juegos equilibrio bayesiano.

En este tipo de equilibrio las creencias de cada uno, relativas a las formas de reaccionar de los otros juegan un papel decisivo, en tanto que lo observado por los jugadores, son las conductas de los “otros” pero no sus tipos efectivos. Para establecer sus planes, procurarán estimar estos tipos a partir de sus probabilidades de ocurrencia -según la idea que ellos se hagan- y lo que crean será la manera de reaccionar de los otros según sean de tal o cual tipo. Tales creencias toman generalmente la forma de una distribución de probabilidades: “si este trabajador es del tipo “diestro”, pienso que hay un x % de probabilidades que trabaje con dedicación y 1-x % que no lo haga”; “si es torpe existe un y % de probabilidades que trabaje con dedicación y 1-y % que no lo haga”. En tanto no se puede olvidar que los jugadores observan su conducta, para deducir su tipo, y, además, pueden tener interés en hacer creer a los otros que son de un tipo diferente del que son realidad un trabajador torpe quisiera pasar por hábil etc.. Sin embargo, los que observan deben, muy racionalmente, considerar este asunto y así sucesivamente. Se mide la complejidad de los cálculos y de las expectativas que resultan de un proceso similar. Por tal razón los teóricos de los juegos se contentan con creencias dadas, sin precisar demasiado su origen o formación, poniendo así un límite al principio de racionalidad.

c) Los juegos de señalización.

Los juegos de señalización son los más simples con información incompleta, puesto que se hacen con dos individuos y sólo uno de ellos puede tomar tipos diferentes. Interesa muy particularmente esta clase de juegos al microeconomista, porque se pueden emplear para representar situaciones del tipo principal-agente que hemos mencionado al final del capítulo anterior. En efecto en tales situaciones, uno de los individuos puede ser de varios tipos el agente, el otro el principal, busca deducir el tipo efectivo de agente observando su comportamiento; de este examen se deduce una elección o una acción que el principal a manera de información, en tanto “señal” que proporciona una indicación sobre lo que puede ser el tipo de agente.

Los juegos de señalización tienen la ventaja de permitir una presentación secuencial, al menos si se estima que quien “emite” la señal el agente por ejemplo no toma en cuenta las creencias del receptor, (el principal). Tomemos un ejemplo simple: sea un agente que debe efectuar una cierta tarea, que puede ser fácil o complicada, y es el único que sabe bien de que se trata. En tales condiciones, el principal debe proponer al agente un contrato, el cual tiene en cuenta la naturaleza de la tarea a efectuar sí el principal no ofrece suficiente y la tarea es difícil el agente rechazará el contrato; si propone mucho y es fácil, las utilidades del principal se reducen. Sabiendo tal cosa, el agente evita enviar una señal clara del género “acepto ser mal remunerado si la tarea es fácil, mejor pagado en caso contrario”. Incluso, si la tarea es fácil, puede rechazar una remuneración baja sembrando la duda sobre el nivel de dificultad del trabajo a efectuar. En consecuencia, frente a un rechazo el principal debe decir si éste proviene de la dificultad efectiva de la tarea o de una tentativa de “bluff” o “caña” por parte del agente. Para tomar su decisión debe tener en cuenta probabilidades de que:

La tarea sea mas o menos difícil

El agente envíe una “señal” que no corresponda a la dificultad real de la tarea para “despistar”.

Estas probabilidades traducen las creencias del principal sobre el “estado de la naturaleza” y el comportamiento del agente; tales probabilidades le sirven para calcular su esperanza de ganancia en cada uno de los contratos posibles y, por tanto, le permite determinar el contrato óptimo. Este contrato es de equilibrio si maximiza igualmente la esperanza de ganancia del agente, también fundado en sus creencias. Así pues una de las características del equilibrio es que las creencias de cada uno se confirmen o, mas precisamente que no sean desmentidas, ya que, incluso en el equilibrio, los jugadores no conocen el tipo de los otros; existe en este caso una diferencia importante con las anticipaciones, cuya veracidad o falsedad se puede constatar.

Evidentemente, el equilibrio depende de manera decisiva de las creencias de los jugadores; ahora bien, como ellas pueden ser muy diversas, sucede lo mismo con los equilibrios; los teóricos de los juegos hablan entonces del problema de la multiplicidad de equilibrios, situación típica en los juegos con información incompleta, fuente esencial de la indeterminación.

d) Conclusión.

La teoría de juegos aparece como una generalización de la microeconomía en tanto ella tiene como propósito el estudio de la racionalidad individual y las interacciones de las decisiones que de acá se desprenden. Presenta la ventaja de suministrar un enfoque y conceptos precisos y, sobre todo, de llamar la atención sobre marco institucional e “informacional” implícito en todo modelo. Además, coloca al frente del análisis nociones como la reputación o las creencias, que la microeconomía soslayaba, pero que aparecen como inevitables, y que hacen muy relativo su mensaje, como lo constatamos en el capitulo precedente. 

Título: La Microeconomía
Autor: JBernard Guerrien
URL: http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/la_microeconomia/index.htm


Atrás Tabla de contenido Adelante