Los orígenes de la teoría de supercuerdas I: de la interacción nuclear fuerte a la gravedad cuántica

31/12/2014 0 comentarios
Menear

El trigésimo aniversario del artículo de Michael Green y John Schwarz en el que despejaban las dudas sobre la consistencia cuántica de la teoría de supercuerdas es una buena excusa para repasar el origen de la que ha sido desde los años ochenta la candidata estrella a una "teoría del todo". En esta primera entrega revisamos como la teoría de supercuerdas surgió de los intentos de encontrar una descripción satisfactoria de la interacción nuclear fuerte.

En diciembre de 1984 apareció publicado en la revista Physics Letters B el artículo que desencadenó la llamada "primera revolución de las supercuerdas". En él John Schwarz y Michael Green demostraban que en la llamada teoría de supercuerdas de tipo I las anomalías tanto gauge como gravitacionales cancelaban de forma sorprendente y no trivial para una elección particular del grupo gauge. Esto significaba que la teoría en estos casos podía ser cuantizada sin que apareciesen patologías.

Este resultado supuso un importante estímulo a la investigación de las teorías de supercuerdas, que empezaron a verse como serias aspirantes no solamente a una teoría cuántica de la gravedad sino a una descripción unificada de las cuatro interacciones fundamentales. Inmediatamente después llegaría la formulación de la cuerda heterótica por el llamado "cuarteto de cuerdas de Princeton" (David Gross, Jeffrey Harvey, Emil Martinec y Ryan Rohm), el modelo que dominó la fenomenología de supercuerdas hasta la "segunda revolución" en 1994.

Antes de entrar a discutir el trabajo de Green y Schwarz y de explicar qué son las anomalías gravitacionales y gauge y por qué son un problema, vamos a repasar el camino que llevó a la teoría de supercuerdas -originalmente un desarrollo hasta cierto punto marginal emergido como spinoff de los intentos de encontrar una descripción de la interacción nuclear fuerte- al centro de atención de la física de altas energías. Nuestra historia comienza en el periodo fundacional de la teoría cuántica de campos.

Las horas bajas de la teoría cuántica de campos

Los creadores de la QED: Feynman, Tomonaga, Schwinger y Dyson

En los últimos años de la década de 1940 Richard Feynman, Sin-Itiro Tomonaga, Julian Schwinger y Freeman Dyson consiguieron describir la interacción electromagnética entre partículas elementales en términos de una teoría cuántica de campos, la electrodinámica cuántica (QED). Las dificultades -surgidas ya en los años treinta del siglo XX- con los infinitos en el cálculo de los observables se habían resuelto mediante el procedimiento de renormalización. Este era una aplicación de la idea básica de que la teoría cuántica tenía que ser formulada en términos de cantidades observables. De esta forma, los infinitos podían ser absorbidos en parámetros auxiliares sin significado físico, ya que las cantidades medibles estaban determinadas por los resultados de los experimentos, por lo que debían ser finitas y estar libres de cualquier ambigüedad.

La teoría cuántica de campos -que hoy consideramos el instrumento básico de la física de altas energías- no siempre fue tan popular. A pesar del éxito de la QED, la construcción de una teoría cuántica de campos satisfactorias para describir las otras interacciones fundamentales resultó ser un camino lleno de obstáculos.

En el caso de la interacción débil, Enrico Fermi había formulado en la década de 1930 una teoría de la desintegración beta, pero los intentos de generalizarla una teoría semejante a QED chocaron con el problema de que la partícula responsable de mediar la fuerza débil, a diferencia del fotón, debía tener masa. Esto hacía que la teoría correspondiente fuese no renormalizable. El problema solamente sería resuelto a finales de la década de 1960 por Steven Weinberg y Abdus Salam con ayuda del mecanismo de Brout-Englert-Higgs (la historia puede encontrarse en este artículo).

El caso de la interacción nuclear fuerte era, si cabe, más intrincado aún. El problema de construir una teoría cuántica de campos consistente se veía complicado por el número creciente de partículas que participaban de esta interacción (conocidas con el nombre de hadrones). Mientras que a efectos experimentales la interacción débil era una cosa de relativamente pocas partículas (protones, neutrones, piones, electrones, muones y neutrinos), el aumento de la energía en los experimentos de colisión trajo consigo una explosión en el número de los hadrones conocidos. La mayor parte de estos no se observaban directamente, sino que aparecían como productos intermedios inestables en las colisiones entre partículas. Estas llamadas "resonancias" serán objeto de nuestra atención en breve.

La matriz S y los modelos duales

El aparente imposibilidad de la teoría cuántica de campos de describir las interacciones nucleares generó la idea en una parte de la comunidad científica de que quizás el ejemplo de QED constituía una excepción más que una regla general en física subnuclear. La pérdida de fe en los campos cuánticos quedó reflejada en los diversos intentos en la década de 1960 de encontrar una descripción alternativa.

En particular, cabía la posibilidad de que el andamiaje que proporcionaba la teoría cuántica de campos fuera prescindible, y que existiesen métodos de cálculo directo de las cantidades medibles experimentalmente. En cualquier teoría cuántica, el objetivo último es calcular las probabilidades de los diferentes resultados de un experimento dado. En el caso de una teoría de partículas elementales, los experimentos típicos consisten en hacer colisionar dos partículas de manera que puedan registrarse las propiedades de las partículas que resultan de este choque. Las probabilidades de los diferentes resultados de un experimento de dispersión se encuentran codificados en un objeto matemático llamado matriz S.

La idea de que la teoría cuántica de campos era algo prescindible en el estudio de la interacción nuclear fuerte se concretó en una estrategia liderada por Geoffrey Chew que partía de la hipótesis de que la matriz S podía ser construida directamente a partir de sus propiedades matemáticas y de un número reducido de datos experimentales.

Una de las propiedades que era necesario requerir de una buena matriz S era que reflejara un comportamiento peculiar de los hadrones. A bajas energías los experimentos de dispersión mostraban la existencia de resonancias, esto es, la probabilidad de ciertos procesos presentaba un máximo cuando la energía total de las partículas que colisionan se acercaba a cierto valor. Físicamente esto se interpreta como que la colisión da lugar a un estado intermedio inestable (la resonancia) que se desintegra pasado un tiempo:

canal_s

La energía a la cual se produce esta amplificación de la probabilidad marca la masa de la resonancia, mientras que su espín podía inferirse de las condiciones del experimento. Estas resonancias tenían además una propiedad curiosa: si se representaba su espín como función de su masa al cuadrado, estas aparecían ordenarse aproximadamente a lo largo de líneas rectas paralelas llamadas trayectorias de Regge, tal y como se indica en esta figura esquemática:

Regge trajectories

Las partículas pertenecientes a la misma trayectoria de Regge comparten números cuánticos tales como la carga, la paridad, etc.

A altas energías el comportamiento de la probabilidad era diferente. En este régimen los experimentos de dispersión parecía estar dominado por el intercambio de todos los estados de una de las trayectorias de Regge que hemos mencionado hace un momento. Matemáticamente, el intercambio de esta torre de estados quedaba marcado por la existencia de singularidades en la amplitud de probabilidad -llamados polos de Regge- que aparecían cuando el momento angular del proceso tomaba ciertos valores complejos

canal_t

Los procesos representados en las figuras (1) y (2) se conocen con los nombres respectivos de canal s y canal t. Tanto en teoría cuántica de campos como en la construcción de Chew, al calcular la amplitud de probabilidad es necesario sumar la contribución de todos los posibles canales en los cuales puede tener lugar la interacción. Por tanto, la probabilidad total del proceso es resultado de la interferencia de los diferentes canales.

Las trayectorias de Regge parecían jugar un papel crucial en la interacción fuerte, ya que aparecía a bajas como a altas energías. En 1967 Richard Dolen, David Horn y Christoph Schmid encontraron evidencias de que la suma sobre resonancias que domina la amplitud a bajas energías contenía suficiente información como para reconstruir el comportamiento de la amplitud a altas energías. Por ello, para calcular la amplitud de probabilidad no era necesario sumar sobre resonancias y polos de Regge -ya que esto sobreestimaría el resultado- sino solamente sobre resonancias o solamente sobre polos de Regge. Gráficamente lo podemos representar de la siguiente manera:

DHS duality

Esta propiedad se bautizó como dualidad de Dolen-Horn-Schmid o simplemente dualidad de canales. El término "dualidad" significa que las descripciones del canal s y el canal t son duales, es decir complementarias. Por ello los modelos de interacción de los hadrones basados en esta idea recibieron el nombre de modelos duales, distinguiéndolos así de los modelos "de interferencia" en los que era necesario sumar sobre todos los canales para obtener la amplitud.

Desde el punto de vista de los modelos duales, el objetivo consistía por tanto en construir una matriz S que cumpliese no solamente las propiedades matemáticas que ya le habían exigido Chew y sus seguidores, sino que también incorporase la dualidad de canales. Tras algunos ejemplos en los que esta última propiedad se satisfacía solamente de forma aproximada, la primera solución exacta de este problema fue obtenida por Gabriele Veneziano en 1968. Un año después Miguel Virasoro encontraría un segundo ejemplo de una amplitud para cuatro partículas que satisfacía todas las propiedades exigidas a los modelos duales.

Las amplitudes escritas por Veneziano y Virasoro, así como sus generalizaciones, podían obtenerse usando un formalismo que involucraba un número infinito de osciladores armónicos. En realidad se trataba de una teoría cuántica de campos definida en un espacio-tiempo "auxiliar" de dos dimensiones. La consistencia de este formalismo de operadores tenía algunas consecuencias peligrosas para la viabilidad fenomenológica de los modelos duales. Una de ellas -aparentemente desastrosa- era que para que era necesario que los hadrones se propagasen en un espacio-tiempo de 26 dimensiones.

Otro problema radicaba en el espectro de la teoría. Los estados cuya interacción da lugar a las amplitudes de Veneziano y Virasoro resultaban ser taquiones, es decir estados con masa imaginaria. Además, los modelos duales contenían estados de masa nula, entre ellos uno con espín 2 que tendría gran importancia. La presencia de partículas sin masa era también un problema grave, ya que implicaba la existencia de fuerzas de largo alcance entre los hadrones que el modelo aspiraba a describir. Sin embargo la interacción nuclear fuerte entre estos es de muy corto alcance.

Aparecen las cuerdas...

Más allá de resolver el problema de encontrar una matriz S con las propiedades requeridas, quedaba pendiente encontrar una imagen espacio-temporal de los modelos duales. Recordemos que estos se habían formulado en términos de una teoría cuántica de campos bidimensional que no parecía tener ninguna interpretación física.

Esta cuestión fue clarificada independientemente por Holger Nielsen, Yoichiro Nambu y Leonard Susskind. Y la solución que encontraron fue que la amplitud de Veneziano correspondía a la amplitud de dispersión de dos cuerdas abiertas que interaccionaban para dar lugar a otras dos cuerdas abiertas. Esquemáticamente podemos representar esta interacción usando el siguiente diagrama

open_strings

Si en un diagrama de Feynman una partícula que se propaga viene representada por una línea que converge con otras en los puntos en las que esta interacciona con otras partículas, aquí una cuerda abierta se representa por una "banda" que se une con otras para dar lugar a la interacción. Es esta superficie la que proporciona el espacio-tiempo bidimensional que aparece en el formalismo de operadores de los modelos duales.

Vemos también como este nuevo diagrama de alguna forma "desdibuja" los canales s y t, algo natural ya que recordemos que la dualidad de Dolen-Horn-Schmid nos dice que toda la información sobre la colisión en cuestión está contenido en un solo canal. Por tanto, describirlo como un proceso en el canal s o el canal t es una mera cuestión de gusto o conveniencia.

La amplitud de Virasoro también admitía una interpretación similar. La diferencia sin embargo consistía en que ahora los objetos que interaccionaban no era cuerdas abiertas, sino cuerdas cerradas. Estas describían al propagarse "tubos" que se unían y separaban al interaccionar con otras cuerdas cerradas:

closed strings

La formulación de los modelos duales en términos de cuerdas relativistas cuánticas clarifica además el origen del espectro: los estados corresponden a los diferentes modos de vibración de las cuerda abiertas o cerradas.

...y las supercuerdas

Aparte de los problemas ya mencionados, los modelos duales surgidos de las amplitudes de Veneziano y Virasoro tenían otra limitación importante. Todos los estados que contenían eran de espín entero, esto es bosones. Dada la existencia de hadrones de espín semientero -entre ellos nuestros viejos conocidos el protón y el neutrón- era necesario encontrar modelos que pudiesen acomodar este tipo de partículas, denotadas colectivamente como bariones.

En la primeros días de 1971 Pierre Ramond construyó un modelo dual que incorporaba hadrones fermiónicos. Al hacerlo, estaba de hecho construyendo el primer ejemplo de lo que luego se llamaría una teoría de campos supersimétrica, aunque esta teoría vivía en el espacio auxiliar de dos dimensiones que ya hemos mencionado. Simultáneamente, André Neveu y John Schwarz trabajaban en un modelo muy similar al de Ramond, pero que a pesar de usar grados de libertad fermiónicos en la teoría bidimensional solamente contenía hadrones bosónicos (mesones). El modelo de Neveu y Schwarz era en realidad muy parecido al modelo de Veneziano, incluyendo también el indeseable taquión. Pero su taquión era más "ligero" que el de Veneziano, por lo que parecía ser un mejor candidato para describir el pion. De ahí que recibiera el nombre de dual pion model.

Los modelos formulados por Ramond y por Neveu y Schwarz carecían de interpretación espacio-temporal hasta que Stanley Mandelstam los combinó para construir el primer modelo de supercuerdas. El modelo era similar al de cuerdas abiertas que daba lugar a la amplitud de Veneziano, salvo que la supercuerda contiene grados de libertad fermiónicos que hacen que algunos de sus modos de vibración den lugar a estados con espín semientero. La diferencia entre los estados contenidos en los modelos de Ramond y de Neveu-Schwarz radica simplemente en la forma en que los modos fermiónicos de la cuerda "rebotan" al llegar a los extremos de esta.

De los hadrones a los gravitones

No son poco los críticos de la teoría de supercuerdas que anuncian que en breve esta pasará a engrosar las vitrinas del gabinete de curiosidades científicas haciendo compañía a los vórtices cartesianos, la electrodinámica de Mie o la teoría unificada de Heisenberg.

Lo cierto es que la teoría de supercuerdas pudo haber acabado en dicho gabinete mucho antes de lo que algunos han profetizado. Ya hemos visto como la credibilidad de los modelos de cuerdas para describir la física hadrónica se había encontrado con diferentes problemas: taquiones, demasiadas dimensiones, etc.

Además, la teoría cuántica de campos, que muchos habían declarado incapaz de resolver el problema de la interacción nuclear fuerte, empezaba a dar signos de recuperación. Los experimentos llevados a cabo en el Stanford Linear Accelerator Center (SLAC) en 1968 indicaban que el protón estaba compuesto de ciertos objetos puntales que Richard Feynman bautizó con el nombre de partones.
 
Estos partones no fueron inmendiatamente identificados con los quarks, introducidos en 1964 por Murray Gell-Mann y George Zweig pero que todavía se veían como un mero artilugio matemático para obtener los números cuánticos de los hadrones. Sin embargo, el descubrimiento en 1973 de la libertad asintótica por David Gross, David Politzer y Frank Wilczek y la formulación de la Cromodinámica Cuántica (QCD) por Harald Fritzsch, Murray Gell-Mann y Heinrich Leutwyler cambió completamente el panorama y condujo a la que hoy consideramos la explicación estándar de la interacción nuclear fuerte. Los partones detectados en SLAC años antes no eran sino los quarks y gluones que componían el protón.

Estos desarrollos trajeron como consecuencia que a lo largo de la década de 1970 los modelos duales -es decir, la teoría de cuerdas- fueran perdiendo la razón de su existencia como modelo de la interacción fuerte. Pero algo cambió cuando en 1973/74 Tamiaki Yoneya por una parte y Joël Scherk y John Schwarz por otra se dieron cuenta de que el estado de masa cero y espín 2 que contenían modelos duales y que resultaba tan incómodo para una teoría de los hadrones, tenía una propiedad extremadamente interesante: a bajas energía interaccionaba exactamente igual que lo haría el gravitón, la hipotética partícula de espín 2 mediadora de la interacción gravitacional.

No solamente esto. Scherk y Schwarz mostraron que el modelo de Ramond-Neveu-Schwarz contenía junto al gravitón también estados que podían identificarse con leptones y bosones gauge. De esta forma lo que había comenzado como un intento de describir los hadrones se convertía en una teoría de partículas elementales con la promesa de unificar todas las interacciones fundamentales.

Los viejos modelos duales, que habían comenzado como un intento de explicar la fauna de resonancias hadrónicas y cuya misma existencia se veía amenazada por la resurrección de la teoría cuántica de campos, parecían poder reconvertirse en una teoría de gravedad cuántica, o incluso en una "teoría del todo". A pesar de esto, su momento de éxito no había llegado aún. En la siguiente entrada retomaremos nuestra historia para ver como la teoría de supercuerdas abandonó la marginalidad y pasó a convertirse en uno de los temas dominantes de la física teórica de altas energías.

¡Feliz 2015!