La investigación · Schurger · Sitt · Dehaene · 2012

El modelo del acumulador estocástico del potencial de preparación

El artículo de 2012 en PNAS de Aaron Schurger, Jacobo D. Sitt y Stanislas Dehaene, An accumulator model for spontaneous neural activity prior to self-initiated movement, propone que el potencial de preparación (RP) clásico, previo a los movimientos autoiniciados, puede explicarse como un acumulador estocástico con fugas impulsado por ruido neural espontáneo — en lugar de por un proceso «preparatorio» lento y determinista que comienza cientos de milisegundos antes de la intención consciente. Es la reinterpretación metodológica más citada de Libet, y el artículo que reabrió silenciosamente una pregunta que la lectura estándar de Libet parecía haber cerrado.

Guía de lectura para una entrada de la bibliografía. Léase junto a la guía sobre Libet; los dos artículos solo se entienden como par.

Idea central del modelo

Schurger, Sitt y Dehaene modelan la decisión de cuándo moverse — en tareas tipo Libet de «muévete cuando te apetezca» — como un proceso de cruce de umbral en un acumulador con fugas. Fluctuaciones aleatorias subumbral de la actividad neural en curso se integran hasta cruzar un umbral de decisión, momento en el cual se dispara un movimiento.

Como los ensayos se sincronizan en el tiempo con el inicio del movimiento, promediar a lo largo de muchas trayectorias de cruce de umbral produce un aparente ascenso lento — el RP — incluso aunque, en ensayos individuales, no haya rampa lenta estereotipada que comience segundos antes. El RP clásico es, según esta explicación, un artefacto estadístico del promediado de trayectorias estocásticas que casualmente terminaron en un cruce.

El potencial de preparación, reinterpretado

Clásicamente, el RP se tomaba como evidencia de que el cerebro comienza a preparar una acción voluntaria varios cientos de milisegundos antes de que el sujeto se vuelva conscientemente consciente de decidir. Schurger y col. argumentan, en cambio, que el RP refleja principalmente la estructura estadística del ruido neural en curso más la sincronización temporal — no una «decisión inconsciente» determinista que comienza en el inicio del RP.

En el modelo del acumulador, la decisión neural de moverse ahora se identifica con el cruce del umbral, que ocurre cerca del inicio del movimiento (dentro de aproximadamente 150 ms). La actividad premovimiento anterior refleja fluctuaciones sin compromiso, sesgadas débilmente hacia el umbral por la instrucción de actuar — no una decisión inconsciente fija.

El cambio es sutil pero consecuente. El RP es real; se observa; el modelo del acumulador se ajusta a su forma empírica. Lo que cambia es la interpretación de lo que el RP mide — de una orden determinista de premovimiento a la firma estadística del ruido integrándose hasta volcar el borde.

El contexto de la tarea: movimientos autoiniciados bajo imperativo débil

El modelo está hecho a medida para paradigmas en los que se instruye a los sujetos a hacer movimientos espontáneos tras una demora no especificada, sin estímulos externos ni estrategias como contar. Bajo estas instrucciones, el «imperativo» de moverse es débil y poco específico, de modo que el momento exacto lo fijan en gran medida fluctuaciones aleatorias en vez de un reloj interno preciso o un estímulo.

Los autores replican los hallazgos conductuales y de EEG tipo Libet usando este marco, ajustando la forma del RP con parámetros obtenidos a partir de distribuciones conductuales de tiempos de espera — no de la señal EEG misma. Esa decisión metodológica importa: las predicciones del modelo sobre el RP se derivan solo del comportamiento, y el acuerdo con el EEG es por tanto una confirmación independiente y no un ajuste circular.

Acumulador estocástico con fugas: cómo funciona

El modelo de decisión estocástica usa un acumulador con fugas cuya entrada es ruido neural intrínseco más un pequeño sesgo constante que refleja la instrucción de moverse. El estado del acumulador deriva estocásticamente hacia arriba y hacia abajo, pero como está sesgado y tiene fugas, tiende a flotar por debajo del umbral hasta que una fluctuación lo empuja a cruzarlo.

Una vez el estado alcanza el umbral, se toma un compromiso de actuar y se inicia el movimiento — análogo a los modelos de acumulación de evidencia en la toma de decisiones perceptual (Ratcliff, Gold y Shadlen) que disparan una elección cuando se alcanza un criterio. La maquinaria matemática se toma íntegramente de la literatura de decisión perceptual; lo que cambia es la fuente de la «evidencia» — no la entrada sensorial externa, sino la actividad espontánea interna.

Unificación con la toma de decisiones perceptual

Una afirmación teórica clave es la unificación: el mismo mecanismo de acumulador-con-umbral que subyace a las decisiones perceptuales impulsadas por estímulo puede dar cuenta también de las acciones voluntarias autoiniciadas, con la «evidencia» sustituida por fluctuaciones intrínsecas de la actividad. Esto sitúa la acción voluntaria dentro del marco más amplio de la toma de decisiones, en lugar de exigir un mecanismo especial exclusivo de las acciones libres.

Los autores observan que trabajos existentes sugieren mecanismos neurales comunes para las acciones voluntarias y para las impulsadas por estímulo, lo que apoya la idea de que la arquitectura del acumulador se reutiliza entre dominios. La implicación: las acciones «autoiniciadas» y «externamente señaladas» no son dos tipos distintos de actividad cerebral, sino un proceso subyacente único corriendo sobre distintas fuentes de entrada.

Pruebas experimentales y predicciones

Los autores validan el modelo de dos maneras:

Primero, hacen coincidir RPs simulados con RPs empíricos de EEG usando parámetros ajustados al comportamiento de tiempos de espera, no al EEG mismo — una predicción independiente que se cumple.
Segundo, ponen a prueba una predicción más fuerte señalando respuestas rápidas en momentos aleatorios y ordenando los ensayos por tiempo de reacción: los tiempos de reacción más cortos corresponden a ensayos en los que las fluctuaciones en curso estaban ya más cerca del umbral, consistente con la explicación del acumulador.

La lógica de la «interrupción» se apoya en el supuesto de que las respuestas forzadas y las espontáneas se basan en la misma variable de decisión subyacente; cuando interrumpes en un momento aleatorio, lo único que haces es muestrear el estado actual del acumulador. Los datos encajan con la predicción.

Implicaciones filosóficas y para el libre albedrío

En el debate sobre el libre albedrío, el modelo socava una lectura simple de Libet que equipara el inicio del RP con el inicio de una decisión inconsciente que fija el movimiento antes de la intención consciente. En cambio, la decisión se vincula a un cruce de umbral tardío, con la actividad anterior reflejando una dinámica estocástica que solo influye probabilísticamente en cuándo ocurre la decisión.

Esto apoya interpretaciones en las que la intención consciente puede seguir estando estrechamente ligada en el tiempo al compromiso real de actuar, y en las que el RP no es evidencia directa de que «el cerebro decide antes que tú». La lectura canónica de treinta años — que Libet había falsado el libre albedrío — tiene que retirarse, o al menos matizarse seriamente, a la luz del modelo del acumulador.

Nada de esto demuestra el libre albedrío. Lo que hace es restaurar la pregunta: el hueco entre el inicio del RP y el tiempo W reportado, tomado por muchos como prueba de que la conciencia llega demasiado tarde para importar, es según Schurger el hueco entre fluctuación aleatoria y decisión por cruce de umbral — con la decisión misma mucho más cercana en el tiempo a la intención consciente de lo que la lectura clásica de Libet sugería.

Por qué esto importa para la trilogía

El compromiso de la trilogía con Libet es más honesto con Schurger en el cuadro que sin él. Las conversaciones de Anima y Numen sobre Sapolsky, el potencial de preparación y el hueco de 300 milisegundos toman en serio el fenómeno empírico pero rechazan la interpretación determinista que se había vuelto ortodoxa. Schurger explica por qué ese rechazo es ahora metodológicamente respetable y no mera preferencia metafísica: la evidencia empírica que supuestamente cerraba la pregunta nunca la cerró de verdad.

La lectura del modelo receptor que la trilogía ofrece está motivada de manera independiente por la neurología anómala, por la no localidad de Bell y por el marco del «renderizador» a escala de Planck. Schurger no se requiere para hacer coherente el modelo receptor. Pero Schurger elimina la objeción empírica más citada en su contra. Una vez que el RP deja de ser evidencia de un compromiso neural inconsciente cientos de milisegundos antes de la conciencia, la arquitectura que Anima describe — el campo renderizando la agencia local a través del tejido biológico con una latencia no nula — se vuelve consistente con los mismos datos que el productivista había usado en su contra.

La tesis de compresión de Senna Park en Anima se lee con más limpieza a través de Schurger que a través de Libet solo: el filtro de 40 bits es la arquitectura en la que las fluctuaciones neurales intrínsecas se integran en un momento coherente de elección. La ventana cimática pre-evento de 300 milisegundos de Lucía Reyes en Numen — patrones geométricos formándose en agua antes de que se toque el acorde — encaja en una simetría complementaria: en un extremo, ruido interno integrándose hacia un cruce que se vuelve el «ahora» sentido; en el otro, los efectos del campo apareciendo en el medio antes del disparador causal local. Ambos huecos son ahora empíricos. Ninguno exige que la conciencia sea tardía, ilusoria o productivista.

Para el experimento original de Libet, ve la guía sobre Libet. Para el marco filosófico que organiza ambos artículos, ve la guía sobre Chalmers. Para la síntesis que entrelaza todo esto, ve Lo que la evidencia muestra hasta ahora. El artículo de Schurger es de acceso abierto en PNAS.

← Lecturas y referencias