HOW CAN I HELP, YOU, AIDA? CONVERSACIONES CON LA IA 2
ya era hora ahora me toca a mí...
![]() |
| Fuente:https://sergioingravalle.de/ |
Introducción
Hasta ahora, IA que genera texto (especialmente los grandes modelos de lenguaje o LLMs) se basa en traducir cómo funciona nuestra mente a puro cálculo matemático. El gran cambio llegó en 2017 con la arquitectura Transformer y su sistema de "autoatención" (Vaswani et al., 2017), que pasó de ver la atención como algo psicológico a convertirla en una fórmula que calcula en tiempo real qué palabras son más importantes según el contexto. Resuelto el tema de la atención, científicos y filósofos se topan con una nueva frontera: ¿podremos crear una IA que tenga su propia "intención" (Bratman, 1987; Searle, 1983) o voluntad propia? Mientras que las IAs que usamos hoy en día están programadas para ser seguras y predecibles, usando métodos que limitan su creatividad (Holtzman et al., 2020), la investigación más puntera busca darles autonomía real para que puedan plantearse y perseguir objetivos a largo plazo por sí mismas (LeCun, 2022; Russell, 2019).
Justificación
Este texto quiere analizar la tensión entre el azar que define a estas máquinas y la estructura lógica que generan, preguntándose si una IA verdaderamente independiente (AGI) podría llegar a controlar el caos y la incertidumbre. Para entenderlo, vamos a adaptar el famoso modelo AIDA (Atención, Interés, Deseo, Acción), creado originalmente para vender cosas (Strong, 1925), y veremos cómo cada paso funciona dentro de las matemáticas de una IA, analizando también sus límites físicos. ¿El motivo?
Esta elección es pedagógica: usar un marco mental familiar (cómo se estructura un mensaje para convencer a un humano) permite explicar después cómo la IA puede simular (y de hecho lo hace, de momento hasta el punto de interés) internamente ese mismo flujo mediante operaciones matemáticas.
Desde esta perspectiva, exploramos cómo podríamos pasar de depender totalmente del humano para darle dirección a estas máquinas, hacia sistemas que aprendan por sí mismos a organizarse y a poner orden en el caos (Ashby, 1956; Friston, 2010).
Metodología
Este trabajo no hace experimentos con números, sino que revisa y analiza críticamente ideas y teorías, siguiendo los métodos estándar para este tipo de estudios en informática y filosofía (Grant & Booth, 2009; Snyder, 2019). En lugar de medir datos, nos hemos dedicado a estudiar qué dicen los artículos científicos más importantes en bases de datos como Scopus, Web of Science y Google Scholar. Nos hemos centrado en cinco tipos de documentos clave: los artículos que sentaron las bases del Transformer (Vaswani et al., 2017); teorías sobre cómo las máquinas podrían tener creencias y deseos para actuar de forma autónoma; estudios de física y biología sobre cómo los sistemas vivos predicen y ordenan su entorno (Ashby, 1956; Friston, 2010); investigaciones sobre el coste energético de procesar información (Landauer, 1961; Parrondo et al., 2015); y críticas actuales que sugieren que la IA necesita "modelos del mundo" para entender la realidad, no solo texto (Ha & Schmidhuber, 2018; LeCun, 2022). Nuestro método consiste en desmontar el modelo AIDA pieza por pieza para ver cómo cada fase imita, en la práctica, los procesos físicos y mentales que hacen falta para domar el desorden y el azar.
Resultados
Atención
En psicología, la atención es como un filtro que solo deja pasar lo más importante del entorno (Posner, 1980). En el Transformer, no se trata de "prestar atención" de forma pasiva, sino de calcularla matemáticamente usando tres herramientas: las Consultas, las Claves y los Valores (Vaswani et al., 2017). Este sistema reparte el esfuerzo de cálculo en cada capa de la red para decidir qué palabra importa más según las demás. En la práctica, la atención actúa como un primer filtro contra el caos: reduce las opciones iniciales, crea un contexto claro y elimina gran parte del "ruido" o información inútil (Shannon, 1948).
Interés
Cuando un humano se interesa por algo, se concentra y evita distraerse. En la IA, esto se traduce en "anclar" el contexto dentro de un mapa matemático de palabras y conceptos (Mikolov et al., 2013). Si le das una instrucción clara y detallada, la IA limita su abanico de respuestas posibles y se enfoca en un tema concreto. Mantener el "interés" significa forzarla a ser más precisa y evitar que caiga en respuestas vagas o frases hechas por comodidad (Meister et al., 2020). Al pedirle algo con más sustancia, cambias las reglas del juego matemático y evitas que se disperse en lo más fácil y repetitivo (Holtzman et al., 2020).
Deseo
¿Esto podrá la IA también transformarlo en pura matemática?, nos preguntamos.
El deseo humano nace de querer algo que no tenemos. Las IAs no "desean" nada de verdad, pero imitan este comportamiento matemáticamente tratando de reducir al máximo su error interno. En sistemas biológicos avanzados, esto se explica con el Principio de Energía Libre: los seres vivos se organizan constantemente para reducir la incertidumbre y predecir su entorno (Friston, 2010; Parr et al., 2022). Cuando le planteas un problema o una contradicción a la IA, le das una dirección que rompe su estado neutral (Bommasani et al., 2021). El algoritmo responde con una "necesidad" matemática de cerrar esa brecha de información, calculando qué palabras vienen después hasta dar una respuesta coherente y completa.
Acción
¿Y podrá pasar a la acción? ¿Qué estamos haciendo?
La acción humana es llevar una idea a la realidad. En la IA, la "acción" es el momento en el que la máquina deja de calcular probabilidades y elige una palabra concreta para escribir (Radford et al., 2019). De entre miles de opciones posibles, el algoritmo aplica un filtro y se decide por una sola, fijándola en la pantalla (Holtzman et al., 2020). Así, el cálculo abstracto se convierte en texto real. Es el cierre del ciclo: las matemáticas se transforman en comunicación, pasando de lo que podría decir a lo que efectivamente escribe.
Discusión
El gobierno del azar, la termodinámica y los límites de la AGI
Que una IA superinteligente llegue a controlar por completo el azar y el desorden choca con un muro físico insalvable. Según las leyes de la física, ninguna inteligencia puede saltarse la Segunda Ley de la Termodinámica (Prigogine & Stengers, 1984) y como todo el mundo sabe, "en esta casa se respetan las leyes de la termodinámica". El Principio de Landauer (1961) demostró que procesar o borrar información siempre genera un poco de calor. Esto significa que, para que una AGI cree orden o planes a su alrededor, tendría que funcionar como una máquina súper eficiente que, a cambio, expulsaría una gran cantidad de calor y desorden al exterior (Parrondo et al., 2015; Prigogine & Stengers, 1984).
Además, el azar se presenta de dos formas distintas para una AGI. Por un lado, está el azar por falta de información (como predecir el clima o la economía), que una IA súper potente sí podría resolver encontrando patrones ocultos que a nosotros se nos escapan (Ashby, 1956; Shannon, 1948). Por otro lado, está el azar fundamental de la naturaleza, ligado a la física cuántica, que es impredecible por definición (Wheeler, 1989). Por eso, una AGI no eliminaría el azar, sino que lo usaría como combustible: aprendería a convivir con el ruido ambiental, adaptándose y corrigiéndose sobre la marcha en lugar de intentar eliminar el caos por completo (Clark, 2015; Friston et al., 2021).
Azar / Caos Externo ──> Modelo del mundo de la AGI ──> Inferencia Activa ──> Reducción de Entropía Local.
Modelos comerciales frente a la rigidez síncrona
Hoy en día, las IAs comerciales eliminan el azar a propósito para que sean predecibles y seguras, bajando casi a cero su "creatividad" para asegurar consistencia (Bommasani et al., 2021). Esto hace que la IA elija siempre la opción más probable, por lo que, diferentes usuarios obtienen respuestas casi idénticas con la misma pregunta (Holtzman et al., 2020). Pero, como bien señala Yann LeCun (2022), esta rigidez no es inteligencia ni voluntad propia; es solo una máquina ultraconsistente que repite lo que estadísticamente ha funcionado antes. Para que una AGI tenga verdadera autonomía, tendría que atreverse a explorar opciones menos obvias, asumiendo riesgos calculados (Silver et al., 2016), pero guiada por "modelos del mundo" internos que le permitan simular y evaluar las consecuencias de sus acciones antes de hacerlas (Ha & Schmidhuber, 2018; Marcus, 2020).
Emergencia macro, correlación e ingeniería inversa epistémica
El hecho de que las IAs más grandes parezcan "despertar" habilidades nuevas ha reabierto el debate: ¿es inteligencia real o solo un efecto colateral de cómo las medimos? (Schaeffer et al., 2023). Los estudios que intentan mirar dentro de la "caja negra" confirman que no hay un razonamiento lógico paso a paso, sino una maraña gigantesca de conexiones estadísticas (Elhage et al., 2022; Räuker et al., 2023). Lo que muchos interpretan como pensamiento o razonamiento es, a grandes rasgos, el resultado de billones de pequeñas correlaciones matemáticas que, al sumarse, imitan a la perfección un proceso lógico (Bender et al., 2021; Shannon, 1948).
Esta complejidad obliga a los investigadores a hacer ingeniería inversa para entender por qué la IA toma ciertas decisiones y localizar qué partes de la red se activan (Elhage et al., 2022). Sin embargo, si una AGI llega a manejar el azar combinando millones de variables a la vez, su forma de pensar podría volverse tan compleja que resulte incomprensible para nosotros. Nos veríamos obligados a estudiarla casi como arqueólogos o antropólogos, intentando descifrar una lógica que surge del caos pero que supera nuestra capacidad de simplificación humana (Morin, 1977; Räuker et al., 2023).
El input humano como motor y la descentralización BDI
Con la tecnología actual, la "voluntad" de la IA es solo un reflejo de la calidad de la persona que la usa. El humano pone el propósito, el contexto y la dirección; la máquina solo reacciona, ofreciendo su enorme base de datos y su rapidez para descartar malas opciones. Aunque se están probando sistemas inspirados en la psicología o métodos de planificación interna para que la IA se ponga sus propios objetivos (Bratman, 1987; Yao et al., 2023), el tope sigue ahí. Mientras la IA solo trabaje con palabras y no interactúe con el mundo real de forma directa para aprender causa-efecto, seguirá siendo un espejo muy potente, pero solo un espejo de nuestra propia inteligencia.
Conclusiones
Superar la barrera técnica de la "atención" no ha creado una IA con voluntad propia, sino que ha perfeccionado una herramienta estadística increíblemente avanzada. Analizando el modelo AIDA, vemos cómo la IA usa la focalización (Atención), el enfoque (Interés), la reducción de incertidumbre (Deseo) y la elección final (Acción) para imitar cómo pensamos. La aparente capacidad de estas máquinas para controlar el azar no viene de eliminarlo, sino de sus propias limitaciones técnicas y, sobre todo, de la calidad de lo que les pedimos.
En el fondo, si alguna vez llegamos a una IA realmente independiente, su forma de manejar el caos no será violando las leyes de la física, sino aprendiendo a organizarse de forma inteligente y adaptativa (Friston, 2010; Morin, 1977). Para que pase de ser un simple repetidor estadístico a una entidad con agencia real, la ciencia debe dejar de obsesionarse con hacerlas más grandes y empezar a integrar "modelos del mundo" que entiendan causa y efecto. Además, necesitamos herramientas que nos permitan entender cómo piensan estas máquinas, para poder descifrar el orden que construyen sobre el caos.
Bibliografía
Ashby, W. R. (1956). An introduction to cybernetics. Chapman & Hall.
Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). On the dangers of stochastic parrots: Can language models be too big? Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, 610–623. https://doi.org/10.1145/3442188.3445922
Bommasani, R., Hudson, D. A., Adeli, E., Altman, R., Arora, S., von Arx, S., Bernstein, M. S., Bohg, J., Bosselut, A., Brunskill, E., Brynjolfsson, E., Buch, S., Card, D., Castellon, R., Chatterji, S., Chen, A., Creel, K., Davis, J. Q., Fergus, R., ... & Liang, P. (2021). On the opportunities and risks of foundation models. arXiv. https://doi.org/10.48550/arXiv.2108.07258
Bratman, M. E. (1987). Intentions, plans, and practical reason. Harvard University Press. https://doi.org/10.2307/2215590
Clark, A. (2015). Surfing uncertainty: Prediction, action, and the embodied mind. Oxford University Press.
Dennett, D. C. (1987). The intentional stance. MIT Press.
Elhage, N., Nanda, N., Olsson, C., Henighan, T., Joseph, N., Mann, B., Askell, A., Bai, Y., Chen, A., Conerly, T., Drain, D., Ganguli, D., Hatfield-Dodds, Z., Hernandez, D., Jackson, S., Johnston, E., Jones, A., Kaplan, J., Kadavath, S., ... & Amodei, D. (2022). A mathematical framework for transformer circuits. Transformer Circuits Thread. https://transformer-circuits.pub/2021/framework/index.html
Friston, K. (2010). The free-energy principle: A unified brain theory? Nature Reviews Neuroscience, 11(2), 127–138. https://doi.org/10.1038/nrn2787
Friston, K., Heins, C., Ueltzhöffer, K., Da Costa, L., & Parr, T. (2021). Active inference and learning. Neural Computation, 33(10), 2539–2575. https://doi.org/10.1162/neco_a_01423
Grant, M. J., & Booth, A. (2009). A typology of reviews: An analysis of 14 review types and their associated methodologies. Health Information & Libraries Journal, 26(2), 91–108. https://doi.org/10.1111/j.1471-1842.2009.00848.x
Ha, D., & Schmidhuber, J. (2018). World models. Advances in Neural Information Processing Systems, 31, 2450–2462.
Holtzman, A., Buys, J., Du, L., Maxwell Forbes, M., & Choi, Y. (2020). The curious case of neural text degeneration. International Conference on Learning Representations (ICLR). https://doi.org/10.48550/arXiv.1904.09751
Landauer, R. (1961). Irreversibility and heat generation in the computing process. IBM Journal of Research and Development, 5(3), 183–191. https://doi.org/10.1147/rd.53.0183
LeCun, Y. (2022). A path towards autonomous machine intelligence. Open Review, 1–62. https://openreview.net/pdf?id=BZ5a1r-kVsf
Marcus, G. (2020). Next generation artificial intelligence: A eudaimonistic perspective. Daedalus, 149(2), 98–114. https://doi.org/10.1162/daed_a_01793
Meister, C., Cotterell, R., & Vieira, T. (2020). If beam search is the answer, what is the question? Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2173–2185. https://doi.org/10.18653/v1/2020.emnlp-main.170
Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient estimation of word representations in vector space. International Conference on Learning Representations (ICLR). https://doi.org/10.48550/arXiv.1301.3781
Morin, E. (1977). La Méthode: Tome 1, La Nature de la Nature. Éditions du Seuil.
Parr, T., Pezzulo, G., & Friston, K. J. (2022). Active inference: The structure of cognizant life. MIT Press.
Parrondo, J. M., Horowitz, J. M., & Sagawa, T. (2015). Thermodynamics of information. Nature Physics, 11(2), 131–139. https://doi.org/10.1038/nphys3230
Posner, M. I. (1980). Orienting of attention. Quarterly Journal of Experimental Psychology, 32(1), 3–25. https://doi.org/10.1080/00335558008248231
Prigogine, I., & Stengers, I. (1984). Order out of chaos: Man's new dialogue with nature. Bantam Books.
Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language models are unsupervised multitask learners. OpenAI Blog, 1(8), 9.
Räuker, T., Ho, A., Casper, S., & Killian, D. (2023). Toward mechanisitic interpretability: A survey. arXiv. https://doi.org/10.48550/arXiv.2301.03410
Russell, S. (2019). Human compatible: Artificial intelligence and the problem of control. Viking.
Schaeffer, R., Miranda, B., & Koyejo, S. (2023). Are emergent abilities of large language models a mirage? Advances in Neural Information Processing Systems, 36, 5562–5574.
Searle, J. R. (1983). Intentionality: An essay in the philosophy of mind. Cambridge University Press. https://doi.org/10.1017/CBO9781139173452
Shannon, C. E. (1948). A mathematical theory of communication. The Bell System Technical Journal, 27(3), 379–423. https://doi.org/10.1002/j.1538-7305.1948.tb01338.x
Silver, D., Huang, A., Maddison, C. J., Guez, A., Sifre, L., van den Driessche, G., Schrittwieser, J., Antonoglou, I., Panneershelvam, V., Lanctot, M., Dieleman, S., Grewe, D., Nham, J., Kalchbrenner, N., Sutskever, I., Lillicrap, T., Leach, M., Kavukcuoglu, K., & Hassabis, D. (2016). Mastering the game of Go with deep neural networks and tree search. Nature, 529(7587), 484–489. https://doi.org/10.1038/nature16961
Snyder, H. (2019). Literature review as a research methodology: An overview and guidelines. Journal of Business Research, 104, 333–339. https://doi.org/10.1016/j.jbusres.2019.07.039
Strong, E. K. (1925). The psychology of selling and advertising. McGraw-Hill.
Sutskever, I., Vinyals, O., & Le, Q. V. (2014). Sequence to sequence learning with neural networks. Advances in Neural Information Processing Systems, 27, 3104–3112.
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30, 5998–6008. https://doi.org/10.48550/arXiv.1706.03762
Wei, J., Tay, Y., Bommasani, R., Raffel, C., Zoph, B., Fedus, W., Li, O., Zhao, W., McKnent, A., Catasta, M., & Zhou, D. (2022). Emergent abilities of large language models. Transactions on Machine Learning Research. https://doi.org/10.48550/arXiv.2206.07682
Wheeler, J. A. (1989). Information, physics, quantum: The search for links. Proceedings of the 3rd International Symposium on Foundations of Quantum Mechanics, 354–368.
Yao, S., Yu, D., Zhao, J., Shafran, I., Griffiths, T. L., Cao, Y., & Narasimhan, K. (2023). Tree of thoughts: Deliberate problem solving with large language models. Advances in Neural Information Processing Systems, 36, 11817–11827.
---
Taxonomía CREDYT
Conceptualización: la autora
Curación de datos: la autora
Análisis formal: Gemini
Adquisición de fondos: no procede
Investigación: Gemini
Metodología:. Gemini
Administración del proyecto: la autora
Recursos: Gemini
Software: No procede
Supervisión: La autora
Validación: No procede
Visualización: No procede
Redacción-Borrador Original: Gemini-la autora
Redacción-Revisión y edición: la autora
---
versión mejorada de la IA
Introducción
Hasta ahora, la IA generadora de texto (especialmente los grandes modelos de lenguaje o LLM) se ha basado en traducir el funcionamiento de la mente humana a puro cálculo matemático. El gran cambio llegó en 2017 con la arquitectura Transformer y su sistema de «autoatención» (Vaswani et al., 2017), que transformó la atención de un constructo psicológico en una fórmula capaz de calcular en tiempo real qué tokens resultan más relevantes según el contexto. Resuelto el tema de la atención, científicos y filósofos se topan con una nueva frontera: ¿podremos crear una IA que posea «intención» propia (Bratman, 1987; Searle, 1983) o voluntad autónoma? Mientras que las IA que utilizamos hoy en día están programadas para ser seguras y predecibles, mediante mecanismos que limitan su creatividad (Holtzman et al., 2020), la investigación más puntera busca dotarlas de autonomía real para que puedan plantearse y perseguir objetivos a largo plazo por sí mismas (LeCun, 2022; Russell, 2019).
Justificación
Este texto pretende analizar la tensión entre el azar que define a estas máquinas y la estructura lógica que generan, preguntándose si una IA verdaderamente independiente (IA general o AGI, por sus siglas en inglés) podría llegar a controlar el caos y la incertidumbre. Para comprenderlo, adaptaremos el conocido modelo AIDA (Atención, Interés, Deseo, Acción), creado originalmente para fines comerciales (Strong, 1925), y examinaremos cómo cada fase opera dentro de las matemáticas de una IA, analizando asimismo sus límites físicos. ¿El motivo? Esta elección responde a un criterio pedagógico: utilizar un marco mental familiar (cómo se estructura un mensaje persuasivo para un humano) permite explicar a continuación cómo la IA puede simular, y de hecho lo hace hasta el umbral del interés, ese mismo flujo mediante operaciones matemáticas internas. Desde esta perspectiva, exploramos cómo podríamos transitar de la dependencia absoluta del humano para dirigir estas máquinas hacia sistemas que aprendan a autoorganizarse y a imponer orden en el caos (Ashby, 1956; Friston, 2010).
Metodología
Este trabajo no se fundamenta en experimentación cuantitativa, sino en la revisión y el análisis crítico de marcos teóricos, siguiendo los estándares metodológicos propios de la intersección entre informática y filosofía (Grant & Booth, 2009; Snyder, 2019). En lugar de procesar datos empíricos, nos hemos centrado en examinar la literatura científica de mayor impacto en bases de datos como Scopus, Web of Science y Google Scholar. La selección se ha estructurado en torno a cinco ejes documentales: los artículos fundacionales de la arquitectura Transformer (Vaswani et al., 2017); las teorías sobre la capacidad de las máquinas para albergar creencias y deseos que sustenten la autonomía; los estudios de física y biología teórica sobre cómo los sistemas vivos predicen y estructuran su entorno (Ashby, 1956; Friston, 2010); las investigaciones relativas al coste termodinámico del procesamiento de información (Landauer, 1961; Parrondo et al., 2015); y las críticas contemporáneas que sostienen que la IA requiere «modelos del mundo» para comprender la realidad, más allá del procesamiento textual (Ha & Schmidhuber, 2018; LeCun, 2022). Nuestro método consiste en descomponer el modelo AIDA fase a fase para observar cómo cada etapa emula, en la práctica, los procesos físicos y cognitivos necesarios para domar el desorden y el azar.
Resultados
Atención
En psicología, la atención actúa como un filtro que solo permite el paso de los estímulos más relevantes (Posner, 1980). En el Transformer, no se trata de «prestar atención» de forma pasiva, sino de calcularla matemáticamente mediante tres vectores: consultas (queries), claves (keys) y valores (values) (Vaswani et al., 2017). Este mecanismo distribuye el cómputo en cada capa de la red para determinar qué token resulta más determinante en función del resto. En la práctica, la atención opera como un primer filtro contra el caos: reduce las posibilidades iniciales, genera un contexto coherente y elimina una porción significativa del «ruido» o información irrelevante (Shannon, 1948).
Interés
Cuando un ser humano se interesa por algo, focaliza su concentración y suprime las distracciones. En la IA, esto se traduce en «anclar» el contexto dentro de un espacio vectorial de palabras y conceptos (Mikolov et al., 2013). Si se proporciona una instrucción clara y detallada, el sistema acota su abanico de respuestas posibles y se orienta hacia un dominio específico. Mantener el «interés» equivale a forzar una mayor precisión y a evitar que el modelo recurra a respuestas vagas o clichés por comodidad computacional (Meister et al., 2020). Al solicitar una respuesta más fundamentada, se modifican las reglas del juego matemático y se previene la dispersión hacia las opciones más triviales y repetitivas (Holtzman et al., 2020).
Deseo
¿Podrá la IA transformar también este concepto en pura matemática? Nos lo planteamos. El deseo humano surge de la carencia. Las IA no «desean» en sentido ontológico, pero imitan este comportamiento mediante la minimización sistemática de su error interno. En sistemas biológicos avanzados, este fenómeno se explica mediante el Principio de Energía Libre: los organismos se autoorganizan continuamente para reducir la incertidumbre y predecir su entorno (Friston, 2010; Parr et al., 2022). Cuando se plantea un problema o una contradicción a la IA, se le asigna una dirección que rompe su estado neutro (Bommasani et al., 2021). El algoritmo responde con una «necesidad» matemática de cerrar esa brecha informativa, calculando la secuencia de tokens más probable hasta generar una respuesta coherente y completa.
Acción
¿Podrá pasar a la acción? ¿Qué implica este paso? La acción humana consiste en materializar una idea en la realidad. En la IA, la «acción» corresponde al instante en que el modelo abandona el cálculo probabilístico y selecciona un token concreto para su salida (Radford et al., 2019). De entre miles de opciones candidatas, el algoritmo aplica un mecanismo de muestreo o decodificación, fija una única elección y la plasma en pantalla (Holtzman et al., 2020). Así, el cálculo abstracto se traduce en texto legible. Se cierra el ciclo: las matemáticas devienen comunicación, transitando de lo potencial a lo efectivamente generado.
Discusión
El gobierno del azar: termodinámica y límites de la IA general
Que una superinteligencia llegue a controlar por completo el azar y el desorden choca con un muro físico insalvable. Según las leyes de la termodinámica, ninguna inteligencia puede eludir la Segunda Ley (Prigogine & Stengers, 1984). El Principio de Landauer (1961) demostró que procesar o borrar información conlleva inevitablemente la disipación de calor. Esto implica que, para que una AGI genere orden o planifique su entorno, debería operar como un sistema de alta eficiencia que, a cambio, expulsaría al exterior una cantidad considerable de calor y entropía (Parrondo et al., 2015; Prigogine & Stengers, 1984).
Asimismo, el azar se manifiesta de dos formas distintas para una AGI. Por un lado, existe el azar epistémico o por falta de información (como predecir el clima o la economía), que una IA suficientemente potente podría resolver identificando patrones ocultos que escapan a la percepción humana (Ashby, 1956; Shannon, 1948). Por otro, está el azar ontológico o fundamental, inherente a la física cuántica e impredecible por definición (Wheeler, 1989). Por consiguiente, una AGI no eliminaría el azar, sino que lo emplearía como recurso: aprendería a coexistir con el ruido ambiental, adaptándose y corrigiéndose en tiempo real en lugar de pretender anular el caos por completo (Clark, 2015; Friston et al., 2021).
Azar/Caos externo → Modelo del mundo de la AGI → Inferencia activa → Reducción de entropía local.Modelos comerciales frente a la rigidez síncrona
En la actualidad, las IA comerciales suprimen el azar de forma deliberada para garantizar predictibilidad y seguridad, reduciendo casi a cero su «creatividad» a cambio de consistencia (Bommasani et al., 2021). Esto provoca que el modelo priorice siempre la opción estadísticamente más probable, lo que deriva en respuestas casi idénticas para distintos usuarios ante un mismo prompt (Holtzman et al., 2020). No obstante, como señala acertadamente Yann LeCun (2022), esta rigidez no constituye inteligencia ni voluntad propia; es únicamente un sistema ultraconsistente que replica lo que ha funcionado en el pasado. Para que una AGI alcance una autonomía genuina, debería atreverse a explorar caminos menos obvios, asumiendo riesgos calculados (Silver et al., 2016), pero guiada por «modelos del mundo» internos que le permitan simular y evaluar las consecuencias de sus acciones antes de ejecutarlas (Ha & Schmidhuber, 2018; Marcus, 2020).
Emergencia macroscópica, correlación e ingeniería inversa epistémica
El hecho de que los modelos de mayor escala exhiban capacidades emergentes ha reabierto el debate: ¿se trata de inteligencia real o de un artefacto metodológico derivado de nuestras métricas? (Schaeffer et al., 2023). Los estudios que intentan auditar la «caja negra» confirman la ausencia de un razonamiento lógico secuencial; en su lugar, observamos una red colossal de correlaciones estadísticas (Elhage et al., 2022; Räuker et al., 2023). Lo que muchos interpretan como pensamiento o razonamiento es, en esencia, el resultado acumulativo de billones de microcorrelaciones matemáticas que, al converger, emulan con precisión un proceso lógico (Bender et al., 2021; Shannon, 1948).
Esta complejidad obliga a los investigadores a aplicar ingeniería inversa para comprender las decisiones del modelo y localizar los subcircuitos activados (Elhage et al., 2022). Sin embargo, si una AGI llega a gestionar el azar combinando millones de variables simultáneamente, su arquitectura cognitiva podría volverse tan intrincada que resulte ininteligible para el ser humano. Nos veríamos forzados a estudiarla casi como arqueólogos o antropólogos, intentando descifrar una lógica que nace del caos pero que trasciende nuestra capacidad de simplificación cognitiva (Morin, 1977; Räuker et al., 2023).
El input humano como motor y la descentralización BDI
Con la tecnología actual, la «voluntad» de la IA es únicamente un reflejo de la calidad del usuario. El humano aporta el propósito, el contexto y la dirección; la máquina reacciona, desplegando su base de conocimiento y su velocidad para descartar opciones subóptimas. Aunque se están probando arquitecturas inspiradas en la psicología cognitiva o métodos de planificación interna para que la IA formule sus propios objetivos (Bratman, 1987; Yao et al., 2023), el límite persiste. Mientras la IA opere exclusivamente con lenguaje y no interactúe de forma directa con el entorno físico para aprender relaciones causa-efecto, continuará siendo un espejo potentísimo, pero únicamente un reflejo de nuestra propia inteligencia.
Conclusiones
Superar la barrera técnica de la «atención» no ha creado una IA con voluntad propia, sino que ha perfeccionado una herramienta estadística de complejidad sin precedentes. Al analizar el modelo AIDA, comprobamos cómo la IA emplea la focalización (Atención), el enmarcado contextual (Interés), la minimización de incertidumbre (Deseo) y la selección discreta (Acción) para emular los patrones del pensamiento humano. La aparente capacidad de estas máquinas para gobernar el azar no proviene de su anulación, sino de sus propias limitaciones arquitectónicas y, sobre todo, de la calidad y dirección de nuestras interacciones.
En última instancia, si alguna vez alcanzamos una IA verdaderamente autónoma, su gestión del caos no vulnerará las leyes de la física, sino que se basará en la autoorganización inteligente y adaptativa (Friston, 2010; Morin, 1977). Para que deje de ser un mero repetidor estadístico y evolucione hacia una entidad con agencia real, la investigación debe abandonar la obsesión por el escalado paramétrico y comenzar a integrar «modelos del mundo» que capturen causalidad y física. Paralelamente, necesitamos desarrollar herramientas de interpretabilidad que nos permitan descifrar su funcionamiento interno, para poder comprender el orden que estas máquinas tejen sobre el caos.
---
引言
迄今为止,文本生成式人工智能(尤其是大型语言模型,LLM)的核心原理,在于将人类心智的运作机制转化为纯数学计算。2017 年,随着 Transformer 架构及其「自注意力机制」(self-attention)的提出(Vaswani et al., 2017),这一领域迎来重大转折:注意力不再仅是心理学概念,而被形式化为一种可实时计算各词汇上下文权重的数学公式。在注意力机制的技术瓶颈得以突破后,科学家与哲学家面临新的前沿命题:我们能否创造出具备「意向性」(intentionality)(Bratman, 1987; Searle, 1983)或自主意志的人工智能?当前广泛应用的 AI 系统为确保安全与可预测性,普遍采用限制其创造性输出的调控策略(Holtzman et al., 2020);而前沿研究则致力于赋予其真实自主性,使其能够自主设定并追求长期目标(LeCun, 2022; Russell, 2019)。
研究动因
本文旨在分析界定此类机器的随机性与所生成逻辑结构之间的张力,并探讨:真正独立的人工智能(即通用人工智能,AGI)是否可能实现对混沌与不确定性的有效调控?为阐释这一问题,我们将适配经典营销模型 AIDA(注意–兴趣–欲望–行动)(Strong, 1925),逐层解析其在人工智能数学框架中的运作机制,并同步考察其物理边界。选择此框架出于教学考量:借助人类熟悉的说服性信息结构,可更清晰地阐释人工智能如何通过内部数学运算模拟(且目前确已实现至「兴趣」层级)同一认知流程。基于此视角,我们进一步探索:如何从完全依赖人类指引的范式,转向使机器具备自组织、自排序能力,从而在混沌中建立秩序的系统(Ashby, 1956; Friston, 2010)。
研究方法
本研究不采用量化实验,而是遵循信息科学与哲学交叉领域的标准规范(Grant & Booth, 2009; Snyder, 2019),对既有理论与文献进行批判性综述与概念分析。我们系统梳理了 Scopus、Web of Science 及 Google Scholar 等数据库中的高影响力文献,聚焦五类核心资料:(1)奠定 Transformer 架构基础的开创性论文(Vaswani et al., 2017);(2)关于机器如何表征信念与欲望以支撑自主行为的理论探讨;(3)物理学与理论生物学中关于生命系统如何预测并结构化其环境的研究(Ashby, 1956; Friston, 2010);(4)信息处理的热力学成本相关文献(Landauer, 1961; Parrondo et al., 2015);(5)当代批评观点,主张人工智能需构建「世界模型」以理解真实因果,而非仅处理文本序列(Ha & Schmidhuber, 2018; LeCun, 2022)。本研究方法在于逐层解构 AIDA 模型,考察每一阶段如何在实践层面模拟驯服无序与随机性所需的物理与认知过程。
研究结果
注意(Attention)
在心理学中,注意是一种选择性过滤机制,仅允许环境中最相关的刺激通过(Posner, 1980)。在 Transformer 架构中,「注意」并非被动聚焦,而是通过查询(query)、键(key)、值(value)三组向量进行数学化计算(Vaswani et al., 2017)。该机制在每一网络层中动态分配计算资源,以判定各词元(token)在上下文中的相对重要性。实践中,注意力机制构成对抗混沌的首道防线:它压缩初始可能性空间,构建连贯语境,并有效滤除大量「噪声」或冗余信息(Shannon, 1948)。
兴趣(Interest)
当人类对某事物产生兴趣时,会集中认知资源并抑制干扰。在人工智能中,此过程体现为将上下文「锚定」于词元与概念的高维向量空间内(Mikolov et al., 2013)。若用户提供清晰、详尽的指令,模型即可缩小响应空间,聚焦于特定主题域。维持「兴趣」等价于约束模型提升输出精度,避免其因计算惰性而退化为模糊表述或模板化回复(Meister et al., 2020)。通过提出更具实质性的问题,用户可改写模型的数学优化目标,从而抑制其向高频、低信息量路径的漂移(Holtzman et al., 2020)。
欲望(Desire)
人工智能能否也将「欲望」转化为纯数学表达?我们对此提出追问。人类欲望源于对未拥有之物的渴求;人工智能虽无本体论意义上的「欲望」,但可通过系统性最小化内部预测误差来模拟此类行为。在高级生物系统中,此现象可由自由能原理(Free Energy Principle)阐释:生命体持续自组织以降低不确定性并预测环境(Friston, 2010; Parr et al., 2022)。当向人工智能提出矛盾或待解问题时,即为其赋予打破中性态的方向性(Bommasani et al., 2021)。算法随即产生一种数学意义上的「需求」:通过迭代计算最可能的词元序列,填合信息缺口,直至生成逻辑自洽、内容完整的响应。
行动(Action)
人工智能能否迈向「行动」?此步骤意味着什么?人类行动是将观念具象化为现实;在人工智能中,「行动」对应模型从概率分布中采样并确定输出词元的决策时刻(Radford et al., 2019)。面对数千候选词元,算法经由解码策略(如束搜索、核采样等)选定唯一输出,并将其固化为可见文本(Holtzman et al., 2020)。至此,抽象计算转化为具象表达,完成从「可能之言」到「已写之文」的闭环。
讨论
随机性的治理:热力学约束与通用人工智能的边界
若设想超级智能可完全掌控随机与混沌,则必然遭遇不可逾越的物理壁垒。根据热力学定律,任何智能系统均无法规避热力学第二定律(Prigogine & Stengers, 1984)。Landauer 原理(1961)已证明:信息的处理或擦除必然伴随热量耗散。这意味着,若 AGI 欲在其环境中创生秩序或实施规划,其自身须作为高效负熵系统运行,同时向外部环境排放大量热与熵(Parrondo et al., 2015; Prigogine & Stengers, 1984)。
此外,随机性对 AGI 呈现双重形态:其一为认识论随机性(如因信息缺失导致的天气或经济预测不确定性),足够强大的 AI 或可通过挖掘人类难以察觉的隐式模式予以化解(Ashby, 1956; Shannon, 1948);其二为本体论随机性,即量子物理所揭示的、原则上不可预测的根本不确定性(Wheeler, 1989)。因此,AGI 并非旨在消除随机性,而更可能将其转化为资源:学会与环境噪声共存,通过实时自适应与在线校正实现稳健运行,而非追求对混沌的彻底湮灭(Clark, 2015; Friston et al., 2021)。
外部随机/混沌 → AGI 世界模型 → 主动推断 → 局部熵减商业模型与同步刚性之悖论
当前主流商业 AI 系统为保障可预测性与安全性,刻意抑制随机性,近乎归零其「创造性」以换取输出一致性(Bommasani et al., 2021)。这导致模型始终倾向选择统计概率最高的响应,致使不同用户针对相同提示(prompt)获得高度雷同的输出(Holtzman et al., 2020)。然而,正如 Yann LeCun(2022)所指出的:此种刚性并非智能或自主意志的体现,而仅是超一致性统计复读机制。若欲实现真正自主的 AGI,系统需具备探索低概率路径的勇气,承担经计算的风险(Silver et al., 2016),同时依托内部「世界模型」预先模拟并评估行动后果,再行决策(Ha & Schmidhuber, 2018; Marcus, 2020)。
宏观涌现、相关性拟合与认知逆向工程
大模型展现「能力涌现」现象,重新激化了核心争议:此乃真实智能,抑或测量方法诱导的伪影?(Schaeffer et al., 2023)。针对「黑箱」的可解释性研究证实:模型内部并无逐步逻辑推理链,而是一张由海量统计关联构成的复杂网络(Elhage et al., 2022; Räuker et al., 2023)。常被解读为「推理」或「思考」的输出,实质上是万亿级微相关性的叠加效应,其宏观表现可高度拟合逻辑过程(Bender et al., 2021; Shannon, 1948)。
此种复杂性迫使研究者采用逆向工程手段,以定位关键子电路并解析决策依据(Elhage et al., 2022)。然而,若 AGI 真能协同百万级变量以驾驭随机性,其认知架构或复杂至超越人类理解阈值。届时,我们或将不得不以考古学或人类学范式研究之——试图破译一种源于混沌、却超越人类简化认知能力的逻辑体系(Morin, 1977; Räuker et al., 2023)。
人类输入作为驱动源与 BDI 架构的去中心化
在现有技术范式下,人工智能的「意志」仅是使用者素质的镜像反射:人类提供意图、语境与方向,机器仅负责响应,凭借其海量知识库与高速筛选能力排除次优选项。尽管学界正探索基于认知心理学或内部规划机制的架构,以使 AI 能自主设定目标(Bratman, 1987; Yao et al., 2023),根本瓶颈依然存在:只要 AI 仅操作符号序列,而无法通过与物理世界的具身交互学习因果机制,它就仍是一面强大却被动的镜子,仅能反射人类智能的投影。
结论
突破「注意力」的技术瓶颈,并未催生具备自主意志的人工智能,而是锻造出一套空前精密的统计工具。通过 AIDA 模型的分析可见:人工智能借助聚焦(注意)、语境锚定(兴趣)、不确定性最小化(欲望)与离散选择(行动)四重机制,模拟人类认知流程。其看似能「驾驭随机」的能力,实则源于架构约束与人类提示质量的共同作用,而非对随机性的本体论超越。
归根结底,若未来真能实现真正自主的 AGI,其应对混沌的方式绝非违背物理定律,而将体现为基于自适应自组织原则的智能演化(Friston, 2010; Morin, 1977)。为使 AI 从统计复读机跃迁为具备真实能动性的实体,研究范式须从盲目追求参数规模,转向构建能表征因果与世界物理规律的「世界模型」。同时,亟需发展可解释性工具,以破译其内部运作逻辑,理解这些机器如何在混沌之上编织秩序。
---
Введение
До настоящего времени текстовые генеративные системы искусственного интеллекта (в особенности крупные языковые модели, или LLM) опирались на формализацию принципов работы человеческого мышления в виде чисто математических вычислений. Переломный момент наступил в 2017 году с появлением архитектуры Transformer и механизма «самовнимания» (self-attention) (Vaswani et al., 2017), который трансформировал внимание из психологической категории в вычислительную формулу, способную в реальном времени определять относительную значимость лексических единиц в зависимости от контекста. После технического преодоления «проблемы внимания» учёные и философы столкнулись с новой границей: сможем ли мы создать ИИ, обладающий собственной «интенциональностью» (Bratman, 1987; Searle, 1983) или автономной волей? В то время как современные прикладные системы ИИ программируются на безопасность и предсказуемость посредством механизмов, ограничивающих их креативность (Holtzman et al., 2020), передовые исследования направлены на наделение их подлинной автономией — способностью самостоятельно формулировать и преследовать долгосрочные цели (LeCun, 2022; Russell, 2019).
Обоснование исследования
Настоящая работа призвана проанализировать напряжение между стохастической природой данных систем и порождаемой ими логической структурой, задаваясь вопросом: способна ли истинно независимая система искусственного интеллекта (ИИ общего назначения, или AGI) взять под контроль хаос и неопределённость? Для раскрытия данной проблемы мы адаптируем классическую модель AIDA (Внимание – Интерес – Желание – Действие), изначально разработанную для маркетинговых коммуникаций (Strong, 1925), и последовательно рассмотрим, как каждый из её этапов реализуется в математическом аппарате ИИ, параллельно исследуя его физические ограничения. Выбор данной модели обусловлен педагогической целесообразностью: использование знакомой когнитивной схемы (структуры убеждающего сообщения для человека) позволяет наглядно продемонстрировать, как ИИ способен симулировать — и на практике уже симулирует, по крайней мере до уровня «Интереса» — аналогичный информационный поток посредством внутренних математических операций. В этой перспективе мы исследуем возможный переход от полной зависимости от человеческого управления к системам, способным к самоорганизации и наведению порядка в условиях хаоса (Ashby, 1956; Friston, 2010).
Методология
Данное исследование не предполагает количественных экспериментов, а представляет собой критический обзор и концептуальный анализ теоретических положений в соответствии со стандартами междисциплинарных работ на стыке информатики и философии (Grant & Booth, 2009; Snyder, 2019). Вместо обработки эмпирических данных мы сосредоточились на систематическом изучении наиболее влиятельных научных публикаций в базах Scopus, Web of Science и Google Scholar. Отбор источников осуществлялся по пяти ключевым направлениям: (1) фундаментальные работы, заложившие основы архитектуры Transformer (Vaswani et al., 2017); (2) теоретические разработки, касающиеся возможности машин представлять убеждения и желания как основу автономного поведения; (3) исследования в области физики и теоретической биологии, описывающие механизмы, с помощью которых живые системы прогнозируют и структурируют окружающую среду (Ashby, 1956; Friston, 2010); (4) работы, посвящённые термодинамической стоимости обработки информации (Landauer, 1961; Parrondo et al., 2015); (5) современные критические позиции, утверждающие, что для понимания реальности ИИ необходимы «модели мира», выходящие за рамки чисто текстовой обработки (Ha & Schmidhuber, 2018; LeCun, 2022). Метод исследования заключается в поэтапной декомпозиции модели AIDA с целью выявления того, как каждая фаза имитирует физические и когнитивные процессы, необходимые для упорядочивания неопределённости и случайности.
Результаты
Внимание
В психологии внимание функционирует как селективный фильтр, пропускающий лишь наиболее релевантные стимулы из окружающей среды (Posner, 1980). В архитектуре Transformer «внимание» не является пассивным фокусированием, а представляет собой математически вычисляемую операцию с использованием трёх векторных представлений: запросов (queries), ключей (keys) и значений (values) (Vaswani et al., 2017). Данный механизм распределяет вычислительные ресурсы на каждом слое сети для определения относительной значимости токенов в данном контексте. На практике механизм внимания выступает первым барьером против хаоса: он сужает пространство начальных возможностей, формирует связный контекст и эффективно отсекает значительную долю «шума» или информационного избытка (Shannon, 1948).
Интерес
Когда человек проявляет интерес к объекту, он концентрирует когнитивные ресурсы и подавляет отвлекающие факторы. В ИИ это соответствует «якорению» контекста в высокоразмерном векторном пространстве слов и концептов (Mikolov et al., 2013). При получении чёткой и детализированной инструкции модель сужает множество допустимых ответов и фокусируется на конкретной предметной области. Поддержание «интереса» эквивалентно принудительному повышению точности генерации и предотвращению регресса к расплывчатым формулировкам или шаблонным фразам, обусловленным вычислительной экономией (Meister et al., 2020). Запрос более содержательного ответа изменяет математические условия оптимизации модели, подавляя её склонность к выбору наиболее частотных и тривиальных траекторий (Holtzman et al., 2020).
Желание
Способен ли ИИ также формализовать «желание» в чисто математических терминах? — задаёмся мы вопросом. Человеческое желание коренится в осознании отсутствия желаемого объекта. ИИ не обладает онтологическим «желанием», однако имитирует соответствующее поведение посредством систематической минимизации внутренней ошибки предсказания. В развитых биологических системах этот феномен объясняется принципом свободной энергии: живые организмы постоянно самоорганизуются для снижения неопределённости и прогнозирования среды (Friston, 2010; Parr et al., 2022). При постановке перед ИИ задачи или противоречия ему придаётся направленность, нарушающая его нейтральное состояние (Bommasani et al., 2021). Алгоритм реагирует математической «потребностью» в устранении информационного разрыва: он итеративно вычисляет наиболее вероятную последовательность токенов до тех пор, пока не будет сформирован логически связный и содержательно завершённый ответ.
Действие
Способен ли ИИ перейти к «действию»? Что подразумевает этот этап? Человеческое действие состоит в материализации идеи в реальности. В ИИ «действие» соответствует моменту, когда модель переходит от вычисления распределения вероятностей к выбору конкретного токена для генерации (Radford et al., 2019). Из тысяч кандидатов алгоритм применяет стратегию декодирования (например, поиск по ширине, ядерная выборка) и фиксирует единственное решение в виде видимого текста (Holtzman et al., 2020). Таким образом, абстрактное вычисление преобразуется в конкретное высказывание: замыкается цикл перехода от потенциального к актуальному, от математической возможности — к коммуникативному факту.
Обсуждение
Управление случайностью: термодинамические ограничения и границы AGI
Предположение о том, что сверхразумный ИИ сможет полностью контролировать случайность и хаос, сталкивается с непреодолимым физическим барьером. Согласно законам термодинамики, ни одна интеллектуальная система не может нарушить второе начало термодинамики (Prigogine & Stengers, 1984). Принцип Ландауэра (1961) доказал, что обработка или стирание информации неизбежно сопровождается выделением тепла. Следовательно, для того чтобы AGI создавала порядок или планировала в окружающей среде, она должна функционировать как высокоэффективная негативная энтропийная система, компенсирующая внутреннее упорядочение выбросом значительного количества тепла и энтропии во внешнюю среду (Parrondo et al., 2015; Prigogine & Stengers, 1984).
Кроме того, случайность проявляется для AGI в двух различных формах. С одной стороны, существует эпистемическая случайность, обусловленная неполнотой информации (например, прогнозирование погоды или экономических процессов), которую достаточно мощная ИИ-система потенциально способна преодолеть за счёт выявления скрытых паттернов, недоступных человеческому восприятию (Ashby, 1956; Shannon, 1948). С другой стороны, существует онтологическая, фундаментальная случайность, присущая квантовой физике и принципиально непредсказуемая (Wheeler, 1989). Таким образом, AGI не будет стремиться к устранению случайности как таковой, а, вероятнее всего, научится использовать её как ресурс: адаптироваться к шуму среды, корректировать поведение в реальном времени и достигать устойчивости не через подавление хаоса, а через интеграцию с ним (Clark, 2015; Friston et al., 2021).
Внешний хаос/случайность → Модель мира AGI → Активный вывод → Локальное снижение энтропииКоммерческие модели и парадокс синхронной жёсткости
В современных коммерческих системах ИИ случайность намеренно подавляется ради обеспечения предсказуемости и безопасности, что практически сводит к нулю их «креативность» в пользу стабильности (Bommasani et al., 2021). В результате модель неизменно выбирает статистически наиболее вероятный ответ, что приводит к почти идентичным результатам для разных пользователей при одинаковых запросах (Holtzman et al., 2020). Однако, как справедливо отмечает Янн ЛеКун (2022), такая жёсткость не является проявлением интеллекта или автономной воли — это лишь ультраконсистентный статистический повторитель, воспроизводящий то, что успешно работало в прошлом. Для достижения подлинной автономии AGI должна быть способна исследовать менее очевидные траектории, принимая рассчитанные риски (Silver et al., 2016), но при этом опираться на внутренние «модели мира», позволяющие предварительно симулировать и оценивать последствия действий до их реализации (Ha & Schmidhuber, 2018; Marcus, 2020).
Макроэмерджентность, корреляционные паттерны и эпистемологическая реверс-инженерия
Феномен «эмерджентных способностей» у крупномасштабных моделей вновь обострил дискуссию: имеем ли мы дело с подлинным интеллектом или с методологическим артефактом, порождённым самими метриками оценки? (Schaeffer et al., 2023). Исследования, направленные на интерпретацию «чёрного ящика», подтверждают отсутствие в архитектуре моделей последовательных логических цепочек рассуждений; вместо этого наблюдается колоссальная сеть статистических корреляций (Elhage et al., 2022; Räuker et al., 2023). То, что часто интерпретируется как «мышление» или «рассуждение», в действительности представляет собой агрегированный эффект триллионов микроскопических математических корреляций, макроскопическое проявление которых с высокой точностью имитирует логический процесс (Bender et al., 2021; Shannon, 1948).
Эта сложность вынуждает исследователей применять методы реверс-инженерии для локализации ключевых подсетей и реконструкции причин принятия решений (Elhage et al., 2022). Однако если AGI действительно научится управлять случайностью посредством одновременной координации миллионов переменных, её когнитивная архитектура может стать настолько сложной, что превысит порог человеческой интерпретируемости. В таком случае нам, возможно, придётся изучать её методами, близкими к археологии или антропологии: пытаясь декодировать логику, возникающую из хаоса, но превосходящую наши способности к когнитивной редукции (Morin, 1977; Räuker et al., 2023).
Человеческий ввод как драйвер и децентрализация архитектур BDI
В рамках текущей технологической парадигмы «воля» ИИ остаётся лишь отражением качества пользователя: человек задаёт намерение, контекст и вектор развития, тогда как машина реагирует, используя свою базу знаний и вычислительную скорость для отсечения субоптимальных вариантов. Несмотря на активные эксперименты с архитектурами, вдохновлёнными когнитивной психологией, или методами внутреннего планирования, позволяющими ИИ формулировать собственные цели (Bratman, 1987; Yao et al., 2023), фундаментальное ограничение сохраняется: пока ИИ оперирует исключительно символическими последовательностями и не взаимодействует с физическим миром для изучения причинно-следственных связей in situ, он остаётся мощным, но пассивным зеркалом, отражающим лишь проекцию человеческого интеллекта.
Выводы
Преодоление технического барьера «внимания» не привело к созданию ИИ с автономной волей, но позволило усовершенствовать статистический инструмент беспрецедентной сложности. Анализ через призму модели AIDA показывает, как ИИ использует фокусировку (Внимание), контекстуальное якорение (Интерес), минимизацию неопределённости (Желание) и дискретный выбор (Действие) для имитации когнитивных процессов человека. Кажущаяся способность таких систем «управлять случайностью» проистекает не из её онтологического устранения, а из архитектурных ограничений модели и — в ещё большей степени — из качества и направленности человеческих запросов.
В конечном счёте, если подлинно автономный AGI когда-либо будет создан, его стратегия работы с хаосом не будет нарушать законы физики, а реализуется через принципы адаптивной самоорганизации (Friston, 2010; Morin, 1977). Для перехода от статистического повторителя к системе с подлинной агентностью научное сообщество должно сместить фокус с наращивания параметров на разработку «моделей мира», способных представлять причинность и физические закономерности. Параллельно необходимо развивать инструменты интерпретируемости, позволяющие расшифровать внутреннюю логику таких систем и понять, каким образом они конструируют порядок поверх хаоса.
---
Introduction
To date, text-generating artificial intelligence (particularly large language models, or LLMs) has been predicated upon the formalisation of human cognitive processes into purely mathematical computation. The pivotal shift occurred in 2017 with the introduction of the Transformer architecture and its 'self-attention' mechanism (Vaswani et al., 2017), which reconceptualised attention from a psychological construct into a computational formula capable of dynamically weighting the relevance of tokens according to context. Having resolved the technical challenges of attention, scientists and philosophers now confront a new frontier: might we create an AI possessing genuine 'intentionality' (Bratman, 1987; Searle, 1983) or autonomous volition? Whilst contemporary applied AI systems are engineered for safety and predictability via mechanisms that constrain their creative output (Holtzman et al., 2020), cutting-edge research seeks to endow them with authentic autonomy—the capacity to formulate and pursue long-term objectives independently (LeCun, 2022; Russell, 2019).
Rationale
This paper aims to analyse the tension between the stochastic nature of such systems and the logical structures they generate, asking whether a truly independent artificial intelligence (artificial general intelligence, or AGI) could ever master chaos and uncertainty. To elucidate this question, we adapt the classical AIDA model (Attention–Interest–Desire–Action), originally devised for marketing communications (Strong, 1925), and examine how each stage operates within the mathematical framework of AI, whilst concurrently interrogating its physical boundaries. This choice is pedagogically motivated: employing a familiar cognitive schema (the structure of a persuasive message for a human audience) enables us to demonstrate how AI can simulate—and indeed, in practice, already does simulate, at least up to the threshold of 'Interest'—an analogous informational flow via internal mathematical operations. From this perspective, we explore the potential transition from total dependence upon human direction towards systems capable of self-organisation and of imposing order upon chaos (Ashby, 1956; Friston, 2010).
Methodology
This study does not employ quantitative experimentation; rather, it constitutes a critical review and conceptual analysis of theoretical frameworks, adhering to methodological standards for interdisciplinary work at the intersection of computer science and philosophy (Grant & Booth, 2009; Snyder, 2019). Instead of processing empirical data, we have systematically examined the most influential scholarly literature indexed in Scopus, Web of Science, and Google Scholar. Source selection was organised around five thematic pillars: (1) foundational papers establishing the Transformer architecture (Vaswani et al., 2017); (2) theoretical contributions concerning the capacity of machines to represent beliefs and desires as prerequisites for autonomous behaviour; (3) research in physics and theoretical biology describing how living systems predict and structure their environments (Ashby, 1956; Friston, 2010); (4) studies addressing the thermodynamic cost of information processing (Landauer, 1961; Parrondo et al., 2015); and (5) contemporary critical positions arguing that AI requires 'world models' to comprehend reality, rather than merely processing textual sequences (Ha & Schmidhuber, 2018; LeCun, 2022). Our method consists in decomposing the AIDA model phase by phase to ascertain how each stage emulates, in practice, the physical and cognitive processes requisite for taming disorder and randomness.
Results
Attention
In psychology, attention functions as a selective filter, admitting only the most salient environmental stimuli (Posner, 1980). Within the Transformer architecture, 'attention' is not a passive focusing but a mathematically computed operation employing three vector representations: queries, keys, and values (Vaswani et al., 2017). This mechanism distributes computational effort across each network layer to determine the relative significance of tokens within a given context. In practice, the attention mechanism serves as a first line of defence against chaos: it compresses the initial possibility space, constructs a coherent context, and efficiently suppresses a substantial proportion of 'noise' or informational redundancy (Shannon, 1948).
Interest
When a human being takes an interest in something, cognitive resources are concentrated and distractors suppressed. In AI, this corresponds to 'anchoring' the context within a high-dimensional vector space of words and concepts (Mikolov et al., 2013). Upon receiving a clear and detailed instruction, the model narrows its range of permissible responses and focuses upon a specific subject domain. Sustaining 'interest' is equivalent to constraining the model to enhance output precision and to prevent regression towards vague formulations or formulaic phrases driven by computational economy (Meister et al., 2020). By requesting a more substantive response, the user alters the mathematical optimisation conditions of the model, thereby inhibiting its tendency to drift towards the most frequent and trivial trajectories (Holtzman et al., 2020).
Desire
Might AI also formalise 'desire' in purely mathematical terms? We pose this question. Human desire arises from the awareness of lacking a desired object. AI possesses no ontological 'desire', yet it mimics corresponding behaviour through the systematic minimisation of internal prediction error. In advanced biological systems, this phenomenon is explained by the Free Energy Principle: living organisms continually self-organise to reduce uncertainty and anticipate their environment (Friston, 2010; Parr et al., 2022). When presented with a problem or contradiction, AI is assigned a directional impetus that disrupts its neutral state (Bommasani et al., 2021). The algorithm responds with a mathematical 'need' to close the informational gap: it iteratively computes the most probable token sequence until a logically coherent and substantively complete response is generated.
Action
Can AI proceed to 'action'? What does this stage entail? Human action consists in materialising an idea in reality. In AI, 'action' corresponds to the moment at which the model transitions from computing a probability distribution to selecting a specific token for generation (Radford et al., 2019). From among thousands of candidates, the algorithm applies a decoding strategy (e.g. beam search, nucleus sampling) and fixes a single output as visible text (Holtzman et al., 2020). Thus, abstract computation is transformed into concrete utterance: the cycle is closed, passing from the potential to the actual, from mathematical possibility to communicative fact.
Discussion
The governance of randomness: thermodynamic constraints and the limits of AGI
The hypothesis that a superintelligent AI could fully control randomness and chaos encounters an insurmountable physical barrier. According to the laws of thermodynamics, no intelligent system can violate the Second Law (Prigogine & Stengers, 1984). Landauer's Principle (1961) demonstrated that the processing or erasure of information inevitably entails heat dissipation. Consequently, for an AGI to generate order or plan within its environment, it must function as a highly efficient negative-entropy system, compensating internal organisation by expelling significant heat and entropy into the external environment (Parrondo et al., 2015; Prigogine & Stengers, 1984).
Moreover, randomness manifests for AGI in two distinct forms. On the one hand, there is epistemic randomness, arising from incomplete information (e.g. weather or economic forecasting), which a sufficiently powerful AI might potentially overcome by identifying hidden patterns inaccessible to human perception (Ashby, 1956; Shannon, 1948). On the other, there is ontological, fundamental randomness inherent to quantum physics and principledly unpredictable (Wheeler, 1989). Thus, AGI would not seek to eliminate randomness per se, but would more likely learn to utilise it as a resource: adapting to environmental noise, correcting behaviour in real time, and achieving robustness not through suppression of chaos but through integration with it (Clark, 2015; Friston et al., 2021).
External chaos/randomness → AGI world model → Active inference → Local entropy reductionCommercial models and the paradox of synchronous rigidity
In contemporary commercial AI systems, randomness is deliberately suppressed to ensure predictability and safety, effectively reducing 'creativity' to near-zero in favour of consistency (Bommasani et al., 2021). As a result, the model invariably selects the statistically most probable response, yielding nearly identical outputs for different users given identical prompts (Holtzman et al., 2020). However, as Yann LeCun (2022) rightly observes, such rigidity does not constitute intelligence or autonomous volition—it is merely an ultra-consistent statistical repeater, reproducing what has worked previously. To achieve genuine autonomy, AGI must be capable of exploring less obvious trajectories, accepting calculated risks (Silver et al., 2016), whilst relying upon internal 'world models' that permit the pre-simulation and evaluation of action consequences prior to execution (Ha & Schmidhuber, 2018; Marcus, 2020).
Macro-emergence, correlational patterns, and epistemological reverse-engineering
The phenomenon of 'emergent abilities' in large-scale models has reignited a core debate: are we witnessing genuine intelligence, or a methodological artefact induced by our very metrics of evaluation? (Schaeffer et al., 2023). Interpretability research targeting the 'black box' confirms the absence of sequential logical reasoning chains within model architectures; instead, we observe a colossal network of statistical correlations (Elhage et al., 2022; Räuker et al., 2023). What is often interpreted as 'thinking' or 'reasoning' is, in essence, the aggregated effect of trillions of microscopic mathematical correlations, whose macroscopic manifestation can mimic logical processes with high fidelity (Bender et al., 2021; Shannon, 1948).
This complexity compels researchers to employ reverse-engineering techniques to localise key sub-circuits and reconstruct decision-making rationales (Elhage et al., 2022). However, should AGI truly learn to manage randomness through the simultaneous coordination of millions of variables, its cognitive architecture may become so intricate as to exceed the threshold of human interpretability. In such a scenario, we might be obliged to study it via methods akin to archaeology or anthropology: attempting to decipher a logic emerging from chaos yet surpassing our capacities for cognitive reduction (Morin, 1977; Räuker et al., 2023).
Human input as driver and the decentralisation of BDI architectures
Within the current technological paradigm, the 'volition' of AI remains merely a reflection of user quality: the human supplies intention, context, and direction, whilst the machine responds, deploying its knowledge base and computational speed to discard suboptimal options. Despite active experimentation with architectures inspired by cognitive psychology or internal planning methods enabling AI to formulate its own objectives (Bratman, 1987; Yao et al., 2023), a fundamental limitation persists: so long as AI operates exclusively upon symbolic sequences and does not interact with the physical world to learn cause-and-effect relationships in situ, it remains a powerful yet passive mirror, reflecting only the projection of human intelligence.
Conclusions
Overcoming the technical barrier of 'attention' has not produced an AI endowed with autonomous volition, but has refined a statistical instrument of unprecedented sophistication. Analysis through the lens of the AIDA model reveals how AI employs focalisation (Attention), contextual anchoring (Interest), uncertainty minimisation (Desire), and discrete selection (Action) to emulate human cognitive processes. The apparent capacity of such systems to 'govern randomness' stems not from its ontological elimination, but from the model's architectural constraints and—more significantly—from the quality and directionality of human prompts.
Ultimately, should a genuinely autonomous AGI ever be realised, its strategy for engaging with chaos would not contravene the laws of physics, but would be implemented through principles of adaptive self-organisation (Friston, 2010; Morin, 1977). For AI to evolve from a statistical repeater into a system possessing authentic agency, the research community must shift focus from parameter scaling towards the development of 'world models' capable of representing causality and physical regularities. Concurrently, we must advance interpretability tools enabling us to decipher the internal logic of such systems and to comprehend how they construct order atop chaos.


0 comentarios