

Cuando Elon Musk anunció Grokipedia, el mensaje era claro: un nuevo modelo de enciclopedia, más libre, más transparente y más comprometida con la verdad que la Wikipedia “sesgada” que tanto criticaba. La presentación tuvo el tono épico y desafiante al que Musk acostumbra y, durante unas horas, dio la sensación de que Internet estaba ante un punto de inflexión. Una enciclopedia generada por IA, conectada a X y sin los supuestos “filtros ideológicos” que, según él, condicionan al proyecto fundacional de conocimiento colectivo.
Pero ahora que existen datos, la historia real es muy distinta.
Un análisis exhaustivo realizado por los investigadores Harold Triedman y Alexios Mantzarlis, de Cornell Tech, ha permitido rastrear prácticamente el 100% del contenido inicial de Grokipedia. El estudio es extremadamente técnico, combina análisis semántico avanzado con comparaciones estructurales y revisiones de las fuentes citadas, y sus conclusiones contradicen de forma frontal la narrativa oficial del proyecto. El estudio representa la primera revisión a fondo de los más de 880.000 artículos de Grokipedia y sostiene que, en ciertos ámbitos, la plataforma de Musk recurre a fuentes con sesgos raciales explícitos, presentándolas como si fueran referencias fiables. Y lo que emerge no es la alternativa que Musk prometió, sino un producto profundamente dependiente de Wikipedia, con cambios estratégicos en los temas más sensibles y un ecosistema de fuentes muy inferior al estándar de calidad que la comunidad digital considera aceptable.
La primera gran sorpresa es la dependencia masiva de Wikipedia. Más de la mitad de los artículos de Grokipedia —concretamente el 56%— incorporan la licencia Creative Commons que obliga a reconocer la autoría de los editores originales. La cifra sería simplemente un dato administrativo si no fuera por el nivel de similitud observado: alrededor del 90% en los textos licenciados. Esto implica que Grokipedia, pese a su ambición fundacional, consiste en gran medida en una copia estilizada del trabajo acumulado durante dos décadas por voluntarios de Wikipedia.
La otra mitad del corpus, la que no incluye licencia CC, tampoco se aleja demasiado. La similitud media en esos artículos es del 77%. No se puede hablar de copia literal, pero sí de un uso intensivo del contenido original como base sobre la cual la IA genera nuevas versiones. Esta estrategia crea una paradoja: la enciclopedia que pretende superar a Wikipedia se sostiene precisamente sobre ella.
La segunda gran cuestión es la longitud. Los artículos de Grokipedia son mucho más extensos que los de Wikipedia. Añaden explicaciones, descripciones adicionales, interpretaciones complementarias y, sobre todo, enormes bloques de bibliografía. El efecto superficial puede resultar atractivo: más información, más contexto, más profundidad. Pero es en este punto donde surge el principal problema técnico del proyecto. Cuantas más citas incorpora, más se expone la calidad real de las fuentes. Y el análisis revela un deterioro evidente.
Triedman y Mantzarlis detectan un incremento del 86% en el uso de fuentes que Wikipedia clasifica como poco fiables. También identifican un aumento del 275% en la presencia de fuentes catalogadas como directamente prohibidas. El salto cualitativo no es menor. Entre esas páginas se encuentran portales conspirativos, sitios pseudocientíficos y webs asociadas históricamente a discursos extremistas. El caso más llamativo es la aparición de docenas de citas a Stormfront, un foro neonazi fundado por un antiguo dirigente del Ku Klux Klan, y a Infowars, una referencia recurrente de la desinformación estadounidense. Ninguno de estos dominios aparece citado en Wikipedia.
La estructura de fuentes no muestra un patrón aleatorio. Al revisar los artículos donde más se aleja Grokipedia del original, el informe encuentra que sus modificaciones afectan sobre todo a temas políticos, conflictos internacionales, cuestiones sociales, biografías de figuras públicas y debates culturales. En estos ámbitos, la enciclopedia de Musk introduce cambios narrativos, reorganiza prioridades y enfatiza polémicas que en Wikipedia aparecen en secciones más contextualizadas o directamente no aparecen.
Las biografías de políticos son un ejemplo revelador. En muchos casos, la introducción de los artículos destaca controversias antes que trayectoria o datos verificables. En el caso de responsables públicos británicos y estadounidenses, Grokipedia tiende a resaltar episodios polémicos, críticas mediáticas o declaraciones controvertidas. No se inventa información, pero sí modifica el orden y la relevancia de los elementos, creando un nuevo marco interpretativo.
Los artículos etiquetados como controvertidos por la propia Wikipedia muestran una divergencia aún mayor. La similitud cae hasta el 73%, un descenso significativo respecto al resto del corpus. Además, casi todos estos textos carecen de licencia CC, lo que indica que la IA los reescribe sin apoyarse estructuralmente en el original. En esos casos también se dispara la presencia de fuentes problemáticas. Más del 85% incluye al menos una fuente considerada poco fiable y casi uno de cada cuatro incorpora referencias provenientes de sitios que la comunidad de editores considera peligrosos o inapropiados para sustentar datos enciclopédicos.
Uno de los descubrimientos más sorprendentes del estudio es la autocitación algorítmica. Grokipedia no solo cita páginas externas, sino también conversaciones generadas por el propio chatbot Grok en X. En la práctica, crea una situación donde una IA cita a otra IA para validar su propio contenido. El análisis identifica más de mil referencias a enlaces de conversaciones entre usuarios y Grok en X, muchos de ellos destinados a justificar afirmaciones recogidas después en entradas enciclopédicas. Este mecanismo cierra un círculo que plantea nuevos dilemas: si la IA se alimenta de sí misma, el riesgo de amplificar errores, sesgos o especulaciones sin control se multiplica.
La pregunta central del estudio era determinar si Grokipedia es un simple derivado sintético de Wikipedia o un proyecto ideológico con ambición de modificar el conocimiento público. La respuesta no es sencilla, pero sí clara: es ambas cosas. Por un lado, depende masivamente del trabajo previo de Wikipedia; por otro, interviene de forma activa en los temas que más impacto tienen en la conversación global. Su tamaño, su tono más expansivo y la inclusión de fuentes de baja calidad la convierten en una enciclopedia más ruidosa, más narrativa y más vulnerable a sesgos.
La conclusión es clara
El estudio concluye con una idea que resume la magnitud del cambio: Grokipedia es, al mismo tiempo, un derivado masivo de Wikipedia y un proyecto ideológico.
Lo primero explica su similitud estructural. Lo segundo explica por qué las diferencias aparecen siempre en los mismos lugares: política, sociedad, historia, medios de comunicación, biografías, conflictos internacionales.
Wikipedia tiene políticas estrictas: punto de vista neutral, prohibición de investigación original, control de fuentes, jerarquía editorial, supervisión colaborativa. Grokipedia prescinde de todo esto. Esa libertad creativa, unida a su dependencia de Wikipedia, genera un híbrido extraño: una enciclopedia que parece la misma, pero que respira distinto.
El resultado es un repositorio más largo, más expansivo y más ruidoso, donde la frontera entre información y opinión pierde consistencia. Una máquina narrativa que convierte las zonas grises en afirmaciones más categóricas y que amplifica voces que la comunidad científica y periodística considera inaceptables.
Tal vez esa sea la auténtica innovación de Grokipedia: no cómo escribe, sino por qué escribe distinto.