La relación entre Internet y los usuarios está experimentando una transformación significativa gracias a la inteligencia artificial (IA). Este cambio se ha visto reflejado en tensiones recientes entre creadores de contenido y grandes empresas que utilizan sus datos para entrenar modelos de IA. Un ejemplo notable de esta dinámica es el desafío planteado por Elon Musk, quien ha propuesto una alternativa a Wikipedia llamada Grokipedia. En respuesta, los responsables de Wikipedia han anunciado el Proyecto de Integración de Wikidata, una nueva base de datos diseñada para facilitar el acceso a la información de Wikipedia para los modelos de IA.
Wikimedia Alemania, la entidad que supervisa la división Wikidata de Wikimedia, ha desarrollado esta base de datos optimizada específicamente para modelos de inteligencia artificial. Según TechCrunch, este proyecto ha convertido 30 millones de entradas de Wikidata en vectores que capturan el contexto y el significado de cada entrada. Este sistema, conocido como Wikidata Embedding Project, utiliza una búsqueda semántica basada en vectores, lo que permite a los modelos de IA comprender mejor las relaciones entre palabras y su significado.
Es importante destacar que, desde la perspectiva del usuario, Wikipedia no experimentará cambios significativos. Los responsables de Wikidata han enfatizado que la plataforma no se convertirá en una IA ni en un chatbot similar a ChatGPT. Sin embargo, el backend de Wikipedia se volverá más accesible para laboratorios y desarrolladores de inteligencia artificial, facilitando la creación de herramientas que utilicen los datos almacenados en esta nueva base.
El equipo detrás del proyecto ha utilizado un modelo de la firma de IA Jina AI para convertir datos estructurados de Wikidata en vectores. DataStax se encargará de la infraestructura necesaria para almacenar esta base de datos vectorial. Además, se implementará un nuevo soporte para el Protocolo de Contexto de Modelo (MCP), que facilitará la comunicación entre sistemas de IA y fuentes de datos. Esto permitirá que las consultas en lenguaje natural sean más accesibles, superando las limitaciones de las búsquedas por palabras clave y consultas SPARQL.
El nuevo sistema promete un mejor rendimiento con sistemas de recuperación-generación aumentada (RAG), que combinan un modelo de recuperación de información con un modelo de generación. Esto permitirá a los desarrolladores basar sus modelos de lenguaje en conocimiento verificado por editores de Wikipedia, lo que a su vez enriquecerá la calidad de la información disponible.
Con estas innovaciones, los responsables de Wikidata esperan que los sistemas de inteligencia artificial modernos puedan reflejar mejor ciertos temas que, de otro modo, no tendrían suficiente representación en Internet. A medida que la precisión y sofisticación de los modelos de IA aumentan, se hace evidente la necesidad de fuentes de datos de alta calidad. Las empresas de IA más pequeñas, que a menudo carecen de los recursos de gigantes como OpenAI o Anthropic, se beneficiarán de este acceso mejorado a datos optimizados.
Lydia Pintscher, responsable de porfolio de Wikidata, ha expresado esta filosofía en una entrevista con The Verge, señalando que el objetivo es proporcionar a los desarrolladores más pequeños una ventaja y una oportunidad en el competitivo campo de la inteligencia artificial. Este proyecto busca, en última instancia, crear un entorno más equitativo para aquellos que no están bajo el paraguas de las grandes corporaciones en la carrera por la inteligencia artificial general (AGI).
¿NO ES IRÓNICO QUE, MIENTRAS SE BUSCA IGUALAR OPORTUNIDADES EN LA IA, SE SIGA DEPENDIENDO DE GRANDES NOMBRES COMO ELON MUSK PARA IMPULSAR EL CAMBIO?
—
«`
APARECEN EN EL ARTÍCULO ORIGINAL:
DataStax
Elon Musk
Jina AI
Lydia Pintscher
TechCrunch
Wikimedia Alemania
Wikidata
«`
Fuente: El Español | URL: Ver noticia original









