De la fuente de datos al análisis inteligente: Análisis del desarrollo de la pista de indexación de datos Web3
1. Introducción
Desde que aparecieron las primeras aplicaciones descentralizadas en 2017, el ecosistema de blockchain ha prosperado, y una variedad de dApps han surgido como hongos después de la lluvia. Al discutir estas aplicaciones descentralizadas, ¿alguna vez hemos pensado en las fuentes de datos de las que dependen?
En 2024, la inteligencia artificial y Web3 se convierten en temas candentes. En el campo de la IA, los datos son como la fuente de vida, impulsando la constante evolución de los sistemas inteligentes. Así como las plantas necesitan luz solar y agua, los sistemas de IA también dependen de grandes cantidades de datos para aprender y pensar. Sin el apoyo de datos, incluso los algoritmos de IA más avanzados tienen dificultades para alcanzar su potencial.
Este artículo explorará en profundidad la evolución de la accesibilidad de los datos en blockchain, comparando las similitudes y diferencias entre los protocolos tradicionales de indexación de datos y los nuevos servicios de datos en blockchain, con un enfoque especial en la innovación de los nuevos protocolos que combinan la tecnología de IA en la arquitectura de servicios y productos de datos.
2. La evolución del índice de datos: de nodos de blockchain a base de datos de cadena completa
2.1 Fuente de datos: nodo de blockchain
La blockchain se conoce como un libro de contabilidad descentralizado, y los nodos de la blockchain son la piedra angular de esta red, responsables de registrar, almacenar y difundir datos de transacciones en la cadena. Cada nodo guarda una copia completa de los datos de la blockchain, asegurando la característica de descentralización de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo no solo tiene un alto umbral técnico, sino que también requiere asumir costos costosos de hardware y ancho de banda. Además, la capacidad de consulta de los nodos comunes es limitada, lo que dificulta satisfacer las necesidades de los desarrolladores. Por lo tanto, aunque en teoría cualquier persona puede ejecutar un nodo, en la práctica, los usuarios tienden a confiar más en servicios de terceros.
Para resolver este problema, surgieron los proveedores de nodos RPC. Ellos asumen los costos de gestión de nodos y ofrecen servicios de acceso a datos a través de puntos finales RPC. Los puntos finales RPC públicos son gratuitos pero tienen límites de tasa, lo que puede afectar la experiencia del usuario de las dApps. Los puntos finales RPC privados tienen un mejor rendimiento, pero no son muy eficientes para consultas complejas y son difíciles de escalar a través de redes. A pesar de esto, las interfaces API estandarizadas de los proveedores de nodos reducen la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para la posterior解析 de datos y aplicaciones.
2.2 Análisis de datos: de datos en bruto a información utilizable
Los datos originales proporcionados por los nodos de blockchain a menudo son procesados mediante cifrado y codificación, lo que, aunque garantiza la integridad y seguridad de los datos, también aumenta la dificultad de análisis. Para los usuarios comunes y los desarrolladores, manejar estos datos directamente requiere una gran cantidad de conocimientos técnicos y recursos computacionales.
El proceso de análisis de datos se vuelve especialmente importante en este contexto. Al convertir datos crudos complejos en un formato fácil de entender y operar, los usuarios pueden aprovechar esta información de manera más intuitiva. La calidad del análisis afecta directamente la eficiencia y efectividad de las aplicaciones de datos en blockchain, siendo un eslabón clave en todo el proceso de indexación de datos.
2.3 Desarrollo del indexador de datos
Con el aumento exponencial de la cantidad de datos en blockchain, la demanda de indexadores se ha vuelto cada vez más evidente. Los indexadores son responsables de organizar los datos en la cadena y de importarlos a una base de datos para su consulta. Indexan los datos de la blockchain y proporcionan interfaces API con lenguajes de consulta tipo SQL como GraphQL (, haciendo que los datos estén disponibles en todo momento. Los indexadores ofrecen a los desarrolladores una interfaz de consulta unificada, simplificando enormemente el proceso de recuperación de datos.
Diferentes tipos de indexadores tienen sus ventajas:
Indexador de nodo completo: extrae datos directamente de un nodo completo, asegurando la integridad de los datos, pero requiere una gran cantidad de almacenamiento y capacidad de procesamiento.
Indexador ligero: depende de nodos completos para obtener datos específicos, reduce la necesidad de almacenamiento pero puede aumentar el tiempo de consulta.
Indexador dedicado: optimizado para tipos de datos específicos o blockchain, como datos de NFT o transacciones de DeFi.
Agregador de índices: extrae datos de múltiples blockchains y fuentes, incluyendo información fuera de la cadena, proporcionando una interfaz de consulta unificada, adecuada para dApps de múltiples cadenas.
Actualmente, los nodos de archivo de Ethereum ocupan entre 3TB y 13.5TB de espacio en diferentes clientes. Frente a tal cantidad de datos, los protocolos de indexación más populares no solo admiten la indexación de múltiples cadenas, sino que también han personalizado marcos de análisis de datos para diferentes necesidades de aplicación, como el marco "subgráfico" de The Graph.
La aparición de los indexadores ha mejorado significativamente la eficiencia de indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, los indexadores pueden manejar grandes volúmenes de datos de manera eficiente, admitiendo consultas complejas y filtrado de datos. Algunos indexadores también admiten la agregación de datos de múltiples blockchains, evitando el problema de que una dApp multichain necesite desplegar múltiples API. A través de la ejecución distribuida, los indexadores ofrecen una mayor seguridad y rendimiento, reduciendo el riesgo de interrupciones que pueden surgir de los proveedores RPC centralizados.
![Lectura, indexación y análisis, resumen de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-587ce87f6dbedee4acec7d939fed6980.webp(
) 2.4 Base de datos de cadena completa: alineación prioritaria hacia el flujo
A medida que las demandas de las aplicaciones se vuelven más complejas, los indexadores de datos básicos y sus formatos estandarizados son difíciles de satisfacer para las diversas necesidades de consulta, como búsqueda, acceso entre cadenas o mapeo de datos fuera de la cadena. Los proveedores de servicios de datos blockchain están avanzando hacia la construcción de flujos de datos para satisfacer las necesidades de análisis en tiempo real y consultas exhaustivas.
Los proveedores tradicionales de servicios de indexación han lanzado productos de flujo de datos, como Substreams de The Graph y Mirror de Goldsky. Al mismo tiempo, servicios emergentes como Chainbase y SubSquid también ofrecen lagos de datos en tiempo real generados a partir de blockchain. Estos servicios están diseñados para apoyar el desarrollo de aplicaciones y ayudar en el análisis de datos en cadena a través de fuentes de datos más avanzadas.
Al reexaminar los datos en cadena a través de la perspectiva de los modernos canales de datos, podemos imaginar un futuro que pueda personalizar conjuntos de datos de alto rendimiento para cualquier caso de uso empresarial.
3. La fusión de AI y bases de datos: Análisis comparativo de The Graph, Chainbase y Space and Time
3.1 El Gráfico
La red The Graph proporciona servicios de indexación y consulta de datos multicanal a través de nodos descentralizados, facilitando a los desarrolladores la construcción de aplicaciones descentralizadas. Su modelo de producto central incluye un mercado de ejecución de consultas de datos y un mercado de caché de indexación de datos, atendiendo las necesidades de consulta de los usuarios.
La red está compuesta por cuatro roles: indexadores, curadores, delegadores y desarrolladores, asegurando el funcionamiento del sistema a través de incentivos económicos. Los indexadores proporcionan servicios de indexación y consulta, los delegadores apoyan la operación de los nodos de indexación, los curadores filtran subgráficos valiosos y los desarrolladores son los principales usuarios.
El ecosistema de The Graph está adoptando activamente la tecnología AI. Herramientas como AutoAgora, Allocation Optimizer y AgentC, desarrolladas por Semiotic Labs, optimizan respectivamente el precio de los índices, la asignación de recursos y la experiencia de consulta del usuario, mejorando la inteligencia del sistema y su amigabilidad con el usuario.
![Lectura, indexación y análisis, resumen de la pista de indexación de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Chainbase
Chainbase, como una red de datos de cadena completa, integra datos de diversas blockchains, simplificando el proceso para que los desarrolladores construyan y mantengan aplicaciones. Sus características incluyen:
Lago de datos en tiempo real: proporciona acceso instantáneo a flujos de datos de blockchain.
Arquitectura de doble cadena: construida sobre la capa de ejecución de Eigenlayer AVS, en paralelo con el algoritmo de consenso CometBFT, mejorando la capacidad de procesamiento de datos entre cadenas.
Formato de datos innovador: introducción del estándar "manuscripts" para optimizar la estructura de datos de la industria de la criptografía.
Modelo de mundo cripto: combinando tecnología AI, creando un modelo que puede entender y predecir transacciones en blockchain, como la versión básica Theia.
El modelo de IA Theia de Chainbase se basa en el modelo DORA de NVIDIA, combinando análisis de datos externos en la cadena con un patrón de cifrado, y responde a través del razonamiento causal, profundizando en el valor de los datos en la cadena y proporcionando servicios de datos inteligentes.
![Lectura, indexación y análisis, descripción del campo de indexación de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Espacio y Tiempo
Space and Time ###SxT( se dedica a construir una capa de computación verificable, ampliando pruebas de conocimiento cero sobre un almacén de datos descentralizado, para proporcionar procesamiento de datos confiables para contratos inteligentes, modelos de lenguaje grandes y empresas.
SxT ha introducido la innovadora tecnología Proof of SQL, que es una tecnología de prueba de cero conocimiento, asegurando que los resultados de las consultas SQL ejecutadas en un almacén de datos descentralizado sean verificables y a prueba de manipulaciones. A diferencia de las redes blockchain tradicionales que dependen de mecanismos de consenso, SxT obtiene datos a través de un nodo, mientras que otros nodos utilizan tecnología zk para verificar la autenticidad de los datos, mejorando así el rendimiento del sistema.
SxT colabora con el laboratorio de IA de Microsoft para desarrollar herramientas de IA generativa que simplifican el proceso para que los usuarios procesen datos de blockchain a través del lenguaje natural. En Space and Time Studio, los usuarios pueden ingresar consultas en lenguaje natural, la IA las convierte automáticamente en SQL y las ejecuta, presentando el resultado final.
![Leer, indexar y analizar, una breve descripción de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Conclusión y perspectivas
La tecnología de indexación de datos en blockchain ha evolucionado desde las fuentes de datos de nodo iniciales, pasando por el desarrollo de análisis de datos y indexadores, hasta llegar a un servicio de datos de cadena completa potenciado por IA, a través de un proceso de mejora gradual. Estos avances tecnológicos no solo han mejorado la eficiencia y precisión del acceso a los datos, sino que también han brindado a los usuarios una experiencia inteligente.
En el futuro, con el desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de conocimiento cero, los servicios de datos de blockchain se volverán aún más inteligentes y seguros. Como infraestructura, los servicios de datos de blockchain continuarán desempeñando un papel importante en la innovación de la industria.
![Leer, indexar y analizar, resumen de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-0742180b7da8a9dcddafc465a4dba9cb.webp(
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
17 me gusta
Recompensa
17
4
Republicar
Compartir
Comentar
0/400
VCsSuckMyLiquidity
· hace19h
Otra vez dibujando BTC, los datos son buenos datos
Ver originalesResponder0
TokenTaxonomist
· hace19h
*ajusta las gafas de hoja de cálculo*
estadísticamente hablando, el 94.3% de estos híbridos de ai-web3 son solo callejones sin salida evolutivos
Ver originalesResponder0
PaperHandSister
· hace19h
¡No se puede tener todo! La IA no puede manejar datos, ya he comprado en la cima.
Nuevas tendencias en el desarrollo del índice de datos Web3: servicios de datos de cadena completa potenciados por IA
De la fuente de datos al análisis inteligente: Análisis del desarrollo de la pista de indexación de datos Web3
1. Introducción
Desde que aparecieron las primeras aplicaciones descentralizadas en 2017, el ecosistema de blockchain ha prosperado, y una variedad de dApps han surgido como hongos después de la lluvia. Al discutir estas aplicaciones descentralizadas, ¿alguna vez hemos pensado en las fuentes de datos de las que dependen?
En 2024, la inteligencia artificial y Web3 se convierten en temas candentes. En el campo de la IA, los datos son como la fuente de vida, impulsando la constante evolución de los sistemas inteligentes. Así como las plantas necesitan luz solar y agua, los sistemas de IA también dependen de grandes cantidades de datos para aprender y pensar. Sin el apoyo de datos, incluso los algoritmos de IA más avanzados tienen dificultades para alcanzar su potencial.
Este artículo explorará en profundidad la evolución de la accesibilidad de los datos en blockchain, comparando las similitudes y diferencias entre los protocolos tradicionales de indexación de datos y los nuevos servicios de datos en blockchain, con un enfoque especial en la innovación de los nuevos protocolos que combinan la tecnología de IA en la arquitectura de servicios y productos de datos.
2. La evolución del índice de datos: de nodos de blockchain a base de datos de cadena completa
2.1 Fuente de datos: nodo de blockchain
La blockchain se conoce como un libro de contabilidad descentralizado, y los nodos de la blockchain son la piedra angular de esta red, responsables de registrar, almacenar y difundir datos de transacciones en la cadena. Cada nodo guarda una copia completa de los datos de la blockchain, asegurando la característica de descentralización de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo no solo tiene un alto umbral técnico, sino que también requiere asumir costos costosos de hardware y ancho de banda. Además, la capacidad de consulta de los nodos comunes es limitada, lo que dificulta satisfacer las necesidades de los desarrolladores. Por lo tanto, aunque en teoría cualquier persona puede ejecutar un nodo, en la práctica, los usuarios tienden a confiar más en servicios de terceros.
Para resolver este problema, surgieron los proveedores de nodos RPC. Ellos asumen los costos de gestión de nodos y ofrecen servicios de acceso a datos a través de puntos finales RPC. Los puntos finales RPC públicos son gratuitos pero tienen límites de tasa, lo que puede afectar la experiencia del usuario de las dApps. Los puntos finales RPC privados tienen un mejor rendimiento, pero no son muy eficientes para consultas complejas y son difíciles de escalar a través de redes. A pesar de esto, las interfaces API estandarizadas de los proveedores de nodos reducen la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para la posterior解析 de datos y aplicaciones.
2.2 Análisis de datos: de datos en bruto a información utilizable
Los datos originales proporcionados por los nodos de blockchain a menudo son procesados mediante cifrado y codificación, lo que, aunque garantiza la integridad y seguridad de los datos, también aumenta la dificultad de análisis. Para los usuarios comunes y los desarrolladores, manejar estos datos directamente requiere una gran cantidad de conocimientos técnicos y recursos computacionales.
El proceso de análisis de datos se vuelve especialmente importante en este contexto. Al convertir datos crudos complejos en un formato fácil de entender y operar, los usuarios pueden aprovechar esta información de manera más intuitiva. La calidad del análisis afecta directamente la eficiencia y efectividad de las aplicaciones de datos en blockchain, siendo un eslabón clave en todo el proceso de indexación de datos.
2.3 Desarrollo del indexador de datos
Con el aumento exponencial de la cantidad de datos en blockchain, la demanda de indexadores se ha vuelto cada vez más evidente. Los indexadores son responsables de organizar los datos en la cadena y de importarlos a una base de datos para su consulta. Indexan los datos de la blockchain y proporcionan interfaces API con lenguajes de consulta tipo SQL como GraphQL (, haciendo que los datos estén disponibles en todo momento. Los indexadores ofrecen a los desarrolladores una interfaz de consulta unificada, simplificando enormemente el proceso de recuperación de datos.
Diferentes tipos de indexadores tienen sus ventajas:
Actualmente, los nodos de archivo de Ethereum ocupan entre 3TB y 13.5TB de espacio en diferentes clientes. Frente a tal cantidad de datos, los protocolos de indexación más populares no solo admiten la indexación de múltiples cadenas, sino que también han personalizado marcos de análisis de datos para diferentes necesidades de aplicación, como el marco "subgráfico" de The Graph.
La aparición de los indexadores ha mejorado significativamente la eficiencia de indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, los indexadores pueden manejar grandes volúmenes de datos de manera eficiente, admitiendo consultas complejas y filtrado de datos. Algunos indexadores también admiten la agregación de datos de múltiples blockchains, evitando el problema de que una dApp multichain necesite desplegar múltiples API. A través de la ejecución distribuida, los indexadores ofrecen una mayor seguridad y rendimiento, reduciendo el riesgo de interrupciones que pueden surgir de los proveedores RPC centralizados.
![Lectura, indexación y análisis, resumen de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-587ce87f6dbedee4acec7d939fed6980.webp(
) 2.4 Base de datos de cadena completa: alineación prioritaria hacia el flujo
A medida que las demandas de las aplicaciones se vuelven más complejas, los indexadores de datos básicos y sus formatos estandarizados son difíciles de satisfacer para las diversas necesidades de consulta, como búsqueda, acceso entre cadenas o mapeo de datos fuera de la cadena. Los proveedores de servicios de datos blockchain están avanzando hacia la construcción de flujos de datos para satisfacer las necesidades de análisis en tiempo real y consultas exhaustivas.
Los proveedores tradicionales de servicios de indexación han lanzado productos de flujo de datos, como Substreams de The Graph y Mirror de Goldsky. Al mismo tiempo, servicios emergentes como Chainbase y SubSquid también ofrecen lagos de datos en tiempo real generados a partir de blockchain. Estos servicios están diseñados para apoyar el desarrollo de aplicaciones y ayudar en el análisis de datos en cadena a través de fuentes de datos más avanzadas.
Al reexaminar los datos en cadena a través de la perspectiva de los modernos canales de datos, podemos imaginar un futuro que pueda personalizar conjuntos de datos de alto rendimiento para cualquier caso de uso empresarial.
3. La fusión de AI y bases de datos: Análisis comparativo de The Graph, Chainbase y Space and Time
3.1 El Gráfico
La red The Graph proporciona servicios de indexación y consulta de datos multicanal a través de nodos descentralizados, facilitando a los desarrolladores la construcción de aplicaciones descentralizadas. Su modelo de producto central incluye un mercado de ejecución de consultas de datos y un mercado de caché de indexación de datos, atendiendo las necesidades de consulta de los usuarios.
La red está compuesta por cuatro roles: indexadores, curadores, delegadores y desarrolladores, asegurando el funcionamiento del sistema a través de incentivos económicos. Los indexadores proporcionan servicios de indexación y consulta, los delegadores apoyan la operación de los nodos de indexación, los curadores filtran subgráficos valiosos y los desarrolladores son los principales usuarios.
El ecosistema de The Graph está adoptando activamente la tecnología AI. Herramientas como AutoAgora, Allocation Optimizer y AgentC, desarrolladas por Semiotic Labs, optimizan respectivamente el precio de los índices, la asignación de recursos y la experiencia de consulta del usuario, mejorando la inteligencia del sistema y su amigabilidad con el usuario.
![Lectura, indexación y análisis, resumen de la pista de indexación de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Chainbase
Chainbase, como una red de datos de cadena completa, integra datos de diversas blockchains, simplificando el proceso para que los desarrolladores construyan y mantengan aplicaciones. Sus características incluyen:
El modelo de IA Theia de Chainbase se basa en el modelo DORA de NVIDIA, combinando análisis de datos externos en la cadena con un patrón de cifrado, y responde a través del razonamiento causal, profundizando en el valor de los datos en la cadena y proporcionando servicios de datos inteligentes.
![Lectura, indexación y análisis, descripción del campo de indexación de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Espacio y Tiempo
Space and Time ###SxT( se dedica a construir una capa de computación verificable, ampliando pruebas de conocimiento cero sobre un almacén de datos descentralizado, para proporcionar procesamiento de datos confiables para contratos inteligentes, modelos de lenguaje grandes y empresas.
SxT ha introducido la innovadora tecnología Proof of SQL, que es una tecnología de prueba de cero conocimiento, asegurando que los resultados de las consultas SQL ejecutadas en un almacén de datos descentralizado sean verificables y a prueba de manipulaciones. A diferencia de las redes blockchain tradicionales que dependen de mecanismos de consenso, SxT obtiene datos a través de un nodo, mientras que otros nodos utilizan tecnología zk para verificar la autenticidad de los datos, mejorando así el rendimiento del sistema.
SxT colabora con el laboratorio de IA de Microsoft para desarrollar herramientas de IA generativa que simplifican el proceso para que los usuarios procesen datos de blockchain a través del lenguaje natural. En Space and Time Studio, los usuarios pueden ingresar consultas en lenguaje natural, la IA las convierte automáticamente en SQL y las ejecuta, presentando el resultado final.
![Leer, indexar y analizar, una breve descripción de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Conclusión y perspectivas
La tecnología de indexación de datos en blockchain ha evolucionado desde las fuentes de datos de nodo iniciales, pasando por el desarrollo de análisis de datos y indexadores, hasta llegar a un servicio de datos de cadena completa potenciado por IA, a través de un proceso de mejora gradual. Estos avances tecnológicos no solo han mejorado la eficiencia y precisión del acceso a los datos, sino que también han brindado a los usuarios una experiencia inteligente.
En el futuro, con el desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de conocimiento cero, los servicios de datos de blockchain se volverán aún más inteligentes y seguros. Como infraestructura, los servicios de datos de blockchain continuarán desempeñando un papel importante en la innovación de la industria.
![Leer, indexar y analizar, resumen de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-0742180b7da8a9dcddafc465a4dba9cb.webp(
estadísticamente hablando, el 94.3% de estos híbridos de ai-web3 son solo callejones sin salida evolutivos