https://images.cointelegraph.com/images/528_aHR0cHM6Ly9zMy5jb2ludGVsZWdyYXBoLmNvbS9zdG9yYWdlL3VwbG9hZHMvdmlldy8xYTMwZDI0MTFiNWJiZjc4ZTNkOWU4NzUxMWRkYmEyZC5qcGc=.jpg
image

DataUnion es un proyecto de aprendizaje automático que utilizará una subvención de Human para construir oráculos de registro y reputación gratuitos y de código abierto para el trabajo de etiquetado de datos realizado en Human Protocol. Así lo informaron desde el blog oficial de Human.

En ese blog aclararon que, aunque este es el alcance de la subvención inicial, los intereses y capacidades de DataUnion podrían promover otras colaboraciones con el proyecto de Human.

“DataUnion está diseñado para obtener más valor de los datos. Fundada en noviembre de 2020, el primer movimiento comercial de DataUnion fue operar en el mercado de datos de Ocean Protocol, en el que capturarían, anotarían y verificarían los datos. Se dieron cuenta de que solo las entidades individuales podían ofrecer sus datos en este mercado, lo que creaba silos y bloqueos para el uso y la curación de las ideas de los conjuntos de datos”, indicaron.

Luego agregaron: “Desde entonces, han creado un producto para que la gente construya y venda conjuntos de datos juntos. Esto se consigue atribuyendo una ´cuota de valor´ a todos los que contribuyen a un conjunto de datos. Si un individuo anota una sola imagen, y esa imagen se vende, el individuo puede ganar por su rol. Cuando los datos se venden a través de DataUnion, no se eliminan simplemente del conjunto de datos y se envían a otro lugar. Por el contrario, DataUnion adopta un enfoque de colaboración. Los datos vendidos son datos compartidos y DataUnion, junto con el comprador, puede trabajar con los datos para obtener más información”. 

“Este intercambio de datos puede beneficiar a todos. Uno de los principios fundamentales del Machine Learning es que la cantidad de datos es una cualidad propia; el método de DataUnion unifica, en lugar de fragmentar, los conjuntos de datos”, remarcaron

Sobre la subvención

Un Oráculo de Registro registra las respuestas y reserva los fondos de la recompensa inteligente para el Trabajador.

Un Oráculo de reputación comprueba el trabajo del Oráculo de registro, que comprueba el trabajo del Oráculo de intercambio, que a su vez puede realizar comprobaciones de los datos enviados por un Trabajador. El Oráculo de Reputación determina si el Trabajador recibirá el pago; y asigna una puntuación de reputación al Trabajador.

En el caso de esta subvención, DataUnion construirá un Oráculo de reputación específicamente para comprobar el trabajo que proviene del Oráculo de intercambio de hCaptcha. 

“El Oráculo realizará un servicio humano en el bucle. Los datos que llegan a través de hCaptcha suelen ser trabajados por un algoritmo; no queremos que un algoritmo compruebe el trabajo de un algoritmo, ya que es probable que caigan en los mismos errores. En su lugar, el algoritmo hCaptcha pasa las etiquetas de datos que no puede determinar si son correctas o no. El oráculo de reputación de DataUnion aprovechará sus redes de humanos para comprobar el trabajo”, especificaron en el blog de Human.

Con el tiempo, sin embargo, se espera que esto pueda muchas nuevas posibilidades. DataUnion podría utilizar los conjuntos de datos para entrenar algoritmos que, a su vez, podrían etiquetar o comprobar diferentes tipos de datos en diversos escenarios.

Colaboración y arranque

“En el aprendizaje automático, compartir, conectar y colaborar puede beneficiar a todas las partes. Este es un principio básico que comparten el Protocolo de HUMAN y DataUnion. Es un principio que puede abrir escenarios para una mayor colaboración entre los dos proyectos”, señalaron.

Si bien la subvención es para que DataUnion compruebe la calidad del trabajo con un oráculo de reputación, los papeles podrían invertirse, por ejemplo: “DataUnion podría llevar a cabo el trabajo de etiquetado de datos, y hCaptcha podría proporcionar el servicio HUMAN-in-the-loop como Oráculo de Reputación. El objetivo es aprovechar al máximo la capacidad y las posibilidades de cada red, y así crear más formas potenciales de obtener valor de los conjuntos de datos”.

“De cara al futuro, el oráculo de comprobación de anotación de imágenes de DataUnion podría potenciar otros trabajos de oráculo, tanto dentro de la vertical de anotación de imágenes, como la que ofrece Intel CVAT, como en nuevas verticales de trabajo de etiquetado de datos en general, como el vídeo y el texto. Data Union está trabajando en la creación de algoritmos para estas verticales”, añadieron.

Te puede interesar:

Las inversiones en criptoactivos no están reguladas. Es posible que no sean apropiados para inversores minoristas y que se pierda el monto total invertido. Los servicios o productos ofrecidos no están dirigidos ni son accesibles a inversores en España.