Cosa sarà il Web 3.0: blocker-marketplace per l'apprendimento automatico

Come creare una potente intelligenza artificiale? Un modo è utilizzare modelli di machine learning con dati distribuiti attraverso i marketplace basati sul blockbuster. Cosa per qui blocco? È con il suo aiuto in futuro che possiamo aspettarci l'emergere di scambi elettronici aperti, in cui tutti possono vendere i loro dati senza violare la riservatezza. E gli sviluppatori - per scegliere e acquisire le informazioni più utili per i loro algoritmi. In questo post parleremo dello sviluppo e delle prospettive di tali siti.

Oggi, gli elementi di base di tali sistemi si stanno solo formando. Semplici versioni iniziali di tali decisioni ispirano la speranza per il successo. Queste piattaforme di trading forniranno una transizione dall'attuale era di proprietà esclusiva dei dati Web 2.0 al Web 3.0: concorrenza aperta per dati e algoritmi con possibilità di monetizzazione diretta.

L'emergere di idee

L'idea di una piattaforma del genere mi è venuta in mente nel 2015 dopo una conversazione con Richard dell'hedge fund Numerai. Hanno condotto una gara d'appalto per sviluppare un modello del mercato azionario e inviato dati di mercato crittografati a qualsiasi specialista che voglia partecipare a questo. Di conseguenza, Numerai unisce i migliori modelli nel "metamodello", lo vende e paga una ricompensa a quegli specialisti i cui modelli funzionano efficacemente.

La competizione tra specialisti dell'elaborazione dei dati e analisi dei dati sembrava un'idea promettente. Poi ho pensato: è possibile creare una versione completamente decentralizzata di un tale sistema che sarebbe di natura generale e potrebbe essere utilizzato per risolvere eventuali problemi? Penso che questa domanda possa essere risolta in senso affermativo.

disegno

Ad esempio, proviamo a creare un sistema completamente decentralizzato per scambiare cripto-valute su scambi decentrati. Ecco uno schema possibile:

Cerchiamo di spiegare i diversi livelli del suo lavoro:

dati . I fornitori di dati mettono i loro dati in borsa e li condividono con gli sviluppatori dei modelli.

Modello . Gli sviluppatori di modelli scelgono i dati da utilizzare e creano modelli. La formazione viene condotta utilizzando un metodo di calcolo sicuro che consente di addestrare i modelli senza rivelare i dati utilizzati. I modelli sono messi in borsa allo stesso modo dei dati.

Metamodelli . Il metamodello viene creato sulla base di un algoritmo che tiene conto del prezzo di scambio di ciascun modello. La creazione di un metamodello è facoltativa: alcuni modelli vengono anche utilizzati senza unirsi al metamodello. Un contratto intelligente utilizza una metamodella nel commercio elettronico attraverso meccanismi di scambio decentralizzati (transazioni in catena).

Distribuzione di profitti / perdite . Dopo un po 'di tempo, le negoziazioni generano profitti o perdite, che sono divisi tra gli sviluppatori del meta-modello, a seconda del loro contributo al suo miglioramento. I modelli che hanno avuto un impatto negativo sul meta-modello perdono i loro fondi attratti in tutto o in parte. Anche i fornitori di dati per questo modello subiscono alcune perdite.

Verifica dei calcoli . I calcoli in ogni fase vengono eseguiti in due modi. O centralmente, ma con la possibilità di verificare e protestare attraverso meccanismi come Truebit . O decentralizzato, utilizzando il protocollo di calcolo confidenziale.

Hosting . Dati e modelli sono ospitati su IPFS, o sui nodi in un sistema di contabilità confidenziale sicuro con un numero elevato di partecipanti. Lo stoccaggio su catena in questo caso sarà troppo costoso.

Perché è efficiente e produttivo?

Elenciamo i principali vantaggi di un tale sistema:

L'incentivo per attirare i dati più richiesti. Di norma, per la maggior parte dei progetti di machine learning il principale fattore limitante è la mancanza di dati qualitativi. La struttura dei premi correttamente progettata consentirà di ottenere l'accesso a tutti i dati più preziosi allo stesso modo in cui l'aspetto dei bitcoin con il sistema di premi dei partecipanti ha portato all'emergere della più potente rete di computer del mondo. Inoltre, è quasi impossibile fermare il sistema, in cui i dati provengono da migliaia o milioni di fonti.
Competizione tra algoritmi. Modelli e algoritmi competono direttamente tra di loro in aree in cui ciò non è accaduto prima. Immagina una rete Facebook decentralizzata con migliaia di algoritmi di flusso di notizie concorrenti.
Trasparenza dei premi . I fornitori di dati e modelli vedono che ottengono un prezzo equo per i loro prodotti, poiché tutti i calcoli possono essere verificati. Ciò attirerà ancora più fornitori di dati.
Automazione. Le transazioni vengono eseguite nell'ambiente del sistema di blocco e il valore viene generato direttamente nei token. Pertanto, tutte le interazioni diventano automatizzate e chiuse, senza richiedere l'instaurazione di relazioni di fiducia.
Effetto rete La partecipazione di utenti, fornitori di dati e specialisti di elaborazione dati e analisi fornisce un effetto di rete multiforme e rende il sistema auto-sviluppante. Meglio funziona, più capitale attrae. Più capitale - più pagamenti potenziali. Questo, a sua volta, attrae più fornitori di dati e specialisti di elaborazione, che rendono il sistema più perfetto e razionale. Di conseguenza, vengono attratti più investimenti e quindi in un cerchio.

Riservatezza del sistema

Oltre a quanto sopra, la riservatezza è la proprietà più importante. La garanzia di riservatezza consente agli utenti ordinari di fornire tranquillamente qualsiasi informazione personale. E anche per prevenire la perdita di valore economico di dati e modelli. Se si lasciano i dati e i modelli non crittografati di pubblico dominio, questi verranno copiati gratuitamente e utilizzati da altri che non contribuiscono alla causa comune (" effetto free-rider ").

Una soluzione parziale al problema del cavaliere libero è la vendita di dati in modo privato. Anche se gli acquirenti vogliono rivendere o divulgare i dati, non è così spaventoso, perché il costo dei dati è ancora ammortizzato nel tempo. Tuttavia, con questo approccio, i dati vengono utilizzati esclusivamente a breve termine e i problemi con la garanzia della loro riservatezza non vengono risolti in alcun modo. Quindi l'uso del computing sicuro sembra essere un approccio più complesso, ma più efficace.

Calcolo sicuro

I metodi di calcolo sicuri ti consentono di addestrare i modelli senza rivelare i dati stessi. Attualmente vengono utilizzati tre tipi principali di calcolo sicuro, oggetto di studio: crittografia omomorfica (HE), protocollo di contabilità riservata (MPC) e zero-disclosure (ZKP). Per l'apprendimento automatico con dati personali, MPC è usato molto spesso oggi, dal momento che HE di solito lavora troppo lentamente e come usarlo per l'apprendimento automatico ZKP non è ancora chiaro. Metodi di calcolo sicuro: questo è l'argomento più urgente della moderna ricerca sui computer. Tali algoritmi, di norma, richiedono molto più tempo dei normali calcoli e diventano il collo di bottiglia del sistema. Ma negli ultimi anni sono stati notevolmente migliorati.

"Sistema di consulenza ideale"

Per illustrare il potenziale dell'apprendimento automatico su dati privati, immagina un'applicazione chiamata "Sistema di riferimento ideale". Si tiene traccia di tutto ciò che si sta facendo sui propri dispositivi: analizza tutti i siti visitati, tutte le azioni in applicazioni visualizzate le immagini sui vostri dati di localizzazione del telefono, la storia dei dati di costo da sensori indossabili, messaggi di testo, i dati delle telecamere in casa e sulla i tuoi futuri occhiali di realtà aumentata. Queste informazioni permetteranno l'applicazione di darvi consigli: Qual è il sito vicino per vedere che tipo di articolo da leggere, ascoltare quale canzone o quali prodotti acquistare.

Questo sistema di raccomandazioni sarà estremamente potente, più potente di qualsiasi "torre del silo" esistente con dati di Google, Facebook o chiunque altro. Tutto grazie all'analisi più approfondita e all'opportunità di apprendere attraverso i dati personali più sensibili che non condivideresti con nessun altro . Come nell'esempio precedente con il sistema di commercio in cripto-valute, la chiave del funzionamento del sistema di consulenza è la creazione di un mercato per modelli orientati a settori diversi (ad esempio, raccomandazioni di siti Web o musica). Questi modelli competerebbero per l'accesso ai dati crittografati, la capacità di raccomandare e probabilmente anche di pagare per l'utilizzo dei dati o per l'attenzione ai consigli.

Sistema di apprendimento distribuitoGoogle e il sistema di privacy differenziale di Apple possono essere considerati passi nella direzione dell'apprendimento automatico utilizzando dati personali. Ma queste soluzioni significano ancora l' instaurazione di rapporti di fiducia , non consentono agli utenti di monitorare in modo indipendente la loro sicurezza e di memorizzare i dati separatamente.

Approcci implementati

È troppo presto per parlare di sistemi completi di questo tipo. Al momento, pochissime persone hanno già qualcosa in funzione, e la maggior parte di esse si rivolge gradualmente a tali sistemi.

Società Algorithmia La ricerca ha sviluppato una soluzione abbastanza semplice che premia per un modello con una precisione di sopra di una certa soglia determinata in modo retrospettivo:

Hedge fund Numerai andati tre passi avanti. Il suo sistema:

utilizza dati crittografati (sebbene questo tipo di crittografia non possa essere considerato completamente omomorfico),
integra modelli di crowdsourcing in una metamodella,
premiare i modelli attraverso il proprio Numeraire Ethereum- Token basato sulle prestazioni future (settimana della settimana di trading), piuttosto che sui test retrospettivi.

Gli specialisti dell'analisi dei dati dovrebbero utilizzare Numeraire come shell, confermando in tal modo il proprio interesse e stimolando le prestazioni future. Ancora, al momento, Numerai distribuisce i dati centralmente, quindi la caratteristica più importante del sistema non è ancora implementata.

Al momento, non è stato ancora creato un mercato di dati di successo basato sul blockbuster. Il primo tentativo di sviluppare un tale sistema, almeno in termini generali, fu The Ocean . Altri iniziano con la costruzione di reti informatiche sicure. Il progetto Openmined sta lavorando per creare una rete di computer multi-utente per i modelli di apprendimento automatico sulla base di Unity, che può funzionare su qualsiasi dispositivo, comprese le console di gioco (simile a Folding at Home ). Successivamente, è previsto l'estensione di questo sistema al protocollo di elaborazione confidenziale. Un approccio analogo è preso da Enigma .

Come risultato di questi lavori, sarebbe bello ricevere metamodelli che forniscano ai comproprietari - fornitori di dati e sviluppatori di modelli - diritti di proprietà in un volume proporzionale al loro contributo al miglioramento del metamodello. I modelli sarebbero tokenizzati e potrebbero produrre reddito nel tempo, e coloro che li hanno addestrati potrebbero persino gestirli. Sarebbe una specie di intelletto sciame, che è in comproprietà. Di tutto ciò che ho visto finora, il progetto Openmined è venuto più vicino a tale sistema, se si crede al video a riguardo.

Cosa può funzionare più velocemente?

Non dirò che so quale progetto è migliore, ma ho qualche idea su questo.
Come applicato al blocco, valuto il sistema come segue. Se lo espandi nello spettro continuo di "blocco fisico-digitale", tanto più ci sarà dal blocco, tanto meglio. Più in basso dal blocco, più devi coinvolgere parti fidate. Quindi il sistema diventa più complicato ed è meno conveniente utilizzarlo come parte integrante di altri sistemi.

Ciò significa che il sistema guadagnerà di più con probabilità se il valore creato da esso sarà quantificabile. Idealmente - in termini di denaro, o meglio ancora sotto forma di gettoni. Questo creerà un sistema completamente chiuso. Per valutare l'efficacia, confrontare il sistema sopra, ad esempio, con il sistema di riconoscimento dei tumori sulla radiografia. In quest'ultimo caso, è necessario convincere la compagnia di assicurazione che i raggi X hanno un certo valore, per stabilire le modalità sono preziosi, e poi di affidare ad un piccolo gruppo di persone confermare il successo o il fallimento della radiografia.

Un tale sistema può essere utilizzato in molti altri scenari utili. Possono essere legati ai mercati della cura: saranno in grado di lavorare a ciclo chiuso sul modello a blocchi e i token di questo mercato possono agire come bonus. Ora l'immagine non è ancora chiara, ma suppongo che col tempo il numero di aree che richiedono l'uso del blocco aumenterà solo.

Conseguenze per il mercato

Mercati dei dati decentralizzati e modelli per l'apprendimento automatico possono distruggere il monopolio sui dati che le società moderne hanno. Negli ultimi 20 anni, hanno standardizzato e scambiato la principale fonte di valore su Internet: reti di dati proprietarie e l'impatto che hanno. Ma ora la creazione di valore non è più associata ai dati, ma agli algoritmi.

Cicli di standardizzazione e commercializzazione di tecnologie. Ci stiamo avvicinando alla fine dell'era delle reti che monopolizzano i dati.

In altre parole, creano un modello aziendale di intelligenza artificiale basato sull'interazione diretta , forniscono sia la consegna dei dati che la formazione dei modelli.
L'emergere di mercati di dati decentralizzati e modelli per l'apprendimento automatico può portare alla creazione dell'IA più potente del mondo. A causa di incentivi economici diretti, sarebbero in grado di ottenere i dati e i modelli più preziosi. La loro forza è aumentata a causa di effetti multi-rete. I monopoli di dati Web dell'era del Web 2.0 si stanno trasformando in beni di uso quotidiano e diventano un buon materiale per un nuovo conglomerato. Probabilmente, dobbiamo andare avanti per qualche altro anno, ma stiamo andando nella giusta direzione.
Come mostra l'esempio del sistema di consulenza, il processo di ricerca è globalmente invertito. Ora le persone cercano merci - e in futuro i beni cercheranno persone e competeranno per loro. Ogni consumatore avrà mercati di supervisione personale, sui quali i sistemi di raccomandazioni competeranno per collocare i contenuti più rilevanti sui loro canali. E la rilevanza sarà determinata dal consumatore.

I nuovi modelli ci permetteranno di ricevere gli stessi benefici da potenti servizi basati sull'apprendimento automatico, a cui siamo abituati usando l'esempio dei servizi di Google e Facebook. Ma senza fornire dati personali.

Infine, l'apprendimento automatico si evolverà più rapidamente, come ogni ingegnere sviluppatore sarà in grado di accedere al mercato dei dati aperti, e non solo un piccolo gruppo di ingegneri in grandi aziende Web 2.0.

problematica

Innanzitutto, i metodi di calcolo sicuri stanno funzionando lentamente, e l'apprendimento automatico richiede già una grande potenza di calcolo. D'altra parte, c'è un crescente interesse per i metodi di calcolo sicuri e la loro produttività è in aumento. Negli ultimi sei mesi, ho visto diversi nuovi approcci che migliorano significativamente le prestazioni di HE, MPC e ZKP.

È difficile determinare il valore di un determinato set di dati o modello per un metamodello.
Anche pulire e formattare i dati di crowdsourcing non è facile. Molto probabilmente, verranno utilizzati un numero di strumenti in combinazione tra loro, e nel segmento, i processi di standardizzazione cominceranno con la partecipazione attiva delle piccole imprese.

Infine, paradossalmente, il modello di business per la creazione di un sistema così generalizzato è meno ovvio che nel caso di un sistema privato. La stessa situazione con molti nuovi criptoprimitives, compresi i mercati della cura.

conclusione

La combinazione di machine learning basata su dati parziali con blokcheyn-ricompense possono portare alla creazione dei sistemi di intelligenza artificiale più produttivi per vari scopi. Ora ci sono grossi problemi tecnici che alla fine sembrano essere abbastanza decisiva. Questo segmento ha un enorme potenziale nel lungo termine, e la sua formazione può indebolire la posizione dominante delle grandi società di Internet nel campo di accesso ai dati. Questi sistemi anche ispirare qualche timore: sono caricati, sviluppare in modo autonomo, consumano privacy e diventato quasi unkillable, che mi chiedo se il risultato invece di creare l'aspetto del più potente Molochnella storia. In ogni caso, questi sistemi sono un altro esempio di come le criptovalute possono prima lentamente, e poi rapidamente irrompere in tutte le sfere dell'attività economica.

Шукати в цьому блозі

EURO Блог

Cosa sarà il Web 3.0: blocker-marketplace per l'apprendimento automatico

Коментарі

Дописати коментар

Популярні дописи з цього блогу

Автомобиль на польской регистрации

Онлайн камера Шегині

Разъёмы а/магнитол PIONEER