Come stavo cercando lo strumento perfetto per progettare interfacce conversazionali o Alla ricerca del Santo Graal

Paul Gwai, sviluppatore Android KODE


Ciao, il mio nome è Paul pavelgvay , io lavoro in studio di Kaliningrad KODE sviluppo di applicazioni mobili e circa un anno fa a immersi attivamente nel processo di sviluppo di applicazioni per Google Assistant e addirittura bloccato sulla fase di progettazione dell'interfaccia, che è diventato un vero e proprio sbocco creativo dopo le righe di codice.


Progettato con una dozzina di progetti, parlando a diverse conferenze, essendo venuto a conoscenza gli sviluppatori di Google Assistant, che, per inciso, sarà presto parlare in russo , per lo scambio di esperienze con gli sviluppatori, i monolocali e anche l'autore del libro , sto seriamente pensando alla ottimizzazione delle applicazioni di progettazione e di prova di voce, che già può essere fatto anche per Alice.


Questa idea mi ha dato un calcio motivazionale inviato su un lungo viaggio per i loro strumenti esistenti e difetti analizzare bene e ha portato alla conclusione prevista - su di esso alla fine di questo articolo, fino a quando il presente.


teoria

Per coloro che non hanno toccato l'interno delle interfacce conversazionali, spiegherò in cosa consiste la progettazione di un'applicazione del genere.


Una buona applicazione colloquiale differisce dai chatbots per l'impossibilità di usare comandi specifici - qui l'utente ha un dialogo libero con il servizio, simile alla comunicazione con una persona reale. Il principale è voce e testo, ma nel caso in cui il dispositivo abbia uno schermo, l'applicazione può connettere l'accompagnamento visivo sotto forma di schede, rotatorie, elenchi per una migliore trasmissione delle informazioni.


Prendi almeno "ordina pizza": immagina quante frasi diverse puoi usare per dire all'applicazione che vuoi la pizza. Un utente può nominare un nome specifico o chiedergli di consigliarlo sulle opzioni con funghi e prosciutto, o chiedergli di leggere l'intera lista e scegliere da esso, o forse solo per dire che ha fame.


Tutte queste sono opzioni per lo sviluppo della trama. Ecco cosa dobbiamo fornire: ogni singolo passaggio in ogni modo possibile per ciascuno degli scenari applicativi. Campo di Nepahanoe! E non abbiamo ancora ordinato la pizza!


Metodologia di progetto

Progetta (o progetta, come preferisci) l'interfaccia di conversazione, indipendentemente dalla piattaforma, passa attraverso una serie standard di passaggi. Linee guida dettagliate possono essere trovate dagli sviluppatori Google Assistant , Amazon Alexa , Microsoft Cortana , ho anche inserito una breve lista di controllo:


Identificare le persone - ogni persona è un'immagine collettiva di un rappresentante di un gruppo di spettatori dell'applicazione, dietro la quale vi è un certo insieme di frasi basate sugli stereotipi del suo comportamento.
Filtra gli scenari - ordina le possibili opzioni per la conversazione sulla loro applicabilità a un vero dialogo con la persona. Sembra strano? Quindi scartare. Scriviamo esempi di dialoghi per questi scenari.
Crea un personaggio - poiché siamo per la naturalezza del dialogo, allora l'interlocutore della nostra applicazione dovrebbe formare l'immagine della persona con cui comunica. Aggiungiamo un nome, disegniamo esteriorità, abilità, breve biografia, carattere e, ovviamente, voce ( SSML - linguaggio di markup per il parlato).
Stiamo costruendo un albero di dialogo - per tenere conto di tutte le varianti del corso degli eventi, tutti i passaggi che porteranno l'utente a un ipotetico "ordine della pizza", vale la pena visualizzare tutte le azioni.



Lavora con le frasi : ogni passaggio comporta almeno 5-10 variazioni come replica sul lato dell'interfaccia, che rende la conversazione in diretta e utente, il che aiuterà nel riconoscimento vocale.
Test - se tutti i rami del dialogo sono presi in considerazione, se ci sono logici vicoli ciechi, frasi tagliate - per questo è necessario controllare tutti gli scenari parlando a qualcuno.

Houston, abbiamo un problema

La radice di tutti i problemi di interfacce di conversazione di design - si tratta di una massa enorme di informazioni. Scenari, opzioni del loro passaggio, alberi dialoghi gradini, che una piccola applicazione può guadagnare un centinaio di pezzi. Tutto questo patrimonio di informazioni deve essere conservato da qualche parte, in qualche modo sintetizzare, controllare, testare, trasferire in fase di sviluppo, dare al cliente di vedere e raccomandazioni per la selezione di strumenti da parte degli sviluppatori di un assistente vocale per la linea guida non c'è.


Dopo aver progettato le prime applicazioni, ho ridotto tutti i miei problemi alla serie principale di problemi:


Un enorme mappa del dialogo - un modo dettagliato e chiaro dal punto A al punto B, tutto il labirinto di movimento intricato degli utenti alla meta - non è adatto per un tale compito è di solito il bordo bianco (solo immaginare quanto piccolo, come è necessario scrivere una parola, e quindi trascinare gli sviluppatori Talmud), e infatti ancora bisogno di negoziare con la squadra sulle convenzioni che usiamo su una mappa. Gloom!
Lavoro manuale degli schiavi : un sacco di tempo che devi dedicare non solo alla pubblicazione di informazioni, ma anche alla sincronizzazione di modifiche e modifiche. Tutte le varianti di frasi sulla carta non possono essere piazzate, quindi devi tenerle sul tavolo. Ci vuole un sacco di tempo per sincronizzare manualmente tutte le informazioni che abbiamo. Poiché tutte le azioni sono eseguite manualmente e non sono assicurate contro errori e errori di battitura comuni, è necessario ricontrollare se stessi un centinaio di volte.
Marchio di qualità : ogni volta per verificare la qualità del lavoro eseguito, è necessario raccogliere manualmente la trascrizione del dialogo, passando continuamente dal documento a una trascrizione, a una scheda di dialogo e a una tabella con frasi. Questo è un processo terribilmente noioso e lungo, che scoraggia il desiderio di controllare completamente la qualità del loro lavoro.

Il risultato di questa costante lotta con i dolori non è solo l'estensione dei termini di sviluppo, ma anche la perdita di qualità dovuta a disattenzione, affaticamento e, naturalmente, perdita di motivazione.


La rete ha già un numero di strumenti che dovrebbero facilitare il processo, ma la loro funzionalità è limitata.


Criteri di valutazione

Per non essere infondato nella mia analisi e nella mia critica soggettiva, io, nelle migliori tradizioni di ricerca scientifica, ho preso la stessa parte della reale applicazione su cui ho lavorato e ho cercato di implementarla con l'aiuto del toolkit proposto.


Ho inserito tutti i risultati in una tabella e valutato ogni serie di servizi in base a tre criteri di base, impostandoli su una scala a 5 punti:


visibilità della mappa del dialogo;
facilità e qualità dei test;
semplicità di editing e sincronizzazione.

Lavagna bianca (Realtimeboard)




Iniziamo con l'approccio "classico": costruiamo una mappa dei dialoghi su una lavagna bianca, o meglio nella sua analogica digitale - Realtimeboard . La descrizione del personaggio e delle frasi verrà archiviata in Google Documenti .


La mappa


Prima di costruire una mappa, dovrai elaborare la tua notazione personale - ancora una volta, il tempo necessario e quando si costruisce una mappa, ogni fase viene disegnata e allineata manualmente - è lenta, ma la mappa diventa visivamente più chiara.


analisi

Il processo di raccolta dei materiali per i test richiede molto tempo. Sembra: ha guardato la mappa, poi ha preso una frase dal tavolo e l'ha scritta nel documento. Nessuna flessibilità, routine continua e commutazione costante tra gli strumenti.


Modifica e sincronizzazione

È facile modificare la mappa: puoi scambiare i passaggi, spostare interi rami e selezionare singoli elementi in gruppi. Ma per sincronizzare la mappa con la tabella delle frasi devi manualmente - di nuovo, il senso di raschiamento dei dati persi.


Il risultato

Mettiamo "buon" realtimeboard per visibilità e adeguamento flessibile della metodologia di lavoro per il progettista. Pensa con un dito al lungo processo di test e alla sincronizzazione manuale della tabella delle frasi con la carta.


Mappa - 5/5
Modifica e sincronizzazione - 0/5
Test - 0/5

Sayspring

La mappa e le frasi sono all'interno di Sayspring , le informazioni relative a personaggi e persone rimarranno in Google Documenti .


La mappa


La mappa è formata passo dopo passo: ci sono notazioni per l'utente e l'interfaccia, può essere divisa in script. Nel processo di costruzione si riscontrano piccoli inconvenienti, ad esempio la necessità di salvare costantemente le modifiche. Allo stesso tempo, la mappa è assolutamente lineare: le transizioni non vengono visualizzate in alcun modo (link e biforcazioni sullo schermo vengono aggiunti indipendentemente).


analisi


Il servizio consente scenari di test di voce, ma non è disponibile frasi del testo analogico, non c'è possibilità di tornare a un paio di passi indietro (deve ricominciare da capo), il riconoscimento vocale è disponibile solo per le tre lingue e funziona male. Per verificare questa modalità è inutile, perché non v'è alcuna possibilità di vedere la storia del dialogo, devono ancora raccogliere i dialoghi nel file. Fortunatamente, la raccolta di dialoghi qui è facilitata. Premendo un pulsante il tool stesso vi mostrerà le possibili dialoghi. Ci sono molti problemi e disagi (ad esempio non è possibile raccogliere due script in un unico file, non è possibile scaricare il file, basta sfogliare allo strumento), ma ci sta risparmiando tempo sui test.



Modifica e sincronizzazione


Tutte le repliche vengono assegnate a uno specifico passaggio logico nella mappa, eliminando la necessità di passare da uno strumento all'altro e sincronizzarne lo stato.


È scomodo apportare modifiche alla mappa: il trascinamento di elementi è possibile solo all'interno di uno scenario, il raggruppamento non è disponibile.


Il risultato

Sayspring elimina il lavoro di routine della raccolta dei materiali per testare e sincronizzare la tabella delle frasi con la mappa, poiché le repliche vengono fissate dopo i passaggi. Questi sono gli unici vantaggi.


La mappa è cara, lavorare con esso è difficile e scomodo. I test vocali funzionano, ma è inutile, perché non c'è modo di entrare nel merito, vedere la storia e scaricare i dialoghi è limitato.


Mappa - 0/5
Modifica e sincronizzazione - 3/5
Test - 3/5

Botsociety




Lo strumento differisce nel formato della schermata principale: la finestra di dialogo viene inizialmente creata e la mappa viene disegnata automaticamente. Frasi e personaggi saranno archiviati in Google Documenti .


La mappa




Sulla mappa, le forche e le connessioni tra i passaggi sono chiaramente visibili. È interattivo: facendo clic sul passaggio, l'oggetto viene aperto.


Non c'è divisione nello scenario, che porterà a un gran numero di ripetizioni e un enorme diagramma di flusso confusionario.


analisi


I test vengono eseguiti sotto forma di corrispondenza, che ti permette di entrare nel gioco, vedere la storia.


Tuttavia, non c'è modo di scegliere i passaggi: infatti, non controlliamo il processo, ma guardiamo il video, il che rende la modalità inutile.


Modifica e sincronizzazione

Poiché le frasi e la scheda sono memorizzate separatamente, rimane il problema con la sincronizzazione. È abbastanza comodo apportare modifiche alla mappa, c'è il drag-and-drop, ma non è possibile selezionare diversi elementi e fare un'azione generale su di essi.


A proposito, il servizio implementa la cosiddetta modalità build: nelle frasi è possibile incorporare variabili e accedervi tramite l'API. Pertanto, lo strumento può diventare un content keeper. Che cosa esattamente non è chiaro, perché è possibile specificare solo una versione della frase.


Il risultato

Lo strumento è piuttosto progettato per la prototipazione rapida di applicazioni semplici e non per una progettazione a tutti gli effetti. I test non funzionano, lasciando aperto il problema con la raccolta dei materiali. Il download di finestre di dialogo è disponibile solo in formato MP4, GIF o AVI.


Mappa - 2/5
Modifica e sincronizzazione - 1/5
Test - 1/5

XMind

Lo strumento consente di creare mappe, ma non è specializzato nella progettazione di interfacce di conversazione. Il carattere e le frasi saranno memorizzati in Google Documenti .


La mappa


La mappa può essere divisa in scenari. È costruito comodamente e rapidamente grazie a comodi tasti di scelta rapida, eliminando da noi la necessità di allineamento.


Le connessioni tra i passaggi sono mal implementate, è impossibile modificare le curve e sono costruite su tutto, riducendo notevolmente la leggibilità della mappa.


Come in realtimeboard, prima di costruire una mappa, dovrai elaborare le convenzioni.


analisi

Per raccogliere materiali nello strumento non c'è niente, il problema non è affatto risolto.


Modifica e sincronizzazione

Lavorare con la mappa è comodo: puoi selezionare e trascinare elementi. Poiché le frasi sono memorizzate separatamente, il problema di sincronizzazione rimane.


Il risultato

Il processo di costruzione di una mappa è molto comodo, la mappa stessa è piuttosto visiva, ma c'è un problema con i collegamenti tra i passaggi. I problemi con i test e la sincronizzazione della frase e della tabella della mappa non sono risolti.


Mappa - 3/5
Modifica e sincronizzazione - 0/5
Test - 0/5

Mi sono lamentato e qual è il prossimo

E 'chiaro che non tutte le opzioni disponibili sono stati considerati nello studio (sarà lieto di vostri consigli nei commenti), ma il servizio può essere analizzato per rendere una conclusione chiara - nessuno strumento è simile al Santo Graal. Una soluzione temporanea per me personalmente è un combo di Realtimeboard + Google Fogli + Google Docs.


Tuttavia, non ho sopportato la perdita di tempo ed energie per progettare e mi sono prefisso l'obiettivo di sviluppare il mio strumento personale: Tortu .


Lo sviluppo funzionale dipende direttamente dall'opinione degli sviluppatori interessati. Soprattutto per questo ho preparato alcune domande che mi aiuteranno a navigare. Ti sarò grato se mi aiuterai e compilerai il modulo . Il riempimento richiederà non più di 5-7 minuti.


postfazione

Se ti interessa l'argomento delle interfacce conversazionali e vuoi saperne di più su design, sviluppo o eventuali domande, allora benvenuto alla mia chat telegram dedicata alle interfacce conversazionali in cui è già stata raccolta una piccola comunità di sviluppatori e designer.

Коментарі

Популярні дописи з цього блогу

Автомобілі на польській реєстрації.

Малий Прикордонний Рух

база номеров мобильных телефонов украины скачать