Come si progetta un modello di dati?
Prima di rispondere a questa domanda, vale la pena di soffermarsi sul modello tradizionale di web analytics, che viene utilizzato più spesso in ambito analitico. Questo modello è quello più comunemente utilizzato dai team di analisi che studiano il comportamento degli utenti sul web.
In questo esempio, possiamo vedere i dati riassunti in tre tabelle: pagine viste, sessioni e utenti. Le pagine viste sono aggregate in sessioni - con una riga di dati per sessione - e potremmo avere anche una tabella per gli utenti, se disponiamo di ID utente affidabili nel tempo.
Questo formato, pur essendo ottimo perché conveniente, può presentare alcune limitazioni: le sessioni stesse potrebbero non essere in linea con il vostro modello di business o con le vostre esigenze.
- Cosa possiamo aspettarci da una sessione quando le persone utilizzano dispositivi mobili?
- Come si misurano le sessioni in modo affidabile per le aziende con più sessioni?
È difficile misurare le sessioni in modo affidabile per le aziende con più utenti target. Ad esempio, supponiamo che il percorso di un cliente inizi sul vostro sito e termini due mesi dopo su un altro sito web su cui non avete alcun controllo.
- Quando si parla di unità di interazione, le visualizzazioni di pagina non sono sempre la misura ideale. Consideriamo invece altre misurazioni, come le ricerche o il coinvolgimento nei video.
- Le competenze SQL sono fondamentali per l'analisi e l'archiviazione dei dati. Senza le competenze SQL, non si può fare nulla di più di ciò che è disponibile in superficie.
- I diversi reparti dell'organizzazione potrebbero non essere in grado di estrarre valore dai dati in questo modo.
È importante tenere a mente queste limitazioni, ma non è tutto negativo. Qualsiasi cosa si possa fare con il rewriter è comunque utile: c'è qualcosa con cui possiamo lavorare se non abbiamo molta scelta.
Quando si utilizza questo modello tradizionale, è importante considerare chi sta catturando la tabella. Le visualizzazioni di pagina potrebbero essere classificate come un livello di coinvolgimento che un utente ha con la piattaforma. Una sessione di interazioni nel tempo potrebbe essere vista come un ciclo. Al livello più alto, un utente può essere classificato come un'entità, ovvero una persona coinvolta in un'interazione all'interno della vostra azienda.

Il framework può essere utilizzato così com'è o può essere ampliato per adattarsi ad altri casi d'uso e piattaforme. Il framework è suddiviso in tre parti: il livello delle interazioni, il livello del ciclo e il livello delle entità. Quando guardiamo alle interazioni, vediamo una riga per ogni interazione. Ad esempio, le visualizzazioni di pagina sono un'interazione tipica.
Dimensioni legate all'interazione:
- Referrer: timestamp
Le dimensioni relative al ciclo comprendono:
- ID sessione, indice di sessione
- Imbuto, passo dell'imbuto
Dimensione relativa alle entità:
- Titoli delle pagine, url
- ID utente, posizione
Metriche di interazione:
- Tempo medio di permanenza sulle pagine, profondità di scorrimento
Ma le visualizzazioni di pagina sono solo un modo per misurare il successo dei vostri contenuti. Altre misure possono essere:
- Clic
- Visualizzazioni dello schermo
- Impressioni pubblicitarie
- Apertura dell'e-mail
- Offerte
- Transazioni
- Modifiche al modulo
- Acquisti
- Ricerche
- Accesso
I cicli sono una componente fondamentale del gioco.
In questo livello, abbiamo una riga per ogni ciclo o, nel caso delle sessioni, queste possono essere suddivise come:
- Dimensioni relative al ciclo: ID sessione, indice di sessione
- Dimensione relativa alle entità: ID utente, Posizione
- Metriche del ciclo: Pagine viste, conversioni
I cicli consistono per lo più in una serie di interazioni che hanno luogo in un determinato periodo di tempo. Alcuni esempi di cicli sono:
- Completamento del corso
- Strategia per aumentare i clienti a vita
- Contenuti divertenti per aiutarvi a scoprire cose nuove
- Competizioni a livello di gioco
Esistono diversi tipi di informazioni cicliche che si possono acquisire per la propria azienda, ma alla fine dipende da ciò che ha senso per voi.
Il livello dell'entità
Il livello entità comprende una riga per entità. Se prendiamo come esempio gli utenti, le informazioni acquisite possono essere suddivise in:
- Dimensioni relative all'entità: ID utente, Posizione
- Metriche delle entità: Sessioni, pagine viste
- Altri esempi di entità possono essere: Prodotti, Articoli, Video, Campagne, App, Condotte di dati.
Con questo framework abbiamo un'ottima base per progettare un modello di dati da zero. Ma ci sono altri aspetti tecnici da considerare quando si progettano i modelli di dati:
Questo può aiutare a capire su quali entità concentrarsi, compresi grafici e visualizzazioni.
Chi consuma questi dati e a cosa è interessato?
Questo indicherà quali sono le entità a cui dovete pensare.
Qual è il caso d'uso di questi dati?
Ciò determinerà il grado di aggregazione delle tabelle (a livello granulare o alto).
Come verranno consumati questi dati?
Questo spiega come devono essere strutturate le tabelle.
Che tipo di attività gestite? Quanti clienti avete? Come interagiscono le persone con il vostro prodotto? Queste sono tutte domande che ci aiuteranno a progettare il modello di dati migliore per la vostra azienda.
Introduzione ai modelli di dati nella pratica: Esempi nell'e-commerce e nelle aziende in abbonamento
Vale la pena di esaminare alcuni esempi di modelli di dati per gruppi di consumatori specifici per farsi un'idea di come potrebbe funzionare il proprio modello di dati.
Questo è importante per qualsiasi azienda, ma soprattutto per le aziende di e-commerce. Quindi, per prima cosa, analizziamo un esempio (cioè Target) di come modellare i dati:
- Team marketing
- Team di inventario
Se consideriamo un esempio per un abbonamento (ad esempio Netflix), la modellazione dei dati per il:
- Team di prodotto
- Team di contenuti
ECOMMERCE: IL MARKETING VUOLE CAPIRE COME OTTIMIZZARE IL PROPRIO BUDGET DI MARKETING
Consideriamo un team di marketing di un'azienda di e-commerce. Potrebbe voler capire in che modo i suoi sforzi stiano generando ricavi. In particolare, potrebbero chiedersi:
- Quali canali di marketing portano alle sessioni con il maggior numero di dollari di prodotti acquistati?
- Quali canali o campagne di marketing sono migliori per ottenere clienti abituali?

Questo esempio riguarda le sessioni. Vogliamo sapere quali sono le sessioni che generano maggiori entrate. Le visualizzazioni di pagina ci diranno quali pagine sono più coinvolgenti e hanno generato più traffico. Abbiamo quindi bisogno di una riga per ogni visualizzazione di pagina, aggregata fino al livello delle sessioni.
Tracciamo alcuni dati relativi agli acquisti dei clienti, come il valore totale di ogni transazione e i prodotti acquistati. Ma ci si potrebbe chiedere come identificare i clienti fedeli. Questo sarebbe già un report molto utile; si potrebbe voler esaminare una riga per ogni campagna, con le sessioni totali della campagna, le entrate generate, gli acquisti effettuati e così via.
In alcuni casi può essere utile aggregare a livello di utente. Non importa se un utente ha fatto un solo acquisto o dieci, vogliamo comunque capire l'importanza di ogni singolo cliente. Ad esempio, se una campagna determina un maggior numero di acquisti a vita per utente rispetto a un'altra, non dovrebbe essere ignorata.
Ma i dati non sono solo per i marketer. Ad esempio, anche il team dell'inventario ha molte domande da fare.
- Quali sono i prodotti migliori? Quali sono quelli di tendenza?
- Quali strategie di posizionamento del prodotto e di prezzo dovrebbero adottare per vendere le scorte esistenti?
Anche se queste domande sono molto diverse da quelle poste dal team di marketing, dobbiamo assicurarci che le informazioni in nostro possesso siano ancora rilevanti.
Non vogliamo sapere solo quando un cliente acquista un prodotto, ma anche quando fa clic per visualizzare i dettagli del prodotto, lo aggiunge al carrello o lo rimuove dal carrello. Vogliamo conoscere ogni singola interazione che hanno con il sito per avere un quadro completo di come utilizzano il nostro sito e di cosa dobbiamo migliorare. Potremmo anche voler aggregare tutte le interazioni e gli acquisti di prodotti in una tabella, con una riga per ogni prodotto, che ci mostri la frequenza di gioco e di interazione prima dell'acquisto.
Questi modelli di dati possono apparire molto diversi, con poche sovrapposizioni. Tuttavia, quando i dati vengono inviati alla tabella delle sessioni, può essere utile includere un filtro "acquisti" per isolare le azioni di acquisto per il marketing.
Con il tempo, il team di marketing potrebbe iniziare a sviluppare un interesse per le funzionalità dettagliate del vostro prodotto, che sarà facile includere nei loro report.