Vi segnalo un interessante articolo di Aline Bessa, Data Evangelist in KNIME, che tratta il problema della valutazione del Sentiment utilizzando l’analisi lessicale e, ovviamente, KNIME.
L’articolo mostra la costruzione e il funzionamento di due Workflow:
- il primo analizza un dataset disponibile su Kaggle relativo alla valutazione di sei compagnie aeree americane, comprensivo di una classificazione manuale del sentiment espresso (positivo /negativo /neutro), che viene elaborato in KNIME utilizzando l’approccio Sentiment Score (StSc) e poi confrontando i risultati come in un problema di classificazione
- il secondo utilizza un nodo per il collegamento a Twitter per effettuare la stessa analisi, stavolta su dati non classificati, mostrando per ogni tweet, lo score del sentiment e raggruppando i risultati in una diagramma a barre (numero di sentiment per data del tweet) e in una rappresentazione Wordcloud
L’autrice dell’articolo, conclude indicando pregi e difetti di questo approccio basato sul lessico, abbastanza semplice da implementare, ma che ha prestazioni non sempre ottimali.
Buona lettura.