Riconoscimento di emozioni

Il riconoscimento delle emozioni è il processo di identificazione delle emozioni umane, più tipicamente dalle espressioni facciali e dalle espressioni verbali. Questo è sia qualcosa che gli esseri umani fanno automaticamente, ma anche metodologie computazionali sono state sviluppate.

Emotion Definizione Scientifica
Un’emozione deve essere differenziata dal concetto di sentimento, umore e personalità. Una sensazione è z. Una paura, per esempio, quando senti una persona mascherata dietro un muro. Allora senti la paura. Una sensazione diventa un’emozione solo quando questo cambiamento fisico viene valutato cognitivamente.

Se qualcuno, per esempio, il suo battito del cuore è ricondotto all’uomo mascherato, si parlerebbe di paura. Tuttavia, se ritorna alla sua amata segretamente, si parla di gioia. Le emozioni di solito durano solo pochi secondi e hanno un insieme chiaramente definito e off-set. Gli stati d’animo, d’altra parte, possono durare per ore, giorni o addirittura settimane. Se qualcuno dice che oggi è di cattivo umore, è di cattivo umore. Tuttavia, questo non ha necessariamente nulla a che fare con le emozioni.

Spesso uno stato d’animo particolare può aumentare o diminuire la probabilità di accadimento di una particolare emozione, ma queste due cose devono essere separate analiticamente. Infine, la personalità di una persona deve essere differenziata dall’umore. Una persona colerica, per esempio, è permanentemente negativamente eccitata. In questo modo si possono immaginare i termini sentimento, emozione, umore e personalità disposti su una linea del tempo – con sentimento da una parte, a breve termine, e personalità dall’altra, lato a lungo termine.

Umano
Gli umani mostrano una coerenza universale nel riconoscere le emozioni ma mostrano anche una grande quantità di variabilità tra gli individui nelle loro capacità. Questo è stato un argomento importante di studio in psicologia.

Effetto Cross Race
Il riconoscimento emotivo tra due persone è soggetto a forti fluttuazioni. In psicologia, è stato scoperto un fenomeno, che si chiama effetto cross-race. Questo fenomeno implica che il tasso di riconoscimento delle emozioni è inferiore quando l’emozione da riconoscere appartiene a un volto che non appartiene alla stessa cultura o etnia di quello dell’osservatore. Tuttavia, questo effetto può essere superato da una forma di allenamento.

Riconoscimento mimico visivo
Questa parte è comunemente indicata come espressione facciale. Come interfaccia uomo-macchina, viene utilizzata una videocamera digitale o un dispositivo di ingresso ottico equivalente. Qui, i metodi di riconoscimento facciale vengono utilizzati per analizzare le caratteristiche della superficie facciale. Con la classificazione automatica è possibile associare le espressioni facciali dei frame seriali a un cluster che potrebbe essere associato a un’emozione. La ricerca ha dimostrato, tuttavia, che solo il 30% delle emozioni mimiche corrisponde alle emozioni realmente provate. Pertanto non si dovrebbero equiparare le espressioni facciali visive con il riconoscimento visivo delle emozioni. Lo sfondo biologico del riconoscimento delle emozioni visive è la simulazione di un nervo ottico umano in un robot.

Induzione di emozioni
Per le impostazioni sperimentali nei campi della psicologia delle emozioni, dell’etologia comportamentale, della neuropsicologia e di molte altre scienze, è spesso importante “generare” emozioni specifiche in condizioni di laboratorio. L’induzione emotiva è una delle aree più difficili della ricerca emotiva. Diverse meta-analisi su questo argomento hanno estratto diversi metodi che possono indurre più efficacemente le emozioni.

Innanzitutto è la cattura delle emozioni nella realtà (ricerca sul campo delle parole chiave). A causa della bassa validità interna, questo viene spesso evitato. Il secondo metodo, che combina un alto interno con un’alta validità esterna, è il metodo dei richiami emozionali in cui si cerca di evocare ricordi dalla memoria emotiva. Sconsigliato per gli esperimenti al di fuori della ricerca emotiva EEG è attraverso metodi di induzione come il metodo IAPS o induzione, che presumibilmente utilizzano sequenze di film emotivo o brani musicali. Tutti questi metodi rimangono senza prove di efficacia specifica. La robotica utilizza spesso procedure sperimentali idealizzate, ad esempio:

Si suppone che un metodo di induzione induca un’emozione negli umani.
L’uomo esprime la sua emozione con una superficie del viso cambiata.
Una webcam sul computer cattura la nuova espressione facciale.
Il computer può automaticamente classificare l’emozione classificandola come l’emozione che era stata precedentemente indotta.

Dopo aver completato la fase di apprendimento, l’IA dovrebbe essere in grado di riconoscere indipendentemente le emozioni senza essere stata precedentemente insegnata da un essere umano. Tuttavia, poiché né il metodo di induzione viene spesso testato per l’efficacia, né le emozioni indotte vengono valutate durante l’esperimento stesso, queste procedure sperimentali idealizzate in robotica rimangono spesso errate e incomplete.

Automatico
Questo processo sfrutta le tecniche di più aree, come l’elaborazione del segnale, l’apprendimento automatico e la visione artificiale. Diverse metodologie e tecniche possono essere impiegate per interpretare emozioni come le reti bayesiane., I modelli Gaussian Mixture e Hidden Markov Models.

approcci
Il compito del riconoscimento delle emozioni spesso implica l’analisi delle espressioni umane in forme multimodali come testi, audio o video. Diversi tipi di emozione sono rilevati attraverso l’integrazione di informazioni da espressioni facciali, movimenti del corpo e gesti e linguaggio. Gli approcci esistenti nel riconoscimento delle emozioni per classificare determinati tipi di emozioni possono essere generalmente classificati in tre categorie principali: tecniche basate sulla conoscenza, metodi statistici e approcci ibridi.

Tecniche basate sulla conoscenza
Le tecniche basate sulla conoscenza (talvolta denominate tecniche basate sul lessico), utilizzano la conoscenza del dominio e le caratteristiche semantiche e sintattiche del linguaggio al fine di rilevare determinati tipi di emozione. In questo approccio, è comune utilizzare risorse basate sulla conoscenza durante il processo di classificazione delle emozioni come WordNet, SenticNet, ConceptNet ed EmotiNet, solo per citarne alcuni. Uno dei vantaggi di questo approccio è l’accessibilità e l’economia determinate dall’ampia disponibilità di tali risorse basate sulla conoscenza. Una limitazione di questa tecnica, d’altra parte, è la sua incapacità di gestire sfumature di concetto e regole linguistiche complesse.

Le tecniche basate sulla conoscenza possono essere principalmente classificate in due categorie: approcci basati sul dizionario e basati sul corpus. Gli approcci basati sul dizionario trovano parole di opinione o di emozione in un dizionario e cercano i loro sinonimi e contrari per espandere l’elenco iniziale di opinioni o emozioni. Gli approcci basati sul corpus, d’altra parte, iniziano con una lista di semi di parole di opinione o di emozione e espandono il database trovando altre parole con caratteristiche specifiche del contesto in un corpus di grandi dimensioni. Sebbene gli approcci basati sui corpus prendano in considerazione il contesto, le loro prestazioni variano ancora in domini diversi poiché una parola in un dominio può avere un diverso orientamento in un altro dominio.

Metodi statistici
I metodi statistici implicano comunemente l’uso di diversi algoritmi di apprendimento automatico supervisionati in cui un grande insieme di dati annotati viene inserito negli algoritmi affinché il sistema apprenda e predetti i tipi di emozione appropriati. Questo approccio comporta normalmente due insiemi di dati: il set di addestramento e il set di test, in cui il primo viene utilizzato per apprendere gli attributi dei dati, mentre il secondo viene utilizzato per convalidare le prestazioni dell’algoritmo di apprendimento automatico. Gli algoritmi di apprendimento automatico generalmente forniscono un’accuratezza di classificazione più ragionevole rispetto ad altri approcci, ma una delle sfide per ottenere buoni risultati nel processo di classificazione è la necessità di disporre di un set di formazione sufficientemente ampio.

Alcuni degli algoritmi di apprendimento automatico più comunemente utilizzati includono Support Vector Machines (SVM), Naive Bayes e Maximum Entropy. Anche l’apprendimento approfondito, che appartiene alla famiglia di apprendimento automatico senza supervisione, è ampiamente utilizzato nel riconoscimento delle emozioni. Gli algoritmi di deep learning ben conosciuti includono diverse architetture di reti neurali artificiali (ANN) come la rete neurale convoluzionale (CNN), la memoria a breve termine (LSTM) e l’Extreme Learning Machine (ELM). La popolarità degli approcci di deep learning nel campo del riconoscimento delle emozioni può essere attribuita principalmente al suo successo in applicazioni correlate come la visione artificiale, il riconoscimento vocale e il Natural Language Processing (NLP).

Approccio ibrido
Gli approcci ibridi nel riconoscimento delle emozioni sono essenzialmente una combinazione di tecniche basate sulla conoscenza e metodi statistici, che sfruttano le caratteristiche complementari di entrambe le tecniche. Alcuni dei lavori che hanno applicato un insieme di elementi linguistici basati sulla conoscenza e metodi statistici includono il calcolo sentoriale e iFeel, che hanno entrambi adottato la risorsa SenticNet basata sulla conoscenza a livello di concetti. Il ruolo di tali risorse basate sulla conoscenza nell’implementazione di approcci ibridi è molto importante nel processo di classificazione delle emozioni. Poiché le tecniche ibride traggono vantaggio dai vantaggi offerti sia dall’approccio basato sulla conoscenza che da quello statistico, tendono ad avere prestazioni di classificazione migliori rispetto all’utilizzo indipendente di metodi basati sulla conoscenza o statistici. Uno svantaggio di usare le tecniche ibride, tuttavia, è la complessità computazionale durante il processo di classificazione.

Dataset
I dati sono parte integrante degli approcci esistenti nel riconoscimento delle emozioni e nella maggior parte dei casi è una sfida ottenere dati annotati necessari per addestrare algoritmi di apprendimento automatico. Sebbene la maggior parte dei dati disponibili al pubblico non siano annotati, esistono serie di dati annotati esistenti per eseguire ricerche sul riconoscimento delle emozioni. Per il compito di classificare diversi tipi di emozioni da fonti multimodali sotto forma di testi, audio, video o segnali fisiologici, sono disponibili i seguenti set di dati:

HUMAINE: fornisce clip naturali con parole di emozione e etichette di contesto in più modalità
Database di Belfast: fornisce clip con una vasta gamma di emozioni da programmi TV e registrazioni di interviste
SEMAINE: fornisce registrazioni audiovisive tra una persona e un agente virtuale e contiene annotazioni di emozione come arrabbiato, felice, paura, disgusto, tristezza, disprezzo e divertimento
IEMOCAP: fornisce registrazioni di sessioni diadiche tra attori e contiene annotazioni di emozione come felicità, rabbia, tristezza, frustrazione e stato neutro
eTERFACE: fornisce registrazioni audiovisive di soggetti di sette nazionalità e contiene annotazioni di emozioni come felicità, rabbia, tristezza, sorpresa, disgusto e paura
DEAP: fornisce elettroencefalografia (EEG), elettrocardiografia (ECG) e registrazioni video di volti, oltre a annotazioni di emozione in termini di valenza, eccitazione e dominanza di persone che guardano filmati
DREAMER: fornisce registrazioni di elettroencefalografia (EEG) ed elettrocardiografia (ECG), oltre a annotazioni di emozione in termini di valenza, eccitazione e dominanza di persone che guardano filmati

applicazioni
I programmatori di computer usano spesso come guida il sistema di codifica delle azioni facciali di Paul Ekman.

Il riconoscimento delle emozioni viene utilizzato per una serie di motivi. Affectiva lo utilizza per aiutare gli inserzionisti e i creatori di contenuti a vendere i loro prodotti in modo più efficace. Affectiva crea anche un sensore Q che misura le emozioni dei bambini autistici. Emotient era una startup company che utilizzava l’intelligenza artificiale per prevedere “atteggiamenti e azioni basati sulle espressioni facciali”. Apple ha indicato l’intenzione di acquistare Emotient a gennaio 2016. nViso offre il riconoscimento delle emozioni in tempo reale per applicazioni Web e mobili tramite un’API in tempo reale. Visage Technologies AB offre la stima delle emozioni come parte del loro Visage SDK per il marketing e la ricerca scientifica e scopi simili. Eyeris è una società di riconoscimento delle emozioni che collabora con produttori di sistemi integrati, tra cui produttori di automobili e società di robotica sociale, integrando i propri software di analisi facciale e riconoscimento delle emozioni; così come con i creatori di contenuti video per aiutarli a misurare l’efficacia percepita della loro creatività video a forma corta e lunga. Il riconoscimento delle emozioni e l’analisi delle emozioni vengono studiati da aziende e università di tutto il mondo.

Rilevamento sdraiato
La percezione multisensoriale delle emozioni è utile per valutare la veridicità delle espressioni, più specificamente nel rilevare bugie, dove le bugie devono essere intese come deliberatamente false affermazioni ingannevoli. Sebbene non sia un indicatore universalmente valido per la certezza delle bugie, la mimica, i gesti, la lingua e la postura possono fornire indizi. Relativamente affidabili sono i segnali inconsci o non controllabili, come la larghezza della pupilla, la linea di visione o il rossore. Inoltre, l’attenzione dovrebbe focalizzarsi sempre più sulle discrepanze tra le varie espressioni verbali e non verbali di una persona.