Description
“Empator” is a simple AI-based detector of emotional expressions on the faces of people detected in the camera’s field of view. “Empator” extracts two faces from the image (and generally requires at least two people in the camera’s field of view) and analyzes the facial expressions for combinations of seven emotional states: calm (“neutral” state), joy, fear, surprise, disgust, anger, and sadness. It can also extract and amplify information about emotional components other than the dominant ones from the data provided by the AI.
The miniature analyzes the correspondence between the emotional states of both people’s faces, generating a soundscape based on the congruent emotional states (“Empator” can also be switched to a mode that amplifies the differences between individual emotional components) and visualizes the “halo” or “aura” of both faces (similar emotional states are similar “appearances”). The work handles both live faces and photos placed in front of the camera equally well, allowing one to compare one’s own emotional expression with that of another person (either standing next to us in front of the camera or with someone else’s image), and thus, this Miniature can be used in various ways.
One of the key inspirations for the work (both “Empator” and “MianX”) was a device invented for the plot of the book “Do Androids Dream of Electric Sheep?” (Philip K. Dick, 1968) and the film based on it, “Blade Runner” (Ridley Scott, 1982), which conducts the so-called “Voit-Kampf test” on certain book and film protagonists and antagonists — a hypothetical procedure that tests the capacity for empathy, which allows one to distinguish humans from androids.
Technical documentation
Parameters passed via URL
- cnf 0.0 … 1.0; “confidence level” of the model detecting emotional expression
- famo user | environment (or env); default user; [facingMode] allows forcing the use of the front (user) or rear (environment) camera on devices equipped with dual cameras (most modern mobile devices)
- gui 0 or 1; default 1; hides/shows the graphical user interface panel
- h vertical camera resolution
- inv 0 or 1 (default 0); switches between searching for analogous or opposing emotional expressions of both analyzed faces
- lang en or pl; default en; sets the interface language (additional languages can be added)
- mirror 0 or 1; default 1; disables/enables mirroring of the image from the capture device (usually a camera)
- pointer 0 or 1; default 1; hides/shows the mouse cursor
- sel 0.0 … 1.0; selectivity of the model detecting emotional expression
- synth 0 or 1; default 1; disables/enables the internal sound generator
- tuning sequence of 14 numbers separated by commas in the range 0 … 127 representing MIDI notes assigned to emotional components of both compared faces; the first 7 numbers specify values for the first face, the next 7 for the second; the order of emotions is: “calm”, “happiness”, “anger”, “sadness”, “disgust”, “surprise”, “fear”
- vol 0.0 … 1.0; sets the initial instrument volume level (global “vol” slider)
- w horizontal camera resolution
- worker 0 or 1; default 0; allows blocking the browser’s built-in mechanisms that suspend the program when the window is not visible
- ws address; disabled by default; enables and sets the address (usually localhost:9001) for WebSocket communication (allows external control of Miniature and customization)
- xws address; disabled by default; enables and sets the address (usually ws://localhost:9001) with protocol specification for WebSocket communication (allows external control of Miniature and customization)
Komunikaty przekazywane przez WebSocket
Komunikaty, na które reaguje Miniatura
nie dotyczy
Komunikaty wysyłane przez Miniaturę
- empator data “spokój” pierwszej twarzy (znormalizowana wartość), “szczęście” pierwszej twarzy (znormalizowana wartość), “gniew” pierwszej twarzy (znormalizowana wartość), “smutek” pierwszej twarzy (znormalizowana wartość), “wstręt” pierwszej twarzy (znormalizowana wartość), “zaskoczenie” pierwszej twarzy (znormalizowana wartość), “strach” pierwszej twarzy (znormalizowana wartość) “spokój” drugiej twarzy (znormalizowana wartość), “szczęście” drugiej twarzy (znormalizowana wartość), “gniew” drugiej twarzy (znormalizowana wartość), “smutek” drugiej twarzy (znormalizowana wartość), “wstręt” drugiej twarzy (znormalizowana wartość), “zaskoczenie” drugiej twarzy (znormalizowana wartość), “strach” drugiej twarzy (znormalizowana wartość) “spokój” (znormalizowana różnica lub zgodność pomiędzy analizowanymi twarzami), “szczęście” (znormalizowana różnica lub zgodność pomiędzy analizowanymi twarzami), “gniew” (znormalizowana różnica lub zgodność pomiędzy analizowanymi twarzami), “smutek” (znormalizowana różnica lub zgodność pomiędzy analizowanymi twarzami), “wstręt” (znormalizowana różnica lub zgodność pomiędzy analizowanymi twarzami), “zaskoczenie” (znormalizowana różnica lub zgodność pomiędzy analizowanymi twarzami), “strach” (znormalizowana różnica lub zgodność pomiędzy analizowanymi twarzami)
- empator face parametry twarzy: index, znormalizowane położenie w poziomie, znormalizowane położenie w pionie, znormalizowana szerokość, znormalizowana wysokość, “spokój” (znormalizowana wartość), “szczęście” (znormalizowana wartość), “gniew” (znormalizowana wartość), “smutek” (znormalizowana wartość), “wstręt” (znormalizowana wartość), “zaskoczenie” (znormalizowana wartość), “strach” (znormalizowana wartość)
- empator faces raportuje ilość rozpoznanych twarzy
MIDI
Komunikaty, na które reaguje Miniatura
nie dotyczy
Komunikaty wysyłane przez Miniaturę
nie dotyczy
Komunikacja z MaxMSP
Komunikaty, na które reaguje Miniatura
nie dotyczy
Komunikaty wysyłane przez Miniaturę
nie dotyczy