Opis
„MianX” to bazujący na prostej AI detektor ekspresji emocjonalnej malującej się na twarzach osób wykrytych w monitorowanym przez kamerę polu. „MianX”, w przeciwieństwie do „NVED” skupia się na jednej twarzy (jakkolwiek zaznacza też na obrazie wszystkie twarze wychwycone przez system). Miniatura wykrywa kombinację 7 stanów emocjonalnych: spokoju (stan „neutralny”), radości, strachu, zdziwienia, wstrętu, gniewu, smutku; potrafi też wydobyć z danych przekazanych przez AI i wzmocnić informację o składnikach emocjonalnych innych niż dominujące.
Miniatura wizualizuje i sonifikuje wydobyte informacje. Wizualizacja, jakkolwiek jest proceduralnym i literalnym efektem konwersji danych o emocjach na postać graficzną w oczywisty sposób nawiązuje do „nimbu” lub „aury”. Sonifikacja (w wersji wbudowanej w pracę, choć dzięki możliwości komunikacji Miniatury ze światem zewnętrznym można pokusić się o stworzenie własnej ścieżki dźwiękowej) bazuje na prostej idei przyporządkowania każdej z emocji osobnego tonu.
Tytuł Miniatury „MianX” pochodzi od nazwy antycznej chińskiej sztuki czytania z twarzy Mian Xiang (面相) — osoby biegłe w Mian Xiang potrafiły diagnozować choroby, określać cechy charakteru, a nawet przewidywać przyszłe losy przyglądając się twarzom „badanych” osób.
Dokumentacja techniczna
Parametry przekazywane przez adres URL
- cnf 0.0 … 1.0; „poczucie pewności” modelu wykrywającego ekspresję emocjonalną
- famo user | environment (lub env); domyślnie user; [facingMode] pozwala wymusić użycie przedniej (user) lub tylnej (environment) kamery na urządzeniach, które są wyposażone w podwójne kamery/aparaty (większość współczesnych urządzeń mobilnych)
- gui 0 lub 1; domyślnie 1; chowa/pokazuje panel z interfejsem graficznym
- h pionowa rozdzielczość kamery
- lang en lub pl; domyślnie en; ustawia język interfejsu (istnieje możliwość dodania kolejnych języków)
- mirror 0 lub 1; domyślnie 1; wyłącza/włącza lustrzane odbicie obrazu z urządzenia przechwytującego (zwykle kamery)
- pointer 0 lub 1; domyślnie 1; chowa/pokazuje kursor myszy
- sel 0.0 … 1.0; selektywość modelu wykrywającego ekspresję emocjonalną
- synth 0 lub 1; domyślnie 1; wyłącza/włącza wewnętrzny generator dźwięku
- tuning sekwencja 7 odzielonych przecinkami liczb z zakresu 0 … 127 reprezentujących nuty MIDI przyporządkowane składnikom emocjonalnym badanej twarzy, kolejność emocji to: „spokój”,”szczęście”,”gniew”,”smutek”,”wstręt”,”zaskoczenie”,”strach”
- vol 0.0 … 1.0; ustala inicjalny poziom głośności instrumentu (globalny suwak „vol”)
- w pozioma rozdzielczość kamery
- worker 0 lub 1; domyślnie 0; umożliwia zablokowanie wbudowanych w przeglądarkę mechanizmów zatrzymywania pracy programu kiedy okno nie jest widoczne
- ws adres; domyślnie wyłączone; włącza i ustala adres (zwykle localhost:9001) dla komunikacji poprzez WebSocket (umożliwia zewnętrzne sterowanie Miniaturą i dostosowanie do własnych potrzeb)
- xws adres; domyślnie wyłączone; włącza i ustala adres (zwykle ws://localhost:9001) ze wskazaniem protokołu dla komunikacji poprzez WebSocket (umożliwia zewnętrzne sterowanie Miniaturą i dostosowanie do własnych potrzeb)
Komunikaty przekazywane przez WebSocket
Komunikaty, na które reaguje Miniatura
nie dotyczy
Komunikaty wysyłane przez Miniaturę
- mianx face parametry twarzy: index, znormalizowane położenie w poziomie, znormalizowane położenie w pionie, znormalizowana szerokość, znormalizowana wysokość, „spokój” (znormalizowana wartość), „szczęście” (znormalizowana wartość), „gniew” (znormalizowana wartość), „smutek” (znormalizowana wartość), „wstręt” (znormalizowana wartość), „zaskoczenie” (znormalizowana wartość), „strach” (znormalizowana wartość)
- mianx faces raportuje ilość rozpoznanych twarzy
MIDI
Komunikaty, na które reaguje Miniatura
nie dotyczy
Komunikaty wysyłane przez Miniaturę
nie dotyczy
Komunikacja z MaxMSP
Komunikaty, na które reaguje Miniatura
nie dotyczy
Komunikaty wysyłane przez Miniaturę
nie dotyczy