Jak używać I Have A Voice

Dwa sposoby komunikacji

I Have A Voice obsługuje dwa tryby. Większość rodzin zaczyna od trybu z opiekunem; śledzenie wzroku jest dla osób, które mogą same obsługiwać aplikację.

Z opiekunem

Członek rodziny lub opiekun obsługuje urządzenie. Osoba komunikuje się sygnałem - mrugnięciem, spojrzeniem, oddechem, dowolnym wcześniej ustalonym znakiem.

Śledzenie wzroku

Osoba sama steruje aplikacją oczami. Niewielki ruch ust lub języka potwierdza każdy wybór. Bez dotyku, bez przełączników.

Tryb opiekuna w szczegółach

Na papierze tryb opiekuna wydaje się powolny - w praktyce jest zaskakująco skuteczny. Dwa pytania powtarzają się w stałym rytmie.

1. Znajdź właściwy ekran klawiatury

Zapytaj: "Czy litera jest na tym ekranie?" Poczekaj na umówiony sygnał. Jeśli nie ma sygnału, dotknij, aby przejść do następnego ekranu klawiatury i zapytaj ponownie. Klawiatura ma pięć ekranów obejmujących wszystkie litery - być może trzeba przejrzeć więcej niż jeden.

2. Znajdź właściwą literę

Gdy masz właściwy ekran, pytaj o każdą literę po kolei: "Czy to A?" - czekaj - "Czy to B?" - czekaj - aż otrzymasz sygnał. Wtedy dotknij tej litery.

3. Zbuduj zdanie

Powtarzaj literę po literze, słowo po słowie. Model neuronowy proponuje słowo po kilku literach - zapytaj, czy to właściwe, i dotknij Accept, gdy tak jest. Akceptowanie sugestii to właśnie to, co uczy aplikację głosu danej osoby w czasie. Gdy zdanie jest gotowe, dotknij Speak, aby urządzenie odczytało je na głos.

Kilka rzeczy, które pomagają

Uzgodnij sygnał przed rozpoczęciem - mrugnięcie, spojrzenie w górę, świadomy oddech, cokolwiek, co oboje potraficie powtórzyć. Rytm jest ważniejszy niż szybkość. Róbcie przerwy; komunikacja w ten sposób to prawdziwy wysiłek fizyczny.

Zgodne urządzenia

Śledzenie wzroku korzysta z kamery TrueDepth firmy Apple - tej samej, która obsługuje Face ID. Tryb opiekuna działa na każdym iPhonie i iPadzie; tylko śledzenie wzroku wymaga TrueDepth.

Śledzenie wzroku + tryb opiekuna

iPhone X i nowsze
iPad Pro 11" - wszystkie generacje
iPad Pro 12.9" - 3. generacja (2018) i nowsze

Tylko tryb opiekuna

iPhone SE - wszystkie generacje
iPhone 8 i starsze
iPad Air, iPad mini, zwykły iPad

Wymaga systemu iOS lub iPadOS 17.6 lub nowszego. Można też zainstalować na komputerach Mac z procesorami Apple Silicon (M1 lub nowsze) jako aplikację iPada - śledzenie wzroku nie jest dostępne na komputerach Mac.

Konfiguracja śledzenia wzroku

Pozycja to najważniejszy pojedynczy czynnik decydujący o tym, czy śledzenie wzroku działa płynnie. Ustaw to dobrze, a reszta pójdzie sama.

Konfiguracja fizyczna

Trzymaj urządzenie 35-50 cm (około 14-20 cali) od twarzy, z przednią kamerą blisko poziomu oczu. Płaski stół wystarcza na krótkie sesje. Do codziennego użytku stojak na telefon lub tablet albo teleskopowe ramię przymocowane do łóżka czy fotela daje właściwą wysokość i utrzymuje urządzenie stabilnie - trzymanie w ręku zmienia pozycję, gdy ręce się męczą.

Celownik

Aplikacja pokazuje małą kropkę. Niech osoba patrzy bezpośrednio na kropkę podczas konfiguracji - kropka przesuwa się, gdy przesuwasz urządzenie (w górę, w dół, w lewo, w prawo). Przesuwaj urządzenie, aż kropka znajdzie się na środku. To idealna pozycja do kalibracji.

Orientacja nie ma znaczenia

Urządzenie może być w pionie, poziomie lub pod dowolnym kątem - tak jak pasuje do pozycji osoby. Jeśli jest zamontowane bokiem lub pod kątem, włącz blokadę obrotu iOS (przesuń palcem w dół z prawego górnego rogu, aby otworzyć Centrum Sterowania, następnie dotknij ikony kłódki ze strzałką), aby ekran nie obracał się, gdy stojak lub ramię się przesunie.

Najpierw spróbuj sam

Przed skonfigurowaniem urządzenia dla osoby, która będzie z niego korzystać, poświęć kilka minut na używanie aplikacji samodzielnie. Przejdź przez śledzenie wzroku, wykonaj kalibrację, wyślij kilka liter ruchem ust. Wiedza o tym, jak aplikacja działa z pierwszej ręki, znacznie ułatwia wyjaśnienie, co się dzieje, i wychwycenie tego, co wymaga dopracowania, gdy konfigurujesz ją dla tej osoby.

Jak działa śledzenie wzroku

Oczy sterują, krok po kroku

Ruch oczu przy śledzeniu powinien być świadomy, nie subtelny - wyraźne spojrzenie w lewo i z powrotem do środka, wyraźne spojrzenie w górę i z powrotem. Jedno świadome spojrzenie przesuwa zaznaczenie o jeden krok. Nie wpatrujesz się w docelową literę, prowadzisz kursor w jej kierunku. Precyzja nie ma znaczenia; świadomy ruch tak. Ponieważ patrzenie prosto w dół jest fizycznie trudne dla wielu osób, mrugnięcie może zastąpić spojrzenie w dół.

Potwierdzenie wyboru

Otwórz usta lub wysuń język

Gdy zaznaczenie znajduje się na przycisku, który chcesz wybrać, otwórz usta lub wysuń język. Aplikacja odczyta to jako wybór. Naprowadzanie wzrokiem + wybór ruchem ust - to całe sterowanie.

Dwa najważniejsze przyciski

Większość klawiatury to litery, ale dwa nieliterowe przyciski wykonują prawdziwą pracę komunikacyjną.

Accept

Model neuronowy proponuje słowo po kilku literach. Accept bierze proponowane słowo i dodaje je do tworzonego zdania - znacznie szybciej niż wpisywanie reszty litera po literze.

Speak

Speak czyta tworzone zdanie na głos. To moment, w którym urządzenie staje się głosem. Używaj go, aby podzielić frazę na mniejsze wypowiedzi lub odczytać całe zdanie naraz.

Aplikacja uczy się, kim jesteś

Akceptowanie proponowanych słów i dotykanie Speak uczy model neuronowy głosu osoby - jej słów, fraz, sposobu mówienia. Działa to tak samo w trybie opiekuna i w śledzeniu wzroku. Im więcej aplikacja jest używana, tym celniejsze podpowiedzi i tym mniej liter trzeba pisać. Każda zaakceptowana sugestia i każde wypowiedziane zdanie czyni następne łatwiejszym.

Możesz zaczynać

Wszystko gotowe

Dopracuj czułość w dowolnym momencie w Options > Eye Tracking. Jeśli coś działa nie tak, to pierwsze miejsce do sprawdzenia.

Ustawienia śledzenia wzroku

Śledzenie wzroku ma dedykowany ekran ustawień w Options > Eye Tracking. Trzy rzeczy do wiedzy: jak włączyć, jak skalibrować i trzy wartości, które można dostroić.

Eye tracking settings screen showing inactive state with Tracking Off button and Calibrate option

Włączanie

Śledzenie wzroku jest nieaktywne przy pierwszym otwarciu aplikacji. Dotknij szarego przycisku "TRACKING OFF", aby je włączyć. Przycisk Calibrate poniżej pozwala dopasować zakres śledzenia do ruchu oczu osoby.

Sensitivity settings screen showing <strong>eye sensitivity, mouth sensitivity, and cooldown duration</strong> controls

Czułość i czas

Trzy wartości pozwalają dostosować aplikację do osoby, która z niej korzysta: czułość oczu, czułość ust i odstęp między wyborami (cooldown). Każdą można dostroić przyciskami Decrease i Increase. Zacznij od wartości domyślnych i dostosuj na podstawie tego, co widzisz w rzeczywistym użytkowaniu.

Czułość oczu (0.1 - 1.0)

Jak mocno spojrzenie przesuwa zaznaczenie. Wyższe wartości reagują na mniejsze ruchy oczu; niższe wymagają większego, bardziej świadomego spojrzenia. Jeśli kursor działa chaotycznie lub uruchamia się przypadkiem, obniż wartość. Jeśli osoba musi mocno patrzeć, aby przesunąć zaznaczenie, podnieś. 0.7-0.8 to dobry punkt startowy dla większości osób.

Czułość ust (0.1 - 1.0)

Jak łatwo wykrywany jest gest otwarcia ust lub wysunięcia języka. Wyższa wartość oznacza, że mały ruch liczy się jako wybór; niższa wymaga bardziej świadomego, dłuższego gestu. Jeśli wybory uruchamiają się przypadkiem (ziewanie, mówienie, przełykanie), obniż. Jeśli gest trzeba trzymać zbyt długo, podnieś. 0.6-0.7 to rozsądny punkt startowy.

Odstęp między wyborami (0.1 - 2.0 sekundy)

Pauza między kolejnymi wyborami. Działa jako zabezpieczenie przed podwójnym naciśnięciem. Dłuższy odstęp oznacza większą przerwę między literami i mniej przypadkowych duplikatów; krótszy pozwala pisać szybciej, ale grozi duplikatami. 0.5 sekundy to wyważona wartość domyślna.

Kalibracja ręczna

Ruch oczu nie jest równy we wszystkich kierunkach. Wiele osób patrzy łatwo w lewo i w prawo, ale trudno im patrzeć w dół; niektórzy mają silniejszy ruch w jedną stronę; niektórzy mogą tylko nieznacznie otworzyć usta. Kalibracja ręczna pozwala ustawić pięć indywidualnych progów - lewo, prawo, góra, dół i otwarcie ust - tak aby każdy kierunek był dostrojony do tego, co osoba faktycznie potrafi. Znajdziesz ją w Options > Eye Tracking > Calibration > Manual Calibration.

Jak to czytać

Każdy próg to "jak daleko w tym kierunku oko (lub usta) musi się poruszyć, zanim gest zostanie zarejestrowany". Niższe liczby oznaczają, że uruchamiają się mniejsze, łatwiejsze ruchy. Wyższe wymagają bardziej świadomego ruchu. Podtytuł ekranu mówi to wprost: "Jak daleko spojrzeć, zanim kierunek zostanie zarejestrowany. Niższe jest łatwiejsze."

Manual calibration screen showing Look Left and Look Right thresholds

Lewo i prawo

Look Left Threshold i Look Right Threshold (domyślnie 0.30 każdy). Obniż te wartości dla osoby, której poziomy zakres oczu jest ograniczony - może nie być w stanie spojrzeć tak daleko, jak domyślnie oczekuje aplikacja. Jeśli jedna strona porusza się łatwiej niż druga (częste po udarze), ustaw je asymetrycznie: np. 0.20 po trudniejszej stronie, 0.30 po łatwiejszej.

Manual calibration screen showing Look Up, Look Down, and Open Mouth thresholds

Góra, dół i usta

Look Up Threshold (domyślnie 0.25), Look Down Threshold (domyślnie 0.20), Open Mouth Threshold (domyślnie 0.30). Dół jest domyślnie ustawiony niżej, ponieważ patrzenie w dół jest fizycznie trudniejsze dla większości osób. Jeśli patrzenie w dół jest niemożliwe, ustaw bardzo nisko - lub polegaj na mrugnięciu jako zamienniku (zgodnie ze wskazówkami dotyczącymi śledzenia wzroku powyżej). Open Mouth Threshold ustala, jak szeroko trzeba otworzyć usta, by liczyło się jako wybór - niżej dla osoby z ograniczonym ruchem szczęki.

Wskazówki dotyczące dostrajania

Dostrajaj jeden próg na raz i testuj przez minutę lub dwie przed zmianą kolejnego. Jeśli kierunek uruchamia się przypadkiem (osoba lekko spogląda w tę stronę bez zamiaru), podnieś jego próg. Jeśli kierunek nie uruchamia się nawet przy wyraźnym, świadomym spojrzeniu, obniż go. Celem jest najmniejszy próg, który nie uruchamia się przypadkiem.

Mowa i głos

W Options > Speech możesz dostosować, jak szybko urządzenie mówi i jakiego głosu używa. Oba ustawienia mają znaczenie dla tego, czy osoba czuje, że wypowiadane słowa są jej.

Speech settings screen showing speech speed and voice link

Prędkość mowy

Speech Speed (domyślnie 1.0x) kontroluje, jak szybko urządzenie czyta na głos utworzone zdania. Wolniejsze prędkości (0.6-0.9x) są łatwiejsze do śledzenia w rozmowie, zwłaszcza dla opiekunów, którzy łapią zdanie ze słuchu. Szybsze (1.1-1.5x) pasują biegłym użytkownikom, którzy chcą szybkiej wymiany. Dostosuj przyciskami Decrease i Increase.

Voice selection screen showing Pro Voices (Google premium) and Offline Voices (built-in iOS)

Głos

Dwa poziomy głosów. Pro voices to premium głosy Google - bardziej naturalna intonacja, płynniejsze frazowanie - i wymagają połączenia z internetem. Offline voices to wbudowane głosy iOS, niższej jakości, ale zawsze dostępne. Oba dostępne w wersji męskiej i żeńskiej, gdzie język to obsługuje.

Online czy offline

Po podłączeniu do internetu automatycznie używany jest głos Pro. W trybie offline aplikacja przełącza się na wbudowany głos iOS tej samej płci, więc mowa działa nawet bez sygnału. Niektóre języki nie mają obu płci głosów dostępnych na każdym urządzeniu - aplikacja używa tego, co jest zainstalowane.

Sugestie słów

W Options > Text Suggestions wybierasz, jak działa przewidywanie słów. Trzy tryby plus opcja resetowania nauczonego profilu.

Intelligent

Spersonalizowane sugestie z własnego profilu osoby. Model neuronowy buduje się w czasie z zaakceptowanych sugestii i wypowiedzianych zdań. To zalecany tryb - to on sprawia, że aplikacja brzmi jak własny głos osoby, a nie ogólny słownik.

Simple

Ogólne sugestie bez używania profilu. Przydatne, gdy osoba woli neutralne, częste przewidywania i nie chce, aby aplikacja uczyła się od niej. To także dobra opcja awaryjna, jeśli spersonalizowany model poszedł w nieoczekiwanym kierunku.

Off

Żadne sugestie słów nie są wyświetlane. Każda litera musi zostać wpisana. Przydatne dla użytkowników, którzy uważają sugestie za rozpraszające, lub którzy wolą dyscyplinę pełnego składania litera po literze.

Reset learning

Czyści wszystkie spersonalizowane sugestie, które model neuronowy zbudował z poprzednich sesji na urządzeniu. To nieodwracalne - nauczony profil zostaje wymazany i buduje się od zera. Użyj tego, jeśli model wychwycił wzorce, których wolisz nie zachować (inna osoba używała urządzenia, słownictwo z wczesnych eksperymentów itp.) lub gdy przekazujesz urządzenie nowemu użytkownikowi.

Potrzebujesz pomocy?

Skorzystaj z formularza kontaktowego poniżej. Możesz też skorzystać z formularza w aplikacji w About > Contact Us. Testerzy Beta mogą pisać na beta@ihaveavoice.app - czytamy wszystko.

Przejdź do formularza opinii