Caption – Google Glass z translacją w czasie rzeczywistym

29 Wrz 2014

Translatory to już bardzo zaawansowane narzędzia. Wciąż jednak nie są w powszechnym użytku, gdyż ich wykorzystanie łączy się z niemałymi problemami. Google Glass może być sprzętem, które w końcu stanie się odpowiednią formą do szybkiego porozumiewania się między osobami nie znającymi języków. Wszystko za sprawą nowej aplikacji Caption. Ideą programu jest dostarczenie widoku tłumaczenia bezpośrednio przed okiem i to w czasie rzeczywistym. Oprogramowanie ma nasłuchiwać języka naszego rozmówcy i w czasie rzeczywistym pokazywać tekst w naszym języku na mini wyświetlaczu inteligentnych okularów. Przecież funkcje rozpoznawania mowy i translacji już istnieją, brakującym ogniwem była wygodna forma dla takiego pomysłu.

Co prawda na razie nie ma zbyt optymistycznych perspektyw, by akcja podobna do tej na promocyjnym video była możliwa, ale kiedyś, kiedy ubieralne ekrany będą normą (lub jakimś standardem), wtedy porozumiewanie mogłoby wyglądać w przybliżeniu właśnie tak. Może nie aż tak szybko, ale zdecydowanie szybciej niż gdybyśmy próbowali porozumieć się bez Caption. Aplikacja jest jeszcze w fazie rozwojowej i pewnie daleko jej do ideału, ale autorzy walczą, by przygotować rozwiązanie nawet dla grupowych konwersacji. Na ten moment skupiono się głównie na rozmowacz w cztery oczy. Prywatne testy potrwają do pierwszego kwartału 2015 roku i na razie dotyczą translacji między niemieckim, hiszpańskim, francuskim i włoskim.

Swoje ograniczenia ma też pierwsza generacja Google Glass, a zwłaszcza ich wrażliwość na mowę. Docelowo sprzęt wykrywa głównie głos użytkownika, ale nie powinno być problemem nasłuchiwanie rozmówcy. Gorzej będzie z kwestiami wyciszania szumu, który zwykle towarzyszy nam z otoczenia. Projekt mógłby stać się też tłumaczem dla niesłyszących, pokazując treści na ekranie i nie zmuszając do czytania z ruchu warg. Potencjał jest spory, zwłaszcza, że sytuacji dla niego jest bardzo, bardzo dużo. Model takiego porozumiewania miałby sens i w spotkaniach biznesowych i w turystyce, nagłych wypadkach (jak na poniższym filmiku), ale i wielu, wielu innych. Złożenie wszystkiego w całość nie jest proste: problemy z rozpoznaniem mowy, szybkie i bezbłędne tłumaczenie, a nawet czas reakcji i to wszystko jeszcze w czasie rzeczywistym…

źródło: Caption

O mnie

Michał Sitnik

Eksploruję Internet Rzeczy, przymierzam ubieralne technologie, zamieszkuję smart dom. Blogując promuję nowoczesne rozwiązania, testuję i dzielę się wynikami. Przestrzegam i ostrzegam, ale częściej zachęcam. Gotowy na nową epokę technologiczną z kilkuletnim wyprzedzeniem. Na bieżąco z rozwiązaniami przyszłości. Nie geek!

Czytaj więcej o mnie

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *