Mówisz trzy razy szybciej niż piszesz. To fizjologia, nie hack produktywności. Rok temu przełożyłem to na codzienną robotę i klawiaturę zostawiłem tylko do skrótów i kodu.
Z tego artykułu dowiesz się:
- dlaczego dyktowanie realnie zmienia dzień pracy, a nie tylko brzmi ładnie,
- które 4 aplikacje trzymam na Macu i kiedy której używam,
- dlaczego VoiceInk jest u mnie numerem jeden, a Handy i FluidVoice zajmują konkretne miejsca w tym stacku.
Rok dyktowania — co się zmieniło
Testowałem to wielokrotnie i wniosek jest zawsze ten sam: przeciętna osoba mówi ~130 słów na minutę i pisze ~40. Różnica to 90 słów na minutę, które codziennie „wyrzucasz w błoto" przez powolne klikanie.
Konkretny case:
- LinkedIn — hook piszę ręcznie, resztę dyktuję, czas z 25 do 8 minut,
- prompty do agentów AI — długie, szczegółowe instrukcje mówię w 2 minuty zamiast pisać przez 15,
- maile — mówię jak do człowieka i wychodzi bardziej ludzko niż przy dłubaniu w edytorze,
- notatki ze spotkań — 3 minuty po calu, gotowe podsumowanie leci do Obsidiana.
Pułapka, w którą wpadają początkujący: pierwsze trzy dni są dziwne. Mówisz do ekranu, czujesz się absurdalnie i chcesz to rzucić. Nie rzucaj. Czwartego dnia przestajesz to zauważać.
Testowałem 4, używam jednego
Uczciwie: na co dzień dyktuję przez VoiceInk i tylko VoiceInk. Reszta to apki, które przetestowałem porządnie — dla siebie i dla klientów — i wiem, kiedy je polecić komuś innemu.
1. VoiceInk — mój codzienny driver
VoiceInk to open-source aplikacja na macOS, która konwertuje głos na tekst lokalnie — model Whisper (albo Parakeet) działa na Apple Silicon, żaden dźwięk nie opuszcza Maca.
Wymagania: Apple Silicon (M1 i nowsze), macOS 14.4+.
Co daje mi realną przewagę nad resztą:
- Power Mode — automatyczna konfiguracja per aplikacja. Inne ustawienia dla maila, inne dla edytora kodu, inne dla LinkedIna. Bez klikania,
- AI Enhancement opcjonalny — możesz podpiąć własny klucz do OpenAI, Anthropic, Google albo Groq i model dopieszcza tekst po transkrypcji,
- systemowy skrót — jeden klawisz, każde pole tekstowe, każda aplikacja,
- płatność jednorazowa (Solo $25) — bez subskrypcji, bez limitów słów, bez chmury.
Dane pokazują jasno: 7 dni trial bez karty, potem $25 raz i temat zamknięty. Dla mnie zwrot w pierwszy tydzień.
2. Handy — co polecam klientom bez budżetu i na Windows
Handy to darmowa, open-source aplikacja MIT, która działa na macOS, Windows i Linux. Ponad 23 tysiące gwiazdek na GitHubie, wersja 0.8.3 z kwietnia 2026. Whisper, Parakeet albo Moonshine — wszystko lokalnie, bez konta, bez limitów.
Kiedy polecam Handy zamiast VoiceInk:
- klient chce zacząć bez wydawania złotówki i sprawdzić, czy dyktowanie w ogóle jest dla niego,
- klient pracuje na Windowsie albo Linuxie — VoiceInk go nie obsłuży, Handy tak,
- środowisko wymaga twardej prywatności — MIT, offline, kod otwarty, koniec kropka.
Gdzie ustępuje VoiceInk: brak Power Mode, brak AI Enhancement, brak własnego słownika terminów. Jeśli dyktujesz sporadycznie — nie zauważysz. Jeśli dyktujesz cały dzień — zauważysz.
To najlepsza darmowa alternatywa i jedyna, którą polecam bez zastrzeżeń, gdy budżet = 0 zł.
3. FluidVoice — świeżynka, którą trzymam na oku
FluidVoice pojawił mi się na radarze w ciągu ostatnich siedmiu dni. Darmowa, open-source (GPLv3), tylko macOS 15+ (Sequoia). Nemotron 3.5, Parakeet, Whisper, Apple Speech — kompletna paleta modeli.
Co robi wrażenie:
- Fluid Intelligence + własny model Fluid-1 — to jest ta jedna cecha, która wyróżnia FluidVoice na tle całej reszty. Wbudowany lokalny LLM (~3.5 GB, opt-in) poprawia dyktowany tekst po transkrypcji: kapitalizacja, interpunkcja, dopasowanie tonu do aktywnej aplikacji. Zero chmury, zero kluczy API. VoiceInk oferuje AI Enhancement, ale wymaga twojego klucza do OpenAI/Anthropic — FluidVoice ma to od razu, w pudełku,
- Command Mode — sterowanie Makiem głosem, bez dotyku klawiatury,
- Write Mode — dyktowanie w dowolnym polu tekstowym przez accessibility API.
Konkretny case: dopiero to testuję i mam mieszane odczucia. Fluid Intelligence brzmi jak game-changer, ale to nadal projekt na wczesnym etapie — 2.6k gwiazdek, aktywny development, „Windows/Linux coming soon". Autor pisze wprost: „na podstawie wczesnych opinii Fluid Intelligence może sprawić, że zrezygnujesz z innych aplikacji do dyktowania".
Zaznaczam uczciwie: dziś nie oddałbym VoiceInka na rzecz FluidVoice. Za pół roku? Możliwe. Warto śledzić.
4. SuperWhisper i Wispr Flow — najpopularniejsze alternatywy z internetu
Dwóch graczy, których widzisz wszędzie w rankingach.
SuperWhisper — jakościowo solidny, dużo trybów i własnych promptów. Lokalne przetwarzanie. Model subskrypcyjny albo lifetime — dla klientów budżetowych trudny do uzasadnienia, gdy VoiceInk daje ten sam efekt końcowy w jednorazowej płatności.
Wispr Flow — najlepszy wybór cross-platformowy dla osób, które chcą subskrypcji i nie mają problemu z chmurą. Działa na Mac, Windows i mobile. Słaby punkt: wszystko idzie przez serwery Wispr, zero trybu offline. Dla klientów wrażliwych na prywatność danych — odpada od razu.
Który wybrać (decyzja w 30 sekund)
Sprowadźmy to do prostego drzewa decyzyjnego:
- Masz Maca z Apple Silicon i chcesz najlepsze doświadczenie → VoiceInk. Bez namysłu,
- Chcesz zacząć darmowo albo pracujesz na Windows/Linux → Handy. Też bez namysłu,
- Lubisz świeżynki i chcesz zobaczyć Fluid Intelligence w akcji → FluidVoice. Miej świadomość, że to wczesny etap,
- Musisz mieć subskrypcję i cross-platform w chmurze → Wispr Flow. Jedyny sensowny scenariusz.
Sprawdziłem to na kilkudziesięciu setupach — u siebie, u klientów PrestaPilot i u uczestników Nawigatora. Rozkład jest zaskakująco równy: 70% ląduje na VoiceInku, 20% na Handym (najczęściej klienci wchodzący bez ryzyka), reszta eksperymentuje z FluidVoice albo zostaje przy Wispr Flow z konieczności.
Mój konkretny workflow
Skrót klawiszowy: CapsLock + A — wciskam, mówię, puszczam. CapsLock i tak leży bezużyteczny, a A jest pod kciukiem — jedna z lepszych rzeczy, jakie zrobiłem dla własnych nadgarstków.
Poranna rutyna: 3 zdania głosem — co dzisiaj, co priorytet, jedno pytanie do siebie. 40 sekund. Ląduje w Obsidianie.
LinkedIn: hook ręcznie (każde słowo się liczy), reszta głosem, potem przegląd i skróty.
Prompty AI: tu dyktowanie świeci najbardziej. Długa, złożona instrukcja — mówię zamiast pisać z backspace'em. Dla agentów Claude Code to game-changer.
Maile trudne: mówię jak do człowieka. Potem poprawiam interpunkcję. Wychodzi lepiej niż pisanie.
Ważne zastrzeżenie: nie zerowy procent halucynacji. Whisper czasem coś przekręci — zawsze rzucam okiem przed wysłaniem.
Podsumowanie
Trzy konkluzje po roku dyktowania:
- mówisz 3x szybciej niż piszesz — to czysta fizyka, nie hack produktywności,
- VoiceInk to mój numer jeden na macOS: lokalnie, jednorazowa płatność, Power Mode robi robotę,
- Handy dla darmowego startu i Windowsa, FluidVoice do obserwowania, Wispr Flow tylko gdy musisz mieć chmurę.
P.S. Jeśli ktoś ci mówi, że dyktowanie „się nie sprawdza w profesjonalnej pracy", zapytaj go, kiedy ostatnio próbował. Zwykle rok temu, na Apple Dictation, bez konfiguracji.
P.S. 2 FluidVoice trzymam na krótkiej smyczy — jeśli Fluid Intelligence dowiezie to, co obiecuje, następny artykuł napiszę o niej.
Damian Ślimak. Twój Nawigator w chaosie AI.
