Whisper Notes für Mac
Fn halten. Sprechen. Fertig.

Wer schon mal Spracheingabe auf dem Mac genutzt hat, weiß, dass die Optionen begrenzt sind. Apples eingebautes Diktat braucht Internet. Apps wie Wispr Flow und SuperWhisper funktionieren gut, kosten aber $10-15 pro Monat. Wir haben etwas anderes gebaut: ein Einmalkauf, der komplett auf dem Mac läuft.
Fn halten, überall sprechen
Die Kernfunktion: systemweites Diktieren. Halte die Fn-Taste in jeder App—Gmail, Slack, VS Code, Terminal, Notion, Obsidian—und sprich los. Beim Loslassen wird deine Sprache zu Text.
Kein App-Wechsel. Kein Kopieren und Einfügen. Einfach Fn halten und sprechen, wo der Cursor steht.
Alles läuft lokal mit Whisper Large-v3 Turbo, eines der leistungsfähigsten On-Device Spracherkennungsmodelle. Dein Audio verlässt nie den Mac. Einrichtung dauert etwa 30 Sekunden: Einstellungen → Tastaturkürzel → Globales Diktieren aktivieren → Bedienungshilfen-Berechtigung erteilen.

Streaming-Transkription
Nach Abschluss der Aufnahme oder dem Importieren von Audio werden die Ergebnisse sofort gestreamt—du musst nicht warten, bis die gesamte Transkription fertig ist. Der Text erscheint Absatz für Absatz, sodass du die Ergebnisse schneller siehst.
Das macht bei längeren Aufnahmen einen echten Unterschied. Statt auf einen Fortschrittsbalken zu starren, siehst du Text Absatz für Absatz erscheinen.

Audiodateien importieren und transkribieren
Hast du schon Aufnahmen? Zieh sie einfach aus dem Finder rein. Die App verarbeitet MP3, WAV, M4A und die meisten gängigen Formate.
Nützlich für Meeting-Aufnahmen, Vorlesungen, Podcasts oder Interviews. Alles wird lokal verarbeitet—kein Cloud-Upload, kein Warten auf Server. Ein MacBook M2 verarbeitet 10 Minuten Audio in etwa 63 Sekunden. M4-Chips sind noch schneller, etwa 12x Echtzeit.

Klickbare Zeitstempel
Jede Transkription enthält klickbare Zeitstempel. Das ist nützlich bei langen Aufnahmen.
Jeder Absatz bekommt einen Zeitstempel. Klicke auf einen Zeitstempel und spring direkt zu dieser Stelle im Audio. Perfekt zum Durchgehen von stundenlangen Meetings oder zum Finden bestimmter Momente in Vorlesungen. Du kannst Transkripte mit Zeitstempeln exportieren.

Benutzerdefiniertes Vokabular
Füge Begriffe, Namen oder Abkürzungen hinzu, die Whisper oft falsch erkennt. Das Modell nutzt deine benutzerdefinierten Wörter. Selbst obskure Fachbegriffe können präzise erkannt werden. Es hilft auch, Formatierungen beizubehalten—zum Beispiel wird aus 'Claude Opus 4.5' nicht 'claude opus 4.5', oder aus 'Whisper Notes' nicht 'whisper notes'.
Füge Wörter hinzu, die das Modell oft überhört—Produktnamen, technische Abkürzungen, Kollegennamen, Fachbegriffe.

Sprachaktivitätserkennung (VAD)
Lange Stille ließ das Modell früher halluzinieren—Phrasen wiederholen oder Text erfinden. VAD erkennt Stille und verarbeitet sie korrekt, sodass Transkriptionen sauber bleiben. Mit VAD haben wir etwa 70% der Wiederholungsprobleme durch Modellhalluzinationen in Audio mit Stille eliminiert, was die Stabilität und Genauigkeit der Transkription erheblich verbessert.
Deine Transkriptionen bleiben sauber, auch wenn du nachdenkst oder die Aufnahme Leerlauf hat.

Warum offline wichtig ist
Cloud-basiertes Diktieren sendet deine Stimme an Remote-Server. Jedes Wort—persönliche Notizen, vertrauliche Meetings, private Gedanken—geht übers Internet.
Whisper Notes verarbeitet alles auf deinem Mac. Keine Netzwerkanfragen, kein Cloud-Speicher, keine Datenspeicherungsrichtlinien. Ob du Journalist bist, der Quellen schützt, Anwalt mit sensiblen Fällen, Arzt, der Patienten bespricht, oder einfach jemand, der Privatsphäre schätzt—das ist wichtig.
Es funktioniert auch überall. Im Flugzeug. In Gebieten mit schlechter Verbindung. In sicheren Umgebungen mit eingeschränktem Netzwerkzugang.
Produktvergleich
| Whisper Notes | MacWhisper | Wispr Flow | Apple Diktat | |
|---|---|---|---|---|
| Preis | $4.99 einmalig | $29 einmalig | $10-15/Monat | Kostenlos |
| Offline | ✓ 100% lokal | ✓ 100% lokal | ✗ Nur Cloud | ✗ Internet nötig |
| Privatsphäre | ✓ Verlässt nie das Gerät | ✓ Verlässt nie das Gerät | ✗ Geht an Server | ✗ Geht an Apple |
| Systemweites Fn-Diktat | ✓ | ✗ | ✓ | ✓ |
| iOS-App inklusive | ✓ Selber Kauf | ✗ Nur Mac | ✗ Nur Mac | ✓ Eingebaut |
| KI-Modell | Whisper Large-v3 Turbo | Whisper-Modelle | Cloud-API | Apple-Modell |
| Jahreskosten | $4.99 gesamt | $29 gesamt | $120-180/Jahr | Kostenlos |
MacWhisper ist solide—Whisper-basierte Transkription, die offline funktioniert. Whisper Notes ist schneller, genauer und kostet nur $4.99 einmalig für Mac und iOS.
Wispr Flow ist poliert, mit Cloud-APIs, die in manchen Fällen etwas genauer sind. Der Kompromiss: Audio geht an deren Server, braucht Internet und kostet $120-180 pro Jahr.
Apple Diktat ist praktisch und kostenlos, braucht aber Internet, hat begrenzte Genauigkeit bei technischen Inhalten und sendet Audio an Apples Server.
Technische Details
| KI-Modell | Whisper Large-v3 Turbo (optimiert für Apple Silicon) |
| Sprachen | 100+ mit automatischer Erkennung |
| Systemanforderungen | macOS 14+ (Sonoma oder neuer) |
| Empfohlene Hardware | Apple Silicon (M1/M2/M3/M4). Intel Macs nicht unterstützt. |
| Speicher | ~3GB für KI-Modell-Dateien |
| Verarbeitung | 100% lokal, null Netzwerkaufrufe |
| Geschwindigkeit (M4) | ~12x Echtzeit (2 Stunden Audio in 10 Minuten) |
| Geschwindigkeit (M2/M3) | ~10x Echtzeit |
Die App läuft in der Menüleiste, stört nicht und verbraucht im Leerlauf minimale Ressourcen.
Erste Schritte
Whisper Notes kostet $4.99 im App Store. Ein Kauf deckt iOS und Mac ab—wenn du die iPhone-Version schon hast, ist die Mac-App inklusive.
Nach der Installation öffne die App einmal, um das KI-Modell (~3GB) herunterzuladen. Dann geh zu Einstellungen → Tastaturkürzel → Globales Diktieren aktivieren. Erteile die Bedienungshilfen-Berechtigung, wenn du gefragt wirst.
Das war's. Halte Fn irgendwo auf deinem Mac und fang an zu sprechen.
Wir entwickeln die Mac-App noch aktiv weiter. Wenn du Feature-Wünsche oder Vorschläge hast, schreib uns bitte an support@whispernotes.app—das würde uns sehr freuen.