Beste Sprach-zu-Text-App
Wir überprüfen unabhängig jede App, die wir in unseren Bestenlisten empfehlen. Wenn Sie auf einige der Links auf dieser Seite klicken, erhalten wir möglicherweise eine Provision. Erfahren Sie mehr. Die frühen Tage der Diktier-Software waren wie Ihr Freund, der Liedtexte falsch versteht: viel Enthusiasmus, aber wenig Genauigkeit.
Jetzt ist KI aus der Pandora-Box, sowohl in den Nachrichten als auch in den Apps, die wir verwenden, und Diktier-Apps werden dadurch immer besser. Ich ging ins Internet, um die beste Speech-to-Text-Software zu finden, die es derzeit gibt, und nach langem Monolog vor Dutzenden von Diktier-Apps sind dies meine Favoriten.
Apple Dictation für kostenlose Diktier-Software auf Apple-Geräten. Windows Voice Access für kostenlose Diktier-Software unter Windows. Dragon by Nuance für eine anpassbare Diktier-App. Google Docs Voice Typing zum Diktieren in Google Docs. Gboard für eine kostenlose mobile Diktier-App.
Letterly zum Strukturieren Ihrer Transkription. Voicenotes zum Chatten mit Ihren Transkripten. Wenn Sie online nach Diktier-Software suchen, werden Sie auf eine Vielzahl von Optionen stoßen. Die, auf die ich mich hier konzentriere, sind Apps oder Dienste, die Sie schnell öffnen, mit dem Sprechen beginnen und die Ergebnisse nahezu in Echtzeit auf Ihrem Bildschirm sehen können.
Das ist großartig, um schnelle Notizen zu machen, E-Mails zu schreiben, ohne zu tippen, oder einen ganzen Roman zu diktieren, während Sie in Ihrem Lieblingspark spazieren gehen – denn warum nicht. Über diese Produktivitätsnutzung hinaus können Menschen mit Behinderungen oder Karpaltunnelsyndrom diese Software verwenden, um einfacher zu tippen.
Sie macht Technologie für alle zugänglicher. Wenn das nicht das ist, wonach Sie suchen, gibt es Folgendes:. KI-Assistenten wie Apples Siri, Amazons Alexa und Microsofts Cortana können Ihnen helfen, mit jedem dieser Ökosysteme zu interagieren, um Texte zu senden, Produkte zu kaufen oder Termine in Ihrem Kalender zu planen.
KI-Meeting-Assistenten nehmen an Ihren Meetings teil und transkribieren alles, um Meeting-Notizen zu erstellen, die Sie mit Ihrem Team teilen können. KI-Transkriptionsplattformen können Ihre Video- und Audiodateien in sauberen Text umwandeln.
Es gibt auch erweiterte Plattformen für Unternehmen, wie Amazon Transcribe und die Speech-to-Text-Dienste von Microsoft Azure. Unsere Bestenlisten werden von Menschen verfasst, die einen Großteil ihrer Karriere damit verbracht haben, Software zu verwenden, zu testen und darüber zu schreiben.
Sofern nicht ausdrücklich anders angegeben, verbringen wir Dutzende von Stunden mit der Recherche und dem Testen von Apps, wobei wir jede App so verwenden, wie sie verwendet werden soll, und sie anhand der Kriterien bewerten, die wir für die Kategorie festgelegt haben.
Wir werden nie für die Platzierung in unseren Artikeln von einer App oder für Links zu einer Website bezahlt – wir schätzen das Vertrauen, das die Leser in uns setzen, um authentische Bewertungen der Kategorien und Apps anzubieten, die wir überprüfen.
Weitere Einzelheiten zu unserem Prozess finden Sie in der vollständigen Übersicht darüber, wie wir Apps auswählen, die im Zapier-Blog vorgestellt werden sollen. Diktier-Software gibt es in verschiedenen Formen und Größen.
Einige sind in Produkte integriert, die Sie bereits verwenden. Andere sind separate Apps, die eine Reihe zusätzlicher Funktionen bieten. Obwohl sich das Aussehen und die Haptik unterscheiden können, habe ich nach Folgendem gesucht, um die besten zu finden:.
Hohe Genauigkeit. Der Wahrheit treu zu bleiben, ist hier die wichtigste Eigenschaft. Benutzerfreundlichkeit. Dies ist keine hohe Hürde, da die meisten Optionen so einfach sind, dass sie jeder in Sekundenschnelle verstehen kann.
Verfügbarkeit von Sprachbefehlen. Mit diesen können Sie "Anweisungen" hinzufügen, während Sie diktieren, z. Zeichensetzung hinzufügen, einen neuen Absatz beginnen oder komplexere Befehle wie das Großschreiben aller Wörter in einem Satz.
Ich habe Ausnahmen für KI-gesteuerte Apps gemacht, die eine hohe Genauigkeit auf Kosten von Sprachbefehlen bieten. Verfügbarkeit der unterstützten Sprachen. Die meisten der hier vorgestellten Optionen unterstützen eine anständige oder beeindruckende Anzahl von Sprachen.
Ich habe darauf geachtet, wie gut sich die Software an verschiedene Umstände, Apps und Systeme anpassen kann. Ich habe diese Apps getestet, indem ich ein Wort-Skript mit Zahlen, zusammengesetzten Wörtern und ein paar kniffligen Begriffen gelesen habe.
Ich habe das Skript für jede App dreimal gelesen: Die Genauigkeitswerte sind ein Durchschnitt aller Versuche. Schließlich habe ich die Sprachbefehle verwendet, um Text zu löschen und zu formatieren sowie die Funktionen der App zu steuern, sofern verfügbar.
Ich habe das Mikrofon meines Laptops oder Smartphones verwendet, um diese Apps in einem ruhigen Raum ohne Hintergrundgeräusche zu testen. Für gelegentliches Diktieren sollte ein gleichwertiges Mikrofon an Ihrem eigenen Computer oder Smartphone die Aufgabe gut erledigen.
Wenn Sie jeden Tag viel diktieren, lohnt es sich wahrscheinlich, in ein externes Mikrofon wie das Jabra Evolve zu investieren. Die Apps auf dieser Liste verwenden eine Kombination von Technologien, die möglicherweise KI – insbesondere maschinelles Lernen und Natural Language Processing NLP – umfassen.
Während sie sich möglicherweise neu erfinden könnten, um mit dem Hype Schritt zu halten, verwenden sie möglicherweise Pipelines oder Modelle, die im Vergleich zu dem, was beispielsweise in Hugging Face oder unter der Haube von OpenAI Whisper vor sich geht, nicht so hochmodern sind.
Bestehende Diktierplattformen könnten hier auf Kurs bleiben und sich dafür entscheiden, ihre Technologie weiterzuentwickeln, möglicherweise einige große Sprach- oder multimodale Modelle mischen, um in Zukunft mehr Funktionen bereitzustellen.
Obwohl Diktier-Software ziemlich gut darin ist, verschiedene Stimmen zu erkennen, ist sie nicht perfekt. Hier sind einige Tipps, um es so gut wie möglich funktionieren zu lassen. Sprechen Sie natürlich mit Vorbehalten. Diktier-Apps lernen im Laufe der Zeit Ihre Stimme und Ihre Sprachmuster.
Und wenn Sie Zeit mit ihnen verbringen, wollen Sie sich wohlfühlen. Sprechen Sie natürlich. Zeichensetzung bei Bedarf. Wenn Sie diktieren, müssen Sie manchmal jeden Punkt, jedes Komma, jedes Fragezeichen usw. sagen. Lernen Sie ein paar Befehle.
Nehmen Sie sich die Zeit, ein paar einfache Befehle zu lernen, wie z. "neue Zeile", um einen Zeilenumbruch einzufügen. Es gibt verschiedene Befehle zum Komponieren, Bearbeiten und Bedienen Ihres Geräts. Befehle können sich von App zu App unterscheiden, also lernen Sie die, die für das von Ihnen gewählte Tool gelten.
Kennen Sie Ihre Grenzen. Insbesondere auf Mobilgeräten haben einige Tools ein Zeitlimit, wie lange sie zuhören können – manchmal nur 10 Sekunden. Werfen Sie von Zeit zu Zeit einen Blick auf den Bildschirm, um sicherzustellen, dass Sie die Markierung nicht überschritten haben.
Es braucht Zeit, sich an die Spracherkennungssoftware zu gewöhnen, aber es wird einfacher, je mehr Sie üben. Einige der ausgefeilteren Apps laden Sie ein, indem Sie Passagen lesen oder andere kurze Übungen durchführen. Scheuen Sie sich nicht vor Tutorials, Hilfe-Menüs und Cheat-Sheets auf dem Bildschirm.
Apple Dictation. Windows Voice Access. Dragon by Nuance. Google Docs Voice Typing. Suchen Sie nicht weiter als nach Ihrem Mac, iPhone oder iPad nach einem der besten Diktierwerkzeuge. Apples integrierte Diktierfunktion, unterstützt von Siri – es würde mich nicht wundern, wenn sich die beiden eines Tages zusammenschließen – wird als Teil der Desktop- und mobilen Betriebssysteme von Apple ausgeliefert.
Auf iOS-Geräten verwenden Sie es, indem Sie auf das Mikrofonsymbol auf der Standardtastatur tippen. Wenn Sie die Möglichkeit haben möchten, Ihren Mac mit Ihrer Stimme zu navigieren und zu diktieren, versuchen Sie es mit Voice Control. Standardmäßig benötigt Voice Control das Internet, um zu funktionieren, und hat ein Zeitlimit von etwa 30 Sekunden für jeden Sprachausdruck.
Um diese Einschränkungen für einen Mac aufzuheben, aktivieren Sie das erweiterte Diktat, und befolgen Sie die Anweisungen hier für Ihr Betriebssystem – Sie können es auch für iPhones und iPads aktivieren. Enhanced Dictation fügt eine lokale Datei auf Ihrem Gerät hinzu, damit Sie offline diktieren können.
Sie können Ihren Text mit einfachen Befehlen wie "neuer Absatz" oder "vorheriges Wort auswählen" formatieren und bearbeiten. Apple bietet auch eine Reihe erweiterter Befehle für Dinge wie Mathematik, Währung und Formatierung. Empfehlung: Für das gelegentliche Diktat empfehle ich die Standard-Diktierfunktion, die mit allen Apple-Systemen verfügbar ist.
Aber wenn Sie mehr benutzerdefinierte Sprachfunktionen benötigen, z. können Sie benutzerdefinierte Vokabeln und benutzerdefinierte Befehle erstellen und importieren und offline arbeiten. Obwohl Apple Dictation nativ auf der Apple Watch verfügbar ist, sollten Sie sich die Just Press Record-App ansehen, wenn Sie ernsthaft viele Sprachnotizen und Memos aufnehmen möchten.
Es läuft auf derselben Engine und hält alle Ihre Aufnahmen auf Ihren Apple-Geräten synchronisiert und organisiert. Voice Access, früher bekannt als Windows 11 Speech Recognition, ist ein starkes Diktierwerkzeug, sowohl zum Schreiben von Dokumenten als auch zur Steuerung Ihres Windows-PCs.
Da es Teil Ihres Systems ist, können Sie es in jeder App verwenden, die Sie installiert haben. Oben auf Ihrem Bildschirm wird ein Mikrofonsymbol und ein graues Feld angezeigt. Stellen Sie sicher, dass sich Ihr Cursor in dem Bereich befindet, in dem Sie diktieren möchten.
Wenn es zum Diktieren bereit ist, wird es Listening sagen. Sie haben etwa 10 Sekunden Zeit, um mit dem Sprechen zu beginnen, bevor sich das Mikrofon abschaltet. Wenn dies geschieht, klicken Sie einfach erneut darauf und warten Sie, bis Listening auftaucht.
Um das Diktat zu beenden, klicken Sie erneut auf das Mikrofonsymbol oder sagen Sie "stop talking". Als ich in ein Word-Dokument diktierte, erinnerte mich das graue Feld, ich solle mich gedulden, wir brauchen einen Moment, um aufzuholen. Wenn Sie zu schnell sprechen, werden Sie auch feststellen, dass Ihre transkribierten Wörter nicht mithalten.
Dies war nie ein Problem mit der Genauigkeit, aber es ist eine nette Erinnerung, es langsam und stetig anzugehen. Aktivieren Sie dort die Windows-Spracherkennung. Dies schaltet eine Reihe neuer Sprachbefehle frei, die Maus und Tastatur vollständig ersetzen können.