あらゆるオーディオ ファイルやビデオ ファイルを数秒で SRT、VTT、またはプレーン テキストに転写します。ブラウザ内でローカルに実行される OpenAI のオープンソース Whisper モデルを利用しており、アップロード、ウォーターマーク、サインアップは必要ありません。
オーディオまたはビデオ ファイルをドロップするか、クリックして参照します。 MP4、MP3、WAV、M4A、MOV などがサポートされています。
Whisper はブラウザ上で実行されます。まず、モデル (約 80 MB) を一度ダウンロードし、オフラインで即時に再利用できるようにキャッシュします。
タイムスタンプ付きのセグメントをプレビューします。ビデオ プレーヤー用の SRT、Web 用の VTT、またはプレーン テキストをダウンロードするか、クリップボードにコピーします。
はい — サインアップ、ウォーターマーク、アップロード制限なしで完全に無料です。
いいえ。Whisper モデルは完全にブラウザ内で実行されます。オーディオとビデオがデバイスから離れることはありません。
Whisper は 99 の言語をサポートしています。 UI には、一般的な言語 (英語、中国語、日本語、韓国語、スペイン語、フランス語、ドイツ語、ポルトガル語、ロシア語、アラビア語、ヒンディー語) と自動検出が表示されます。
デフォルトではウィスパーベースを使用します。明瞭な音声で非常に高い精度を実現します。短いクリップまたは簡単な英語の場合は高速モード (ささやき程度) に切り替え、プロダクションキャプションの場合は正確 (ささやきベース) に切り替えます。
まず、Whisper モデル (約 80 MB) をダウンロードしてキャッシュします。後続の実行は数秒で開始され、オフラインで動作します。