2025/02/17
iPhoneの音声入力を活用した文字起こし
これまで私はiPhoneのキーボードについている音声認識を使い、音声で原稿を作成し、LLMで整形することでこのブログの記事を作成してきました。しかし、iPhone標準の音声認識は誤りを含むため、LLM整形後に細かいニュアンスが削られてしまったり、間違いが多く含まれたりするという課題がありました。
voice2memoを導入して楽して文字起こし
そんな中、Whisper-cliを使った iPhoneでボタン長押し→音声入力→テキスト書き起こしがメモアプリに反映できるスクリプト voice2memo が暦本先生により公開 され、利用し始めました。これはiPhoneとMacをiCloudで連携させることで、Whisperを気軽に使える非常に素晴らしいスクリプトです。
voice2memoではWhisper の large-v3-turboモデルが使用されており、ほとんど文字起こしのミスが発生せず、細かいディティールも正確に反映されます。これまでのiPhoneの音声認識を使っていたときよりも、文章の質が格段に向上しました。
WhisperKitのメリット
voice2memoがあまりに便利なのでforkしWhisperKitを使って文字起こしするようにしました。WhisperKitはiOSやMac向けに最適化されており、高速処理を可能にします。 WhisperKitを活用することで、以下のような利点があります。
- 高速処理:録音の長さにもよりますが、 M3 Macbook Air では体感として録音されている音声の記録時間の数分の1の時間で文字起こしが完了します。
- MacBook Airの負荷が少ない:Whisper.cppなどの従来の方法と比べ、MacBook Airがほとんど熱くならない。
- 高精度な文字起こし:細かいニュアンスが削られず、正確な文章を得られる。これはWhisper.cppと同じ。
Apple Watchとの連携でさらに便利に
暦本先生は、iPhoneで録音を行い、Macで文字起こしをしてメモに記録するスクリプトを作成していました。この方法はiCloudを利用してiPhoneとMacを連動させるため、Apple Watchでも同じように活用可能です。
Apple Watchの時計画面には、ウィジェットやアイコンを配置できます。私は以下の図のようにボイスメモのアイコンをApple Watchの時計画面に設置し、2タップで音声を録音できるように設定しています。
- Apple Watchで手軽に録音。
- Apple Watchで録音した音声がiCloudを通じて同期されるため、すぐにMacへ転送。
- WhisperKitと組み合わせることで、より高速な文字起こしが可能。
まとめ
voice2memoのスクリプトにWhisperKitを導入することで、iPhoneやApple Watchで録音した音声を高速に文字起こしできるようになりました。Apple Watchを活用することで、どこでも気軽に録音し、Macで効率的に文字起こしが可能になります。
なお、もっと簡単にWhisperの力を使いたい場合は 口述筆記 というアプリが利用できます。こちらもおすすめです。