2025/02/17
これまで私はiPhoneのキーボードについている音声認識を使い、音声で原稿を作成し、LLMで整形することでこのブログの記事を作成してきました。しかし、iPhone標準の音声認識は誤りを含むため、LLM整形後に細かいニュアンスが削られてしまったり、間違いが多く含まれたりするという課題がありました。
そんな中、Whisper-cliを使った iPhoneでボタン長押し→音声入力→テキスト書き起こしがメモアプリに反映できるスクリプト voice2memo が暦本先生により公開 され、利用し始めました。これはiPhoneとMacをiCloudで連携させることで、Whisperを気軽に使える非常に素晴らしいスクリプトです。
voice2memoではWhisper の large-v3-turboモデルが使用されており、ほとんど文字起こしのミスが発生せず、細かいディティールも正確に反映されます。これまでのiPhoneの音声認識を使っていたときよりも、文章の質が格段に向上しました。
voice2memoがあまりに便利なのでforkしWhisperKitを使って文字起こしするようにしました。WhisperKitはiOSやMac向けに最適化されており、高速処理を可能にします。 WhisperKitを活用することで、以下のような利点があります。
暦本先生は、iPhoneで録音を行い、Macで文字起こしをしてメモに記録するスクリプトを作成していました。この方法はiCloudを利用してiPhoneとMacを連動させるため、Apple Watchでも同じように活用可能です。
Apple Watchの時計画面には、ウィジェットやアイコンを配置できます。私は以下の図のようにボイスメモのアイコンをApple Watchの時計画面に設置し、2タップで音声を録音できるように設定しています。
voice2memoのスクリプトにWhisperKitを導入することで、iPhoneやApple Watchで録音した音声を高速に文字起こしできるようになりました。Apple Watchを活用することで、どこでも気軽に録音し、Macで効率的に文字起こしが可能になります。
なお、もっと簡単にWhisperの力を使いたい場合は 口述筆記 というアプリが利用できます。こちらもおすすめです。