音声入力は「新しいフェーズ」へ。生成AIで変わるブログの形

最近、ブログの原稿作成に「音声入力」を活用しています。
実際に使ってみて感じるのは、音声入力がいま、これまでとは全く発想の違う「新しいフェーズ」に入ったということです。

「第一段階」:正確さが求められたディクテーション

これまでの音声入力(ディクテーション)は、いわば「話した言葉をそのまま文字にする」という第1段階の機能でした。
話した言葉をそのまま文字にできるというのは画期的でしたが、

  • 頭の中で完璧な文章を組み立ててから話す必要がある
  • 少しでも言い淀んだり、文法が崩れたりすると、手直しが膨大になる
  • 「書く」よりも、むしろ「読み上げる」という感覚に近い

という感じでした。

手書きの原稿をパソコンに入力したり、話された内容をそのまま記述するような議事録の作成には向いているかもしれません。

ただ、正直なところ、この段階ではキーボードで打つほうがずっと楽です。
私も何度か試してみましたが、使い勝手が良いとは思えませんでした。

「第二段階」:思考のプロセスをまとめる生成AIの登場

しかし、生成AIの登場によって、音声入力のあり方は劇的に変ったと思います。
音声入力の精度が向上したこともあります。
しかしそれ以上に、今の音声入力は、「頭に浮かんだことを、そのまま、バラバラな順番で話してもいい」というものになっています。

文章を書くとき、私たちの頭の中では常に試行錯誤が起きていると感じます。
「あ、これも言いたい」「あ、さっきの順番はこっちだな」といった考えが常に浮かんでは、文章を書き改めていきます。

この断片的に口に出したまとまりのない言葉を、生成AIでは、意図を汲み取り、論理的な文章へと整えてくれます。

もちろん、AIが作った文章をそのまま載せるわけではありません。
AI特有の言い回しや、自分では使わない言葉などは修正をしています。

このプロセスの中で面白い「気づき」もあります。
自分が言いたいことというのをうまくまとめるのは、意外と難しいものです。
生成AIがきちんと整理して要約してくれるのを見ると、自分自身の考えがきちんと整理される気持ちがします。

入力の手順

音声入力は、「メモ帳」「ワード」「Googleドキュメント」などテキストデータが入力できるソフトであればなんでも良さそうです。

動作も軽い「メモ帳」などが使いやすいと思います。

Windowsキーと「H」キーを同時に押すと音声入力が可能となります。
この状態で、とりとめのない話を話すだけです。

今回のブログであればこんな感じです。

これを生成AIに貼り付けて文章にしてもらいます。
生成AIへのプロンプトも音声入力を使っています。

ChatGPT、Claudeも使いましたが、Geminiが私にはあっているようです。

「キーワード入力」との決定的な違い

音声入力をもとに生成AIでブログを書くのは、よくある「キーワードをいくつか入れてAIに書かせる」のと大きく違います。

今回のブログでいえば、「音声入力と生成AIの関係についてブログを書いて」という指示を与えてもそれなりの文章は書いてくれるはずです。

しかし、それでは、一般論になってしまいますし、自分の体験が入っていません。
音声入力をもとに生成AIでブログを書いたとしても、オリジナリティーは依然としてあると思っています。

本日のまとめ

音声入力でブログを書き始めて1週間程度が経ちました。

このブログも、もちろん音声入力をベースにしています。
キーボードで文章を書くのも嫌いではありません。

頭の中にある考えをそのまま声に出し、それをAIで完成させるというプロセスを試しているところです。

手書きと音声入力はそのときどきに応じ使い分けていきたいと思っています。