Macの標準機能に音声入力がある!Macの音声入力は使えるのか?

 初めてスマホに音声入力機能が登場したとき「ほんとにそんな事ができるのか?」とめちゃくちゃ驚きました。今となっては当たり前になった音声入力機能。

 今年に入って久しぶりにMacを買い換えました。 早い段階からアクセスビリティを考慮して音声出力(VoiceOver) 機能の方には力を入れてきたMac。ひょっとしてそろそろMacにも音声入力機能が付いているのでは?と環境設定を見てみると、やはり標準機能で付いていました!

 ここではMac標準の音声入力機能の使い方と、その実力について話をしたいと思います。

Macの音声入力機能の使い方

システム環境設定を立ち上げます。(画面はプライベート情報を隠すため上部の部分を切り取った形になっています。)

「キーボード」を選択します。

「キーボード」の中の1番右のタブ「音声入力」をクリックします。


画面中央の「音声入力」が「オン」になっていない場合「オン」にします。
「言語」は「日本語」になっていると思います。日本語で音声入力をすると言う意味なので、特にいじる必要はありません。
これだけで準備完了です。

文字を打ち込めるなら何でも良いのですが、とりあえずMac標準のテキストエディットを立ち上げます。

先程の「システム環境設定」で「ショートカット」は「Controlキーを2回押す」となっていたので、コントロールキーを2回押します。

するとテキストエディットの横にこのような画面が表示されます。音声入力中と言うことです。何か適当に喋ってみましょう。しゃべった文字が(正しく認識されたかどうかは別として)テキストエディットに入力されたと思います。

音声入力を終了するにはエンターキーを押すか、先程の画面の下の「完了」をクリックします。

他にもキーボード上のどのキーを押しても終了します。

何度か試してみてください。どうでしょうか?満足のいく認識結果でテキスト入力が出来たでしょうか?

その実力は?

 Macの音声入力機能とGoogleの音声入力機能を比較してみようと思います。

 ただ比較とは言っても、人間なので同じ文章を同じ環境で読み上げたとしても、若干の話し方が違いがあるのでしょう。
 よって100%正確な判断にはならないと思いますが、Google もMacも何回も使い続けてた結果、全体的に頻繁に起こった現象による判断結果(私の印象)の話をします。

 結果から言うと、私の声との相性もあるかもしれませんが、印象としてはGoogleの方が認識率は断然高いです。Macは「使えない」と言うレベルではありませんが、かなりの率で誤認識をします。

Macの音声入力の不具合関係

ショートカットがなかなか立ち上がらない

 キーボードショートカットでなかなか立ち上がらない時があります。特にWordPress上でこれが頻繁に起こります。

出だしがなかなか認識を始めてくれないことがよくある

 音声入力が立ち上がった状態で話しているのに、なかなか入力を始めてくれないことが多々あります。よって何度も大きな声で繰り返し話すのですが、それでも認識が始まらず諦めて終了すると、その途端に今までこちらが何回もリピートした単語が回数分ずらりと並ぶこともあります。

文字変換がおかしい

 音声入力途中に認識された文字が表示されて、日本語の場合それが変換前の状態になります。そしてその変換前の状態で前後の意味を認識し、変換するひらがなや漢字を正しいものに変えようとします。その時Macの方が変に変換する癖があります。

文字変換がおかしい2

 またその変換中に、Macがせっかく正しい漢字に変換していたのに、何故か話してる途中に勝手に逆に間違った漢字に変換し直したりする癖が多々見られます。なぜ わざわざ間違った方に変換するのか分かりません。文章の前後を見て判断するなら、絶対にありえないような変換に逆に変えてしまうんです。

文字変換に変なクセがある

 上記に関連しますが「モトの画像」と言うと必ず「下の画像」と変換されます。 確かに「した」は「モト」とも 読むでしょうがそんな頻度少ないし… 音声認識 なので「モト」と言う音を普通「下」に変換するかな〜? と思っちゃいます…

認識にクセがある

 ●特に「その」「この」は、Macは毎回のように間違います。 笑っちゃう位 です。私が「その」と言った時は「この」に 変換され、「この」と言った時は「その」に変換されます。 もうワザとやってるんじゃないかと思う位。笑うしかないです。

 ●「〜ですが」などの時の「が」は90%くらいの確率度で「か」になってしまいます。

テキストエディット上のありえない不具合

 音声入力を使用しているとテキストエディット上で2行分の文字がダブって表示される、と言うありえない現象が起こります。実はMacのテキストエディットは、どのOSからかは分かりませんが(少なくともMontereyからは)いろいろな不具合が生じています。

 個人的にはOSの容量を上げていろいろな新機能を追加するのは良いですが、その前に基本中の基本であるテキストアプリ位は不具合のないようにしてほしい、と思ってしまいます。

 このような不具合が起こった場合は、該当行辺でエンターキーを押しても通常の表示には戻りません。
 ここら辺一帯をコピーして別のテキストエディター上にペーストすることによって、通常に表示されます。(しかしこの症状が起こると 私の環境では、かなりの頻度で暫くするとテキストテキストエディットが「応答なし」になります)

終了(完了)時に認識結果が消える

 音声入力を止めた時に、それまで表示されていた変換前もしくは変換中の文字が、なぜか全て、もしくは1つの単語のみを残して消えてしまう事がよくあります。

頭に必ず半角スペースが入る

 何かの意図があってワザとそうしているのだと思いますが、入力結果の頭に必ず半角スペースが入ります。これは特に文中で何回も音声入力をやり直したときに、多くの不要な半角スペースが入ってしまうため邪魔でしょうがありません。後で置換で全て消す、と言う不要な作業も発生するので、これはなしてほしいです。

Macの音声入力の方が優れていている点

ネットにつながっていなくても使用できる

 詳しい技術的な事は分かりませんが、Googleは入力された音声データをサーバーのAI等と連携させて認識しているものと思われます。その証拠にスマホで使用すると分かりますが、インターネット接続がない場合、Googleの音声入力は使用できません。

 Macもてっきり同じだと思っていましたが、macはインターネット接続がなくても音声入力が使用できます。これはWi-Fiのつながらないところや、電波の弱いところなどでは使える機能ではないでしょうか?
 よってMacはOS内のプログラムで認識してるんだと思うのですが、多分その点で認識度がGoogleより低いのかもしれません。

Macらしい気の利いた変換機能がある

 ●「クエスチョンマーク」と言うと「?」が出ます。これはある意味ほとんどの場合使える機能なのですが、逆に言うとカタカナで「クエスチョンマーク」と入力した場合、絶対にカタカナでは認識してくれません。
 ●また「?」は必ず半角で出ますが、日本語入力でやっているので、これは全角で出してほしい、と思います。しょうがないので私は後ですべての「?」を置換で置き換えています。

 ●同様に「かぎかっこ」と言うと『「』。「かぎかっこ閉じ」と言うと『」』が表示されたり、「かっこ」「かっこ閉じ」も『()』が表示されます。(「かっこ」は先ほどの「?」同様半角になってしまいますが…)

 ●「てん」と言うと「、」、「まる」と言うと「。」と、句読点の入力もしてくれます。こちらは先ほどの「?」 より気が利いていて、 必ず毎回と言うわけではありませんが、文章中で「てん」と言うと「、」になりますが、 文末と判断されると「点」などと変換されます。
 「まる」も同様に 文末と判断されると「。」に変換されますが、文中では「〇」や「丸」になります。『「まるまる」や「ばつばつ」』と言うと「〇〇や××」と変換されます。

 ●しかし、ウェブ検索をする時に必須となる半角スペースですが、残念ながら「スペース」と言っても半角スペースにはならず、必ずカタカナの「スペース」になってしまいます。ここも半角スペースに変換されれば、より使い良くなると感じます。

音声入力で改行できる

 「改行」と言うとほとんどの場合半角スペースが表示され、音声入力を終了させた段階で自動的にその半角スペースの場所で改行してくれます。これはかなり使える機能だと思います。

 逆に「改行」という文字で入力したい場合はほとんどの場合「改行」ではなく半角スペース(後の改行)になってしまうので、手入力しなければいけません。
 またこれはWordPress上などでは機能しません。

 ちなみに英語モードでの音声入力でも「リターン」と言えば改行してくれるのかと思い試してみましたが、英語での音声入力の場合はその機能は無いようです。

文章の途中から音声入力をする場合、そこそこに変換してくれる

 「〇〇を××」のように言う時、「〇〇」まで入力し、その続きから音声入力を再開する場合、「を××」や「がXX」と言う時、ある意味それだけでは文章になっていないので「を」や「が」は認識されないのかな?と思いきや、結構ここら辺はきちんと認識してくれます。

 しかし上記の「不具合関係」で言った事と同じ様に「を」と何回も言っても全く認識されてる気配がなくカーソルも動かないままでいるケースがそこそこの頻度で起きます。
 自分の声が届いてないのかと何度も「を」を繰り返していると、数秒後にいきなり「ををををををを」と「を」が連発されます。

静音が長く続いても中止されない

 考えながら話す(音声入力をする)と音声が途切れてしまう時があります。

 Googleの場合、インターネット上で音声データのやりとりをするせいか、静音がしばらく続くと、そこで音声認識を勝手に止めてしまいます。しかしMacはかなりの長い時間の静音でない限り音声入力を止める事はありません。
これは考えながら次の言葉を探しながら入力するような時にはかなり強力です。

言語の変更が楽

 あまり言語の変更をすることはないかもしれませんが、日本語のみ話す方でも、たまに英語のスペルで続けて何文字かを入力したい場合など言語の変更する必要があります。この言語の変更が下の「Mac音声入力のオプション設定」でも紹介しているように、Macでは簡単に変更できます。これは私のように日本語と英語の音声入力を随時切り替えたい人間にはとても便利です。

Mac音声入力のオプション(?)設定

入力言語を変更する

オプションと言う言葉が正しいか分かりませんが、最初に紹介した音声入力の画面で「言語」は 通常「日本語」での設定で使用すると思いますが、 私は英語の文章を入力することも多いので、こちらに英語も使えるように設定しています。

この言語を追加するには単純にこのプルダウン(?)の中から「カスタマイズ」を選びます。

設定できる言語が表示されるので、追加したい言語にチェックマークを入れます。

今回は例として例としてイタリア語を追加してみました。

すると先程の候補の中にイタリア語が追加されました。 後は実際に音声入力を始める前に使用したい言語を、ここで選択しておけばいいだけです。

ショートカットを変更する

同様にショートカットもここで変更することができます。候補になる中から選択することも、「カスタマイズ」を選び任意のショートカットを設定することもできます。

言語が同じで国が違うモノ

 ちなみに、なぜ私の環境に「英語(アメリカ)」と「英語(イギリス)」があるかと言うと、こちらの記事( プラグインを使用しないでテキストの置換が出来る、Google Chromeの「Find & Replace」(略))を書いていて久しぶりに思い出したのですが、イギリス英語とアメリカ英語ではスペルの違う単語があるのです。

 例えば「劇場:theater(米)、theatre(英)」、「お気に入り:favorite(米)、favourite(英)」などがそうです。
 よって音声入力で「英語」に設定して「theater」と言うと、「英語(アメリカ)」での時は「theater」となり、「英語(イギリス)」に設定てしていると「theatre」と変換されます。 当たり前と言えば当たり前なんですが、ちょっと面白い、と思いました。

 ちなみに私はアメリカ英語しか話せないのでイギリス発音はできませんが、 アメリカ発音で話しても一応それなりに認識してくれます。

Macで音声入力を使用するその他の方法

 現在Macで音声入力を使用するには、このMac標準の音声入力、もしくはブラウザー経由でGoogleドキュメント上で Google音声認識を使って行うかの2通りの方法があります。

 しかし何故か私の環境ではGoogleドキュメントで私の音声を全く認識してくれませんでした。Googleのプラグイン的ソフトをインストールして使えるようにする方法もあるようですが、できるだけそういったソフトは入れたくなかったので、 私に残されたGoogle音声入力を使う方法はスマホを使うことです。

 私の場合幸い(?)アンドロイドのスマホを持っているので、こちらでGoogle音声入力を行い、例えばGoogleキープなどクラウドで共有できる媒体にGoogle音声入力を行い、その結果をMac上で表示し、Googleキープからコピーして使用することもできます。 実はMacに音声入力があると言うことをに気づく前は、この方法を使っていました。

 しかしスマホを使用したり、Googleドキュメント上で音声入力ができたとしても、やはり入力したい媒体に直接入力ができるのではなく、コピペと言う作業が発生してしまいます。

 この点Macの音声入力を使えば、例えばウェブブラウザの検索画面やWordPressやInDesignなどのテキスト入力ボックス、何かのソフトでの数値の入力のボックスなど、要するに通常テキスト入力が出来るところはどこでも音声入力で入力することができます。これはかなり便利と言えるでしょう。

最終的に

 率直な私の感想はMacに音声機能が付いていてありがたい。そこそこ使えるので基本は音声入力を使用する。
しかしGoogleの音声入力に比べると認識率がやや低い。
 Macの認識度やその他の不具合(?)はまだまだ改善の余地がかなりある、と言う認識です。

 しかしGoogle音声入力を使用するためには先ほども話したようにワザワザコピペする必要があります。
Macで直接どの媒体にも入力できるのはかなりの魅力だと思います。

Follow me!

Macの標準機能に音声入力がある!Macの音声入力は使えるのか?” に対して1件のコメントがあります。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です