音声入力の進歩に驚いた。これからはキーボードは使わないかもしれない

キーボードの入力方法を、長年親しんだローマ字入力から親指シフト入力へと移行の努力中だ。今のところタイピングのスピードは大変遅い。 

ローマ字入力を二度としないと心に決めたのだが、いまの親指シフト入力のタイピング速度ではSNSのコメントや、SMSの返事などの短文を書くのは億劫だ。しかしそんなことでは仕事に差し支える。当面の間でいいから、ローマ字入力をしなくても速く文字入力する方法がないものかと思案していたらいいこと思いついた。音声入力である。

最新のMac OSには、もともと日本語の音声入力機能がある。MacBookを開いて、エディターを起動し、音声入力モードにすれば口述筆記が可能なのだ。しかも、日本語特有の漢字仮名交じり文をかなり正確に認識する。

002

音声入力の設定

音声入力は初期設定ではオフになっているからここでオンにする。

メニュー >システム環境設定>音声入力と読み上げ>音声入力タブ

009

キーボード入力と音声入力とは、ショートカットキーできりかえられる。初期設定ではFnキーを2回打てば音声入力に切り替えられる。 試みとして、机の上に置いてある本から適当な文章を抜き出して打ってみよう。 塩野七生「ローマは一日にしてならず」p43にある一文。

もとの文章

紀元前8世紀のギリシアは、貴族政によって統治される都市国家の時代に入っていた。農業や牧畜業を主にしていた王制時代に比べて、工業商業海運業にまで手を広げたおかげで経済の発展は目ざましく、それにつれて人口も急速に増大する。

音声入力による文章

紀元前8世紀のギリシアは、属性によって統治される都市国家の時代に入っていた。農協やボク地区業を主にしていた構成時代に比べて、工業商業海運業にまで気をひろげたおかげで経済の発展はめざましく、それにつれて人口も急速に増大する。

正解率8割ぐらいかな? 農業が農協と認識されているのはご愛嬌。 音声認識の正確さ加減は、基本的にぼくの発音にかかっている。しかしこれだけあっているなら、今後の文章作成はおおまかに口述筆記をして、誤記を改めたり微調整だけをキーボードでするという手順でもいいかもしれない。 句読点などはマルとかギモンフとか言えば「。」「?」に変換される。

単語登録はできない

漢字変換はクラウド上でなされるため、一般的でない単語の漢字変換ができないし登録もできない。例えば、僕の名前は漢字にならず「ありがまさひろ」とひらがなのままだ。しかし「塩野七生」は漢字表記される。さすがである。 大河ドラマ「真田丸」の役者を読み上げると「堺雅人、草刈正雄、長澤まさみ、黒木華」といずれも正解。すばらしい。

なお、連絡帳に名前が登録してある会社名や個人名は認識しやすいそうだが、うちの環境ではそれほどでもなかった。何しろぼくの名前を認識しないくらいだから。ぼくの苗字がやや珍しいこともあるかもしれないけど。

漢字を意識的に開いたり閉じたりといった個性的な表現もやりにくい。 音声入力は、認識精度のより向上が求められるものの、OS付属の音声入力でこれだけの文章が作成できるのだから、今後は活用するつもり。しかしこんなことで新しいキーボード入力方法を覚えることができるのだろうか?

ネット検索も口で言うだけ

検索窓に「旅するフォトグラファー」といえば当ブログがヒットする。

011

便利だな。 しかしこんなことでぼくは親指シフト入力を覚えることができるのだろうか。

『音声入力の進歩に驚いた。これからはキーボードは使わないかもしれない』へのコメント

  1. 名前:加藤 投稿日:2016/06/21(火) 17:08:19 ID:49e415495 返信

    この前のブログを拝見したとき親指シフトは行き詰まると思ってました。
    他にもいろいろな文字入力方法があります。検討されてみてはいかがでしょうか?

  2. 名前:加藤 投稿日:2016/06/21(火) 17:30:08 ID:49e415495 返信

    他にも入力方法はいろいろありますが、私個人はAzikという入力方式を改良して使っています。
    体に染み付いたローマ字入力を捨ててしまうのは時間のロスが大きいと思ったからです。
    それより、ローマ字入力を短縮する方を選択しました。
    現在はキー配列はほぼオリジナルになってしまいましたが、考え方だけはAZIKの考え方を残しています。
    オリジナルキー配列の方がAzik より使いやすいと自負しています。

    http://matome.naver.jp/odai/2136697542367374801

    • 名前:ariga masahiro 投稿日:2016/06/21(火) 20:34:04 ID:686ecb96a 返信

      加藤さん、こんにちは。
      文字入力ってこんなにいろんな方法があるんですね。知りませんでした。

      ぼくはローマ字入力ならタッチタイピングから、教えていただいたAZIK方式も魅力的に感じられます。AZIK方式の案内をよく読んでみます。ありがとうございました。

  3. 名前:加藤 投稿日:2016/06/21(火) 21:47:50 ID:49e415495 返信

    返信ありがとうございます。Azik方式は数ヶ月かけて導入しましたので手伝えることやアドヴァイスなどできるかもしれません。メールアドレスにご連絡いただければ、いつでもお手伝いいたします。

  4. 名前:加藤 投稿日:2016/06/21(火) 23:20:18 ID:49e415495 返信

    参考になりそうなリンクを貼っておきます。

    http://jisx6004.client.jp/layout-gyoudan.html#kiuri 

    http://www.asahi-net.or.jp/~dy5h-kdm/index.htm

    http://www.itmedia.co.jp/enterprise/articles/0704/24/news006.html

    • 名前:ariga masahiro 投稿日:2016/06/22(水) 12:02:13 ID:3820407f0 返信

      参考になりそうなリンク、どうもありがとうございます。
      こんなにも沢山の文字入力があるんですね。それぞれどのくらい普及しているんでしょう。

      日本人に適した入力方法を、キーボード配列も含めてメーカーが開発してくれればいいんですけれど。しかし、それには政府が強力に音頭をとって進まないといけないでしょう。昭和40年頃ならともかく、今ではそんなことは無理でしょうねぇ。

  5. 名前:加藤 投稿日:2016/06/22(水) 17:12:13 ID:9c5ff4c2b 返信

    それぞれの普及率はどうでしょう。
    メーカがデフォルトでQWERTY配列を採用していますので、そこまで高くはないでしょう。
    昔、日本人の生産性をQWERTY配列が大きく落としていると、どこかの記事で読んだ記憶があります。
    私も確かにそう思います。不慣な身体運動が人の思考を制約すると思っていました。
    入力に関しては頭に浮かんだことを動作なしに文字に起こせるのが理想の姿だと思いますが、
    なれた動作や好きな動作であれば、最近は問題ないと感じています。

    Google などの影響で、音声認識の技術も普及してきましたね。
    いつの時代でもそうでしょうが、水面下ではDeep learning など進歩が目覚ましいようです。

  6. 名前:加藤 投稿日:2016/06/22(水) 17:59:45 ID:9c5ff4c2b 返信

    そもそもなぜ人は文字を入力するのでしょうか。人の記憶の容量が限られているからですよね。それから情報を他の人と共有するためですようね。他に何か思いつきますか?

    • 名前:ariga masahiro 投稿日:2016/06/22(水) 23:21:21 ID:3820407f0 返信

      QWERTY配列はやぼったく感じます。まるでアメリカ人が話す日本語を聞いているように、どこかしっくりしません。指の使い方が日本語の文字を打つように考えられていないためです。こんなキーボードを使っていては、日本人の生産性が低くなるのも無理もないです。

      人が文字を書くのは、時間と空間を超えて情報を他の人と共有するためでしょう。それは具体的な事実であったり、あるいは単に感情であったり、連絡であったり。

      しかし、文字を介して共有できる情報は、ある事象の30パーセントぐらいでしょうかね。1万字の文章表現よりも、写真1枚のほうが情報が多いかもしれないし、動画ならさらに多いでしょう。それにしたって、現場に直接行くことで得られる情報量には比べられません。

      • 名前:加藤 投稿日:2016/06/24(金) 11:02:46 ID:06c56191d 返信

        おっしゃることはわかります。
        文字から受ける情報、写真、動画、また現場から受け取る情報には、
        それぞれ違う性質があるとは思います。
        しかし、情報量の比較はbit量を調整してやらなければ、一概に同じ土俵で比較できるものでもないと思いました。

        語弊が生まれるかもしれないですが、私は情報の受け手が得られる情報量は時間が同じであれば常に同じだと思いっています。ただ、人はそれぞれで見ているところが違うということはあると思います。
        有賀さんが現場に行かれて受け取る情報と私が同じ現場に行って受け取る情報はたとえ同じ場面であったとしても違うということです。しかし、そこで受け取っている情報量は時間が同じであれば同じ量の違った情報を受け取っているのではないかと。あとは、その人がどこを見ているか。どこにポイントを持って行っているかの違いでしかないように思います。

      • 名前:加藤 投稿日:2016/06/24(金) 21:41:08 ID:06c56191d 返信

        文字入力でキー配列をMax4段活用するのは至難の技であると改めて思いました。
        指をあまり動かさない入力方法が私の好みです。A~Lのキー配置に頻繁に使うキーを集めるのが合理的な配列であると思います。 

        • 名前:ariga masahiro 投稿日:2016/06/25(土) 01:18:38 ID:01e38c273 返信

          キー配列を4段活用するのは指の動きに無駄が多そうですね。QWERTY配列に比べてひらがな入力が人気がないのは、負担が多そうに感じられるからでしょう。

          • 名前:加藤 投稿日:2016/06/26(日) 10:08:11 ID:068a6e841

            そうかもしれないですね。有賀さんの記事を見て久々にキーボード入力のことを考えました。私が使っているのはオリジナル配列ですが、まだまだ改良の余地はいたるところにあると改めて思いました。この機会に再度見なおすきっかけになったと思います。ありがとうございました。

  7. 名前:加藤 投稿日:2016/06/27(月) 11:19:03 ID:41b11580c 返信

    http://jisx6004.client.jp/etude.html

    おそらくですが、リンク先の表は入力キーの使用頻度です。
    ご参考になればと思います。

    • 名前:ariga masahiro 投稿日:2016/06/28(火) 05:36:45 ID:84a7133ea 返信

      貴重なリスト、ありがとうございます。
      入力方法によって打数がかなり違うものですね。

      • 名前:加藤 投稿日:2016/06/28(火) 10:29:45 ID:47e5de20d 返信

        そうですね。このようなデータはとても参考になります。
        一部に改良加えて満足しても、全体を見渡すと意外と抜けてることが多いことに気づかされます。
        随分前ですが、私は有賀さんの過去のブログを一通り読んだことがあります。
        ご自身の道具へこだわる姿にも、私自身勉強させられ大変感心いたしておりました。

        この記事がきっかけに、私自身のオリジナル配列も進化すると今、確信しています。

        • 名前:加藤 投稿日:2016/06/28(火) 10:59:41 ID:47e5de20d 返信

          それから、有賀さんの目を通してみる世界観もとても興味深いものでした。私は写真はほとんどやりませんが、ここに写っているものから、いろいろ想像させていただきました。

  8. 名前:加藤 投稿日:2016/06/28(火) 15:08:46 ID:47e5de20d 返信

    このデータ(ローマ字入力)を私なりに解釈するとC段のF、J が多く使われていません。
    「F」「J」キーを見て下さい。表面にポッチがついています。

    私の主観ですが、一番入力に向いているキーが日本語の文字入力に活かされていないということです。
    最初にこれに気がついた時、大変憂慮することだと思いました。

    それで、考えたのが「F」と「J」のキーをもっと有効に使おうと考えだしたのが、私のキー配置です。名前を「FJ-Right」と名づけています。 FとJのキーを有効に使うことが正しい、という意味を込めています。

    それからローマ字入力で染みこんいる動作があるので、
    キー配置の変更による無用な混乱を避けるよう設計しているつもりです。

    現段階で、ちょっと変更を加えていますが、完成したあかつきには
    道具に厳しい有賀さんに使用感のご意見などいただければ嬉しく思います。

    もちろん無償で提供いたします。