作って欲しい!?「聴けるYouTube チャンネル」を浅く掘り下げる

「 観る」から「聴く」へ

YouTube は楽しいメディアです。

暇があると、以前観たコンテンツを何度も繰り返し観ていたりします。

しかしながら、日常生活は何かと忙しくて、ゆっくりと画面を観ていられる時間は限られます。

さらに、ワイヤレスイヤホンを愛用するようになって、家にいる時もずっと装着していたりします。

なので、最初は画面を観ている時に便利だった使い方が、掃除や料理をしている時も音楽を聴きたくて流しっぱなしになっていることも。

まだ始めて数回ですが、ジョギングにもイヤホンを使い、その時間に音楽を聴くようになりました。

さらには、トーク番組なども観ないで聴いていたりします。

音声読み上げアプリで満足できる!?

テキストをアプリに読ませて、それを音声データに変換することは簡単です。

しかし、観るから聴くへと趣向を変えたチャンネル作りでは、単純に「文字」として認識できればいいのではありません。

画面を観ないで、その言葉だけです状況を伝えるには、「文字」だけでなく、音程やピッチなど抑揚が不可欠です。

さらに言えば、同じ時間内でテンポを壊さないトークとなると、それはプロの技術レベルでしょう。

テレビ番組とYouTube で決定的に違うのが、時間に対する意識で、必要なら長編にできてしまうYouTube のコンテンツは、時に「言葉を削る」作業を省きます。

流暢に聞こえるトークでも、実はその半分で伝えられたり、要約すればひと言で終われたりして、そのあたりは番組の構成から作るテレビ番組の手法は経験則による結果でしょう。

以前までYouTube は楽しい時間を過ごせたらと思っていました。

「嗚呼、面白かった」という感想が最高の褒め言葉だったのです。

しかし、コロナ禍で自粛が制限された頃とは違い、我々はいろんなことをできるような環境に戻りつつあります。

つまり、家で暇を見つけてはYouTube を観ているという流れから、外に出かけたりして楽しむ機会が増えました。

さらに、YouTube 以外のコンテンツも増えて、好みや気分によって楽しみ方が多様化されています。

当時ですが、YouTube の視聴時間は短くなり、再生回数も以前ほど伸びないこともあるでしょう。

しかし、観るコンテンツ以外に、「聴く」コンテンツ、例えばラジオ番組の良さって感じます。

昔、デザイン事務所に勤務していた頃、職場ではいつもラジオか有線が流れていて、音楽などを聴きながら仕事をしていました。

無意識でも感じるリズム感が、仕事で必要なモチベーションを与えてくれ、作業も捗ったように記憶しています。

だから、イヤホンを使うようになって、この感覚って懐かしいなぁと感じました。

欲しいと思うアプリ

音声読み上げアプリで、性別や年齢代、雰囲気と言った要素をミックスして「音声」を作れたらいいとおもいませんか。

さらに簡単な「喜怒哀楽」を再現できたら、それだけでもかなりニーズがあるでしょう。

ただ、それこそ自動運転によってプロドライバーの牙城が崩されるように、音声読み上げアプリが大きく進化すると、声優という職業が「声の演者」ではなくなるかもしれません。

でも、このアプリができたら、それこそYouTube 動画が新たなフェーズに行けると思いました。

ショート動画が人気でも、それとは異なる需要が掘り起こせるからです。

人工知能の開発

こみちは、電気や機械が好きな少年で、仕組みを知りたいと思って子どもの頃にいろんな電化製品を壊しました。

「また壊して!」と何度も怒られて、でもその探究心はいつかロボットを作ってみたいと夢見ていたからです。

しかし、いつしかそんな夢は失せて、もっと現実的な生き方を選んだのですが、ふと人工知能のことを思い出すと、例えば「知能」をどう再現したら良いのか考えたりしてしまいます。

流れとして、ある人格を作る時に、キーワードとなる言葉を選びます。

例えば、バイク、料理、楽しいことと言った具合に。

それをインターネットで検索すると、結果としていろんな記事がリストアップされるでしょう。

そこで、記事に使われる言葉や文脈を分析するプログラムを作り、人格の根源となるリスト化された「言葉」をデータ化します。

つまり、あることを話題に振ると、その解答はデータ化されたフレーズが高頻度で出て来ます。

「好きなものは?」

「それは、キャンプですよ」という具合に。

しかしポイントは、「つまんないなぁ。何か楽しいことない?」と聞けば、「じゃ、バイクに乗ったら?」と答えます。

「バイク?」

と聞き返してくれたら、バイクに関する情報を再構築して伝えます。

「でも、バイクって高額だよね?」と言われたら、「バイク」と「金額」に関する情報を再構築して伝えます。

つまり、再構築することができれば、見せ掛けの「人格」を作り出せるます。

例えば、全く興味の無いことを話題に振られると、「知らないなぁ。面白いの?」と聞き返します。

この「面白いの?」というフレーズは最初の設定部分で、例えば「安いの?」とか「ウケる?」ということも設定次第でしょう。

そして面白いという理由を聞かせてもらい、同時に検索によって情報を集めて再構築し、「〇〇ってこと?」とか「〇〇が楽しいって話?」と言葉を提供します。

「そうそう」と言ってもらえたら、その時に蓄積した情報をさらに展開していけば良いですし、別の言葉を教えられたら、さらに別の展開もできるでしょう。

それこそ、「聞き上手」とか、「教えたがり」とか、「甘えん坊」という選定も加えて、一定時間が経つと話題を変えたりします。

「ねえねえ。腹減ったよね?」

「そろそろ、仕事するよ」

そう言って、話題を相手が満足するまで続けるとは限りません。

音声から文書化することが簡単になり、会話データの蓄積も難しくなくなったので、「会話」を定型化することもできるでしょう。

それこそ、主語と述語があれば、最初は十分で、形容詞などはそれができたら後から加えれば良いだけです。

ということは、検索した情報も主語述語で追うだけでもかなり会話になるように思います。

いやいや、無知って怖いですね。

勝手に妄想して、ワクワクしてしまいました。

人工知能を開発する時に人間以上の知能を目指すから面倒なだけで、「人間並み」を目指して、一般人の使う言語数や文脈の癖を解析できたら、共通点が見つかるように思います。

なぜなら、完璧を目指していないので、ワンパターンでもツーパターンでも大丈夫。

単純に赤ちゃんの言葉使いに寄ってしまうだけで、そこができたら上乗せするだけだからです。

こんな記事はいかが?