【スマートスピーカー】Amazon Echoのアレクサスキル、Google Home のGoogleアシスタント、LINE Clovaのクローバースキル を作ったらどのくらい使われれたか公開します

スマートスピーカー向けコンテンツ製作を検討中の皆様の中には、コンテンツを製作した場合どれくらい利用されるのか分からなかったり、各デバイスの対応優先順位をどのように決めるのか、お困りの方もいらっしゃると思います。
そんな方のお役立てればと思い、2018年9~10月に私が製作したアプリケーション「みんなの背くらべ」の、ユニークユーザー数や発話数を公開したいと思います。

また、各スキルの審査期間やリファレンスの充実度、VUIの精度についても少しだけ書かせて頂いています。

今回製作したスキルについて

ユーザーが身長・体重・性別を答えると、タレントや歌手・お笑い芸人・スポーツ選手・アニメキャラ等から最も体型が近い有名人を探し出し答える、「みんなの背くらべ」というスキルを、Amazon alexa・Googleアシスタント・LINE Clovaで公開しました。

スマートスピーカー各サービスのストアキャプチャー ※各サービスの公式アプリ内のストアで「みんなの背くらべ」を検索して下さい。

ずばり!スマートスピーカのアプリケーションを作ったらどれくらい使われたのか?

デバイス 集計期間 カスタマー セッション 発話数
アレクサスキル9/28~10/410 UU1063
Googleアシスタント10/9~10/1544 UU54387
LINE Clova10/2~10/823 UU26155

プロモーション無しでリリースした場合、Googleアシスタントが一番ユニークユーザー数は多くなるという結果になりました。
OS 5.0以上のAndroid端末全てにGoogleアシスタントが入っている為、対応デバイスの多さが結果に出ました。

また、Amazon alexaよりもLINE Clovaの方が利用されている理由は、ライバルスキル数の違いによるものだと思います。
2018年10月現在、alexaは約1500件、Googleアシスタントは約600件、LINE Clovaは約120件のアプリケーションがストアに公開されていますので、Amazon alexaはすぐに埋もれてしまいます。
一方、LINE Clovaは新規で追加されたスキルが専用アプリのトップに表示されるので、新しいスキルがユーザーの目に触れやすいという所が大きいようです。

スキル/アプリケーションの作りやすさ

各デバイスのスマートスピーカー向けコンテンツの作りやすさという点では、Amazon alexaが圧倒的に作りやすいです。
日本語対応のドキュメントやブログで丁寧に説明してくれています。
今回、Alexa Skills Kit + AWS Lambda でスキルを開発しましたが、alexaブログ等を参考に進めれば、
初めての方でも、十分制作が可能だと思います。

逆にGoogleアシスタントは、非常にわかりづらいです。
公式のドキュメントやツールは、ほとんどが英語で、私のように英語が不得意の人間にはそれだけで難易度が上がります。
また、それ以上に厄介なのが、2018年中盤にDialogflowのAPIバージョンがV2に変わった事です。
これにより、ソースコードの書き方が全くと言っていいほど変わってしまいました。
サンプルコードなどを検索しても、バージョン違いによって全く使えない事が多々あります。
開発環境:Actions on Google + Dialogflow + Fulfillment(AWS Lambdaも可)

LINE Clovaはドキュメント(もちろん日本語)が充実していますが、サードパーティのスキル開発が始まってから日が浅いためか、Amazon alexaや Googleアシスタントにくらべてネット上の情報が少なめです。
また、どうしても機能面で見劣りします。
LINE Clovaでは、「ねぇClova、<スキル名>で<命令>して」のようにスキル起動と命令を同時に発話する事はできませんし、
言語認識の部分で他の二つに劣っています。特に文字数の少ないワードや、同音異義語がある単語、日本語として元々は存在しないワードなどを使ったスキルを作ると苦労しそうです。
「みんなの背比べ」では体重をユーザーに聞くのですが、「〇〇キロ」というワードが数字によっては認識しづらい状況でした。
開発環境:Clova Extensions Kit + AWS Lambda

各社の審査について

審査期間

Amazon alexa ... 1日
Googleアシスタント ... 1日(審査通過後、新着掲載に2~3日)
LINE Clova ... リジェクト時は1日、審査通過時は2日

Amazon alexa

アレクサの審査はとにかく細かく、また指示も具体的です。
「カスタムインテントに〇〇というサンプル発話を追加して下さい」とか「〇〇と言ったときにスキルを終了させて」といった感じです。
また、「みんなの背くらべ」では、ユーザーの性別・身長・体重を入力してもらうのですが、個人を特定する情報は含みません。この場合でもプライバシーポリシーが必須でした。

Googleアシスタントの審査

私は、アレクサ⇒Googleアシスタントの順に開発を行うのですが、アレクサで指示された所をGoogleアシスタントで反映済みのせいか、一度も審査に落ちたことがありません。審査に通っている他社のアプリケーションを見た感じ、そんなに厳しくなさそうです。
ただ、審査通過後、新着に掲載されるのに2~3日かかり、掲載されるまでほぼアプリケーションは使用されません。AnalyticsでUUなどを確認するににも2~3日かかります。
また、審査には直接関係ありませんが「Large banner image (1920 x 1080)」という任意提出のバナー画像がありますが、これはストアのヘッダーに表示される画像で、入れないと画像と同じサイズの”空白”ができる事になるので必ず提出した方が良いです。

LINE Clovaの審査

「みんなの背くらべ」とは別のスキルで、アイコンにフリー素材を使っていたのですが、審査時にその素材の出先を問われました。自分で描いた場合はそれを証明しなければならないそうです。自分で描いたものを証明するのはすごく難しい気がしますが、たまたまフリー素材だったのでそのURLと規約に違反していない事を説明し、無事審査に通過しました。
一番厄介だったのが、Extension ID です。審査に提出する際、Extension ID 他のスキルとかぶっていない事は大前提ですが、他者のドメインとかぶっていてもリジェクトされます。自分が所有しているドメインである場合は、それを証明しなければならないそうです。(この自分が所有しているドメインの証明は意外とゆるく、ホームページの掲載内容が提出しているコンテンツとリンクしていたら大丈夫)
例えば、自分が所有しているドメインが、hogehoge.munya だったときは、Extension ID を、munya.hogehoge.skillname みたいにしなければならないという事
また、もしExtension IDが理由のリジェクトをされた場合、これを変更することになるわけですが、変更する方法はClovaスキルチャンネルを作り直す方法以外ありません。

VUIの制度

同音異義語や短い単語の音声認識

まず、どのスマートスピーカーにも言えることですが、同音異義語や短い単語の音声認識が弱いです。
例えば、動物名を答えるスキルで「サイ」とユーザーが答えた場合、スマートスピーカーは「差異」や「際」と認識してしまうことがあります。
今回制作した「みんなの背くらべ」では、ユーザーに体重の入力を促す際「<数字>キロ」と発話してもらっていたのですが、LINE Clovaでは、いくつかの数字で「<数字>キロ」が認識されず、結局「<数字>キログラム」と入力してもらうことにしました。Amazon Echo や Googleアシスタントではこの問題は起きませんでした。

人名の発話

「みんなの背くらべ」では、ユーザーの体型がどの有名人と近いか答えるのですが、名前や体重・身長などのデータを保有しており、その中から最も近い有名人をいくつかピックアップして人名を答えます。この人名をスマートスピーカーに発話させると、Amazon Echo と Clovaは 漢字で登録された人名を5~10%程度は正確に読むことができませんでした。
一番制度が高かったのはGoogleアシスタントで、正確に読むことができなかったのは1~3%程度でした。

LINE Clovaのウェイクワード

LINE Clova はほかのスマートスピーカーに比べてウェイクワード(ねぇClova)を、はっきりと大きな声で言わないと反応してくれません。
それなのに、リビングなどに置いておくと、TVの音などに反応し命令待ちの状態にすぐなります。これがとにかく頻度が高くて1日に10~20回は「ポン!」と鳴ります。
Googleアシスタントではこのような事はほぼありませんが、Amazon Echoではたまに「アレクサ」に似た言葉(例えば”アラキさん”のような)で反応します。


※このブログに書かれている内容について、問い合わせや間違いなどありましたら、CONTACTからご連絡下さい。
※文中に記載されている会社名、商品名は、各社の登録商標または商標です。