TsuyoshiKusakaの日々思うこと その2

(株)クエステトラに所属、ITエンジニア、テニス好き、地域のお手伝いをいろいろ、@tsuyoshikusaka

20181020 Umeda Voice UI meetup に参加しました

Umeda Voice UI meetup に参加してきました。

connpass.com

ハッシュタグは #umedavui

#umedavui - Twitter Search

ちょうどいま Google Home 向けアプリを作っているので、参考になればと。

以下は印象的だった点などメモ。

VUIによるアクセシビリティ向上を考える 金谷拓哉さん(神戸デジタル・ラボ)

※先日のデブサミ関西で発表されていた内容を少し絞った内容。
 デブサミ関西のときのまとめは以下

20180928 Developers Summit 2018 KANSAI に参加して - TsuyoshiKusakaの日々思うこと その2

・視覚障がい者の課題
スマホは使える
バス降車の際にボタンの位置がわからない、届かない→スマホからの音声指示で降車ボタンを押せるように
ボタンを押す装置を1つつければいいので導入敷居低い、バス会社に実証実験の提案中
(どのバスからの指示かはどう区別している?同じWiFi内かどうか?質問のタイミングを逃した・・・)

・券売機のケース
水族館のコンサルの方のお話
券を売るの券売機と人どちらがいいか実は券売機を入れると余計に時間かかるらしい、わからない人のフォローが必要で混雑すると
人が話すのは究極のインタフェース、VUIで何かできるかも?(考えるのはまだ)
(人件費も考えつつ、慣れている人もいるような場所であれば併用がベストなのかも)

QA
・バス内にWiFi必要?
→Y、WiFiはすでに搭載されていることが多い、バスロケーションの仕組みとかで料金箱内にある
・ボタン押さずに直接通知しては?
→運転手さんは忙しいので今ある環境に乗せたかった
・知的障がい者向けに何かコンセプトあれば
→視覚障がい者の件も当事者と会ったことなかった、ニーズ指向でまずは話を聞くべきか
知的障がい者の場合は10人に3人がつくかまってほしいケース多い、スピーカーで相手できなくないが楽しさが・・・
・音声解釈はAWSでもできると思うがGoogleでしたのは?
→好きというのもある、組みやすさも
(具体的に役に立ってる事例があるのがすばらしい)

Voice UIとエンターテイメント コバヤシトールさん(VoiceAppLab)

京都、フリーランスUXデザインなどが専門で音声UXデザイナーとして
VoiceAppLab はクリエイターユニット
エンタメ系、生活習慣系アプリなどリリースされている

voiceapp-lab.com

代表的なアプリは「キャプテン九九」「はみがきくん」「ゾンビのまち」など

Google Homeのアプリ「キャプテン九九 」で出来ること&使い方|SmartHacks DataBank
(九九のアプリはうちの子どもに試させてみた、最後まで聞いてたのでまずまずよかったのかも)

娯楽、Entertain→もてなす
スマホとスマートスピーカ比較
場所:ポケット/リビング・寝室・車
使い方:メール・SNS・ゲーム/天気・時間・タイマー
だれ:持ち主/子ども・大人・シニア

・小中学生向け
音だけで格闘ゲーム
格闘ゲームの3要素、打撃・守る・投げる→ジャンケンに
「ボイスカンフー」
https://smarthacks.jp/db/7999/
1万ユーザ、平均20発話
田中さんtweet
ボイスカンフーはSSMLとAudio Playを駆使して作られていそうです
https://twitter.com/yoichiro/status/1053510330448470017
https://developers.google.com/actions/reference/ssml

・シニア向け
「記憶の旅」
https://smarthacks.jp/db/18230/
今の年齢を聞いて、何歳のときに行きたいか内容はwikipediaからひっぱってる
そもそもシニアの声をなかなか聞き取れないのが難点・・・

・大人向け
サウンド小説
LINE Clova + bot「ゾンビのまち」
Clova=電話に見立てて、地図をLINEにリアルタイム送付
強制的に5分待たせるとか、ちょっとずつ次の日も遊んでもらえる工夫も
(エンタメやゲームの UI は工夫のレベルが違う)

まとめ
・デバイスの特徴いかす
・年齢層・ターゲットにあわせて
サウンドの強み、見えないことの強み(音作るのはあまり手かからないそう)
(音声だけでも思った以上のところまでできることを感じさせられた)

Googleアシスタントがもたらす次世代インターネット 田中 洋一郎さん(GDE)

speakerdeck.com

speakerdeck.com

Google Develoer Expert(Assistant, web)
Google Home のことを調べていると田中さんのブログに行きつくことが多い)

Assistant developer community japan にぜひ参加してと

groups.google.com

Assistant登場から27か月、5億台(Androidスマホ含む)
Google Home Hubはアメリカではまもなく、日本まだ
Nissan車にも
スマートウォッチで手首にGoogle Home
なぜいろんなデバイスに入れるか
1日の行動をカバー、場所によって適したデバイス違う、視覚情報がほしいこともある

コロンビア事例6000913、電話でAssistantと話できる、myline、ネットなくてもassistant使える
(これはデブサミでも聞いたがすばらしい)

アクションは会話型/スマートスピーカ向けの2種
Dialogflowはテキスト文から温度などをき出すCodeLabあり
お金もうけを考えると、ユーザ認証・決済
認証はnew signinだけ、決済はややこしい
今後はアプリを選択してから使うではなく検索されたものからアプリ選択(App Action)にいかにその候補にのせられるかが勝負
AMPで書いておくとActionにしやすいらしい

Google Home Hubにはカメラがついてないリビングに置くもの、
ずっと映すのはどうか、となくしたとのこと
スマートホームのセンターコンソールを想定、いま寝室の温度がどうとか

以下、VUI全般のお話

デザインチェックリストあり

デザイン チェックリスト  |  Actions on Google  |  Google Developers

コールセンターみたいにユーザに"1"と言わせたら負け
審査前に確認してもらうためのもの
(これが一番印象的)
Conversation design(英語)もかなりいいhttps://developers.google.com/actions/design/
https://robotstart.info/2018/05/03/google-conversation-design.html
Alexa のも
https://developer.amazon.com/ja/designing-for-voice/
まず脚本(app/userのセリフ)を作ることが大事
冗長でもいろんなケースを考える、いなくなることも
会話として、スピーカーの向こうに人がいると思えるか
長すぎると切られる、短いとわからない
脚本のテストは Google Home 役を人にやってもらうのがいい
(いきなり Intent の設計をしてしまうが、それでは確かにだめ。ただ、そう考えると Google Sheets から Dialogflow の設定が落とせたらいいなあとか考える・・・)

学習向けVUIコンテンツ 矢野浩二朗(大阪工業大学

生物系の教員、VR教育コンテンツ研究開発、ヘッドマウントディスプレイ(HMD)つけて移動

「SlidesGo」
講義の内容をアバタがしゃべる
録るのもHMDかけて広いところでしゃべる感じにする方がいい

ハリウッドで360カメラで撮った画像をVR
Unityちゃんがしゃべるが会話一方的しかできず・・・

・英語学習用VRの課題
ユーザが主導権持てない?VR外でも練習できない?
AIキャラクタとVRではHMD、Realではスマートスピーカーでやりとり?

スマートスピーカーで語学学習できるもの
聞くだけ、オウム返し、一問一答
多言語認識・切替は難しい
会話型では My Berlitz Coach はよくできてる

「SpeakDiary」(www.SpeakDiary.fun)
Google Home 英語版アプリで登録サイトあり、プレイヤ側から話す、日本語はmp3でGCPあげてSSMLから
規定さえ満たしてたらアプリ審査あっさり通った
(技術系の人でなくてもここまでできるのがすごい)

スマートスピーカースキル開発について 高馬宏典さん(アイエンター)

カーリング日本代表の社員もいる、カーリング支援ツール開発やドラマのECサイトのアプリ監修

セッションとしては、スキル開発の基本的な話が多かった
日本語認識性能 Home>Alexa>Clova
ディスプレイつきスマートスピーカも各社から、Google以外はカメラつき
APL(Alexa Presentation Language)
スキル数はAlexa1200、Google550ぐらいインストールの概念がない

・開発環境
Google はわかるので割愛
Amazon Developer, Alexa Skills Kit, Lambda
LINE Developer, Clova Extension Kit

審査は2-3日、それぞれオリジナルTシャツもらえるキャンペーンあり

・構成
Google Intent,Entity,Fulfillment
Alexa Intent,Slot,Endpoint
Clova Intent,Slot,Extension

アプリ終わらせる言いまわし、たくさん入れておく

NodeRED と Dialogflowでライブコーディング
NodeREDではhttpリクエスト受けてjson返すだけ
(Questetra BPM Suite のメッセージ開始イベントで以前に試したことがあるが、それと同じか、何でjsonを返すかが違うだけ)

 

全体の中では、田中さんの言われていた 「コールセンターみたいに"1"とか言わせたら負け」というのが一番印象に残った。短いやり取りのアプリ想定だが脚本を書いてみようと思う。