ブログ記事を音声化してみる

Voiced by Amazon Polly

Twitterを眺めていたら

なんて流れてきた。
VUI(Voice User Interface)は流行ると思うし、スマートスピーカーも興味あるし。実際試してみた。

でもこのタイミングなら「【 AWS 新リージョン】 AWS 大阪ローカルリージョンが本日より利用可能になりました」に飛びついて確認すべきだとは思うけどまぁいいや^^;;

AWS 大阪ローカルリージョンをご利用いただくためには、申し込みおよび審査が必要です。

なんて書かれているから一般利用が出来るのはまだ先のことかな。

ご利用の WordPress ブログに新しい Amazon Polly の声を通りにしたら普通に使えます。

IAM コンソールに移動して、新しいポリシーを作成します。

必要なポリシーはamazon-polly-wordpress-pluginの通りに設定しました。

AWS側でPolicyとユーザの作成

{
“Version”: “2012-10-17”,
“Statement”: [
{
“Sid”: “Permissions1”,
“Effect”: “Allow”,
“Action”: [
“s3:HeadBucket”,
“polly:SynthesizeSpeech”,
“polly:DescribeVoices”
],
“Resource”: “*”
},
{
“Sid”: “Permissions2”,
“Effect”: “Allow”,
“Action”: [
“s3:ListBucket”,
“s3:GetBucketAcl”,
“s3:GetBucketPolicy”,
“s3:PutObject”,
“s3:DeleteObject”,
“s3:CreateBucket”,
“s3:PutObjectAcl”
],
“Resource”: “arn:aws:s3:::audio_for_wordpress*”
}
]
}

これでS3 および Polly 機能にアクセスできるようになります。

そのPolicyを新規アカウント(wp-polly-user)に紐付けます。

WordPressのplug-inインストールと設定

WordPressではAmazon Polly plugin for WordPressというプラグインをインストールします。
設定はこんな感じ

日本語もちゃんと対応しています。

aws polly describe-voices –language-code ja-JP

{
“Voices”: [
{
“Gender”: “Male”,
“Id”: “Takumi”,
“LanguageCode”: “ja-JP”,
“LanguageName”: “Japanese”,
“Name”: “Takumi”
},
{
“Gender”: “Female”,
“Id”: “Mizuki”,
“LanguageCode”: “ja-JP”,
“LanguageName”: “Japanese”,
“Name”: “Mizuki”
}
]
}

今回は男性のTakumiで設定してみました。
指定されたS3に吐き出しそれをCloudFrontで配信という流れにしました。
これ便利そうなのが
Amazon Pollycastというfeedを作ってくれてそれを登録してあったら自動的に音声が配信される流れ。このサイトのフィードはhttps://www.barasu.org/feed/amazon-pollycastでとれるはず

記事中にも音声ファイルの再生が表示されます。

使い道

うーん・・・
このサイトで使い道あるのかがまだわからない。

記事を音声で聞いて嬉しいのかな?

サイズ的にはこの記事の音声ファイルであるamazon_polly_13269.mp3は約1.7Mという感じ。
アクセス数が少ないから金額的にはたいしたことにはならないと思われる。
今はBucketがバージニア北部なので日本からのアクセスは早くはないかも
CloudFrontを経由するので2回目からは高速かな(たぶん)

気になるところ

  • 英語が日本語発音になる。
  • 句読点大切

英語が日本語発音に関しましてはAmazon Polly の SSML タグに書かれているようにSSMLで頑張ればいけるのかな?

VoiceがらみはTwilioはじめ色々やっているから今後も追いかけた方が面白そうではある。