キャッチコピー一覧を感情分析してみた

シェアする

スポンサーリンク

ディープラーニングを使って映画の感想レビューデータを感情分析してみたけど・・・の続きです。

一部の映画の感想コメントレビューを元にしているので、キャッチコピーを感情分析しても意味がないかもだが、テストデータとして使用してみた。

人気キャッチコピー 事例集 一覧を使用させていただきました。(引用元:http://www.sendenkaigiaward.comのようですが、つながりませんでした。)

SKAT「宣伝会議賞」の歴代受賞作品のキャッチコピー

「女子トイレがとっても混雑しているのは、落ちやすい口紅にも責任があると思います。」 コーセー

===
[ 0.08541943 0.91458057]
女子トイレがとっても混雑しているのは、落ちやすい口紅にも責任があると思います。 is positive
===

「飲酒は30歳を過ぎてから。」 サントリー

===
[ 0.78677484 0.21322516]
飲酒は30歳を過ぎてから。 is negative
===

「週刊文春は、訴えられました。」文藝春秋

===
[ 0.65256403 0.34743597]
週刊文春は、訴えられました。 is negative
===

「精子だった頃の運をもう一度。」 宝くじ

===
[ 0.22474178 0.77525822]
精子だった頃の運をもう一度。 is positive
===

「家は路上に放置されている。」 セコム

===
[ 0.86591436 0.13408564]
家は路上に放置されている。 is negative
===

「蛍光灯の暗い病院は、不安だ。」 松下電器産業

===
[ 0.09212102 0.90787898]
蛍光灯の暗い病院は、不安だ。 is positive
===

「家に帰ると、母が倒れていた。」 東京ガス

===
[ 0.1675576 0.8324424]
家に帰ると、母が倒れていた。 is positive
===

「さらば、視聴率。こんにちわ、録画率。」 松下電器産業(’78)

===
[ 0.25163389 0.74836611]
さらば、視聴率。こんにちわ、録画率。 is positive
===

「有給とって家にいた。」 積水化学工業

===
[ 0.11302269 0.88697731]
有給とって家にいた。 is positive
===

有休は使用するためにあるのです。

「父親の席は、花嫁から一番遠くにある。」 キヤノン販売

===
[ 0.00821905 0.99178095]
父親の席は、花嫁から一番遠くにある。 is positive
===

「死ぬ回数と病気やケガの回数、どっちが多い?」 アメリカンファミリー生命保険会社

===
[ 0.3509486 0.6490514]
死ぬ回数と病気やケガの回数、どっちが多い? is positive
===

「田舎が発展しませんように。」 日本コカ・コーラ 森の水だより

===
[ 0.51907057 0.48092943]
田舎が発展しませんように。 is negative
===

「1番いいのは、借りないこと。」 アコム

===
[ 0.62899511 0.37100489]
1番いいのは、借りないこと。 is negative
===

アコムとしては借りてもらったほうが良さそうです。

「お母さん、そのお皿の洗い方はなに?」 学生援護会

===
[ 0.03509654 0.96490346]
お母さん、そのお皿の洗い方はなに? is positive
===

「明日の自分に借りるのだ。」 アコム

===
[ 0.8692314 0.1307686]
明日の自分に借りるのだ。 is negative
===

借金ないのが一番。

「目のつけどころがシャープでしょ。」 シャープ (’90~10)

===
[ 0.74694514 0.25305486]
目のつけどころがシャープでしょ。 is negative
===

日本の大手電機として初めて外資の傘下に入る

「目指してる、未来がちがう。」 シャープ (’10~)

===
[ 0.46275862 0.53724138]
目指してる、未来がちがう。 is positive
===

シャープ従業員のリストラを突然発表した鴻海

「お口の恋人」 ロッテ

===
[ 0.27880764 0.72119236]
お口の恋人 is positive
===

「地図に残る仕事。」 大成建設

===
[ 0.5563782 0.4436218]
地図に残る仕事。 is negative
===

「SHIFT_The Future」 日産自動車

===
[ 0.13842605 0.86157395]
SHIFT_The Future is positive
===

「マチのほっとステーション」 ローソン

===
[ 0.27880764 0.72119236]
マチのほっとステーション is positive
===

「開店、開店、開店、開店、ライブドアオート。」

===
[ 0.0506633 0.9493367]
「開店、開店、開店、開店、ライブドアオート。」 is positive
===

「わんぱくでもいい、たくましく育ってほしい」 丸大ハム

===
[ 0.27158509 0.72841491]
わんぱくでもいい、たくましく育ってほしい is positive
===

「100人乗ってもだいじょーぶ!」 稲葉製作所 イナバ物置

===
[ 0.8875507 0.1124493]
100人乗ってもだいじょーぶ! is negative
===

「きれいなお姉さんは好きですか」 ナショナル

===
[ 0.3500486 0.6499514]
きれいなお姉さんは好きですか is positive
===

大好きです。

「残念ながら、ドモホルンリンクルは初めての方にはお売りすることが出来ません」 ドモホルンリンクル

===
[ 0.9923154 0.0076846]
残念ながら、ドモホルンリンクルは初めての方にはお売りすることが出来ません is negative
===

「ん~っ不味い!もう一杯!」 キューサイの青汁

===
[ 0.99357832 0.00642168]
ん~っ不味い!もう一杯! is negative
===

不味いものは不味いんですって。

「24時間戦えますか。」 リゲイン24

===
[ 0.04660986 0.95339014]
24時間戦えますか。 is positive
===

過労死(かろうし、英:karōshi)とは、周囲からの暗黙の強制などにより長時間の残業や休日なしの勤務を強いられる結果、精神的・肉体的負担で、労働者が脳溢血、心臓麻痺などで突然死することや、過労が原因で自殺すること(いわゆる過労自殺)などである。

「ピッカピカの1年生」 小学館

===
[ 0.30484848 0.69515152]
ピッカピカの1年生 is positive
===

「お尻だって洗って欲しい」 TOTO

===
[ 0.01624926 0.98375074]
お尻だって洗って欲しい is positive
===

私のお尻の救世主さま

「プール冷えてます」 としまえん

===
[ 0.15228286 0.84771714]
プール冷えてます is positive
===

「またヘンなものを、つくってしまった。」 富士急ハイランド

===
[ 0.10693467 0.89306533]
またヘンなものを、つくってしまった。 is positive
===

by 石川五イェー門

映画キャッチコピー

「抱きしめたいのに抱きしめられない・・・」 シザーハンズ

===
[ 0.71685993 0.28314007]
抱きしめたいのに抱きしめられない・・・ is negative
===

「アタマ使ってる?」 スナッチ

===
[ 0.94738057 0.05261943]
アタマ使ってる? is negative
===

なんとなくで生きております。

「本日の授業、殺し合い。」 バトル・ロワイヤル

===
[ 0.55670865 0.44329135]
本日の授業、殺し合い。 is negative
===

殺しダメ。ゼッタイ。

「遂に日本政府は、この男を入国させてしまった!!」 ミスタービーン

===
[ 0.70347212 0.29652788]
遂に日本政府は、この男を入国させてしまった!! is negative
===

水際対策は大事ですよね。

「「去年ノ夏、何ヲシタカ知ッテルゾ・・・」」 ラストサマー

===
[ 0.22434013 0.77565987]
「去年ノ夏、何ヲシタカ知ッテルゾ・・・ is positive
===

「決して、ひとりでは見ないでください。」 サスペリア

===
[ 0.02307451 0.97692549]
決して、ひとりでは見ないでください。 is positive
===

彼氏、彼女と見ろってことですね。わかります・・・わか・・うぅ・・・

「一身上の都合により - 戦争します。」 サラリーマン金太郎

===
[ 0.0381516 0.9618484]
一身上の都合により - 戦争します。 is positive
===

一身上の都合じゃ、しょうがない。

糸井重里さんが書いたキャッチコピー

「エンディングまで、泣くんじゃない」 任天堂 MOTHER

===
[ 0.27880764 0.72119236]
エンディングまで、泣くんじゃない is positive
===

「おとなもこどもも、おねーさんも」 任天堂 MOTHER2

===
[ 0.04125978 0.95874022]
おとなもこどもも、おねーさんも is positive
===

「生きろ。」 もののけ姫

===
[ 0.27880764 0.72119236]
生きろ。 is positive
===

自殺する人はすごく「勇気」があると思います。でも、足の小指を角でぶつけたときでさえ、この世の地獄かと思うので、私はとりあえず生きてます。

あなたの事が大切だと思う誰かの機会さえ奪います。

亡くなった後のパラレルは無数に存在できますが、生きていたはずのパラレルは全て無くなるって凄い事だと思うんですけどね。例えば子供が出来た時にあの時自殺しなくて良かったということさえ、もう思えないんですから。

ぼくはちょっとちがうけどね。まお

「4歳と14歳で生きようと思った。」 火垂るの墓

===
[ 0.0776648 0.9223352]
4歳と14歳で生きようと思った。 is positive
===

「カッコイイとは、こういうことさ。」 紅の豚

===
[ 0.37217085 0.62782915]
カッコイイとは、こういうことさ。 is positive
===

飛ばねぇ豚はただの豚だ

「おちこんだりもしたけれど、私はげんきです。」 魔女の宅急便

===
[ 0.37217085 0.62782915]
おちこんだりもしたけれど、私はげんきです。 is positive
===

むしょくだけれど、私はげんきです。

「愛は地球を救う」 日本テレビ24時間テレビ

===
[ 0.57420442 0.42579558]
愛は地球を救う is negative
===

募金とギャラがね・・・

「いいにおいがします。」 西武百貨店

===
[ 0.64576954 0.35423046]
いいにおいがします。 is negative
===

いきなり女性に言ったら引かれる可能性が高いでしょう。

「くう ねる あそぶ」 日産自動車 セフィーロ

===
[ 0.69674125 0.30325875]
くう ねる あそぶ is negative
===

仕事探そうね。

谷山雅計さんが書いたキャッチコピー

「日本の女性は、美しい」 資生堂 TSUBAKI(ツバキ)

===
[ 0.64042691 0.35957309]
日本の女性は、美しい is negative
===

「Yonda?」 新潮社

===
[ 0.33460504 0.66539496]
Yonda? is positive
===

Positive?

「メジャーって、つまり、 すごい草野球みたいな ものだよな。」 ナイキジャパン

===
[ 0.77244444 0.22755556]
メジャーって、つまり、 すごい草野球みたいな ものだよな。 is negative
===

「ガス・パッ・チョ!」 東京ガス

===
[ 0.27880764 0.72119236]
ガス・パッ・チョ! is positive
===

ガス・パッ・チョ!

「可能性 だけは くさる ほどある キミに。」 講談社

===
[ 0.31244162 0.68755838]
可能性 だけは くさる ほどある キミに。 is positive
===

可能性があっても実行に移さない限りは0です。

「試着室で思い出したら、本気の恋だと思う。」 ルミネ

===
[ 0.02232809 0.97767191]
試着室で思い出したら、本気の恋だと思う。 is positive
===

「人生初はセレナ発」 トヨタ自動車

日産自動車の間違い?参照記事側のコピペミス?

===
[ 0.56509493 0.43490507]
人生初はセレナ発 is negative
===

新型セレナに不具合が発覚したってどういうことなの?

日産、セレナの出荷一時停止 再発進時に不具合 2016年9月2日23時19分
日産が新型セレナ9千台リコール 発電機に不具合 2016年9月7日23時19分

「広っ!速っ!」 全日本空輸

===
[ 0.05943513 0.94056487]
広っ!速っ! is positive
===

「海より、山より、夏競馬。」日本中央競馬会

===
[ 0.21502455 0.78497545]
海より、山より、夏競馬。 is positive
===

「もうすぐ金曜ロードショー スタローンは出ません」 金曜ロードショー

===
[ 0.55468997 0.44531003]
もうすぐ金曜ロードショー スタローンは出ません is negative
===

こんな金曜ロードショーは嫌だ。スタローンばかり出てくる。

「「草」とは「ヘタ」ではない、「草」とは「愛」だ。」 ナイキ

===
[ 0.20628493 0.79371507]
「草」とは「ヘタ」ではない、「草」とは「愛」だ。 is positive
===

「 「ごゆっくり」と、響が言った。」 サントリーウイスキー響

===
[ 0.00982117 0.99017883]
ごゆっくり」と、響が言った。 is positive
===

pos分析確率: 0.633333333333 38 60

その他まとめ

映画の感想コメントを別に収集し、いくつか自分が対応した読み込み部分を修正したら、ポジティブ、ネガティブが80%ぐらいになったので一応成功と言えるのかな?前回収集した感想データでテストしても8割ぐらいになったので、前回のデータでも同じようになるかもしれない。

でも、結局このディープラーニングによる結果は何をもって成功と考えたらいいんだろうか。今回も結構適当にやっているので感情分析がうまくいっているのかよくわかってない。

ネガティブデータが少ないので10段階評価の感想データ90点以上、40点以下でポジティブ、ネガティブとした。
pos分析確率: 0.821128451381 684 833
neg分析確率: 0.861944777911 718 833

モデルに含まれているヒストリーデータ valid_err,test_errらしい。参考にした記事よりエラー率が低い(正答率が高い?)のが気になるけど、集めたデータが違うからこんなものなのかね。
キャッチコピーを感情分析してみた。「ディープラーニングを使って映画の感想レビューデータを感情分析してみたけど」の続き

以下は文章を別に追加した結果
===
[ 0.14180702 0.85819298]
とても良い会社だ is positive
===
[ 0.96097994 0.03902006]
とても最悪な会社だ is negative
===
[ 0.74469391 0.25530609]
そんなに面白くない映画だった。 is negative
===
[ 0.04723225 0.95276775]
面白い映画だった。 is positive
===
[ 0.7624356 0.2375644]
彼女がすごく可愛かった is negative
===
[ 0.00466276 0.99533724]
僕と彼女は出会い、そして恋をした。 is positive
===
[ 0.00585209 0.99414791]
僕と彼女は出会い、そして失恋をした。 is positive

失恋に反応してちょっとネガティブよりにはなっているけど。短文は判断しづらいのかな。

error: