2024-02-07

ChatGPTが作ったネタはお笑いライブでウケるのか検証してみた

エンタメエンタメ-お笑い

2024年の芥川賞受賞作品の一部に生成AIが使用されていることが話題になりました。ChatGPTを代表とする生成AIの登場により、小説や絵、音楽などの創作のハードルが大きく下がりました。

ではお笑いにおいてはどうでしょうか？生成AIはネタを作成できるのでしょうか？そのクオリティはどの程度なのでしょうか？

この疑問を検証するために、ChatGPTにネタを作成させ、実際にお笑いライブに出演してそのネタがウケるかどうかを試してみることにしました！

ネタ作り

では早速ネタを作っていきます。

いきなり「ネタを作って」というプロンプトを投げるのではなく、まずは①テーマを作らせ、②そのテーマに基づいたボケを考させる流れにします。

テーマ作り

せっかくなのでありきたりなテーマではなく、自分の専門分野かつお笑いから遠そうな「データサイエンス」をお題にします。

データサイエンスを軸にしたテーマをいくつか作らせてみます。

なかなかいいですね！

「2.データのビジュアライゼーション」の例は粗品がフリップネタで「パイチャート！」とつっこんでいる絵が思い浮かびます笑

「3.AIとの日常生活」もいろいろボケが考えられそうですね。

他にはこれなんかもいい着眼点だなと思います。

データサイエンスを軸にどういうネタが作れるかは自分ではあまり思い浮かびませんでしたが、ChatGPTの回答を見るとそういう観点があったのかと感心させられます。

ボケアイデア出し

次は上記テーマに基づいてボケを考えさせます。

試行回数が多かったので、プロンプトと回答はここでは割愛しますが、結論としては、ボケのクオリティはそれほど高くありませんでした。

「それのどこが面白いんだろう」という回答が多く、たまに笑えるものもありましたが、クスクス笑えるレベルで大笑いできるものはありませんでした。

ただ、これは個人的な感想であり、他の人からすると面白いかもしれないので、ライブでウケるのかを検証していきたいと思います！

仕上げ

ChatGPTが考えたテーマとボケを基に最終的なネタの構成を考えていきます。

ChatGPTのボケだけでは心許なかったので、自分でもボケを考えて追加しました。

テーマ出し：ChatGPT

ボケ出し：ChatGPT8割、人間2割

構成：人間

ネタのスタイルはテーマとピンでやることの親和性からフリップネタにしました。

フリップの絵自体もStable Diffusionで生成AIに作成させようとしたのですが、コミカルな絵を生成するのが難しく、今回は断念しました。

ライブ

お笑いライブに出演するにはオーディションとかあるのかと思ってましたが、オーディションなしで誰でも出れるライブがあるようなので、今回はこちらに出演しました。

kpro-web.com

当日は約40組の出演者がいて、自分は後ろから5番目でした。

自分の番が近づくまでは楽屋で待機しているのですが、ここで一個事件が発生しました。会場にはスタンドマイクが用意されているのですが、フリップネタなのでスタンドマイクが邪魔になることに気づきました。ピンマイクは用意されていなかったので、仕方なく地声でやることになりました。

自分の番まではめちゃめちゃ緊張しました。ネタを飛ばしたら醜態を晒すことになると。舞台袖で待機している時も、前の芸人さんのネタを聞いている余裕はありませんでした。

自分の番が来て、とにかくネタを飛ばさないように意識して、ネタを披露しました。

結果、、、スベりました笑

スベるとこんなに恥ずかしいんですね笑

結論

生成AIによるネタ作りは、ボケに関してはまだまだクオリティが低いことが分かりました。しかし、テーマを考える点には長けており、ネタ作りで方向性に悩んでいるときは役立ちそうです。

良いボケが生成されなかった理由はプロンプトにもあると思うので、今後改良していきたいです。もっと面白いネタを自分で考えてリベンジします！

おまけ

ネタをやってみた感想。

最後まで噛まずにやるの難しい
声量めっちゃ大事
フリップめくるの難しい(めくることに意識持っていかれる)

2024-01-22

西野カナに「恋」とは何か聞いてみた

エンタメエンタメ-音楽

いきなりですが、みなさん恋してますか？僕は出来てないです。というか恋が何か分かってません(笑)。好きは分かるけど、恋って何か重い感じがする。「恋してる」何て言ったことないし、恋って何だーと思ったので、定義を調べてみると、

恋：異性に愛情を寄せること、その心。

ほほう。愛情とは？

愛情：相手にそそぐ愛の気持。

ほほう。愛とは？

愛：そのものの価値を認め、強く引きつけられる気持。

うーん….よく分からないので、よく恋をしてそうな西野カナ先生に聞いてみましょう！

どうやって聞くか？

会って直接！とはいかないので、今回は西野カナ先生の歌に対して自然言語処理をして、先生が恋をどのように表現しているか調べてみます。言い換えると、

「西野カナ先生に恋とは何かを聞く」 → 「西野カナ先生の歌詞から辞書を作り、恋と類似度の高い言葉は何かを解析する」

読者対象

自然言語処理で何が出来るか知りたい人

恋に悩んでいる人

使う技術

自然言語処理(Janome, word2vec)

スクレイピング(BeautifulSoup)

Python

データの抽出

まず始めに、こちらから西野カナの歌全167曲の歌詞をスクレイピングで抽出します。ライブラリはBeautifulSoupを使います。

import requests
from bs4 import BeautifulSoup

base_url = "https://www.uta-net.com"
target_url = 'https://www.uta-net.com/search/?Aselect=1&Keyword=%E8%A5%BF%E9%87%8E%E3%82%AB%E3%83%8A&Bselect=3&x=0&y=0'
music_num = 167

r = requests.get(target_url)

soup = BeautifulSoup(r.text, "html.parser")
url_list = []
#曲一覧から各曲のURLを取り出してリストに入れる
for i in range(music_num):
   href = soup.find_all("td", attrs={"class": "side td1"})[i].contents[0].get("href")
   url_list.append(href)         

kashi = ""
#曲ごとにRequestを送り歌詞を抽出する
for i in range(music_num):
   target_url = base_url + url_list[i]
   r = requests.get(target_url)
   soup = BeautifulSoup(r.text, "html.parser")

   for string in soup.find_all("div", attrs={"id": "kashi_area"})[0].strings:
       kashi += string

with open('kashi.txt', mode = 'w', encoding = 'utf-8') as fw:
   fw.write(kashi)

これでkashi.txtに全曲の歌詞が入りました。

データの前処理

歌詞にはLoveやWowといった英語も含まれており、英数字、記号を正規表現で削除し、日本語のみの歌詞にします。

import re
# 英数字の削除
kashi = re.sub("[a-xA-Z0-9_]","",kashi)
# 記号の削除
kashi = re.sub("[!-/:-@[-`{-~]","",kashi)
# 空白・改行の削除
kashi = re.sub(u'\n\n', '\n', kashi)
kashi = re.sub(u'\r', '', kashi)

形態素解析

次に歌詞データに対して形態素解析を行います。形態素解析とは日本語を最小単位に分割し、品詞などを同定する行為です。形態素解析なんて難しそーと思われるかもしれませんが、Janomeという形態素解析を行ってくれるライブラリがあるのでそれを使います。

def tokenize(text):
    t = Tokenizer()
    tokens = t.tokenize(text)
    word = []
    stop_word = create_stop_word()
    for token in tokens:
        part_of_speech = token.part_of_speech.split(",")[0]
        if part_of_speech == "名詞":
            if not token.surface in stop_word:
                word.append(token.surface)        
        if part_of_speech == "動詞":
            if not token.base_form in stop_word:
                word.append(token.base_form)
        if part_of_speech == "形容詞":
            if not token.base_form in stop_word:
                word.append(token.base_form)        
        if part_of_speech == "形容動詞":        
            if not token.base_form in stop_word:
                word.append(token.base_form)

    return word

結果はこのようになります。

(歌詞)「・・・横顔を見つめながら考えてる・・・」

横顔名詞,一般,*,*,*,*,横顔,ヨコガオ,ヨコガオを助詞,格助詞,一般,*,*,*,

を,ヲ,ヲ見つめ動詞,自立,*,*,一段,連用形,

見つめる,ミツメ,ミツメ

ながら助詞,接続助詞,*,*,*,*,ながら,ナガラ,ナガラ

考え動詞,自立,*,*,一段,連用形,考える,カンガエ,カンガエ

てる動詞,非自立,*,*,一段,基本形,てる,テル,テル

「は」や「の」といった助詞・助動詞は今回は必要ないので、形態素解析を行った後に、名詞・動詞・形容詞・形容動詞だけを取り出しています。動詞・形容詞・形容動詞に関しては、活用されているものは基本形に直します。基本形は.base_formで取り出せます。

(例)見つめ/て　→　見つめる/て

surface	表層形
infl_type	活用型
infl_form	活用形
base_form	原形
print token.reading	読み
print token.phonetic	発音

他にも関係なさそうな単語を省くためストップワードリストを作成します。ストップワードは以下を参考に、いくつか自分で追加しました。
ストップワード参考

def create_stop_word():
    target_url = 'http://svn.sourceforge.jp/svnroot/slothlib/CSharp/Version1/SlothLib/NLP/Filter/StopWord/word/Japanese.txt'
    r =requests.get(target_url)
    soup=BeautifulSoup(r.text, "html.parser")
    stop_word=str(soup).split()
    #自分で追加
    my_stop_word=['いる','する','させる','の','色','真夏','身体','最初','知る','られる']
    stop_word.extend(my_stop_word)
    return stop_word

これで辞書が完成しました。

word2vecで学習

word2vecは、大量のテキストデータを解析し、各単語の意味をベクトル表現化する手法です。Word2Vecを使うことで、単語と単語の関係性を簡単に表現でき、

「王様」 – 「男」+ 「女」 = 「女王」

「パリ」 – 「フランス」 + 「日本」 = 「東京」

のような単語同士の演算が出来たり、単語同士の類似度を計算することができます。では歌詞データに使われている単語の関係性をword2vecに学習させましょう。


model = word2vec.Word2Vec(sentence, size=200, min_count=4, window=4, iter=50)

パラメータはそれぞれ以下を表しています。

size	ベクトルの次元数
min_count	n回未満登場する単語を破棄
window	学習に使う前後の単語数

類似度の計算

さあようやく準備が出揃いました。後は西野カナ先生が恋をどのように表現しているのかを調べるだけです。どうやって調べるかというと、恋という単語に対して類似度の高い単語を出力します。学習したモデルに対し、

.most_similar(positive=["単語"])

という風にmost_similarメソッドを使うことでその単語と類似度の高い単語が出力されます。

from gensim import corpora
from janome.tokenizer import Tokenizer
from gensim.models import word2vec
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import re
import requests
from bs4 import BeautifulSoup

with open("kashi.txt", "r", encoding="utf-8") as f:
    kashi = f.read()

# 英数字の削除
kashi = re.sub("[a-xA-Z0-9_]","",kashi)
# 記号の削除
kashi = re.sub("[!-/:-@[-`{-~]","",kashi)
# 空白・改行の削除
kashi = re.sub(u'\n\n', '\n', kashi)
kashi = re.sub(u'\r', '', kashi)
# counter = {}
# 品詞を取り出し「名詞、動詞、形容詞、形容動詞」のリスト作成
def tokenize(text):
    t = Tokenizer()
    tokens = t.tokenize(text)
    word = []
    stop_word = create_stop_word()
    for token in tokens:
        part_of_speech = token.part_of_speech.split(",")[0]
        if part_of_speech == "名詞":
            if not token.surface in stop_word:
                word.append(token.surface)        
        if part_of_speech == "動詞":
            if not token.base_form in stop_word:
                word.append(token.base_form)
        if part_of_speech == "形容詞":
            if not token.base_form in stop_word:
                word.append(token.base_form)        
        if part_of_speech == "形容動詞":        
            if not token.base_form in stop_word:
                word.append(token.base_form)

    # for wo in word:
    #     if not wo in counter: counter[wo] = 0
    #     counter[wo] += 1
    return word

def create_stop_word():
    target_url = 'http://svn.sourceforge.jp/svnroot/slothlib/CSharp/Version1/SlothLib/NLP/Filter/StopWord/word/Japanese.txt'
    r =requests.get(target_url)
    soup=BeautifulSoup(r.text, "html.parser")
    stop_word=str(soup).split()
    #自分で追加
    my_stop_word=['いる','する','させる','の','色','真夏','身体','最初','知る','られる']
    stop_word.extend(my_stop_word)
    return stop_word

sentence = [tokenize(kashi)]
model = word2vec.Word2Vec(sentence, size=200, min_count=4, window=4, iter=50)
print(model.wv.most_similar(positive=[u"恋"], topn=10))

topnで上位表示数を指定してます。

出力結果

1 追いかける 0.8969742059707642

2 待てる 0.8759297728538513

3 生まれ変わる 0.8688281178474426

4 押す 0.8627504110336304

5 つらい 0.8446334004402161

6 失う 0.8399721384048462

7 逃す 0.8399657011032104

8 送る 0.833713710308075

9 為 0.8328136801719666

10 噂 0.830684244632721

一番近かったのは「追いかける」でした。

西野先生いわく、恋とは追いかけるものらしいです。てっきり「震える」が出ると思ったら出ませんでしたね。

これらの結果から無理やり定義すると

恋：追いかけて、時には待ち、つらい思いもするが生まれ変われるもの

という結果になりました。なるほど、さすが西野先生。納得しました！せっかくなのでaiko先生にも聞いてみたいと思います。

出力結果

1 堕ちる 0.9168707132339478

2 さよなら 0.915056347846984

3 全て 0.9063875675201416

4 嫌い 0.9030067920684814

5 怒る 0.889123797416687

6 並べる 0.8881044983863831

7 上げる 0.8861263990402222

8 我慢 0.885418713092804

9 勇気 0.8848025798797607

10 痺れる 0.8845231533050537

「さよなら」「嫌い」「怒る」「我慢」等。 aiko先生は恋はわりとネガティブなモノと考えているみたいですね。

おまけ

恋についてもっと知りたくなったので、いろいろな演算を行っていましょう！演算はpositiveに足す単語を、negativeに引く単語をいれることで出来ます。

model.wv.most_similar(positive=[u"単語1", u"単語2"], negative=[u"単語3"], topn=10)

この場合単語1 + 単語2 – 単語3 になります。

心

恋という漢字の下に心がつくように、恋とは心あってのものだと思います。では心のない恋とは存在するのでしょうか？恋の概念から心の概念を引いてみました。

model.wv.most_similar(positive=[u"恋"], negative=["心"], topn=3)

1 友達 0.7440136075019836

2 れる 0.7216039896011353

3 思う 0.7072246074676514

友達になっちゃいました。心が動かないとただの友達ということでしょうか。

嘘

恋に関して嘘ついたことありませんか？好きでもないのに、好きって言ってみたり。←特に男性！自分の気持ちに嘘ついたり。西野先生いわく、恋で嘘つくことは・・・

model.wv.most_similar(positive=[u"恋", u"嘘"], topn=3)

1 仕方 0.9253218173980713

2 辛い 0.922753095626831

3 追いかける 0.9220635890960693

仕方ないみたいです笑

コードはこちら

課題

パラメーターによって結果にばらつきがでたので、今後はパラメーターを変えて結果がどう変わっていくかを調査できればなと思います。

2023-01-02

年間365冊読んでわかった、冊数で読書目標を設定すべきでない理由

趣味趣味-本

はじめに
手段の目的化
①無駄な読書が発生する
②専門書を読まなくなる
③情報収集の効率が下がる
まとめ

はじめに

今年の目標として、「〇〇冊本を読む！」といった読書目標を立てられている方は多いのではないでしょうか。

昨年の私もそうでした。私の場合は、「年間365冊の本を読む！」と目標を立て、なんとかやり切りました(しんどかった。。。)

ただやってみて分かったのですが、このような冊数での読書目標を設定することはオススメしません！なぜなら、本を読むこと自体が目的になってしまい、3つの弊害が生じるからです。この記事では、実体験を通して学んだ、冊数で読書目標を設定すべきでない理由をご説明します。

手段の目的化

私は自分の知識や教養を広げたく、今年はいつも以上に本を読もうと思っていました。とはいえ、「たくさんの本を読む」といった漠然な目標を立ててもサボりそうな気がしたので、強制的に読書習慣をつけるためにも、「1日1冊、年間365冊の本を読む」という定量的な目標を設定しました。

目的：知識を広げる

目標：1日1冊、年間365冊の本を読む

しかし、最初の頃は良かったのですが、「今日は達成できた」、「今日は読みきれなかったから残りは明日読もう」という風に進めていくうちに、「今日は疲れたから薄い本にしよう」、「この本なら1時間で読めそうだ」等と、本を読むこと自体が目的になっていることがありました。いわゆる手段の目的化です。

目的：1日1冊、年間365冊の本を読む　←手段の目的化

本を読むこと自体が目的になると、以下の3つの弊害が生じます。

①無駄な読書が発生する

本には当たりの本もあれば、ハズレの本もあります。読んでいる途中で、

「この本は読む価値ないな」

と感じれば、通常なら読むのを辞めるかと思います。

しかし、読むことが目的化している状態では、

「既に1/4も読んでいる。ここで辞めて新しく1冊分を読むよりも、このまま残りを読んだ方が早く読み終わる」

という思考になります。

その結果、読む価値がない本にも関わらず、最後まで読んでしまうという無駄な読書が発生します。

私は読書後に学んだことをevernoteに記録しているのですが、1年間の記録数を見てみると、245冊しか記録していませんでした。

つまり、120冊は学ぶことがなかった(=読む価値がなかった)ということになります。

②専門書を読まなくなる

冊数を目標にしていると、「何を読んだか」よりも、「何冊読んだか」を重視するようになります。読むのに数週間かかる鈍器を読んでも、1時間で読める本と同じ1冊としかカウントされないのです。

本来は知識を得ることが目的なので、情報量が多い前者を読むべきですが、読むことが目的になると、前者のような読むのに時間がかかる本は避けがちになります。

10時間かけて1冊読むよりも、同じ10時間なら、2時間で読める本を5冊読むことを選択してしまいます。

③情報収集の効率が下がる

本を読む目的の一つに情報収集があるかと思います。自分が分からないことを調べる、仕事で必要な知識をインプットする等です。

情報収集のための読書であれば、本の一部分だけを読めば欲しい情報は得られるケースが多いです。

しかし、冊数が目的になっていると、

「せっかく一部を読むのであれば、残りの部分も読んで1冊としてカウントしたい」

と思うようになり、必要な情報を得るのに1冊分の時間がかかることもあります。※私は本の8割以上を読まないと読んだと見なさいルールにしていたので

また、情報収集の手段としてネットや論文の方が妥当なケースにも関わらず、

「1冊としてカウントしたいから、本で情報収集しよう」

と、非効率的な手法をとることもあります。

まとめ

以上3つが冊数で読書目標を設定すべきでない理由になります。

無駄な読書が発生する
専門書を読まなくなる
情報収集の効率が下がる

ここまでデメリットばかりを上げてきましたが、もちろんメリットもあります。

定量的に管理できるので、継続しやすい

「無駄な読書をしないように、読む価値のない本は途中で読むのを辞める」、「専門書を読むためにも固定で読むべき本も決めておく」等の方法と組み合わせれば、冊数で目標設定しても問題ないかもしれません。

1年間読書してみた感想としては、ベストなやり方ではなかったけど、やらないよりは断然良かったと思っています。引き続きベストな方法を探索していきます。