とんぬーらさんの好きなこと

明日死んでもいい様に今日を楽しく生きる

おっちゃんの仕事道具 其之陸 ChatGPTで分析業務を楽にする事

ChatGPTさんがバージョンアップしたので試して見た。というかデータ分析環境が諸事情で使えなくなったのとめんどくさくなったのでAdvance Data analysisで試す。結論から言うと賢くなった気がする。外れ値をあるっぽいけどどうする?的な質問もしてくるし、賢い。日進月歩だね。

はやりのフリーレン構文をやりたいので無理矢理書く。

葬送のフリーレン 原作:山田鐘人・アベツカサ(小学館週刊少年サンデー」連載中)

フリーレン様。Code Interpreterは最近の機能ではありません。今は、Advanced Data Analysisという名前になっています。

もうそんなにか。人の時間は早いね。

ちなみに11月30日でリリース1年になります。

フェルン。それは流石に嘘だよ。GPTは5年だよ。

 

無理があったが、GPTは2018年なのね・・・。

で、本題に戻る。有償版でも前提条件があって経験則だと次のデータぐらいだったらなんとか。

  • データ件数は、1万件未満(これはデータサイズに依存しそうな気がする)
  • スキーマー(列のことね)が150以下(これもデータサイズに依存しそうな気がする)
  • 半角カタカナデータは心の底から全消ししたい*1

うんでもってChatGPTに暗示をかける。おまえは、頑張れる!偉い!だからオレの代わりに仕事頑張れ。オレは、Cities:Skylines 2で忙しいので頼んだぞ。

ちなみには、Cities:Skylines 2はリアル版SimCityみたいな感じでめちゃくちゃ面白い。

amzn.to

と、ちょっとふざけた話っぽく書いているがCode Interpreterから比較しても賢くなった気がする。人によるのだけど、分析するときに俯瞰的にデータを見た上で細部を見て行く感じで進めるタイプの人には有効だ。ただ、言語処理はどうしても壁があるのであくまでもデータになっているものが理想。

とりあえず、自分が気がつかない部分についてどういうことがいえるかを質問しまくってみることを進める。そのうちこつがつかめると思う。そこまで行くと、あと、なぜそういう答えが出てくるかを調べることでデータサイエンティストっぽい思考が身につくと思う。正しいかは難しいけど、少なくともそれっぽいことは話せる様になると思う。

*1:一応、見てくれますが、これはデータサイエンティスト以前にシステムエンジニアリング的なところ