Stack OverflowとOpenAIの技術提携について考えたこと

Stack OverflowとOpenAIの技術提携について考えたこと

こんにちは、ダラーです。

今回は技術でもなく、業務のことでもなく、タイトルにもある最近ニュースになったこちらの話題について色々考えたことがあったので、自分の考えや調べたことなどを共有したいと思います。

背景

今回取り上げるのは、2024年5月7日に発表された以下のニュースについてです。
Stack Overflow and OpenAI Partner to Strengthen the World’s Most Popular Large Language Models(Stack OverflowとOpenAIは世界で最も人気あるLLMモデルの強化のために事業提携します)

日本語についてはこちらの記事をご参照ください。

ここで触れられている提携とは、主にOpenAIがそのモデルを改善するのにStack Overflowコミュニティからのコンテンツやフィードバックを用いてChatGPTでより精度の良い開発者向けの回答が得られるようになるということです。今までもStack Overflowでの回答内容は使われていたのかもしれませんが、大々的にStack OverflowとOpenAIが提携することにより、ChatGPTで得られる回答はStack Overflowで検索して得られる回答だと思って使える、ということです。

Stack OverflowとOpenAI提携の経緯

そもそものこの提携の経緯として、①ChatGPTがリリースされた後で、Stack Overflowへのアクセス数が大幅に落ちた②Stack OverflowにChatGPTで生成した質問/回答が溢れかえった、というようなものがこの1年間で起こりました。

①については、Stack Overflow(というかMeta Exchangeという技術質問ではなく、Stack Overflowの運営やポリシーに関するチャンネルのようなもの)で議論されていました。
参照:Has Stack Exchange’s traffic decreased since ChatGPT?

これを見ると、2023年に起こったGAFAMなどのテック企業の巨大レイオフの影響もあるものの、Stack Overflowの新規登録ユーザ数や、新規質問、回答数についてはChatGPTのリリース以降大幅に減っているというグラフが提示されています。

Stack Overflowのアクセス数減について

実際のところ、Stack Overflowについては自分で質問はしたくないが誰かの過去回答をみたい、という用途でしか自分も使っておらず、何か新規で聞きたい時はChatGPTで回答してもらったり、自分でネット検索してしまうことが多いです。

最近の傾向なのかどうかは分かりませんが、Stack Overflow自体が巨大なコミュニティになってしまったが為に、既出質問なのかどうか、や質問の仕方について死ぬほど細かいルールが設けられており、正直最近プログラミングを始めた人には心的なハードルも高くなっているように感じています。

例えば、新規で質問を上げる際に「Why is “Can someone help me?” not a useful question?(誰か助けてください、はなぜ有益な質問ではないのか)」なんていうスレが立っていたり、何か質問を投げる時に「Duplicate Question(既出です)」なんて一言でスレを終わらせられたりします。
参照:Why is “Can someone help me?” not a useful question?

また、Stack Overflowはほとんどがモデレータや、一部のコントリビューターによって運営されているので、質問の仕方が悪いとすぐモデレータにbanされたり、「質問の仕方が悪い」とDown Vote(👎)されてしまったりするリスクもあります。

これはStack Overflowに限らないですが、プログラミング初心者が初歩的な質問をした時に、百戦錬磨のエンジニアから「アホみたいな質問だな」と返されて会話が終了する、日本だとマサカリが飛んでくるなんて言う表現がありますが、技術者コミュニティが他人にあまり優しくないと言うこともあり、質問すること自体が憚られるのでChatGPTに聞く、と言うのはあると思っています。

RedditのMemeはこちら

今回の論争点

次に、今回のOpenAIとの提携でさらにStack Overflowの衰退が話題になっているのですが、これについても説明していこうと思います。

今回OpenAIとの提携にあたり、Stack Overflow側はOpenAIに対してこれまでStack Overflowに投げられた質問と、回答のデータをOpenAIに学習データとして引き渡すのですが、一部のコントリビューターたちがこれに反対しています。

と言うのは、コントリビューター達は様々な理由でStack Overflowに投稿された質問に回答しているのですが、その多くは技術コミュニティに貢献したいからと言う理由が多く、OpenAIに無償で学習データを提供するためじゃない、と言うものです。

ただ今の所Stack Overflowに貯められた質問と回答データを学習に「勝手に」使います。しかし、Stack Overflowの既存ユーザがこうした学習からOpt Out(対象外)するための方法は今の所なく、問答無用でそのデータは使われてしまうようです。
参照:Where is the opt out option so my answers don’t get used by OpenAI?

そして、こうしたOpt Outも出来ないことに腹を立てた一部のユーザがこれまでの質問や回答を削除しようとしたところ、Stack Overflowからバンされた、なんていうニュースも出回っています。

Stack OverflowとOpenAIの提携に反発し回答を削除したユーザーがBANされる
it begins… users leave Stack Overflow

今後予想される流れ

Stack Overflow離れ

すでに「Stack Overflowのアクセス数減について」で説明した通り、新規の回答数が大幅に減っているわけですが、今後はOpenAI提携で怒り狂ったコントリビュータが減る可能性も考えると、さらにStack Overflow離れは進んでいくかもしれません。Stack Overflowを利用するメリットは、誰かから何かしらの回答をもらえる、ことなので、回答をもらえないとなったらユーザの利用率は下がりそうです。

既にChatGPTなどを使っている会社ではそうかもしれませんが、何か技術的にわからないことがあった場合、日本だと「ggrks(ググれカス)」なんて言う言葉があるぐらい、どうしても分からない場合以外聞いてくるな、と言うような空気があるので、こうしたジュニア↔︎シニアエンジニア同士での技術コミュニケーションは減っていく傾向があると思っています。これがおそらく「ggr」ではなく「askChatGpt」に代わっていくのでしょうか。

生成AI回答の増加とゴミデータ問題

そして、Stack Overflowに回答が減ると言うことは、新規でそもそもChatGPTが学習する元ネタがなくなるということです。ChatGPTはせいぜいまだ学習したリソースからそれらしい回答を生成して返しているだけなので、新しい技術や言語などが出てきた場合にはChatGptで得た回答が的外れ、と言うこともあり得ます。

一応Stack Overflowでは生成AIで得られた内容を投稿するのは禁止されていますが、今の所このAIを正確に見分けるための技術はありません(OpenAIと提携したことでここは何か変わるのかもしれませんが)。その為、今後人間が回答したデータは減るのにAIで生成した回答が溢れかえり、さらにAIがそこから学習してしまうというループが起きた場合に、人間が判断できないゴミが溢れかえって、手がつけられないケスラーシンドロームのような状態が起きたりしないのか、と言うのは危惧している人もいるようです。
参照:The End Of StackOverflow

人間による技術ブログの衰退やQAサービス利用者減に?

おそらく、AIに学習させるためだけにStack Overflowに質問する/回答する、技術ブログを書くと言う人間はほぼいないと思います。ちなみに人が技術ブログを書いたり、Stack Overflowに回答する理由として、一定の時間と精神コストを払ってでも、エンジニアとしての価値をあげたいと言うようなものもあると思います。(日本人でStack Overflowに回答している、と言う人は少なさそうですが、これに回答しているコントリビュータが転職時に評価される、と言う仕組みはあるようです。)ただ、既にこうしたコストを払うのが面倒になってくると、というかChatGPTの精度が上がると、企業でも個人でも対外ブログをChatGPTなどにまるまる書かせているところはどんどん増えて行きそうです。

そうすると、前述のように純粋に人間が全てを書いたコンテンツと言うのは減っていく傾向にあるようにも思います。

まとめ

いかがでしたでしょうか。

最近AIに関するニュースが毎日のように出てきて忙しいですが、今後もこうした気になるAIニュースについて、その是非を考えてみるのも重要かなと思っています。英語ニュースだと、このStack Overflowの動きについて割と議論している人も多いのですが、日本語で書いてあるニュースが少なかったので、取り上げてみました。

皆さんはStack Overflowについて今後どうなると思いますか?

前の記事
«
次の記事
»

技術カテゴリの最新記事