ちょっとだけマニアックなAIの話――第1回 “AIの素”を開発する知られざる組織「EleutherAI」

世界の皆さん、おはようございます、こんにちは、こんばんは。BCG XのリードAIエンジニア、高柳です(肩書は公開当時)。この連載は、私が「ちょっとだけマニアックなAIの話」を非テクニカルな読者の皆さんにもわかりやすいよう噛みくだき、“一歩踏み込んだ”知識をお伝えする、そんなコンセプトでお届けします。

記念すべき第1回は、“AIの素”を開発する知られざる組織「EleutherAI(エルーサーAI)」についてお話しします。EleutherAIはAI開発の研究能力が少数の企業に限定されないよう、オープンサイエンスとオープンソース(注1)を主軸に活動を続けている非営利研究団体です。活動の一環として、高性能なAIの開発も行っています。え?なんで初回から聞いたこともない組織の話を聞かされるんだって?まぁまぁ、少し辛抱してお付き合いください。皆さんの生活と、実はちょっぴりつながっているのです。

インスタントラーメンほど手軽にChatGPTが作れる?

今巷をにぎわせている生成AIといえばChatGPTでしょう。ChatGPTを使うと、小説やエッセー(この連載も実は生成AIを利用して書いています。タネ明かしは後述の「おまけ」で!)、ソフトウェアのプログラム(コード)や歌詞などさまざまなジャンルのテキスト、画像を生成でき、また最近ではオリジナルのAIを作り上げて、サービスとして公開することまでできます(GPTsというサービスです)。しかし、ChatGPTの裏側で動いているプログラムや、どういうデータでどうAIを学習させているのかといった情報は、特にChatGPTの最新エンジン「GPT-4」では全くと言っていいほど明らかにされていません。

そこでEleutherAIは、ChatGPTのようなAI(大規模言語モデルと言います)をオープンソースで実現しようと、ChatGPTの開発元であるOpenAI(オープンAI)が公表したGPT-3の論文をベースに「GPT-NeoX」という“AIの素”を開発・公開しています。GPT-NeoXは誰でも自由にダウンロードでき、それを基にオリジナルの大規模言語モデルを作成できます。極端に言えば、大量のデータを集めて、ここからダウンロードできるGPT-NeoXに投入するだけで、簡単にChatGPTを作成できるということです。生成AIをラーメンに例えるならば、「豚骨と鶏ガラを3日煮込んで出汁をとったスープや、小麦粉から製麺した本格的な平打麺までゼロから自分で作る」のではなく、「お湯を沸かしてインスタントラーメンを茹でるだけ」というイメージでしょうか。

日本でも、GPT-NeoXを使用して大規模言語モデルを開発している事例がいくつかあります。例えば、LINEの「japanese-large-lm(ジャパニーズ ラージ エルエム)」モデル、サイバーエージェントの「OpenCALM(オープンカーム)」モデル、チャットボット「りんな」を開発するrinnaの「Youri」モデル、また東京大学の松尾研究室が開発した「Weblab-10B」モデルは、GPT-NeoXを利用して開発されています。

ここで述べた企業の製品・サービスにお世話になっている方は、知らず知らずのうちにEleutherAIの恩恵を受けていると言えるかもしれません。聞き慣れない響きに思われた団体が、少し身近に感じられたでしょうか?次回もお楽しみに、Catch you later!

注1: プログラムの素であるソースコードを公開して、誰でも使用・改良できるようにすること

「おまけ」

この文章の草稿は、以下の内容をBing(ChatGPTのマイクロソフト版のようなもの)に入力し、生成させたものです。

私は「“AIの素”を開発する知られざる組織EleutherAI」というタイトルでBLOG記事を書く必要があります。以下の“制約条件”を満たすように記事を書いてください。
##制約条件
・フォーマルではなく口語調のカジュアルな文体で書いてください
・1000文字程度で書いてください
・技術用語はあまり用いず平易な日本語で書いてください
・記事の内容は以下の順で書いてください
    ・EleutherAIの紹介
    ・EleutherAIが開発している“AIの素”GPT-NeoXの紹介
    ・GPT-NeoXを使うと簡単にChatGPTのような大規模言語モデルが作れる
    ・日本の企業/研究室でGPT-NeoXを使用して大規模言語モデルを開発している事例を検索して紹介
・文字数が足りない場合は、文字量を増やしてください


高柳 慎一 写真

高柳 慎一
ボストン コンサルティング グループ
BCG X リードAIエンジニア
北海道大学理学部卒業。同大学大学院理学研究科修了。総合研究大学院大学複合科学研究科統計科学専攻博士課程修了。博士(統計科学)。株式会社リクルートコミュニケーションズ、LINE株式会社、株式会社ユーザベースなどを経て現在に至る。デジタル専門組織BCG Xにおける、生成AIを含むAIと統計科学のエキスパート。