編集部注
本稿は、CodeZineに掲載された、ソフトウェア開発者向けカンファレンス「Developers Summit 2024(デブサミ2024)」のセッションレポートを転載したものです。プロダクトづくり、プロダクトマネジメントに近しいテーマを選りすぐってお届けします。
2016年からすでにAIの活用を模索し続けてきた弁護士ドットコム
2022年末のChatGPTの登場以来、多くの企業が自社のビジネスに生成AIを活用する道を模索し続けているが、その大半が検証やデモのレベルで終わっており、実業務で活用したり、本番サービスとして正式にリリースしたりするまでには至っていないのが実情だ。
そんな中、弁護士ドットコムは直近1年間で生成AIを活用したサービスを5つ、矢継ぎ早にリリースしてきた。これらの取り組みをリードしてきたのが、同社が2023年2月に立ち上げた「Professional Tech Lab」と呼ばれるチームだ。社内のエンジニアやリサーチャーに加え、社外の研究機関やベンチャー企業とも広範に連携しつつ、生成AIをはじめとするさまざまな新技術を積極活用したサービス開発に取り組んでいる。
このチームが新設されたのは、2022年11月にChatGPTが登場してからわずか3か月後のこと。さらにその3か月後の2023年5月には、早くも生成AIを活用した最初のサービスをリリースしている。これだけのスピード感で自社の本番サービスに生成AIを取り込めた理由について、Professional Tech Labの所長を務める市橋氏は「これまでの長年に亘るAIへの取り組みの成果だ」と述べる。
「弊社はChatGPTの登場をきっかけに生成AIに取り組み始めたわけではなく、すでに2016年ごろからAIの活用に本格的に取り組んでいました。当時は主にIBM Watsonを使ってユーザーの法律相談に答える仕組みを研究していて、ハッカソンで最優秀賞を獲得したこともありました」
同社が提供する「みんなの法律相談」は、ユーザーから寄せられた法律相談に弁護士が回答するサービスだが、サービス開始当初から「ユーザーに法律知識がないと、そもそも『正しい質問』ができない」という課題に直面していた。そこで同社では、AIを使ってこの課題を解決する道を長年に亘って研究してきたという。
この課題を解決するためのまさに突破口になったのが、ChatGPTだった。
「GPTに関してはGPT3のころから注目していて、これが今後発展していった暁には弊社のサービスと組み合わせて新たな価値を生み出せるはずだと弊社の社長もにらんでおり、AI活用を重要な経営指針の一つに掲げていました。そんな折にChatGPTが登場したため、すぐに社長直轄の組織としてProfessional Tech Labを立ち上げて、生成AIの活用に本腰を入れることになりました」
このように経営がAI活用の明確な意思を持っていたこと、「AIありき」ではなくAIを活用して解決したい課題があったこと、そして社長直轄の組織を立ち上げて事業部の垣根を越えた全社横断の体制を構築できたことが、同社がスピード感をもって生成AI活用に取り組めた秘訣だったという。
「RAG」を使って法律関連のドメイン知識をプロンプトに取り込む
同社が初めて本番サービスに生成AIを組み込んだのが、先述の「チャット法律相談」だった。ユーザーがテキストチャットで法律相談に関する文章を打ち込むと、その内容を基に「法律相談データベース」という過去の質問・回答内容を100万件以上蓄積しているデータベースから類似する質問・回答を抽出。これをプロンプトに組み込んだ上で、「Azure OpenAI Service」で稼働しているChatGPTに投入する。そしてChatGPTから返ってきた回答内容を加工して、最終的にユーザーに対して提示する。
この他にも同社はいくつかのサービスにすでに生成AIの機能を組み込んでいるが、どれも基本的な仕組みは同じで、同社がもともと持っている独自ナレッジやドメイン知識のデータベースから関連する情報を検索・抽出して、これをプロンプトに組み込んだ上でChatGPTに対して投げ掛ける。
こうした方式は「RAG(Retrieval-Augmented Generation)」と呼ばれ、プロンプトエンジニアリングだけではなかなか対処できない「専門知識に関する適切な回答を引き出すためのプロンプト」を生成するための方式として、現時点では最良の選択肢だと言われている。
弁護士ドットコムでもこのRAG方式を採用し、ユーザーの問い合わせに法律の専門知識の要素を適切に付加したプロンプトを生成することで、先述の「ユーザーに法律知識がないと、そもそも『正しい質問』ができない」という課題を乗り越えることを企図している。
ちなみに一見すると極めてシンプルな仕組みのように見えるRAGだが、実際に実装するとなるとさまざまな最適化技術を組み合わせる必要があり、「現時点ではまだ発展途上の段階にあるのが実情だ」と市橋氏は語る。またLLMを用いたアプリケーションを開発するにあたっては、多くの場合「LangChain」「LlamaIndex」などのフレームワークを使うことが多いが、弁護士ドットコムではあえてフレームワークは使わずに自前で処理を書いて実装しているという。
その理由について市橋氏は「モデルをチューニングしたいときに、ミスマッチなフレームワークの抽象化層があると、かえって最適化の妨げになることがあります。最適化手法も次々と新しいものが登場しており、それらに既存のフレームワークがどれだけ追随していけるかも不透明です。総じて、既存のフレームワークはまだ改善の余地があるというのが私たちの見立てです」と説明する。
生成AIを使ったプロダクト自体にも、まだまだ不確実性が多いと同氏は指摘する。
「どこをどうすれば望ましい回答ができるようになるのか、現時点では明確な答はなく、『いろいろやってみるしかない』というのが実情です。また出力結果が自然言語であるという生成AIの特性上、チューニングの結果の評価もかなりの部分が評価者の主観に委ねられます」
こうした不確実性を乗り越え、AIモデルの品質を引き上げていくには、現時点では「頑張って人間が評価基準を作った上で、大量の人間を動員して評価していくしかない」と同氏は言う。事実、同社では過去の質問・回答データベースの内容を法改正などに合わせて適切にアップデートするために、弁護士による回答内容のチェック作業を愚直に繰り返してきたという。
「実行するAI」「チェックする人間」という役割分担は将来行き詰まる?
こうして自社サービスへの生成AIの取り込みを着々と進める同社だが、市橋氏はこれから生成AIをさらに活用していく上で解決しなければならない課題について次のように述べる。
「生成AIを有効活用するためには、とにかくデータの品質が重要です。品質の悪いデータを大量に集めるより、少量でもいいから高品質のデータを集めた方が有利です。しかし10年以上前から『Data is the new oil』と言われ続けてきたにも関わらず、実際にはほとんどの企業・組織でデータの整備が進んでいないのが実情です。まず真っ先に、この課題を乗り越える必要があると思います」
また同社が長らく頭を悩ませてきたように、一般ユーザーは「自然言語を使って何を質問してもいい」と言われても、逆にその自由を持て余して適切に生成AIを使いこなすことができない。このいわゆる「ブランク・キャンバス症候群」と呼ばれる課題を乗り越えるためには、「チャットを超えたUXの探求が必要だろう」と市橋氏は指摘する。
さらには、今後生成AIの適用範囲が広がっていくと、「人間と生成AIの役割分担」が問題化してくるだろうと同氏は予想する。現時点では個別のタスクの自動化・省力化に利用されている生成AIだが、今後活用がさらに進むとワークフローの中に組み込まれ、複数のタスクを制御するようになってくる。そうなると今度は、生成AIが適切にワークフローを制御できているかどうか人間がチェックする必要性が出てくる。
つまり「実行するAI」「それをチェックする人間」という役割分担が徐々に出来上がってくることになるが、同氏は「チェックするだけの役割で、果たして人間はやりがいや楽しみを感じられるだろうか?」と疑問を呈する。
「例えば最近注目を集めているGitHub Copilotは、AIがプログラムの設計から実装まで行ってくれるので、人間はレビュー・修正する作業だけで済みますとうたっています。しかし設計やコーディングの楽しみを奪われた人間が働きがいを感じられるかどうか大いに疑問ですし、実務知識を持つ人材を育成することもできなくなってしまいます。こうした観点も加味した上で生成AIと人間の役割分担を考えないと、いずれは行き詰まってしまうのではないかと危惧しています」(市橋氏)