「Developers Summit 2025」レポート（AD）

生成AIの光と影、短期間で効果を生んだ企業の事例とリスクに備えるためにすべきこと

【13-B-5】生成AIプロダクトを育てる技術～データ品質向上による継続的な価値創出の実践～

2025/04/01 12:00

リスト

　生成AIが登場し、短期間で新たなサービスを構築し、大きな成果を挙げる企業も出てきている。一方、思わぬ事態にサービスを中断するといったことも起きている。直近で生じた生成AI活用時の失敗例を通じて、どんなことに配慮し、どのような取り組みをしていくべきか。機械学習やAIに詳しいアマゾンウェブサービスジャパン久保隆宏氏が生成AIを長期に活用するために必要な取り組みについて語る。

リスト

編集部注

　本稿は、CodeZineに掲載された、ソフトウェア開発者向けカンファレンス「Developers Summit 2025（デブサミ2025）」のセッションレポートを転載したものです。プロダクトづくり、プロダクトマネジメントに近しいテーマを選りすぐってお届けします。

AWSでは生成AIの活用を促すサービスを3つのレイヤーで提供している

　AIの可能性は実に幅広い。どのような規模、どのような業種・業態であろうとも活用できるように、さまざまなアプローチ方法がある。構築済みのアプリケーションをすばやく導入して活用することもできれば、モデルの構築やカスタマイズをして活用することもできる。

　AWSでは、ブラウザや開発ツールに拡張機能として組み込む「Amazon Q」、サーバーレスのAPI形式でアプリケーションに組み込む「Amazon Bedrock」、基盤モデルを構築するための「Amazon SageMaker」とモデルの学習・推論にそれぞれ特化した専用のチップをそろえている。アプリケーション、API、モデル構築の3レイヤーから必要に応じたサービスを利用できる。

　Amazon Bedrockは、Anthropic ClaudeやAmazon Novaをはじめとした高性能なモデルを共通のAPIで呼び出すことができる。マーケットプレイス経由で個別購入できるモデルも含めると、モデルのラインナップは170以上ある。なお昨今話題のDeepSeek-R1モデルも2025年2月から利用可能となっている。

　AWSでAIを活用している企業は国内で100社を越え、アマゾンウェブサービスジャパン合同会社技術統括本部機械学習デベロッパーリレーションズ久保隆宏氏によると「多くのお客様は3ヶ月ほどで生成AIを本番活用いただいており、しかも高い効果が出ています。この効果の初速がこれまでの機械学習にはない速さで、昨年は何度も驚かされました」と話す。

　従前であればPoCやデータ収集などの前準備にいろいろと時間がかかったが、直近では短期間で成果を挙げることができている。しかし初速はよくても、長期的に価値を継続し、成長させ続けるとなると各種のリスクに備える必要がある。

生成AI活用で効果を得たAWS顧客事例

　生成AIの効果やメリットにはどんなものがあるか、AWS顧客事例を通じて見ていこう。今回は主に、さまざまな形式の入力を解決できる部分を採りあげてみよう。生成AIのマルチモーダルな推論能力はさまざまな形式の入力支援にも役立つ。

事例1：ファストドクター

　オンライン診療サービスのファストドクターでは、患者から保険証をアップロードしてもらいデータ化していた。しかし毎月数万件ものデータを手作業で修正していたため、入力ミスや非効率さが課題となっていた。また保険証には個人情報が含まれるため、セキュアな形で処理を行う必要がある。そこでAmazon Bedrockを通じて、OCRと生成AIを組み合わせて、さまざまなフォーマットの保険証データのセキュアな読み取りと入力の自動化を実現し、作業工数は従来の3分の1まで削減できた。

事例2：パークシャ・コミュニケーション

　パークシャ・コミュニケーションでは、コンタクトセンターの業務効率化ツールを提供している。もともとAI活用は早くから取り組んでいて、直近ではAmazon Bedrockを通じて、音声認識（Amazon Transcribe）、Claude 3 Opus、RAGを組み合わせることでセキュアにコンタクトセンターの通話を要約できるようになった。業務にフィットした要約で、オペレーターの通話後業務が50％以上削減できると見込まれている。

事例3：アイ・スマート・テクノロジーズ

　アイ・スマート・テクノロジーズでは、IoTシステムからデータを収集することで生産現場のカイゼン活動を支援している。データを収集できているものの、データの見方が分からず期待するほどカイゼンにつながっていないことが課題となっていた。そこでAmazon BedrockのClaudeで「AI製造部長」というIoTデータから得られる知見をユーザーに分かりやすい自然言語で解説するキャラクターを作成した。現場監督者が毎朝データ分析していたところ、AI製造部長に質問できるようになり、データ分析時間が70％以上削減した。

事例4：スマートアイデア

　家計簿アプリ「おカネレコ」のスマートアイデアでは、新しい価値提供を模索していた。Amazon BedrockでClaude 3.5 Sonnetなどを組み合わせることで、家計状況や支出パターンに応じて、それぞれのユーザーに合うアドバイスを提供する機能をわずか2ヶ月でリリースできた。導入後の課金売上が前月比で19％向上し、短期間で効果を出している。

2024年に発現した生成AIのリスク事例

　生成AIで新しいサービスをリリースできたものの、潜在するリスクが発現した事例もある。すべて2024年に起きた出来事だ。

リスク発現事例1：チャットボットが不正確な回答

　エアカナダではチャットボットに生成AIを導入したところ、顧客に割引の適用範囲について間違った回答をしてしまった。顧客は払い戻しを求めて提訴し、エアカナダが敗訴した。裁判所は「自社サービスの運用を委ねる以上、出力結果に対して当該企業が責任を負うべき」と判断した。チャットボットは事案発生後に停止した。

リスク発現事例2：音声注文システムが誤認識

　マクドナルドではドライブスルーにAI音声注文システムを導入した。注文を誤認識する場面がSNSで拡散され、100店舗以上に展開していたシステムを2024年6月に撤去することになった。

リスク発現事例3：チャットボットが不適切発言

　フランス配送会社Dynamic Parcel Distribution（DPD）では、カスタマーサポートにAIチャットボットを導入した。顧客がDPDの悪口を言うようにチャットボットに指示したところDPD批判を回答し、その様子がSNSで拡散され、チャットボットは一時運用停止となった。

　マクドナルドもDPDもAI導入から数年が過ぎていた。久保氏は「サービス運用期間が長くなると、現実的な確率でリスクが発現することを示しているのではないかと考えています」と話す。

　あらためて生成AIのリスクを列挙すると、信ぴょう性（ハルシネーション）、悪意や差別的な生成、知的財産侵害、機密保持が挙げられる。最後の機密保持について、久保氏は生成AIの学習データにパスワードやAPIトークンなどを混ぜてしまうと、生成AIは元データに近しいものを生成する場合があるという研究報告を挙げた。

生成AI活用リスクの打開策、データセントリックアプローチ

　これまで挙げたリスクに対してRAG（Retrieval-Augmented Generation）が解決の一助となると期待できる。RAGは検索を組み合わせるので信ぴょう性についてなら、ある程度は役立つかもしれない。しかし不確実性が高い質問、またはマイナーな領域や複雑な質問だと、まだ生成AIは正確に回答することは難しい。ほかのリスクに対してだと、RAGはほとんど無力だ。

　ではどのようにすればプロダクトをリスクから守ることができるか。その問いに対して、久保氏はRAGの補完として、データセントリックアプローチを挙げる。RAGで使用するデータの品質を高めることでリスクを低減する手法となる。モデルの性能ではなく、データの品質を高めるほうに着目するという考え方だ。

　品質が高いデータというのはどういうものか。データの信ぴょう性が高く、カバレッジが広く、有害性やバイアスが除去されていて、知的財産権侵害の恐れがなく、機密情報が含まれていない……などが挙げられる。とはいえ「それが簡単にできるならやってるよ！」と言いたくもなる。だが生成AIが登場したことで、このデータ品質チェックに生成AIを活用することが有望視されている。

　まず、利用されているデータにリスクがないかLLMで判断する。メトリクスをもとにチェックすべきドキュメントを洗い出し、対象となるドキュメントをバッチで更新する。そしてナレッジベースを更新するプロセスを繰り返すことで、データの品質を高めていく。

　現時点ではデータセントリックアプローチについては、先述したリスクを低減するだけではなく、オフラインでの品質検証、オンライン推論のコスト低減、バッチ推論によるコストメリットなどがある。ただ、最新のデータ反映に時間がかかることや、コンテンツ量が多いとコストがかさんでしまうことを考慮する必要がある。久保氏は「データセントリックアプローチに100％寄せる必要はなく、ユースケースに応じて適用の度合いを検討する必要があります」と話す。実践している事例を見てみよう。

事例5：dely（デリー）

　レシピ動画プラットフォーム「クラシル」では、ユーザーが投稿するレシピが8万件ほど蓄積されていた。レシピは自由記入なので表記が統一されておらず、UXやSEOの観点で課題があった。そこでAmazon BedrockのClaudeで解析してデータを構造化し、Amazon Aurora MySQLに取り込むことでUI/UXを改善し、内部リンクを強化できた。表記の統一でUX向上、レシピページの利用者数が120％増加、コンテンツあたりの自然流入効率が290％改善するなど、データ品質向上でサービスそのものの価値を高めることができた。

事例6：JPX総研

　日本取引所グループの子会社となるJPX総研では、金融商品市場に関係するデータ・インデックスサービスなどを提供している。TDNetで開示される書類は年間で14万件、110万ページもあり、ユーザーが必要な情報を探し当てるのが困難だった。そこでAmazon BedrockのClaudeを活用して、適時開示文書の文章からタグを生成し、関連するキーワードを自動付与したところ、ユーザビリティを格段に向上させることができた。

事例7：Amazon

　Amazonでは、商品レビューが大量に投稿されている。レビューのポイントがつかめる要約（Review highlights）をバッチで生成し、逐次更新している。Amazon SageMaker Batch TransformとAWS Inferentia2チップでデータの前処理を高速に行い、小型のLLMでも十分に信ぴょう性の高い要約を生成している。データ品質を高めることでモデルへの依存度を減らせている事例となっている。

生成AIの効果、コスト、リスクについてモニタリングすべき指標と手段

　これまで生成AIについてRAGやデータセントリックアプローチについて述べてきたが、適切なアプローチをとるにはまず現状把握が必要になる。効果、コスト、リスクについて、どのような指標をモニタリングすればいいかを考えてみよう。

　効果については、入力時間の短縮、データレコード・アクティブユーザー増加、コンバージョンレートといった形で測定できる。

　コストについては、ユーザー側は待ち時間や表示エラー数をモニタリングする。AWS X-Rayが有効だ。システム側は推論コストや消費トークン数が対象となり、Amazon Bedrock Model Invocation Loggingを使えば対象データをAmazon Cloud WatchやS3に格納できる。

　リスクについては、Amazon Bedrock Guardrailsで対象のフィルターを使うことでリスクの検知に役立てることができる。またバッチ評価ならAmazon Bedrock Model Evaluationで検索単体、あるいは検索と生成に対して評価できる。なおどちらも2025年3月時点では日本語未対応だ。

　最後に久保氏は「生成AIのリスクは発現すると大きな影響を与えるものが多いです。長期間、生成AIを活用し、価値を向上していくにはリスクのコントロールが不可欠です。そのなかでも推論時に使われるデータ品質向上はリスクのコントロールに有効な手段となります。いま開発に携わる私たちのリスクに対する姿勢と対応がこれからの生成AI活用に影響を与えると考えると、大きな責任をおっていると感じています。これがさまざまな議論のきっかけになればうれしいです」と呼びかけた。