以下の文章は、Niemanlabの「Why “Sorry, I don’t know” is sometimes the best answer: The Washington Post’s technology chief on its first AI chatbot」(2024年7月23日公開)を翻訳したものである。
7月、ワシントン・ポスト紙はClimate Answersという初の生成AIチャットボットの運用を開始した。気候変動に関する読者からの問いに、同紙のこれまでの報道内容を記事の引用やリンク付きで回答する。このツールは、WP紙の気候変動取材の蓄積をもとに、専門の記者たちと協力して作り上げられた。
先週、昨年WP紙に加わったCTO(最高技術責任者)のヴィニート・コスラに会い、このプロダクトと、WP紙のAI戦略全体における位置づけについて話を聞いた。シリコンバレーで20年近くキャリアを積んできたコスラは、AppleのSiriの開発チームに初期から参加し、その後Uberでマップのルーティング機能を長年手がけてきた。
コスラは、AIチャットボットに速報ニュース配信などのポテンシャルはありうると考えているが、Climate Answersはそのようなチャットボットではないという。異常気象や環境災害についての最新ニュースを届けるのではなく、むしろ普遍的なテーマに関するWP紙の長年の報道を統合するために構築された。例えば「大西洋の海流が崩壊するとどうなるのか」「気候変動の否定論者にどう対応すべきか」といった問いに、WP紙の過去の報道を総動員して答えるのだ。
それでもClimate Answersは少なくとも1日1回更新されるようプログラムされており、時間単位ではないにせよ、週単位のニュースには対応できる仕組みになっている。
Climate Answersは、WP紙による生成AIの実験的な第一歩に過ぎない。コスラによれば、テクノロジーやビジネス、政治、犯罪など、他の分野に特化したAIボットの開発も進んでいるという。スポーツの試合結果や気象情報を提供する、よりニュース性の高いボットの構想もある。では、なぜ最初のテーマとして気候変動を選んだのか。
コスラは、気候変動報道の特徴として「事実重視」を挙げる。一般的な記事では、数字や専門用語、科学的な説明が物語や長文の中に埋もれがちだ。Climate Answersは、膨大な記事の山から、こうした客観的な事実を抽出し、整理して提示する。
「好奇心を持って質問と回答のスタイルで自然に対話できる分野なのです」とコスラは語る。「重要な事実は、思いもよらない記事の中に眠っているものです」。
他のメディアも、金融市場や飲食店に関する質問に答えるAIチャットボットを試験的に導入しているが、政治や選挙など、分析的な視点や対立する意見が絡む分野は避ける傾向にある。WP紙も同様のアプローチを取っているようだ。
とはいえ、気候変動の報道にも、否定論者や政治的な思惑、露骨なプロパガンダは存在する。原子力発電や炭素回収などは、科学界でさえ意見が分かれるテーマだ。同じ事実が、気候変動対策の推進派・反対派双方から持ち出されることもある。
「これは非常に解決が難しい問題です」とコスラは認める。個人や集団によって、全く異なる見方が存在するからだ。「プロダクトレベルでの我々のスタンスは明確です。一度公表した記事や意見については、我々はジャーナリストの判断を支持します。AIが二重に編集する必要はない。それはニュースルームの仕事であり、AIの仕事ではないのです」
もう一つの懸念は、誤情報の増幅だ。Climate Answersは、WP紙が誤情報として報じた内容――たとえその記事が誤りを指摘するためのものだったとしても――を、そのまま引用してしまうことはないのか。例えば、ドナルド・トランプはしばしば演説で、洋上風力発電がクジラを殺していると主張している(WP紙は2022年にこれをファクトチェックしている)。
コスラは、何も保証できないと認める。「そういったことが起こる可能性は否定できません」。ただし、そうしたケースを避けるためのセーフガードは設けているという。「我々の記事で『XYZの主張は科学界の共通認識に反する』と指摘されている場合、その主張自体を引用することはないはずです」
WP紙内部では、Climate Answersの開発に関わっていないチームによる「レッドチーム」テストも実施された。セーフガードをかいくぐれないか、様々な角度から検証したのだ。コスラによれば、気候変動取材チームもプロジェクトの立ち上げ段階から参加している。
「取材チームとは毎日のように連携しています」とコスラは語る。「彼らこそが専門家であり、オリジナルの報道を手がけた記者たちです。モデルに問題があれば、私や他の開発者よりも、彼らの方がすぐに気付くはずです」。こうした継続的な連携により、事実関係の修正だけでなく、回答のスタイルや簡潔さも改善されてきた。また、全社員にもチャットボットを試用してもらい、フィードバックを集めた。
「ビッグテックスタイルで、開発環境とリリース環境を整えています」とコスラは説明する。「モデルに大きな更新を加える際は、必ず敵対的テストを実施します」。
Climate AnswersはOpenAIのGPTをベースに構築されているが、コスラは基盤となる大規模言語モデル(LLM)は交換可能であり、重要性は相対的に低いと見ている。「我々独自のファインチューニングと検索拡張生成こそが、このプロダクトを作り上げているのです」と語る。「我々が構築したのは、特定の基盤モデルに依存しないAIプラットフォームです」。
実際、コスラのチームはMetaが開発したLlamaや、フランスのAI企業によるMistralなど、他のLLMでもClimate Answersを動かす実験を進めている。「2、3ヶ月後には、今とは全く違うモデルが動いているかもしれません」とコスラは言う。「既にA/Bテストを受けているかもしれませんが、ユーザにはそれはわかりません」
Climate Answersの特筆すべき点は、引用の仕方にある。ChatGPTは提携メディアの記事でさえ、基本的なURLの生成に失敗することがある。生成AI検索エンジンのPerplexityは最近、コンテンツの無断使用が問題となり、Forbesから訴訟も示唆されている。
一方、Climate Answersは単なるハイパーリンクの提示にとどまらない。記事の見出し、リード文、ヘッダー画像まで含めて引用を行う。記事をクリックすると、引用部分の前後の文脈まで表示され、情報の位置づけが一目でわかる仕組みだ。
「我々の目指すものは、全く異なります。ニュースとジャーナリズムを信頼し、単なる個人ブログではなく、事実に基づく報道こそが最良の情報源だと知る、探究心旺盛な読者のためのツールです」とコスラは言う。「だからこそ、実際の記事の該当部分まで見せる。こうした好奇心が、より深い記事の読み込みにつながると信じています」
質問への回答と、オリジナル記事への誘導が目的とはいえ、コスラはユーザの期待に応えられない場合の対応も重視する。WP紙の気候変動報道を検索しても、質問に関連する記事が見つからない場合、Climate Answersは無理に回答を作り出そうとはしない。代わりに「申し訳ありませんが、ご質問への回答を生成できません。このプロダクトは実験段階にあります」というメッセージを表示する。
「Googleなら失敗とみなすでしょう。常に何らかの回答を返すべきだと」とコスラは語る。「しかし我々のビジネスモデルは異なります。確信が持てない時は『申し訳ありません、わかりません』と答えることこそ、成功なのです」
このような制限は、すでに一部から批判を浴びている。リリース直後、生成AIのエネルギー消費と気候変動への影響を問う質問に、Climate Answersが回答を拒否していることが指摘された。AIのデータセンターが小国に匹敵するエネルギーを消費している事実には触れず、単に回答拒否のメッセージを表示するだけだったのだ。
皮肉なことに、Climate Answersの運用自体が、規模は小さいとはいえ、このエネルギー消費問題に加担しているという指摘もある。
WaPo:「AI」が気候危機を助長している詳細を報道。石炭火力発電所の廃止延期なども含む。
そしてWaPo:気候危機に関する記事の、場合によっては誤った要約を提供するチャットボットを作ろう!https://t.co/MXfZqxB6gU
――@emilymbender@dair-community.social on Mastodon(@emilymbender 2024年7月11日
「はっきりさせておきたいのですが、我々は意図的にその質問への回答を避けるよう設定しているわけではありません」とコスラは反論する。実際、私のテストでも「生成AIのエネルギー消費への影響は?」という質問には回答が得られなかった。ただし、WP紙の広報担当者によれば、「人工知能の電力網への影響は?」といった別の言い回しであれば、きちんとした回答が得られることを示すスクリーンショットを共有してくれた。
一見すると、Climate Answersは過去記事の再配信ツールにすぎないように見える。直近1ヶ月だけでなく、何年も前のアーカイブ記事まで引用する。WP紙のオーディエンスチームは、記事へのクリック数など詳細な分析を行っているが、コスラはトラフィックの増加だけが成功の指標ではないと考えている。
「確かにトラフィックは重要な指標の一つです。しかし、プロダクトの成功にはいろいろな形があります。より長くユーザの関心を引きつけることができれば、購読料の価値を実感してもらえるかもしれない」とコスラは語る。「成長やエンゲージメントの向上、習慣化につながることも大切です。でも最も重要なのは我々の顧客であり、支払ったお金に見合う価値を提供し、我々を選ぶ理由を知ってもらうことなのです」。
Why “Sorry, I don’t know” is sometimes the best answer: The Washington Post’s technology chief on its first AI chatbot | Nieman Journalism Lab
Author: Andrew Deck / Neiman Lab (CC BY-NC-SA 3.0 US)
Publication Date: July 23, 2024
Translation: heatwave_p2p
Material of Header image: Jas Min modified,