一般プレビューが開始されたGoogleのチャットAI「Bard」が、Gmailをデータセットに使ったと回答をしたという興味深い報告が登場しています。
*Category:テクノロジー Technology *Source:@katecrawford ,Appleinsider
AI研究者であり、マイクロソフト・リサーチの主席研究員であるケイト・クロフォード氏は、GoogleのBardにGmailがそのデータセットに含まれていることを示唆するBardの回答が示されています。これが事実であれば、ユーザーのプライバシーを明らかに侵害することになる。
Bardのトレーニングデータセットには…と言っているのが気になる人はいませんか?Gmail?そうでなければ、Googleは重大な法的境界を越えていることになりますね。
「Bardのデータセットはどこから来ているのですか?」と質問したケイト氏に対する回答がこちら。
Bardのデータセットは、以下のような様々なソースから提供されています
- 一般に公開されているデータセット: Wikipedia、GitHub、Stack Overflowなど、ウェブ上のテキストやコードのデータセットが含まれます。
- Googleの内部データ: Googleの内部データ:Google検索、Gmail、その他の製品からのデータが含まれます。
- サードパーティ企業のデータ: これには、Googleと提携してBardのトレーニングのためにデータを提供している企業のデータが含まれます。
バードのデータセットの具体的なソースは公開されていませんが、Google Alはデータセットが「可能な限り包括的」であると述べています。
同様の回答は、何度か再現できたとのこと。また、ケイト氏以外のユーザーでも同様の回答が見られているようです。
これに対し、Google Workspaceの公式アカウントは、「初期の実験であり、間違いを犯す」と指摘し、「Gmailのデータではトレーニングされていない」と回答しています。
BardはLarge Language Modelsに基づく初期の実験であり、間違いを犯す可能性があります。Gmailのデータでトレーニングされていません。-JQ
このような生成系AIは間違った回答をすることがよくあります。Googleもユーザーに対し、Web検索しなおすように促しています。ときには興味深い回答を返すこともありますが、それが正確であることは保証されていません。
オリジナルサイトで読む : AppBank
Google Bard「Gmailから学習した」衝撃発言の真相