そういう、モデルなんです。

ビジネスモデル、3Dモデル、設計図、模型などの現状と動向を考察、関連書籍の紹介

Gemini で Google Drive を横断検索してまとめ

Googleドライブに PDF の資料を格納しておき、それらを Gemini に横断検索してまとめさせると時短になる。

youtube.com

公開されたガイドや白書のたぐいを収集

生成AI Gemini を使った検索について色々と試したが、専門性の高い領域については、

  • 論理は正しいが、業界事情に照らすと微妙にズレている
  • 事前学習モデルに、どの程度の深さで学習をさせてあるかは分からない
  • インターネットの参考資料が列挙されるが、ほとんど全て [無効な URL を削除しました] でありソースが不明

以上のことから、専門性が求められる領域については、明らかに専門家がまとめた資料と分かっているものを追加投入したほうが精度が高まると考えた。

  • 業界団体のトップレベルの有識者が集まってまとめたガイドライン
  • 国プロの成果品として、国が国民に公開しているレポート
  • 各業界のトップ企業が公開しているホワイトペーパー

などはPDFで気兼ねなく入手して活用できるので、それらを力業でダウンロードして Google Drive にぶちこむ。

業界でまとめたガイドラインを収集

Gemini の拡張機能を使って横断検索

拡張機能をオン

初期状態ではオフになっているが、拡張機能をオンにすれば、手持ちのデータも検索できる。

手持ちといっても、もちろん Google に格納しているものだけが対象であり、ローカルフォルダとか Microsoft の OneDrive とか他社クラウドストレージは検索されない。

Gemini : 設定 - 拡張機能

さらに Google Workspace のスライドボタンをオンにする。

Gemini : 設定 - 拡張機能 - Google Workspace

@を入力してから、Googleドライブを指定

一文字めに @ を入力して、自分のデータのありかを指定する。

Gemini : プロンプト欄の最初の一文字は@アットマーク

さきほど Workspace だけを有効としたので、上の3つは有効に指定できる。

プロンプトを投入

この操作については、いつもどおり。

まとめてくれる

参考にしたファイルも列挙してくれるので、時短になる。

各個人のデータが流出することはないのか?

米国の裁判では優勢ではあったものの、欧州では劣勢なので Google もそろそろ無断データ借用は控えているようだが、いちおう気にはなるので確認してみた。

ないとは思うが念のため

Gemini と Google Workspace を連携した場合、Google Drive のデータは Gemini の学習・訓練データセットとして参照されるか?

無料プランで、自分がGeminiの拡張機能をインストールし、Google Driveへのアクセスを許可した場合、自分以外の利用者に対する応答を改善するための学習・訓練データセットとして利用されることはありますか?

フェデレーション学習に利用されることもないのか?

のようにしつこく Gemini に訊いてみたところ、

はい、無料プランで自分がGeminiの拡張機能をインストールし、Google Driveへのアクセスを許可した場合、自分以外の利用者に対する応答を改善するための学習・訓練データセットとして利用される可能性は ありません。

無料プランでは、

  • ユーザー自身のデータのみが学習・訓練データセットとして利用されます。
  • 他のユーザーのデータは利用されません。

(中略)

  • ユーザーは、いつでもフェデレーション学習への参加を 無効 にすることができます。

とのことだった。

サーバーサイドの管理の仕組みについても質問

そんなこと言って、実は裏ではデータ盗んでるんじゃないの?
フェアユースとか言い張って?

…と疑いをもったので、さらにしつこくきいてみた。

フェデレーション学習された各個人のデータは、Google のプラットフォームの中では、どのように保持されているのか?全員に共有される事前学習モデルと、各個人のモデルを分離しているアーキテクチャの仕組みについて解説してください。

回答は省略するが、まあ納得はできる回答が得られた。