そういう、モデルなんです。

ビジネスモデル、3Dモデル、設計図、模型などの現状と動向を考察、関連書籍の紹介

Gemini で Google Drive を横断検索してまとめ

Googleドライブに PDF の資料を格納しておき、それらを Gemini に横断検索してまとめさせると時短になる。

  • 公開されたガイドや白書のたぐいを収集
  • Gemini の拡張機能を使って横断検索
    • 拡張機能をオン
    • @を入力してから、Googleドライブを指定
    • プロンプトを投入
    • まとめてくれる
  • 各個人のデータが流出することはないのか?
    • ないとは思うが念のため
    • サーバーサイドの管理の仕組みについても質問

youtube.com

続きを読む

私的複製の範囲でナレッジを整理

ファイラーと生成AIを併用して、個人の作業環境の範囲でナレッジを整理する。

  • 電子書籍 Kindle、電子データのクセに横断検索できない
    • ChartGPT (Copilot) に聞いてみた
  • 情報源も色々あるので、けっきょく整理は必要
  • 書籍や白書の獲れ高は低いので、まずは量をこなす
    • プッチンクリップが最強
    • 後で調べるときに役立つ部分だけを記録する
  • 専門誌とか論文は?
  • 電子化しても探せないと意味ないので…
    • FenrirFS というファイラーを使っている
    • 最近 Gemini の Google Drive 連携でPDF検索ができるらしいと気づいた

youtube.com

続きを読む

縦書き日本語OCRはGeminiがお勧め

日本語の書籍は縦書きも多く、OCRが利かなくて困る。

検索可能PDFにならない

最近のスキャナーには何らかのOCR機能があるらしく、出力形式として画像、PDF、検索可能PDFなどを指定することはできるが、昔スキャンしたものはPDF形式に見せかけた画像データの塊?であるようで、全く検索できない。

最近スキャンしたものは、OCR機能がマシになったのか、一応認識はされるようだが、どこまで文字認識されているのかは定かでない。

PowerAutomate にあるOCRはイマイチ

PowerAutomate で OCR を自動化するための部品があり、Windows OCR と tessarect をエンジンとして選択できる。このうち Windows OCR は日本語に対応している。

PowerAutomate

しかし、縦書きの文書を読み取らせてみると、なんとなく文字列は読めているものの、段落がめちゃくちゃになった。横書き専用なのかもしれない。

Copilot は文字列読み取り OCR タスクを拒絶

英語のOCRは、中世風の英語でも正しく読み取れるなど、かなり優秀だった。

しかし、縦書き日本語の OCR は拒絶された。

Copilot

Gemini では文字列読み取り OCR タスクは良好

最近、巻き返しが激しい Google Gemini に依頼してみた。

youtube.com

こちらは、ほぼ完ぺきだった。

結局、Copilot と Gemini、両方使うことになりそう

MS/OpenAI の独占にならず、両社が競争している状況は望ましい。
利用者としては両方のいいとこどりをして使い分ければよい。

 

Stable Diffusion WebUI Forge が登場したが簡単ではなかった

Stable Diffusion Web UI に、新しい版が登場した。
Automatic1111 を改良し、性能を向上させ資源を節約しもので Forge と呼ばれている。
開発者は Fooocus と同じ。

youtube.com

続きを読む

もうアイコンライブラリはいらない

画像生成AIとSVGへの変換の組み合わせで、アイコンライブラリは不要となった。

youtube.com

  • プレゼンソフト標準のアイコンライブラリは品揃え微妙
  • 画像生成AIで作ったらどうでしょう
  • 絵柄はいい、でもラスタ画像じゃあねぇ…
  • Inkscape で見てみるか
  • テクスチャサイトも要らなくなった
続きを読む

画像生成AIを併用して、3Dアバター衣服制作を省力化

画像生成AIを併用して、3Dアバターの衣服制作を省力化した。

メッシュの寸法・形状を微調整する手間は省けなかったが、画像生成AIに出力された任意の衣装の画像から3Dモデルを起こすことはできるようになった。

  • youtube.com
  • 画像生成AIで、衣装の画像を生成する
  • 素体メッシュを改変して、衣服メッシュを作成する
  • 表と裏の画像をテクスチャブラシにして、衣服(素体)メッシュに転写
  • 中途半端に出来上がったテクスチャを画像生成AIで補正
続きを読む

生成AIにベン図を描かせてみた

画像生成AIで、ベン図を描かせてみる。

プレゼンテーションソフトで10秒でできることだが、画像生成AIに指図した場合、どのようになるのか。

youtube.com

  • プレゼンテーションソフトでも、ベン図に絵柄を埋め込むのは面倒
  • Bing Image Creator (DALL-E 3) に、心・技・体の3つの図柄で描かせる
  • Fooocus アニメ調で、ネガティブ指定してみる
  • Fooocus 標準で、スタイルを線画にしてみる
  • 論理的な作図は、まだ難しいようだ
  • 何らかの開発言語で描画させるコードを出力させる
  • コードは Copilot に出力させる
  • 出力結果の画像を画像生成AIに投入し、インペイントで図を埋め込んで仕上げる
続きを読む