Gemini CLIを何かに使えないか?学生・会社員向けの論文PDF管理方法

GEMINI logo AI

はじめに

最近,Gemini CLI(Command Line Interface) が話題となっている。
Gemini CLIとは、Googleが提供する生成AIモデル「Gemini」の機能を、直接コマンドライン(ターミナル)から利用するためのツールである。
開発者やクリエイターが、プログラムからGeminiの機能を利用したり、自動化したりする際に使われる。

Gemini CLI : オープンソース AI エージェント | Google Cloud 公式ブログ

一方、Webやアプリで使用できるGeminiは、一般的にGoogleが提供している対話型AIアシスタントの名称である。
これは人間とチャットするように質問に答えたり、文章を作成したり、アイデアを出したりするのに使われる。
少し前までは,Gemini CLIと同じような機能を持つClaude Codeが注目を集めていたのだが,Googleがそのお株を奪いに来た恰好だ。
話題になっているとは言え,Gemini CLIで何ができるのだろうか?
基本的にはシステムを構築したり新しいサービスを開発したりとゴリゴリのプログラミング用途であり,非プログラマーからすると普通のGeminiでもいい気がする。
しかし,ターミナルから直接使えるが故の「ファイルを直接編集できる機能」は面白い。
そこで今回は,論文を整理する際の微妙な不便さをGemini CLIで解消できないか?ということを試みた。

論文を整理する際に感じる不便さ

色んな雑誌から論文をPDFで落とした際,こう思ったことはないだろうか?
「体裁がバラバラで管理しづらい…」
下の画像は,3つの雑誌からダウンロードした論文だが,見事に体裁がバラバラだ。

一番上は論文のタイトルで,かなり親切だ。
真ん中は分類番号だけで,雑誌名著者名タイトルすべて分からない。
一番下は雑誌名と分類番号で,そこそこ親切だ。
このPDFファイルたちを分かりやすく管理しようとすると,「PDFファイルを開ける→情報をコピーしてくる→名前変更のためPDFファイルを閉じる→名前変更」
という微妙に面倒くさい手順を踏む必要がある。
今回は3ファイルだけだが,10や20もあったらそれだけで結構な労働だ。
面倒な作業は生成AIに…ということで,例えばGeminiに頼んでみる。

These PDF files are academic papers. The filenames are not properly organized. Please read the PDF files and extract the author names and journal names from each file. Then, rename each file using the format “Author_Journal Name.pdf”.

返ってきた解答はこれだ。

PDF形式の学術論文のファイルが複数あり、それらをリネームしたいとのことですね。 各PDFファイルから著者名と雑誌名を抽出し、ファイル名を「Author_Journal Name.pdf」という形式にリネームしたいとお考えです。 ただし、私はPDFファイルの内部コンテンツを直接「読み取る」ことや、ご自身のローカルシステム上でファイルをリネームする機能は持ち合わせていません。 私の機能は、ご提供いただいた情報に基づいてテキストを処理し、応答を生成することに限定されています。 ご要望を実現するには、通常、PDF処理ツールやプログラミングライブラリ(PythonのPyPDF2やpymupdfなどのライブラリを使用する)を使用して、PDFからテキストを抽出する必要があります。 関連する情報(著者名と雑誌名)を抽出したら、ファイルシステム関数を使用してファイルをリネームできます。

というわけでファイルの直接のリネームは出来ず,「ファイルを添付→リネームしたファイルの提示」はできるとのことだ。
ただ,添付容量には限りがある。今回は3ファイルだけだが,ファイル数が多いと結局この作業を何度も繰り返す羽目になる。
やはり,一度命令したらほっておくだけですべてを終わらせてほしい。

Gemini CLIの利用

というわけで,Gemini CLIを使ってみた。
起動画面はこんな感じで,何となくサイバーパンクを感じる。
極めて最先端なのに,レトロな見た目だからだろうか。

cd paperで,PDFファイルが入っているpaperフォルダまで移動する。
中に何が入っているかを教えてくれた。

先ほどGeminiに頼んだことを,Gemini CLIにも頼んでみる。

These PDF files are academic papers. The filenames are not properly organized. Please read the PDF files and extract the author names and journal names from each file. Then, rename each file using the format “Author_Journal Name.pdf”.

すると,
“I can do that”
という頼もしい返事と共に,PDFファイルを読み込み始めた。

その後,「ファイル名を変更してもよいか?」という確認メッセージが現れた。
この選択肢で,alwaysを選択したので,3ファイルの変更は自動で行われた。


放置していると5分ほどで作業は終わり,無事に著者-雑誌名のファイル名に統一された。
特に指定していなかったので,著者名が3名以下の場合は全員の名字を書いて,それより多い場合はet_al表記にしたようだ。

5分という思ったより長い時間がかかったが,これはPDFの全文をくまなく読んでしまったためだと考えている。おそらく,「PDFの1~2枚目を読んで」という指令があれば,もっと速かったかと思う。
また,名前の形式ももっと細かく指定すれば,望む体裁に整えることができるだろう。

まとめ,応用

今回,Gemini CLIの使用例として,論文PDFファイル名の自動変換を行った。
結果として,命令文と「変更OK」のボタンを押すだけで,自動でファイル名の変更が行われた。
これは,手動でいちいち直すよりも,またGeminiでファイル名を変更してもらう手順を繰り返すよりもはるかに簡便である。
特に,何十本や何百本といった大量の文献を扱うのに適していると考えられる。
Gemini CLIの「ファイルを直接触れる」性質を活かして,他に応用できないか探っていきたい。

ChatGPT はじめてのプロンプトエンジニアリング | 本郷 喜千 | 工学 | Kindleストア | Amazon
Amazonで本郷 喜千のChatGPT はじめてのプロンプトエンジニアリング。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。

コメント

タイトルとURLをコピーしました