「あの話、どのAIにしたっけ」をなくしたかった ── AIとの会話779件を一か所に集めた話
エクスポートしたファイルを開いて、また手が止まった。
「これ、自分が話した会話だよな……?」と思うくらい、中身がぐちゃぐちゃだった。
前回(第3弾)で、Obsidianに自分用の置き場所(三層構造)を組んだ話を書いた。場所はできた。だったら次は、そこに何を入れるか。一番入れたかったのが、これまでAIと交わしてきた、数年分の会話だった。今回はそれを取り込んだ話を、正直に書く。
このシリーズは全部で7〜8回。今回は第4弾、「データ準備」の回だ。例によって、きれいに片付いた自慢話ではない。思っていたより、ずっと膨大で、ずっと面倒だった。
やってみた理由
きっかけは「他人のサービスは信用できない」みたいな大層な話ではない。もっと地味な、日々の困りごとだった。
自分は、AIを一つに絞っていない。ChatGPT、Claude、Copilot、Gemini。そのときどきで使い分けている。これは、コードを書くときにCodexとClaude Codeを場面で使い分けるのと同じ感覚だ。チャットも、たぶんこれからも使い分けると思う。
ただ、そうやって使い分けていると、困ることが一つある。
「あの話、どのAIにしたっけ?」が、分からなくなる。
自分にとって、AIとの会話の履歴は、ただのログじゃない。何を悩んで、何を調べて、どう試行錯誤したかの記録だ。3DプリンターでもPCでも子育てでも、まずAIに相談して、失敗して、また聞いて、を繰り返してきた。その記録が、ツールごとにバラバラの箱に散らばっている。後から探そうにも、横断して検索する手段がない。
だから、全部を一か所に集めて、まとめて探せるようにしたかった。それだけだ。
軽い気持ちだった。「エクスポートして、フォルダに入れるだけだろう」と。
その見込みが、まず甘かった。
やったこと
1. 4つのAIから集めようとして、集め方が全部違った
使ってきたAIは主に4つ。ChatGPT、Claude、Copilot、Gemini。これを手元に集めようとして、最初の段階でつまずいた。集め方が、4つで見事に違うのだ。
- ChatGPT:エクスポート機能で、まるごと書き出せた。535件。良くも悪くも”すべて”が入っていて、後で一番手こずるのがこれだった。
- Claude:226件。こちらもエクスポートできて、ほとんどが素のテキストの会話。扱いはずっと楽だった。
- Copilot:会話をまとめて書き出す機能が、見当たらなかった。仕方なく、残したいやり取りを自分で選んで、手作業で18件だけ入れた。
- Gemini:これも、まとまった形で会話を取り出す方法が見つからなかった。今回は手をつけられず、見送った。
結局、この時に集められたのは、ChatGPT・Claude・Copilotの合わせて779件。自分でもこんなに溜まっているとは思っていなかった。
整備士をやっていた頃で言うと、メーカーが違うと配線図の描き方からして違う、あの感じに近い。共通のやり方が一つも使えない。
2. ChatGPTのエクスポートは「会話の一覧」じゃなかった
一番手こずったのが、ChatGPTだ。
エクスポートを開けば、上から順に「自分が言った→AIが答えた」が並んでいる――そう思っていた。違った。中身は、枝分かれした巨大なデータの塊だった。
理由はすぐ分かった。AIの答えを「もう一回」と作り直すと、その分だけ会話が枝分かれして記録されるのだ。だから、ただ上から読むと、採用しなかった答えや、途中で捨てた枝まで全部混ざってしまう。
整備士の例えで言うと、ぐちゃぐちゃに分岐したハーネス(配線の束)を渡されて、「実際に電気が流れた一本の道筋だけ抜き出せ」と言われたようなものだ。
これは自分一人ではどうにもならない。Claude Codeと相談しながら、「最後に表示されていた答えから逆向きに、親をたどって本当の道筋を復元する」という処理を作った。正直に言うと、プログラムを自分で全部書いたわけじゃない。やりたいことを日本語で伝えて、出てきたものを動かして、ズレを直して、を何度も繰り返した。
3. ChatGPTには「会話以外」も全部入っていた
道筋を復元できても、まだ終わらない。
さっき「良くも悪くも、すべてが入っていた」と書いたのは、ここのことだ。Claudeのほうは、ほとんどが素直な文章の会話だった。ところがChatGPTは、文章だけじゃない。コードあり、画像あり、AIに読ませた音声メモあり、最近のものだと「考えている途中の思考」まで記録に残っている。数えたら十種類以上あった。
これを一個ずつ、「これは文章」「これは画像のリンク」「これは音声」と仕分けて拾っていく。拾いこぼすと、その部分だけ会話が穴になる。地味で、果てしない作業だった。
4. ChatGPTが勝手に付けた「ラベル」は、持ち込まないことにした
これも細かい話だが、ChatGPTのデータには、ChatGPTが自動で付けた”ラベル”(整理用の目印のようなもの)も一緒に入っていた。そのまま取り込むと、自分のVaultの分類棚に、AIが勝手に決めた目印まで混ざってしまう。
第3弾で「自分の棚の分け方は、自分で決める」と書いた手前、ここは譲りたくなかった。だから、自分で決めた目印だけを残して、ChatGPTが付けたものは取り込むときに捨てるようにした。
5. 一気にやらず、小分けにした
全部で779件。最初は「えいや」で全部いっぺんに流したくなった。でも、過去に何度も「一気にやって、途中で壊れて、最初からやり直し」をやらかしている。なので今回は、日付ごとに小分けにして流した。
それと、「もう取り込み済みのものは、もう一回流しても上書きしない」ようにもした。途中で止まっても、続きから安全にやり直せる。完成より、止まっても壊れないことを優先した。
それでも、何件かは元データが壊れていて復元できず、落ちた。これは無理に直さず、「落ちた」と記録だけ残した。
うまくいった点
- 散らばっていた会話が、一か所に集まった。 「あの話、どのAIにしたっけ」が消えて、検索すれば一発で出る。これが一番うれしい。このブログのネタも、半分はここから掘り出している。
- 過去の履歴は「取り出せる」と分かった。 これからもチャットツールは使い分ける。でも、囲い込まれて取り出せない、わけじゃない。一度通しでやったことで、その手応えがつかめた。
- 小分け+やり直し可能にしたのは、正解だった。 一気にやっていたら、たぶんまた途中で投げ出していた。
失敗・課題
正直に書く。
- Geminiは、まだ取り込めていない。 まとまった形で取り出す方法が見つからず、今回は見送った。後述するが、これが一番の学びにつながった。
- 拾いきれなかった会話がある。 壊れていて復元できなかった分は、あきらめた。全部は救えない。
- 音声メモはまだ「未処理」のまま。 取り込んだ会話の中に、自分が吹き込んだ音声がそこそこ眠っている。これは「あとで文字起こしする」という札だけ付けて、保留にしてある。
- 取り込んだだけで、まだ「整って」はいない。 入れただけでは、タグもバラバラ、表記もバラバラ。ここをそろえるのが次回の話だ。
今回、いちばん腑に落ちたこと
やってみて、はっきり分かったことが一つある。
エクスポート機能は、万能じゃない。
ChatGPTやClaudeのように、ボタン一つで全部書き出せるものもあれば、CopilotやGeminiのように、まとまった書き出しが用意されていないものもある(少なくとも、自分が試した時点では見つけられなかった)。つまり、「いつでもエクスポートすればいい」と思って預けっぱなしにしていると、いざ集めようとした時に、取り出せないものが出てくる。
だから、考えを変えた。大事なやり取りは、エクスポート任せにせず、こまめに自分の手元へ取り込んでおく。 溜め込んでから一気に、ではなく、その都度少しずつ。これが、今回いちばんの収穫だった。
次にやること
- 第5弾:前処理。 取り込んだ779件は、まだ「置いただけ」。バラバラのタグや表記をそろえて、機械でチェックできる状態にする話を書く。
- 音声メモの文字起こし。 保留にしてある音声を、いずれ拾い直す。
- こまめな取り込みを習慣に。 Geminiの分も含め、これからは溜める前に少しずつ。
締め
AIは、これからも一つに絞らず、場面で使い分けると思う。
ただ、「あの話どこでしたっけ」で迷うことは、もうなくなった。過去の履歴を自分の手元に取り出す術も、一度やってみて分かった。あとは、エクスポートを当てにしすぎず、こまめに拾っていくだけだ。
整備と同じで、たぶんこれにも終わりはない。