「あの話、どのAIにしたっけ」をなくしたかった ── AIとの会話779件を一か所に集めた話
第4弾。ChatGPT・Claude・Copilot・Gemini……AIツールをまたいで会話が散らばり、「あの話どこでしたっけ」になっていた。数年分の会話779件をObsidianの一か所に集めて、探せるようにした話。やってみて「エクスポートは万能じゃない」と分かった、つまずきの記録。
Claude Code / ローカルLLM / RTX活用 / OCR・TTS
第4弾。ChatGPT・Claude・Copilot・Gemini……AIツールをまたいで会話が散らばり、「あの話どこでしたっけ」になっていた。数年分の会話779件をObsidianの一か所に集めて、探せるようにした話。やってみて「エクスポートは万能じゃない」と分かった、つまずきの記録。
子どもの読み聞かせで寝落ちする父親が、手持ちの本をOCR→TTSで音声化するパイプラインを自作した記録。更新が止まっていたブログを再開できた理由から、OCRの文字化け、LLMの暴走、完全自動化を諦めるまでをまとめた総集編。
第3弾。Obsidianに三層構造を作り、CLAUDE.mdを設計した。でも正直、まだ自分の手に馴染んでいない。借り物の構造を自分の工具箱に組み直すまでの、つまずきの記録。
第2弾。第1弾で「過去の自分を救い出す」と決めた。でも世界はもう先に進んでいるかもしれない。日本語圏と英語圏を調べて、自分が陣取れる場所を5軸で確認した話。
AIを使うほど考えることが増えて、同じことをまた一から考え直していた。「考えが消えていく」「会話が埋もれる」を解決するため、Obsidian × Claude Code で自分の脳を組み直すシリーズの第1弾。
PDFから音声まで16ステップのパイプラインを作った。完全自動を目指したが、辞書登録と品質確認は人間がやるほうがいい——と気づくまでの話。
TTS音質の壁にぶつかり、ComfyUIで音声クローンとVoiceDesignを試し、Whisperで品質を自動検証する仕組みを作った話。
VOICEVOX・Style-Bert-VITS2・Qwen3-TTSの3エンジンに同じ「吾輩は猫である」を読ませた。読みの正確さと自然なイントネーションは両立しない——と気づくまでの話。
OCR校正用のローカルLLMを選ぶのに、OOM・タイムアウト・thinking暴走を経験した。最終的にQwen3 32Bのthinking抑制で14.6倍の速度改善を得た話。
tmuxとは何か、なぜ必要かを理解するところから、Claude Codeのサブエージェント・エージェントチームの違い、セキュリティ設定、使い方までをまとめた非エンジニア向けガイド。
OCRで取り出したテキストをLLMに校正させたら、文章が要約されたり消えたりした。前処理の順番を間違えると、AIは暴走する。
ChatGPT、Claude、Gemini、Grok、Copilot……半年以上AIツールを乗り換え続けた非エンジニアが、最終的にClaude Code+Copilotの二刀流に落ち着いた記録。
PDF小説の音声化を目指してTesseractでOCRしたら文字化けだらけ。日本語特化のYomiTokuに切り替えるまでの試行錯誤の記録。
読み聞かせで先に寝落ちする父親が、OCR+TTSで"自分のために本を読んでくれる仕組み"を作れないかAIに相談してみた。開発への第一歩の記録。
AIの普及でPC作業が増え、マウス・キーボード・テンキー・音声入力と入力環境を一新。音声入力×AIの組み合わせが想像以上に快適だった記録。
工場勤務の元自動車整備士が、ChatGPTとの出会いをきっかけにブログを始めた理由。非エンジニアがAI時代に「作る側」を目指す記録のはじまり。