まさかの日記

最近まともな文章しか書けなくなってきました

2026/01

社内のChatworkの会話ログから、LLMを使って知識を自動抽出し、グラフDBに蓄積するシステムを構築しました。

何をするシステム?

チャットログ → LLMで分析 → ナレッジグラフ → 自然言語で検索

雑談や議論の中に埋もれている「使える知識」を自動で抽出して、後から検索できるようにします。

入力と出力

入力: Chatworkのチャットログ(JSON)
  • 97件のメッセージ、5名の発言者
出力:
  • 79件の形式知(事実、ヒント、教訓、決定事項、定義)
  • 251件のトピック
  • 発言者ごとの専門性マップ

抽出される知識の例

  • 事実: 「Empathの料金は初期50万、月額5万で1500時間含む」
  • ヒント: 「顧客入力をLLMでカテゴリ分類してGraphRAG検索に活用」
  • 教訓: 「LLMの説明可能性は提供元が保証しない限り信頼できない」
  • 決定: 「特許のQAはgmが担当」

検索の例

CLIで自然言語で質問できます。

Q: 顧客対応のメタスキルとは?
A: 1.感情と理解度のスコアリング 2.フェーズの把握 3.顧客タイプの判定

技術構成

  • Neo4j(グラフDB)
  • Claude API(知識抽出・クエリ生成)
  • Python

チャットの「暗黙知」を「形式知」に変換して、組織のナレッジとして蓄積できるようになりました。

年末ごろ適当に本を買って積んでいたものをざっと読んだ(どこを読むかを決めた)のでここでざっと書いておく




因果推論の基礎をかじろうと思って買った。後で気づいたけどkindle unlimitedでも読める。

後半でTransformerでどうの、、というのがあったのでこれを買ったのだけど、そもそものところからちゃんと理解しないと意味がなさそう。なので最初から読んでいく。




10章あたりの、MCPサーバの作り方のところだけ読もうかなとと
この方の他の本も良さそう。



ClaudeCodeをちゃんとつかう(並列とかチケットで)ために買った。ガイド的に手元においておく感じ。



カスタマーサポートをAWSで作る、みたいなところを参考にしようと思って買った。
あとGraphRAG、StructuredRAGについてもちょっと書いてある

(追記)カスタマサポートのところは、下記を見れば良さそう?

sample-practical-generative-ai-on-aws-book/ch05_ai_agent at main ・ aws-samples/sample-practical-generative-ai-on-aws-book ・ GitHub
https://github.com/aws-samples/sample-practical-generative-ai-on-aws-book/tree/main/ch05_ai_agent





4章のヘルプデスク、8章の評価、というあたりを読もうと思って買った。



3章、4章あたり、ローカルでTransformer動かしたりファインチューニングしたりとか、結構ちゃんとした内容の本。
ここに書いたもののなかで、これが唯一Kindle版が無い。




langchain系でやるならいるだろうなと思ったけど、今時点ではあんまり読まないかも。
7章にフィードバックの話がある。

このページのトップヘ